WWW.DISSERS.RU

БЕСПЛАТНАЯ ЭЛЕКТРОННАЯ БИБЛИОТЕКА

   Добро пожаловать!


Pages:     | 1 |   ...   | 4 | 5 || 7 | 8 |   ...   | 18 |

Поскольку, на первый взгляд, расположение точек напоминает график обратной пропорциональной зависимости, можно попробовать рассмотреть модель наблюдений соответствующую линейной связи между переменными и. Подбор такой связи приводит к модели с достаточно высоким коэффициентом детерминации. Однако, характер диаграммы рассеяния переменных и указывает на неадекватность и этой модели.

Обратившись еще раз к диаграмме рассеяния исходных переменных и (для данных за 1961—1969 годы), можно заметить, что кривая зависимости от повидимому имеет вертикальную асимптоту. Учесть последнее обстоятельство можно в рамках модели MichaelisMenton которую можно преобразовать к виду учитывающему наличие и вертикальной и горизонтальной асимптот. Такая модель связи линеаризуется переходом к обратным величинам,. Действительно, тогда где Диаграмма рассеяния для обратных величин, имеет вид Теперь уже точки на диаграмме рассеяния весьма хорошо следуют прямой линии, подобранной методом наименьших квадратов:

. Здесь, так что,, и оцененная модель MichaelisMenton имеет вид Модель MichaelisMenton хороша тем, что учитывает наличие асимптот и линеаризуется. С другой, стороны, она является лишь частным случаем более общей модели связи с тремя свободно изменяющимися параметрами. Действительно, в модели MichaelisMenton и она только двухпараметрическая, так что модель с тремя свободными параметрами является более гибкой. Но, вместе с тем, трехпараметрическая модель уже не линеаризуется, и параметры приходится оценивать, используя итерационную процедуру последовательного уменьшения суммы квадратов (Конечно, в предположении аддитивности ошибок.) «Стартовые» значения параметров в этой процедуре можно взять близкими к оценкам, полученным при оценивании предыдущей модели, например,, а стартовое значение можно положить равным.

Реализация итерационной процедуры приводит к следующим оценкам параметров:

при этом,. Оцененная модель имеет вид На следующей диаграмме показаны наблюдаемые значения переменной INF (INFtrue) и значения (INFmodel), получаемые по оцененной модели.

Подобранная модель показывает, что экспансионистские экономические мероприятия первоначально обеспечивают снижение нормы безработицы и реальный экономический рост при умеренной инфляции. Однако, удержать норму безработицы ниже ее естественного значения в течение продолжительного времени можно лишь за счет постоянно ускоряющегося темпа инфляции. К окончанию срока пребывания у власти Линдона Джонсона темп инфляции начал стремительно возрастать, что потребовало смены экономической политики.

Соответственно, наблюдать кривые Филлипса в указанном виде удается только на краткосрочных интервалах.

1.12. ЛИНЕЙНЫЕ МОДЕЛИ С НЕСКОЛЬКИМИ ОБЪЯСНЯЮЩИМИ ПЕРЕМЕННЫМИ Рассмотрим статистические данные о потреблении текстиля (текстильных изделий) в Голландии в период между двумя мировыми войнами с 1923 по 1939 годы. В приведенной ниже таблице T — реальное потребление текстиля на душу населения, DPI — реальный располагаемый доход на душу населения, P — относительная цена текстиля. Все показатели выражены в индексной форме, в процентах к 1925 году.

Год T DPI p Год T DPI p 99. 96. 101. 153. 105. 65. 99. 98. 100. 158. 101. 61. 100. 100. 100. 140. 95. 62. 111. 104. 90. 136. 96. 63. 122. 104. 86. 168. 97. 52. 117. 109. 89. 154. 102. 59. 121. 110. 90. 149. 101. 59. 136. 112. 82. 165. 103. 61. 154. 109. 70. Для объяснения изменчивости потребления текстиля в указанном периоде мы можем привлечь в качестве объясняющей переменной как располагаемый доход DPI, так и относительную цену на текстильные изделия P. Если исходить из предположения о постоянстве эластичностей потребления текстиля по доходу и цене, то тогда следует подбирать линейные модели для логарифмов индексов, а не для самих индексов. Подбор таких моделей методом наименьших квадратов приводит к следующим результатам (использовались десятичные логарифмы):

Вторая модель, несомненно, лучше описывает наблюдаемую динамику потребления текстиля. Однако, естественно возникает вопрос о том, нельзя ли для объяснения изменчивости переменной Т использовать одновременно и располагаемый доход и относительную цену текстиля, улучшит ли это объяснение изменчивости потребления текстиля.

Чтобы привлечь для объяснения изменчивости потребления текстиля обе переменные DPI и T, мы рассматриваем модель линейной связи логарифмов этих величин и соответствующую ей модель наблюдений Оценки параметров можно опять находить методом наименьших квадратов, путем минимизации по всем возможным значениям суммы квадратов Минимум этой суммы достигается на некотором наборе так что Это минимальное значение мы опять обозначаем и называем остаточной суммой квадратов.



Коэффициент детерминации определяется, как и в модели связи между двумя переменными:

Здесь где При этом, где так что (и опять, разложение справедливо только при включении постоянной составляющей в правую часть соотношения, определяющего линейную модель связи). При этом также т. е. коффициент детерминации равен квадрату (обычного) выборочного коэффициента корреляции между переменными и Разности называются остатками.

По поводу получения явных выражений для оценок наименьших квадратов мы поговорим несколько позднее, а сейчас просто приведем результаты оценивания для нашего примера:

Мы видим, что в результате привлечения для объяснения изменчивости потребления текстиля сразу двух показателей и произошло заметное увеличение коэффициента детерминации по сравнению с лучшей из двух моделей, использовавших только один показатель — от значения до значения.

Коэффициент в подобранной модели связи интерпретируется здесь как эластичность потребления текстиля по доходу при неизменном значении относительной цены на текстиль, а коэффициент — как эластичность потребления текстиля по относительным ценам при неизменном уровне дохода. Такие значения коэффициентов говорят в пользу того, что потребление текстиля эластично по доходам и неэластично по ценам. Вопрос о том, в какой степени можно доверять подобным заключениям, мы рассмотрим далее в контексте вероятностных моделей.

ЧАСТЬ 2. СТАТИСТИЧЕСКИЕ ВЫВОДЫ ПРИ СТАНДАРТНЫХ ПРЕДПОЛОЖЕНИЯХ О ВЕРОЯТНОСТНОЙ СТРУКТУРЕ ОШИБОК В ЛИНЕЙНОЙ МОДЕЛИ НАБЛЮДЕНИЙ 2.1. ВЕРОЯТНОСТНОЕ МОДЕЛИРОВАНИЕ ОШИБОК Мы уже неоднократно сталкивались с вопросом о том, сколь существенно величина коэффициента корреляции (детерминации) должна отличаться от нуля, чтобы можно было говорить о действительно существующей линейной связи между исследуемыми переменными.

Если оцененное значение эластичности потребления некоторого товара оказалось несколько больше единицы, то возникает вопрос о том, сколь надежным является заключение о том, что потребление этого товара эластично по ценам.

Если мы будем использовать подобранную прямую для прогнозирования значений для новых наблюдений, t= n+1,...,n +k, то сколь надежными будут такие прогнозы? Если у нас нет теоретических (экономических) оснований для выбора между моделью в уровнях переменных и моделью в логарифмах уровней, то как выбрать одну из этих моделей на основании одних только наблюдений? Ответы на эти и другие подобные вопросы невозможны, если мы не сделаем некоторых более или менее подробных предположений о структуре последовательности ошибок, участвующих в определении модели наблюдений Базовая, и наиболее простая модель для последовательности предполагает, что — независимые случайные величины, имеющие одинаковое распределение (i. i. d. — independent, identically distributed random variables).

Для нас (пока!) достаточно представлять случайную величину как переменную величину, такую, что до наблюдения ее значения невозможно предсказать это значение абсолютно точно, и, в то же время, для любого,, определена вероятность того, что наблюдаемое значение переменной не превзойдет ;. Функция, называется функцией распределения случайной величины (c. d. f. — cumulative distribution function).

Говоря об ошибках как о случайных величинах, мы, соответственно, понимаем указанную линейную модель наблюдений таким образом, что а) существует (теоретическая, объективная или в виде тенденции) линейная зависимость значений переменной от значений переменной с вполне определенными, хотя обычно и не известными исследователю, значениями параметров и;

б) эта линейная связь для реальных статистических данных не является строгой:

наблюдаемые значения переменной отклоняются от значений, указываемых моделью линейной связи в) при заданных (известных) значениях конкретные значения отклонений не могут быть точно предсказаны до наблюдения значений даже если значения параметров и известны точно;





г) для каждого, определена вероятность того, что наблюдаемое значение отклонения не превзойдет, причем эта вероятность не зависит от номера наблюдения;

д) вероятность того, что наблюдаемое значение отклонения в iм наблюдении не превзойдет, не зависит от того, какие именно значения принимают отклонения в остальных наблюдениях.

В дальнейшем, говоря о той или иной случайной величине, мы будем предполагать существование функции, принимающей только неотрицательные значения и такой, что 1) площадь под кривой в прямоугольной системе координат (точнее, площадь, ограниченная сверху этой кривой и снизу — горизонтальной осью ) равна, 2) для любой пары значений с, вероятность численно равна площади, ограниченной снизу осью, сверху — кривой, слева — вертикальной прямой, справа — вертикальной прямой (т. е. равна части площади под кривой, расположенной между точками и ).

3) для любого, вероятность того, что наблюдаемое значение не превзойдет, равна площади, ограниченной снизу осью, сверху — кривой и справа — вертикальной прямой, т. е. равна части площади под кривой, расположенной левее точки.

Заметим, что при этом выполняется следующее важное соотношение:

(Действительно, вероятность численно равна части площади под кривой, расположенной левее точки, а эта часть складывается из части площади под кривой, расположенной левее точки и части площади под кривой, расположенной между точками и, так что откуда и следует заявленное соотношение.) Кроме того, (Действительно, поскольку слева складываются части площади под кривой, расположенные, соответственно, левее и правее точки, так что в сумме они составляют всю площадь под этой кривой, а вся площадь под кривой как раз и равна 1.) Функция связана с функцией распределения случайной величины соотношениями и называется функцией плотности вероятности случайной величины (p.d.f. — probability density function). Для краткости, мы часто будем говорить о функции как о функции плотности или о плотности распределения случайной величины.

Возьмем два непересекающихся интервала значений переменной : и. Рассмотрим два варианта распределения вероятности случайной величины : равномерное распределение на отрезке и треугольное распределение на том же отрезке. Графики функций плотности для этих двух вариантов имеют следующий вид:

Площади заштрихованных прямоугольников на первом графике численно равны вероятностям того, что случайная величина, имеющая равномерное распределение на отрезке, примет значения в пределах и, соответственно. Поскольку основания и высоты этих прямоугольников равны, то равны и их площади, т.е. равны указанные вероятности.

Площади заштрихованных трапеций на втором графике численно равны вероятностям того, что случайная величина, имеющая треугольное распределение на отрезке, примет значения в пределах и, соответственно. Высоты этих трапеций равны, однако стороны трапеции, расположенной правее, больше сторон трапеции, расположенной левее. Поэтому и площадь трапеции, расположенной правее, больше площади трапеции, расположенной левее. А это означает, в свою очередь, что вероятность того, что случайная величина, имеющая треугольное распределение на отрезке, примет значения в пределах, больше вероятности того, что эта случайная величина примет значения в пределах.

Таким образом, функция плотности указывает на более вероятные и менее вероятные интервалы значений случайной величины. Если случайная величина имеет равномерное распределение на отрезке, то для нее все интервалы значений, имеющие одинаковую длину и расположенные целиком в пределах отрезка, имеют одинаковые вероятности (т. е. вероятности попадания значений случайной величины на эти интервалы одинаковы). Если же случайная величина имеет треугольное распределение на отрезке, то для нее интервалы значений, имеющие одинаковую длину и расположенные целиком в пределах отрезка, имеют, вообще говоря, различные вероятности: вероятность того, что случайная величина примет значение в интервале, расположенном ближе к центральному значению, больше вероятности того, что случайная величина примет значение в интервале, расположенном ближе к одному из концов отрезка.

Pages:     | 1 |   ...   | 4 | 5 || 7 | 8 |   ...   | 18 |










© 2011 www.dissers.ru - «Бесплатная электронная библиотека»

Материалы этого сайта размещены для ознакомления, все права принадлежат их авторам.
Если Вы не согласны с тем, что Ваш материал размещён на этом сайте, пожалуйста, напишите нам, мы в течении 1-2 рабочих дней удалим его.