WWW.DISSERS.RU

БЕСПЛАТНАЯ ЭЛЕКТРОННАЯ БИБЛИОТЕКА

   Добро пожаловать!


Pages:     | 1 |   ...   | 13 | 14 || 16 | 17 |   ...   | 18 |

Если указанная гипотеза верна, то при большом количестве наблюдений статистика критерия имеет распределение, близкое к распределению хиквадрат с степенями свободы. Гипотеза отвергается при заданном уровне значимости, если вычисленное значение превышает критическое значение, равное квантили уровня указанного распределения, т. е. если Вариант II. В рамках модели где остатки, полученные при оценивании основной модели наблюдений, проверяется гипотеза Статистика критерия равна, где коэффициент детерминации, получаемый при оценивании последней модели.

Если указанная гипотеза верна, то при большом количестве наблюдений статистика критерия имеет распределение, близкое к распределению хиквадрат с степенями свободы. Гипотеза отвергается при заданном уровне значимости, если вычисленное значение превышает критическое значение, равное квантили уровня указанного распределения, т. е. если Как и в случае критерия БройшаГодфри, при интерпретации результатов применения обоих вариантов критерия Уайта следует помнить, что этот критерий асимптотический.

Замечание. При описании критериев Уайта мы неявно предполагали, что. Если постоянная не включена в исходную модель наблюдений, то в моделях, оцениваемых на втором шаге обоих вариантов критерия Уайта, суммирование следует производить, начиная с.

3.3. НЕАДЕКВАТНОСТЬ ПОДОБРАННОЙ МОДЕЛИ: ПРИМЕРЫ И ПОСЛЕДСТВИЯ Пример. Рассмотрим статистические данные по США за период с 1959 по 1985 г. г.

о следующих макроэкономических показателях:

DPI — годовой совокупный располагаемый личный доход;

CONS — годовые совокупные потребительские расходы;

ASSETS — финансовые активы на конец календарного года (все показатели в млрд. долларов, в ценах 1982 г.).

Представление об изменении этих макроэкономических показателей дает следующий график:

Рассмотрим модель наблюдений где индексу t соответствует (1958+ t) год. Это модель с 3 объясняющими переменными:

символ обозначает переменную, значения которой запаздывают на одну единицу времени относительно значений переменной.

Оценивание этой модели дает следующие результаты:, объясняющие переменные имеют высокую статистическую значимость. Ниже представлены диаграмма рассеяния для предсказанных (CONSF) и наблюдаемых (CONS) значений переменной, а также график зависимости стандартизованных остатков (RESID_STAND) от предсказанных (CONSF) значений переменной :

Левый график отражает высокое значение коэффициента детерминации. На правом графике заметно возрастание разброса точек относительно нулевого уровня при значениях.

Поскольку первый из приведенных в этом примере графиков указывает на возрастание годовых потребительских расходов с течением времени, для реализации процедуры GoldfeldQuandt естественно воспользоваться уже имеющимся упорядочением наблюдений во времени (это и будет направлением ожидаемого возрастания дисперсий случайных ошибок). Заметим теперь, что вследствие использования статистических данных, начиная с 1959 года, мы не имеем в своем распоряжении значения, соответствующего 1958 году. Поэтому реально при оценивании коэффициентов модели наблюдений мы используем только 26 (а не 27) наборов значений,.

Выделим из этих 26 наблюдений две группы, состоящие из первых 10 и последних 10 наборов значений, соответствующие периодам с 1960 по 1969 и с 1976 по 1985 годы (так что отброшены центральных наблюдений). При раздельном подборе линейной модели по этим группам наблюдений получаем остаточные суммы квадратов и, соответственно, так что наблюдаемое значение статистики критерия GoldfeldQuandt равно Если стандартные предположения о случайных ошибках в модели наблюдений выполнены, то тогда отношение указанных остаточных сумм квадратов как случайных величин имеет распределение Фишера =. Если мы, как обычно, задаем уровень значимости равным, то соответствующее этому уровню значимости критическое значение статистики равно Наблюдаемое значение этой статистики превышает критическое; поэтому гипотеза выполнения стандартных предположений об ошибках отклоняется в пользу гипотезы возрастания дисперсий с ростом значений. Заметим, наконец, что вероятность превышения случайной величиной с распределением значения равна Сравним результаты применения критерия ГолдфелдаКвандта с результатами, получаемыми при использовании двух вариантов критерия Уайта.



При использовании первого варианта наблюдаемое значение статистики критерия равно. Поскольку, то число степеней свободы соответствующего распределения хиквадрат равно. Вероятность того, что случайная величина, имеющая такое распределение, превысит значение, равна, так что значение меньше критического, а значит, гипотеза однородности дисперсий этим вариантом критерия Уайта не отвергается.

При использовании второго варианта наблюдаемое значение статистики критерия равно. Число степеней свободы соответствующего распределения хиквадрат равно. Вероятность того, что случайная величина, имеющая такое распределение, превысит значение, равна, так что значение меньше критического, а значит, гипотеза однородности дисперсий не отвергается и этим вариантом критерия Уайта.

Таким образом, статистические выводы относительно однородности дисперсий случайных составляющих в рассматриваемой модели наболюдений оказались противоречивыми: гипотеза однородности отвергается критерием ГолфелдаКвандта, но не отвергается обоими вариантами критерия Уайта. Как можно объяснить такое противоречие? Оба варианта критерия Уайта асимптотические, тогда как критерий ГолдфелдаКвандта учитывает реально имеющееся количество наблюдений.

Оба варианта критерия Уайта являются критериями согласия, не настроенными на какойто специфический класс альтернатив гипотезе однородности, тогда как использование критерия ГолдфелдаКвандта непосредственно связано с альтернативой, выраженной в форме возрастания дисперсий ошибок для соответствующего упорядочения наблюдений. И здесь проявляется общее положение:

критерии, построенные с расчетом на узкий класс альтернатив, оказываются более мощными по сравнению с критериями, рассчитанными на более широкий класс альтернатив, т. е. чаще отвергают нулевую гипотезу, когда она не верна.

Рассмотрим теперь график зависимости стандартизованных остатков от номера наблюдений и его вариант в виде зависимости от года наблюдения:

Здесь обращает на себя внимание наличие серий остатков одинакового знака, что сигнализирует о том, что ошибки в модели наблюдений скорее всего имеют положительную автокорреляцию. Для 26 наблюдений и объясняющих переменных границы для критического значения статистики ДарбинаУотсона при (односторонний критерий) равны В то же время, вычисленное по остаткам от оцененной модели значение статистики ДарбинаУотсона равно, что меньше нижней границы Следовательно, нулевая гипотеза о выполнении стандартных предположений отклоняется в пользу гипотезы о положительной автокоррелированности ошибок.

Сравним результаты применения критерия ДарбинаУотсона с результатами, получаемые при использовании критерия БройшаГодфри.

Если исходить из допущения зависимости очищенных случайных ошибок только на один шаг, как это делается при использовании критерия ДарбинаУотсона, то в этом случае вычисленное значение статистики критерия БройшаГодфри равно, что соответствует значению, равному. Гипотеза независимости ошибок отвергается, что согласуется с результатом, полученным при использовании критерия ДарбинаУотсона.

В то же время, если взять, то тогда, что соответствует значению, равному.

Гипотеза независимости ошибок в этом случае не отвергается при установленном уровне значимости, что расходится с результатом, полученным при использовании критерия ДарбинаУотсона. Эта гипотеза не отвергается также при выборе, и т.д., и это вполне объяснимо: выбор,, соответствует выбору все более широких альтернатив по сравнению с, что приводит к уменьшению вероятности отвергнуть гипотезу независимости ошибок в случае, когда она не верна.

Проверим, наконец, предположение о нормальном распределении ошибок. Сначала рассмотрим диаграмму «квантильквантиль»(QQ plot) и диаграмму плотности (DPPplot):

Первая диаграмма не выглядит удовлетворительной; вторая обнаруживает определенную асимметрию. Выборочный коэффициент асимметрии равен здесь 1.285, а выборочный коэффициент эксцесса равен 5.321. Оба эти значения говорят отнюдь не в пользу нормальности ошибок. Статистика критерия JarqueBera принимает значение 12.997, что соответствует Следовательно, имеющиеся данные не подтверждают гипотезу о выполнении стандартных предположений об ошибках и по этому критерию.





В связи со столь неутешительными результатами в отношении проверки гипотезы выполнения стандартных предположений в рассмотренном примере, возникает естественный вопрос о том, как именно влияют нарушения этих предположений на статистические выводы.

Неоднородность дисперсий ошибок (гетероскедастичность, heteroscedasticity).

Этот вид нарушений стандартных предположений характерен для статистических данных, относящихся к одному моменту времени, но собранных по различным регионам, различным предприятиям, различным социальным группам (данные в сечениях, crosssection data). Неоднородность дисперсий возникает также как результат тех или иных структурных изменений в экономике, например связанных с мировыми экономическими кризисами. Последний пример как раз и иллюстрирует подобную ситуацию: резкое возрастание абсолютных величин остатков в этом примере относится к периоду глобального нефтяного кризиса.

Последствия неоднородности дисперсий ошибок:

Оценки дисперсий случайных величин (оценок коэффициентов линейной модели) оказываются смещенными.

Построенные доверительные интервалы для не соответствуют заявленным уровням значимости.

Вычисленные значения и отношений уже нельзя рассматривать как наблюдаемые значения случайных величин, имеющих и распределения, соответствующие стандартным предположениям. Поэтому сравнение вычисленных значений и отношений с квантилями указанных и распределений может приводить к ошибочным статистическим выводам в отношении гипотез о значениях коэффициентов линейной модели.

Автокоррелированность (сериальная корреляция) ошибок (autocorrelation, serial correlation). Этот вид нарушений стандартных предположений характерен для статистических данных, развернутых во времени (продольные данные, longitudial data). Автокоррелированность ошибок обычно возникает вследствие направильной спецификации модели, например, при невключении в модель существенной объясняющей переменной с выраженной автокорреляцией.

Последствия автокоррелированности ошибок:

Оценка дисперсии случайных ошибок смещена вниз в случае положительной и смещена вверх в случае отрицательной автокоррелированности ошибок.

Оценки дисперсий случайных величин (оценок коэффициентов линейной модели) оказываются заниженными в случае положительной и завышенными в случае отрицательной автокоррелированности ошибок.

Построенные доверительные интервалы для не соответствуют заявленным уровням значимости: в случае положительной автокоррелированности ошибок построенные интервалы неоправденно узки, а в случае отрицательной автокоррелированности ошибок неоправданно широки.

Вычисленные значения и отношений нельзя рассматривать как наблюдаемые значения случайных величин, имеющих и распределения, соответствующие стандартным предположениям. Поэтому сравнение вычисленных значений и отношений с квантилями указанных и распределений может приводить к ошибочным статистическим выводам в отношении гипотез о значениях коэффициентов линейной модели. Вычисленные значения и отношений завышены в случае положительной и занижены в случае отрицательной автокоррелированности ошибок.

При обнаружении нарушений стандартных предположений следует либо улучшить спецификацию модели, привлекая подходящие дополнительные объясняющие переменные, либо использовать для оценивания коэффициентов и оценивания дисперсий коэффициентов модели специальные методы оценивания, принимающие во внимание обнаруженные нарушения (далее мы рассмотрим два таких метода:

взвешенный метод наименьших квадратов и авторегрессионное преобразование переменных).

3.4. КОРРЕКЦИЯ СТАТИСТИЧЕСКИХ ВЫВОДОВ ПРИ НАЛИЧИИ ГЕТЕРОСКЕДАСТИЧНОСТИ (НЕОДНОРОДНОСТИ ДИСПЕРСИЙ ОШИБОК) Пример. Для исследования вопроса о зависимости количества руководящих работников от размера предприятия были собраны статистические данные по 27 промышленным предприятиям. Далее обозначено:

— численность персонала на iм предприятии, — количество руководителей на iм предприятии.

Оцениваем линейную модель наблюдений Регрессионный анализ дает следующие результаты: R2= 0.776 и Variable Coefficient Std. Error tStatistic Pvalue.

Pages:     | 1 |   ...   | 13 | 14 || 16 | 17 |   ...   | 18 |










© 2011 www.dissers.ru - «Бесплатная электронная библиотека»

Материалы этого сайта размещены для ознакомления, все права принадлежат их авторам.
Если Вы не согласны с тем, что Ваш материал размещён на этом сайте, пожалуйста, напишите нам, мы в течении 1-2 рабочих дней удалим его.