WWW.DISSERS.RU

БЕСПЛАТНАЯ ЭЛЕКТРОННАЯ БИБЛИОТЕКА

   Добро пожаловать!


Pages:     | 1 |   ...   | 12 | 13 || 15 | 16 |   ...   | 18 |

Отдельную группу составляют графические методы проверки предположения о нормальности распределения случайных составляющих.

Диаграмма «квантильквантиль» (QQ plot). Для построения этой диаграммы значения стандартизованных остатков упорядочивают в порядке возрастания;

упорядоченные значения образуют ряд Если теперь для каждого нанести в прямоугольной системе координат на плоскости точку с абсциссой и ординатой ( — квантиль уровня уровня стандартного нормального распределения), то полученные точек,, в случае нормальности распределения ошибок должны располагаться вдоль прямой, имеющей угловой коэффициент, близкий к единице.

Подобное расположение имеют точки на диаграмме, построенной указанным способом по первому из четырех множеств искусственных данных:

Замечание. Если в последней процедуре не проводить стандартизацию остатков, а использовать непосредственно остатки, то полученные точки,, также будут располагаться (при нормальном распределении ошибок) вдоль некоторой прямой, но уже имеющей угловой коэффициент, не обязательно близкий к единице.

Указанное свойство диаграммы «квантильквантиль» основано на том, что при больших значениях имеет место приближенное равенство Последнему соответствует приближенное равенство — соотношение, используемое для проверки нормальности ошибок в пакете EXCEL.

Диграмма плотности (DPplot, DPP) отличается от диаграммы «квантильквантиль» тем, что по оси ординат вместо значений квантилей откладываются значения функции плотности стандартного нормального распределения. Такая диаграмма дает возможность при достаточном количестве наблюдений не только проверить согласие с предположением о нормальном распределении ошибок, но и выявить характер альтернативного распределения в случае отклонения распределения ошибок от нормального. В качестве примера приведем диаграмму плотности, построенную по остаткам, полученным в результате подбора модели линейной зависимости совокупных расходов на личное потребление от совокупного располагаемого личного дохода (данные по США в млрд. долларов 1982 г., за период с 1959 по 1985 г.):

На этой диаграмме обнаруживается определенная асимметрия, что представляется не вполне согласующимся с предположением о нормальности ошибок. Однако сразу делать на этом основании вывод о нарушении такого предположения не следует.

Дело в том, что при небольшом количестве наблюдений структура подобной диаграммы весьма неустойчива. Поэтому даже при заведомо нормальном распределении ошибок мы редко увидим вполне симметричную картину расположения точек на диаграмме при малом количестве наблюдений.

Ядерные (kernel) оценки плотности — еще один метод получения суждений о форме функции плотности, позволяющий, в отличие от двух предыдущих, получать график в виде непрерывной кривой. Существует много разных вариантов таких оценок, в детали которых мы вдаваться не будем, а отметим только, что в пакете EVIEWS предлагается на выбор 8 вариантов, в рамках которых имеется еще и возможность варьирования параметров. Вариант, применяемый по умолчанию, дает для только что рассмотренных данных следующую оценку плотности распределения ошибок:

Как видим, и такой подход дает график, не очень похожий на график функции плотности стандартного нормального распределения, но это опять может быть вызвано малым количеством наблюдений (27).

3.2. ПРОВЕРКА АДЕКВАТНОСТИ ПОДОБРАННОЙ МОДЕЛИ ИМЕЮЩИМСЯ СТАТИСТИЧЕСКИМ ДАННЫМ:

ФОРМАЛЬНЫЕ СТАТИСТИЧЕСКИЕ ПРОЦЕДУРЫ Помимо графических, существует довольно много процедур, предназначенных для проверки выполнения стандартных предположений о линейной модели наблюдений, использующих статистические критерии проверки гипотез. Мы остановимся только на нескольких таких процедурах. В каждой из этих процедур в качестве нулевой гипотезы берется гипотеза ~.

Однако приспособлены соответствующие критерии для выявления специфических нарушений стандартных предположений, что делает каждый из критериев особо чувствительным именно к тем нарушениям, на которые он «настроен».

Критерий ГолдфелдаКвандта (GoldfeldQuandt). Если графический анализ остатков указывает на возможную неоднородность дисперсий ошибок, то наблюдения, насколько это возможно, упорядочивают в порядке предполагаемого возрастания дисперсий случайных ошибок;



отбрасывают центральных наблюдений (для более надежного разделения групп с малыми и большими дисперсиями случайных ошибок), так что для дальнейшего анализа остается наблюдений;

производят оценивание выбранной модели отдельно по первым и по последним наблюдениям;

вычисляют отношение остаточных сумм квадратов, полученных при подборе модели по последним (остаточная сумма квадратов ) и по первым (остаточная сумма квадратов ) наблюдениям.

При принятии решения учитывают, что если все же, (дисперсии однородны) и выполнены остальные стандартные предположения о модели наблюдений, включая предположение о нормальности ошибок, то тогда отношение имеет— распределение Фишера с и степенями свободы.

Гипотеза, (дисперсии однородны) отвергается, если вычисленное значение отношения «слишком велико», т. е.

превышает критический уровень соответствующий выбранному уровню значимости.

Критерий ДарбинаУотсона (DurbinWatson). Этот критерий применяется, когда наблюдения производятся последовательно во времени, с равными интервалами, и график изменения остатков во времени указывает на наличие автокоррелированности случайных составляющих модели наблюдений. Предполагается, что эта автокоррелированность определяется соотношением где, а — независимые в совокупности случайные величины, имеющие одинаковое нормальное распределение, причем не зависит статистически от для.

Статистика ДарбинаУотсона определяется соотношением где — остатки, получаемые при оценивании линейной модели наблюдений.

В качестве нулевой гипотезы здесь берется гипотеза соответствующая (при нашем предположении о нормальности распределения случайных ошибок) независимости в совокупности случайных величин. В качестве альтернативной при анализе экономических данных чаще всего используют гипотезу соответствующую положительной автокоррелированности случайных величин (т. е.

тенденции преимущественного сохранения знака случайной ошибки при переходе от го наблюдения к му).

Статистика принимает значения в интервале от до. Рассматриваемая как случайная величина она имеет при гипотезе (т. е. если эта гипотеза верна) функцию плотности, симметричную относительно точки — середины этого интервала. Если в действительности то тогда значения статистики тяготеют к левой границе интервала. Поэтому, в соответствии с общим подходом к построению односторонних статистических критериев, мы должны были бы для выбранного нами уровня значимости найти соответствующее ему критическое значение и отвергать гипотезу в пользу при выполнении неравенства.

Однако распределение статистики ДарбинаУотсона зависит не только от и, но также и от конкретных значений объясняющих переменных, что делает неосуществимым построение таблиц критических значений этого распределения.

Дарбин и Уотсон преодолели это затруднение следующим образом. Они нашли (при различных значениях и ) нижнюю и верхнюю границы интервала, в котором только и могут находиться критические значения статистики ДарбинаУотсона, независимо от того, каковы конкретные значения. Иными словами, где и не зависят от конкретных значений, а определяются только количеством наблюдений, количеством объясняющих переменных и установленным уровнем значимости критерия.

Гипотеза отвергается в пользу гипотезы, если ;

не отвергается, если.

Если же то никакого вывода относительно справедливости или несправедливости гипотезы не делается.

При соблюдении этих правил вероятность ошибочного отвержения гипотезы не превосходит заданного уровня значимости.

Критерий ЖаркаБера (JarqueBera). Этот критерий используется в ряде пакетов статистического анализа данных (например, в EVIEWS) для проверки гипотезы нормальности ошибок в модели наблюдений, точнее, ~ (значение не конкретизируется). Если эта гипотеза верна,то при большом количестве наблюдений статистика имеет распределение, близкое к распределению хиквадрат с двумя степенями свободы, функция плотности которого имеет вид Здесь «sample skewness» — выборочный коэффициент асимметрии, «sample kurtosis» — выборочный коэффициент эксцесса, где и — остатки, полученные при оценивании модели.





Если распределение ошибок действительно является нормальным, то значения выборочного коэффициента асимметрии близки к нулю, а значения выборочного коэффициента эксцесса близки к 3.

Существенное отличие выборочного коэффициента асимметрии от нуля указывает на несимметричность (относительно нуля) графика функции плотности распределения ошибок («скошенность» распределения). Существенное отличие от 3 выборочного коэффициента эксцесса указывает на не характерные для нормального распределения «островершинность» (при значении этого коэффициента, большем трех) или излишнюю «сглаженность» (при значении этого коэффициента, меньшем трех) графика функции плотности распределения ошибок.

При нарушении условия нормальности распределения ошибок значения статистики имеют тенденцию к возрастанию. Поэтому гипотеза нормальности ошибок отвергается, если значения этой статистики «слишком велики», а именно, если где — квантиль распределения, соответствующая уровню.

Замечание. Критерии ДарбинаУотсона и ГолдфелдаКвандта являются точными, в том смысле, что они непосредственно учитывают количество наблюдений. В противоположность этому, критерий ЖаркаБера является асимптотическим критерием: распределение статистики хорошо приближается распределениемтолько при большом количестве наблюдений. Поэтому вполне полагаться на результаты применения критерия ЖаркаБера можно только в таких ситуациях. Помимо критерия ЖаркаБера в специализированные пакеты программ статистического анализа данных часто встраиваются и другие асимптотические критерии, например, критерии Уайта и БройшаГодфри, которые рассматриваются ниже.

Критерий БройшаГодфри (BreuschGodfrey). Этот критерий используется в ряде пакетов статистического анализа данных (например, в EVIEWS) для проверки гипотезы некоррелированности ошибок в модели наблюдений При наших предположениях это соответствует гипотезе независимости в совокупности случайных величин Напомним, что критерий Дарбина — Уотсона основан на рассмотрении модели наблюдений, в которой случайные составляющие связаны соотношением где, а — независимые в совокупности случайные величины, имеющие одинаковое нормальное распределение. В такой модели наблюдений случайные составляющие, разделенные двумя или более периодами времени и очищенные от влияния промежуточных, оказываются независимыми.

Критерий БройшаГодфри допускает зависимость случайных составляющих, разделенных периодами времени и также очищенных от влияния промежуточных;

соответствующая модель зависимости имеет вид Статистика этого критерия равна, где коэффициент детерминации, получаемый при оценивании модели а остатки, полученные при оценивании основной модели наблюдений. (Недостающие значения заменяются нулями.) В рамках последней модели проверяется гипотеза Если эта гипотеза верна, то при большом количестве наблюдений статистика критерия имеет распределение, близкое к распределению хиквадрат с степенями свободы. Гипотеза отвергается при заданном уровне значимости, если вычисленное значение превышает критическое значение, равное квантили уровня указанного распределения, т. е. если Конечно, при интерпретации результатов применения критерия БройшаГодфри следует помнить, что этот критерий асимптотический, тогда как критерий ДарбинаУотсона точный. Однако возможность применения критерия ДарбинаУотсона ограничивается тем, что он допускает зависимость «очищенных» случайных ошибок только на один шаг, т. е.

;

он неприменим в ситуациях, когда в число объясняющих переменных включаются запаздывающие значения объясняемой переменной.

Критерий же БройшаГодфри свободен от этих ограничений.

Критерий Уайта (White). Этот критерий используется в ряде пакетов статистического анализа данных (например, в EVIEWS) для проверки однородности дисперсий ошибок в модели наблюдений Критерий имеет два варианта.

Вариант I. В рамках модели где остатки, полученные при оценивании основной модели наблюдений, проверяется гипотеза Статистика критерия равна, где коэффициент детерминации, получаемый при оценивании последней модели.

Pages:     | 1 |   ...   | 12 | 13 || 15 | 16 |   ...   | 18 |










© 2011 www.dissers.ru - «Бесплатная электронная библиотека»

Материалы этого сайта размещены для ознакомления, все права принадлежат их авторам.
Если Вы не согласны с тем, что Ваш материал размещён на этом сайте, пожалуйста, напишите нам, мы в течении 1-2 рабочих дней удалим его.