Авто Автоматизация Архитектура Астрономия Аудит Биология Бухгалтерия Военное дело Генетика География Геология Государство Дом Другое Журналистика и СМИ Изобретательство Иностранные языки Информатика Искусство История Компьютеры Кулинария Культура Лексикология Литература Логика Маркетинг Математика Машиностроение Медицина Менеджмент Металлы и Сварка Механика Музыка Население Образование Охрана безопасности жизни Охрана Труда Педагогика Политика Право Приборостроение Программирование Производство Промышленность Психология Радио Регилия Связь Социология Спорт Стандартизация Строительство Технологии Торговля Туризм Физика Физиология Философия Финансы Химия Хозяйство Ценнообразование Черчение Экология Эконометрика Экономика Электроника Юриспунденкция

Гетероскедастичность ошибок

Читайте также:

Пусть ошибки не коррелированы по наблюдениям, и матрица Ω (а вслед за ней и матрица D) диагональна. Если эта матрица единична, т.е. дисперсии ошибок

8.2. Гетероскедастичность ошибок 259

одинаковы по наблюдениям (гипотеза g4 не нарушена), то имеет место гомос- кедастичность или однородность ошибок по дисперсии — «штатная» ситуация. В противном случае констатируют гетероскедастичность ошибок или их неодно- родность по дисперсии.

Пусть var (ε i) = σ2— дисперсия ошибки i -го наблюдения. Гомоскедастич-

ность означает, что все числа σ2

одинаковы, а гетероскедастичность — что среди

них есть несовпадающие.

Факт неоднородности остатков по дисперсии мало сказывается на качестве оце- нок регрессии, если эти дисперсии не коррелированы с независимыми факторами. Это — случай гетероскедастичности «без негативных последствий».

Данное утверждение можно проиллюстрировать в случае, когда в матрице Z все- го один столбец, т.е. n = 1 и свободный член отсутствует. Тогда формула (7.33) приобретает вид:

 σ2 2 

E (s 2) = 1

 σ2

i zi

e N 

i −  z 2

i i i

Если ситуация штатная и σ2= σ2, то правая часть этой формулы преобразуется к ви-

ду N − 1 σ2, и N s 2

оказывается несмещенной оценкой σ2, как и было пока-

N N − 1 e

1 

зано в параграфе 7.2. Если σ i и zi не коррелированы, то, обозначив σ2=

можно утверждать, что

σ2,

 σ2 2

2 2

i z, i σ

i  2 ≈

z, i

z = σ,

i 2 2

т.е. ситуация остается прежней. И только если σ i и zi положительно (или отрица- тельно) коррелированы, факт гетероскедастичности имеет негативные последствия.

σ2 2

Действительно, в случае положительной корреляции

i zi

 2

> σ2 и, следова-

тельно, E

 N 2

N − 1 e

< σ2. Обычная «несмещенная» оценка остаточной диспер-

сии оказывается по математическому ожиданию меньше действительного значе-

ния остаточной дисперсии, т.е. она (оценка остаточной дисперсии) дает основания для неоправданно оптимистичных заключений о качестве полученной оценки модели.

Следует заметить, что факт зависимости дисперсий ошибок от независимых факторов в экономике весьма распространен. В экономике одинаковыми по диспер-

сии скорее являются относительные (ε z), а не абсолютные (ε)ошибки. Поэтому,

когда оценивается модель на основе данных по предприятиям, которые могут иметь

260 Глава 8. Нарушение гипотез основной линейной модели

и, как правило, имеют различные масштабы, гетероскедастичности с негативными последствиями просто не может не быть.

Если имеет место гетероскедастичность, то, как правило, дисперсия ошибки связана с одной или несколькими переменными, в первую очередь — с факторами регрессии. Пусть, например, дисперсия может зависеть от некоторой перемен- ной yi, которая не является константой:

σ2

i = σ2

(yi), i = 1 ,..., N.

Как правило, в качестве переменной yi берется один из независимых факторов или математическое ожидание изучаемой переменной, т.е. x 0 = Z α (в качестве его оценки используют расчетные значения изучаемой переменной Za).

В этой ситуации желательно решить две задачи: во-первых, определить, имеет ли место предполагаемая зависимость, а во-вторых, если зависимость обнаружена, получить оценки с ее учетом. При этом могут использоваться три группы методов. Методы первой группы позволяют работать с гетероскедастичностью, которая за-

дается произвольной непрерывной функцией σ2(·). Для методов второй группы функция σ2(·) должна быть монотонной. В методах третьей группы функция σ2(·)

предполагается известной с точностью до конечного числа параметров.

Примером метода из первой группы является критерий Бартлетта, который заключается в следующем.

Пусть модель оценена и найдены остатки ei, i = 1 ,..., N. Для расчета bc — статистики, лежащей в основе применения этого критерия, все множество наблю- дений делится по какому-либо принципу на k непересекающихся подмножеств. В частности, если требуется выявить, имеется ли зависимость от некоторой пе- ременной yi, то все наблюдения упорядочиваются по возрастанию yi, а затем в соответствии с этим порядком делятся на подмножества. Пусть

Nl — количество элементов в l -м подмножестве,

s 2

 Nl = N;

l =1

l — оценка дисперсии остатков в l -м подмножестве, найденная на основе

остатков ei;

1  Nls 2

bs =

l =1

— отношение средней арифметической дисперсий к сред-

. k

3 2 Nl

.1/ N

l =1

ней геометрической; это отношение в соответствии со свойством мажорантности средних (см. п. 2.2) больше или равно единице, и чем сильнее различаются диспер- сии по подмножествам, тем оно выше.

8.2. Гетероскедастичность ошибок 261

i

s

2

s

s

2 2

1 4

s

2 5

Рис. 8.1

Тогда статистика Бартлетта равна

bc = N

 k

ln bs.

1+ l =1 Nl − N

3(k − 1)

При однородности наблюдений по дисперсии (нулевая гипотеза) эта статистика

распределена как 2

k −1

. Проверка нулевой гипотезы проводится по обычному ал-

горитму.

Если нулевую гипотезу отвергнуть не удалось, т.е. ситуация гомоскедастична, то исходная оценка модели удовлетворительна. Если же нулевая гипотеза отверг- нута, то ситуация гетероскедастична.

Принцип построения статистики Бартлетта иллюстрирует рисунок 8.1.

Классический метод второй группы заключается в следующем. Все наблюдения упорядочиваются по возрастанию некоторой переменной yi. Затем оцениваются две вспомогательные регрессии: по K «малым» и по K «большим» наблюдениям (с целью повышения мощности критерия средние N − 2 K наблюдения в расчете не участвуют, а K можно, например, выбрать равным приблизительно трети N).

Пусть s 2 — остаточная дисперсия в первой из этих регрессий, а s 2 — во второй.

1 2

В случае гомоскедастичности ошибок (нулевая гипотеза) отношение двух дисперсий

распределено как

s 2

2 ∼ FK − n −1 ,K − n −1.

Здесь следует применять обычный F -критерий. Нулевая гипотеза о гомос- кедастичности принимается, если рассчитанная статистика превышает 95%-ный квантиль F -распределения.

262 Глава 8. Нарушение гипотез основной линейной модели

i

s

2

s

2

Рис. 8.2

Такой подход применяется, если ожидается, что дисперсия может быть только по- ложительно коррелирована с переменной yi. Если неизвестно, положительно или отрицательно коррелирована дисперсия с рассматриваемым фактором, то следу- ет отклонять нулевую гипотезу как при больших, так и при малых значениях ста-

s 2

2

тистики s 2

. Можно применить следующий прием: рассчитать статистику как

отношение максимальной из дисперсий s 2

и s 2

к минимальной. Такая статисти-

ка будет иметь усеченное F -распределение, где усечение происходит на уровне медианы, и берется правая половина распределения. Отсюда следует, что для до- стижения, например, 5%-го уровня ошибки, следует взять табличную критиче- скую границу, соответствующую, 2. 5%-му правому хвосту обычного (не усеченного) F -распределения. Если указанная статистика превышает данную границу, то нуле- вая гипотеза о гомоскедастичности отвергается.

Данный метод известен под названием метода Голдфельда—Квандта.

Можно применять упрощенный вариант этого критерия, когда дисперсии s 2 и

s 2 2 2

2 считаются на основе остатков из проверяемой регрессии. При этом s 1 и s 2 не

будут независимы, и их отношение будет иметь F -распределение только прибли-

женно. Этот метод иллюстрирует рисунок 8.2.

Для того чтобы можно было применять методы третьей группы, требуется обладать конкретной информацией о том, какой именно вид имеет гетероскеда- стичность.

Так, например, если остатки прямо пропорциональны значениям фактора (n = 1):

x = z α + β + z ε,

и ε удовлетворяет необходимым гипотезам, то делением обеих частей уравнения на z ситуация возвращается в «штатную»:

x = α + 1 β + ε,

Z Z

8.2. Гетероскедастичность ошибок 263

i

s

2

s

2

Рис. 8.3

в которой, правда, угловой коэффициент и свободный член меняются местами. Тем самым применяется преобразование в пространстве наблюдений такое, что диаго-

нальныеэлементыматрицы D равны1 zi.

Если зависимость дисперсии от других переменных известна не точно, а только с точностью до некоторых неизвестных параметров, то для проверки гомоскеда- стичности следует использовать вспомогательные регрессии.

Так называемый метод Глейзера состоит в следующем. Строится регрессия модулей остатков | ei | на константу и те переменные, которые могут быть коррели- рованными с дисперсией (например, это может быть все множество независимых факторов или какое-то их подмножество). Если регрессия оказывается статисти- чески значимой, то гипотеза гомоскедастичности отвергается.

Построение вспомогательной регрессии от некоторой переменной yi показано на рисунке 8.3.

Другой метод (критерий Годфрея) использует аналогичную вспомогательную регрессию, в которой в качестве зависимой переменной используются квадраты остатков e 2.

Если с помощью какого-либо из перечисленных критериев (или других анало- гичных критериев) проверены различные варианты возможной зависимости и ну- левая гипотеза во всех случаях не была отвергнута, то делается вывод, что ситуа- ция гомоскедастична или гетероскедастична без негативных последствий и что для оценки параметров модели можно использовать обычный МНК. Если же нуле- вая гипотеза отвергнута и поэтому, возможно, имеет место гетероскедастичность с негативными последствиями, то желательно получить более точные оценки, учи- тывающие гетероскедастичность.

Это можно сделать, используя для оценивания обобщенный МНК (см. уравне- ние (8.2)). Соответствующее преобразование в пространстве наблюдений состоит

264 Глава 8. Нарушение гипотез основной линейной модели

в том, чтобы каждое наблюдение умножить на di, т.е. требуется оценить обычным методом наименьших квадратов преобразованную регрессию с переменными diXi и diZi. При этом не следует забывать, что если матрица факторов Z содержит свободный член, то его тоже нужно умножить на di, поэтому вместо свободного члена в регрессии появится переменная вида (d 1 ,..., dN). Это приводит к тому, что стандартные статистические пакеты выдают неверные значения коэффициен- та детерминации и F -статистики. Чтобы этого не происходило, требуется поль- зоваться специализированными процедурами для расчета взвешенной регрессии. Описанный метод получил название взвешенного МНК, поскольку он равнозначен

минимизации взвешенной суммы квадратов остатков

 d 2 e 2.

i i

i =1

Чтобы это можно было осуществить, необходимо каким-то образом получить оценку матрицы D, используемой для преобразования в пространстве наблюдений. Перечисленные в этом параграфе методы дают возможность не только проверить гипотезу об отсутствии гетероскедастичности, но и получить определенные оценки матрицы D (возможно, не очень хорошие).

Если S 2— оценка матрицы σ2Ω, где S 2— диагональная матрица, состав- ленная из оценок дисперсий, то S −1(матрица, обратная к ее квадратному кор- ню) — оценка матрицы σ D.

Так, после проверки гомоскедастичности методом Глейзера в качестве диа-

гональных элементов матрицы S −1 можно взять 1

c, где | ei | c — расчетные

| ei |

значения | ei |. Если используются критерии Бартлетта или Голдфельда—Квандта, то наблюдения разбиваются на группы, для каждой из которых есть оценка дис- персии, s 2. Тогда для этой группы наблюдений в качестве диагональных элементов

матрицы S −1можновзять1 sl.

В методе Голдфельда—Квандта требуется дополнительно получить оценку дис- персии для пропущенной средней части наблюдений. Эту оценку можно получить непосредственно по остаткам пропущенных налюдений или как среднее (s 2 + s 2) / 2.

1 2

Если точный вид гетероскедастичности неизвестен, и, как следствие, взвешенный МНК неприменим, то, по крайней мере, следует скорректировать оценку ковариа- ционной матрицы оценок параметров, оцененных обычным МНК, прежде чем про- верять гипотезы о значимости коэффициентов. (Хотя при использовании обычного МНК оценки будут менее точными, но как уже упоминалось, они будут несмещенны- ми и состоятельными.) Простейший метод коррекции состоит в замене неизвестной

ковариационной матрицы ошибок σ2Ω на ее оценку S 2, где S 2 — диагональная

матрица с типичным элементом e 2 (т.е. квадраты остатков используются как оценки дисперсий). Тогда получается следующая скорректированная оценка ковариацион-

ной матрицы a (оценка Уайта или устойчивая к гетероскедастичности оценка):

(Z r Z)−1 Z r S 2 Z (Z r Z)−1.

8.3. Автокорреляция ошибок 265

1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | 10 | 11 | 12 | 13 | 14 | 15 | 16 | 17 | 18 | 19 |

Поиск по сайту:

Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав. Студалл.Орг (0.175 сек.)

Главная | О проекте | Полезные cсылки | Контакты | Случайная страница