АвтоАвтоматизацияАрхитектураАстрономияАудитБиологияБухгалтерияВоенное делоГенетикаГеографияГеологияГосударствоДомДругоеЖурналистика и СМИИзобретательствоИностранные языкиИнформатикаИскусствоИсторияКомпьютерыКулинарияКультураЛексикологияЛитератураЛогикаМаркетингМатематикаМашиностроениеМедицинаМенеджментМеталлы и СваркаМеханикаМузыкаНаселениеОбразованиеОхрана безопасности жизниОхрана ТрудаПедагогикаПолитикаПравоПриборостроениеПрограммированиеПроизводствоПромышленностьПсихологияРадиоРегилияСвязьСоциологияСпортСтандартизацияСтроительствоТехнологииТорговляТуризмФизикаФизиологияФилософияФинансыХимияХозяйствоЦеннообразованиеЧерчениеЭкологияЭконометрикаЭкономикаЭлектроникаЮриспунденкция

Гетероскедастичность ошибок

Читайте также:
  1. Автокорреляция ошибок
  2. ЕСЛИ РОДИТЕЛИ НЕ ПРИЕМЛЮТ ОШИБОК
  3. Издержки ошибок в гражданских делах
  4. Источники ошибок в логических рассуждениях
  5. Как уменьшить вероятность ошибок?
  6. Классификация ошибок руководителей
  7. Классы istream, ostream, iostream и _withassign. Предопределенные потоковые объекты. Флаги статуса ошибок потоков, функции для флагов ошибок.
  8. Контроль за усвоением знаний, умений и навыков по русскому языку: организационные формы, критерии орфографической и пунктуационной грамотности, условные обозначения ошибок.
  9. Критерии оценки контрольной работы и порядок исправления ошибок.
  10. Методы исправления ошибок в первичных документах и учетных регистрах
  11. МЕТОДЫ ОБНАРУЖЕНИЯ ОШИБОК

 

Пусть ошибки не коррелированы по наблюдениям, и матрица Ω (а вслед за ней и матрица D) диагональна. Если эта матрица единична, т.е. дисперсии ошибок


 

 

8.2. Гетероскедастичность ошибок 259

одинаковы по наблюдениям (гипотеза g4 не нарушена), то имеет место гомос- кедастичность или однородность ошибок по дисперсии — «штатная» ситуация. В противном случае констатируют гетероскедастичность ошибок или их неодно- родность по дисперсии.

i
Пусть vari) = σ2— дисперсия ошибки i -го наблюдения. Гомоскедастич-


i
ность означает, что все числа σ2


одинаковы, а гетероскедастичность — что среди


них есть несовпадающие.

Факт неоднородности остатков по дисперсии мало сказывается на качестве оце- нок регрессии, если эти дисперсии не коррелированы с независимыми факторами. Это — случай гетероскедастичности «без негативных последствий».

 

Данное утверждение можно проиллюстрировать в случае, когда в матрице Z все- го один столбец, т.е. n = 1 и свободный член отсутствует. Тогда формула (7.33) приобретает вид:

 σ2 2 


E (s 2) = 1


 σ2


i zi

i.


e N


i −  z 2


i i i

 

i
Если ситуация штатная и σ2= σ2, то правая часть этой формулы преобразуется к ви-


ду N − 1 σ2, и N s 2


оказывается несмещенной оценкой σ2, как и было пока-


N N − 1 e


1


i
зано в параграфе 7.2. Если σ i и zi не коррелированы, то, обозначив σ2=

N

можно утверждать, что


σ2,

i


 σ2 2


2 2


i z, i σ

z
i  2 ≈

i

i


z, i

z = σ,
i 2 2

i

i


т.е. ситуация остается прежней. И только если σ i и zi положительно (или отрица- тельно) коррелированы, факт гетероскедастичности имеет негативные последствия.

σ2 2


Действительно, в случае положительной корреляции


i zi

z
 2

i


> σ2 и, следова-


тельно, E


N 2

s
N − 1 e


< σ2. Обычная «несмещенная» оценка остаточной диспер-


сии оказывается по математическому ожиданию меньше действительного значе-

ния остаточной дисперсии, т.е. она (оценка остаточной дисперсии) дает основания для неоправданно оптимистичных заключений о качестве полученной оценки модели.

 

Следует заметить, что факт зависимости дисперсий ошибок от независимых факторов в экономике весьма распространен. В экономике одинаковыми по диспер-

сии скорее являются относительные (ε z), а не абсолютные (ε)ошибки. Поэтому,

когда оценивается модель на основе данных по предприятиям, которые могут иметь


 

 

260 Глава 8. Нарушение гипотез основной линейной модели

 

и, как правило, имеют различные масштабы, гетероскедастичности с негативными последствиями просто не может не быть.

Если имеет место гетероскедастичность, то, как правило, дисперсия ошибки связана с одной или несколькими переменными, в первую очередь — с факторами регрессии. Пусть, например, дисперсия может зависеть от некоторой перемен- ной yi, которая не является константой:

 


σ2
i = σ2


(yi), i = 1 ,..., N.


 

 

Как правило, в качестве переменной yi берется один из независимых факторов или математическое ожидание изучаемой переменной, т.е. x 0 = Z α (в качестве его оценки используют расчетные значения изучаемой переменной Za).

В этой ситуации желательно решить две задачи: во-первых, определить, имеет ли место предполагаемая зависимость, а во-вторых, если зависимость обнаружена, получить оценки с ее учетом. При этом могут использоваться три группы методов. Методы первой группы позволяют работать с гетероскедастичностью, которая за-

дается произвольной непрерывной функцией σ2(·). Для методов второй группы функция σ2(·) должна быть монотонной. В методах третьей группы функция σ2(·)

предполагается известной с точностью до конечного числа параметров.

Примером метода из первой группы является критерий Бартлетта, который заключается в следующем.

Пусть модель оценена и найдены остатки ei, i = 1 ,..., N. Для расчета bc — статистики, лежащей в основе применения этого критерия, все множество наблю- дений делится по какому-либо принципу на k непересекающихся подмножеств. В частности, если требуется выявить, имеется ли зависимость от некоторой пе- ременной yi, то все наблюдения упорядочиваются по возрастанию yi, а затем в соответствии с этим порядком делятся на подмножества. Пусть

k


Nl — количество элементов в l -м подмножестве,

s 2


Nl = N;

l =1


l — оценка дисперсии остатков в l -м подмножестве, найденная на основе

остатков ei;

k

1  Nls 2


bs =


N

l =1


l

— отношение средней арифметической дисперсий к сред-


. k

s
3 2 Nl

l


.1/ N


l =1

ней геометрической; это отношение в соответствии со свойством мажорантности средних (см. п. 2.2) больше или равно единице, и чем сильнее различаются диспер- сии по подмножествам, тем оно выше.


 

 

8.2. Гетероскедастичность ошибок 261

e
2

i

 

 

s
2

s
s
2 2

1 4

s
2

s
2 5

Yi

 

 

Рис. 8.1

 

 


Тогда статистика Бартлетта равна

bc = N

k


 

11


 

ln bs.


1+ l =1 NlN

3(k − 1)

 

При однородности наблюдений по дисперсии (нулевая гипотеза) эта статистика


χ
распределена как 2

k −1


. Проверка нулевой гипотезы проводится по обычному ал-


горитму.

Если нулевую гипотезу отвергнуть не удалось, т.е. ситуация гомоскедастична, то исходная оценка модели удовлетворительна. Если же нулевая гипотеза отверг- нута, то ситуация гетероскедастична.

Принцип построения статистики Бартлетта иллюстрирует рисунок 8.1.

Классический метод второй группы заключается в следующем. Все наблюдения упорядочиваются по возрастанию некоторой переменной yi. Затем оцениваются две вспомогательные регрессии: по K «малым» и по K «большим» наблюдениям (с целью повышения мощности критерия средние N − 2 K наблюдения в расчете не участвуют, а K можно, например, выбрать равным приблизительно трети N).

Пусть s 2 — остаточная дисперсия в первой из этих регрессий, а s 2 — во второй.

1 2

В случае гомоскедастичности ошибок (нулевая гипотеза) отношение двух дисперсий

распределено как

 

2
s 2

s
2 ∼ FKn −1 ,Kn −1.

 

Здесь следует применять обычный F -критерий. Нулевая гипотеза о гомос- кедастичности принимается, если рассчитанная статистика превышает 95%-ный квантиль F -распределения.


 

 

262 Глава 8. Нарушение гипотез основной линейной модели

 

e
2

i

 

 

s
2

 

s
2

Yi

 

 

Рис. 8.2

 

 

Такой подход применяется, если ожидается, что дисперсия может быть только по- ложительно коррелирована с переменной yi. Если неизвестно, положительно или отрицательно коррелирована дисперсия с рассматриваемым фактором, то следу- ет отклонять нулевую гипотезу как при больших, так и при малых значениях ста-


s 2
2
тистики s 2


. Можно применить следующий прием: рассчитать статистику как


 
отношение максимальной из дисперсий s 2


и s 2


к минимальной. Такая статисти-


 
ка будет иметь усеченное F -распределение, где усечение происходит на уровне медианы, и берется правая половина распределения. Отсюда следует, что для до- стижения, например, 5%-го уровня ошибки, следует взять табличную критиче- скую границу, соответствующую, 2. 5%-му правому хвосту обычного (не усеченного) F -распределения. Если указанная статистика превышает данную границу, то нуле- вая гипотеза о гомоскедастичности отвергается.

 

Данный метод известен под названием метода Голдфельда—Квандта.

 
Можно применять упрощенный вариант этого критерия, когда дисперсии s 2 и

s 2 2 2

2 считаются на основе остатков из проверяемой регрессии. При этом s 1 и s 2 не

будут независимы, и их отношение будет иметь F -распределение только прибли-

женно. Этот метод иллюстрирует рисунок 8.2.

Для того чтобы можно было применять методы третьей группы, требуется обладать конкретной информацией о том, какой именно вид имеет гетероскеда- стичность.

 

Так, например, если остатки прямо пропорциональны значениям фактора (n = 1):

x = z α + β + z ε,

и ε удовлетворяет необходимым гипотезам, то делением обеих частей уравнения на z ситуация возвращается в «штатную»:

x = α + 1 β + ε,

Z Z


 

 

8.2. Гетероскедастичность ошибок 263

e
2

i

 

 

s
2

 

s
2

Yi

 

 

Рис. 8.3

 

 

в которой, правда, угловой коэффициент и свободный член меняются местами. Тем самым применяется преобразование в пространстве наблюдений такое, что диаго-

нальныеэлементыматрицы D равны1 zi.

 

Если зависимость дисперсии от других переменных известна не точно, а только с точностью до некоторых неизвестных параметров, то для проверки гомоскеда- стичности следует использовать вспомогательные регрессии.

Так называемый метод Глейзера состоит в следующем. Строится регрессия модулей остатков | ei | на константу и те переменные, которые могут быть коррели- рованными с дисперсией (например, это может быть все множество независимых факторов или какое-то их подмножество). Если регрессия оказывается статисти- чески значимой, то гипотеза гомоскедастичности отвергается.

Построение вспомогательной регрессии от некоторой переменной yi показано на рисунке 8.3.

i
Другой метод (критерий Годфрея) использует аналогичную вспомогательную регрессию, в которой в качестве зависимой переменной используются квадраты остатков e 2.

Если с помощью какого-либо из перечисленных критериев (или других анало- гичных критериев) проверены различные варианты возможной зависимости и ну- левая гипотеза во всех случаях не была отвергнута, то делается вывод, что ситуа- ция гомоскедастична или гетероскедастична без негативных последствий и что для оценки параметров модели можно использовать обычный МНК. Если же нуле- вая гипотеза отвергнута и поэтому, возможно, имеет место гетероскедастичность с негативными последствиями, то желательно получить более точные оценки, учи- тывающие гетероскедастичность.

Это можно сделать, используя для оценивания обобщенный МНК (см. уравне- ние (8.2)). Соответствующее преобразование в пространстве наблюдений состоит


 

 

264 Глава 8. Нарушение гипотез основной линейной модели

 

в том, чтобы каждое наблюдение умножить на di, т.е. требуется оценить обычным методом наименьших квадратов преобразованную регрессию с переменными diXi и diZi. При этом не следует забывать, что если матрица факторов Z содержит свободный член, то его тоже нужно умножить на di, поэтому вместо свободного члена в регрессии появится переменная вида (d 1 ,..., dN). Это приводит к тому, что стандартные статистические пакеты выдают неверные значения коэффициен- та детерминации и F -статистики. Чтобы этого не происходило, требуется поль- зоваться специализированными процедурами для расчета взвешенной регрессии. Описанный метод получил название взвешенного МНК, поскольку он равнозначен

N


минимизации взвешенной суммы квадратов остатков


d 2 e 2.


i i

i =1

Чтобы это можно было осуществить, необходимо каким-то образом получить оценку матрицы D, используемой для преобразования в пространстве наблюдений. Перечисленные в этом параграфе методы дают возможность не только проверить гипотезу об отсутствии гетероскедастичности, но и получить определенные оценки матрицы D (возможно, не очень хорошие).

Если S 2— оценка матрицы σ2Ω, где S 2— диагональная матрица, состав- ленная из оценок дисперсий, то S −1(матрица, обратная к ее квадратному кор- ню) — оценка матрицы σ D.

Так, после проверки гомоскедастичности методом Глейзера в качестве диа-


гональных элементов матрицы S −1 можно взять 1


c, где | ei | c — расчетные


| ei |

l
значения | ei |. Если используются критерии Бартлетта или Голдфельда—Квандта, то наблюдения разбиваются на группы, для каждой из которых есть оценка дис- персии, s 2. Тогда для этой группы наблюдений в качестве диагональных элементов

матрицы S −1можновзять1 sl.

В методе Голдфельда—Квандта требуется дополнительно получить оценку дис- персии для пропущенной средней части наблюдений. Эту оценку можно получить непосредственно по остаткам пропущенных налюдений или как среднее (s 2 + s 2) / 2.

1 2

 

Если точный вид гетероскедастичности неизвестен, и, как следствие, взвешенный МНК неприменим, то, по крайней мере, следует скорректировать оценку ковариа- ционной матрицы оценок параметров, оцененных обычным МНК, прежде чем про- верять гипотезы о значимости коэффициентов. (Хотя при использовании обычного МНК оценки будут менее точными, но как уже упоминалось, они будут несмещенны- ми и состоятельными.) Простейший метод коррекции состоит в замене неизвестной

ковариационной матрицы ошибок σ2Ω на ее оценку S 2, где S 2 — диагональная

i
матрица с типичным элементом e 2 (т.е. квадраты остатков используются как оценки дисперсий). Тогда получается следующая скорректированная оценка ковариацион-

ной матрицы a (оценка Уайта или устойчивая к гетероскедастичности оценка):

(Z r Z)−1 Z r S 2 Z (Z r Z)−1.


 

 

8.3. Автокорреляция ошибок 265

 


1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | 10 | 11 | 12 | 13 | 14 | 15 | 16 | 17 | 18 | 19 |

Поиск по сайту:



Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав. Студалл.Орг (0.03 сек.)