|
||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
АвтоАвтоматизацияАрхитектураАстрономияАудитБиологияБухгалтерияВоенное делоГенетикаГеографияГеологияГосударствоДомДругоеЖурналистика и СМИИзобретательствоИностранные языкиИнформатикаИскусствоИсторияКомпьютерыКулинарияКультураЛексикологияЛитератураЛогикаМаркетингМатематикаМашиностроениеМедицинаМенеджментМеталлы и СваркаМеханикаМузыкаНаселениеОбразованиеОхрана безопасности жизниОхрана ТрудаПедагогикаПолитикаПравоПриборостроениеПрограммированиеПроизводствоПромышленностьПсихологияРадиоРегилияСвязьСоциологияСпортСтандартизацияСтроительствоТехнологииТорговляТуризмФизикаФизиологияФилософияФинансыХимияХозяйствоЦеннообразованиеЧерчениеЭкологияЭконометрикаЭкономикаЭлектроникаЮриспунденкция |
Прогнозирование. Пусть получены оценки параметров уравнения (7.11)
Пусть получены оценки параметров уравнения (7.11). Задача прогнозирования заключается в определении возможного значения (прогноза) переменной x, объ- ясняемой этой моделью, при некоторых заданных значениях факторов z, которые не совпадают ни с одним из наблюдений в матрице Z. Более того, как прави- ло, z лежит вне области, представляемой матрицей Z. При этом предполагается, что гипотезы g1 − g3 по-прежнему выполняются. Обычно термин «прогнозирование» используется в случае, когда наблюдения i = 1 ,..., N в матрице Z даны по последовательным моментам (периодам) вре- мени, и заданные значения факторов z, для которых требуется определить прогноз x, относятся к какому-то будущему моменту времени, большему N (т.е. z лежит вне области, представляемой матрицей Z). Методы прогнозирования могут быть различными. Если применяются отно- сительно простые статистические методы, как в данном случае, то часто исполь- зуют термин «экстраполирование». Если аналогичная задача решается для z, лежащих внутри области, представляемой наблюдениями в матрице Z (например, для «пропущенных» по каким-то причинам наблюдений), то используют термин «интерполирование». Процедуры экстраполирования и интерполирования с ис- пользованием модели (7.11) с формальной точки зрения одинаковы. Итак, задан некоторый zr = [ zr 1 ··· zrn 1], который отличается от всех zi, i = 1 ,..., N (если i — обозначает момент времени, то r > N). xr = zr α + ε r — истинное значение искомой величины,
Предполагаем, что гипотезы g1 − g4 выполнены как для i = 1 ,..., N, так и для r > N. Это линейный (относительно случайных величин X) прогноз: xp (7. 26) z LX, r = r он не смещен относительно ожидаемого значения вслед за несмещенностью a: E (xp) = x 0. Его ошибка ε p = xr − xp имеет нулевое математическое ожидание r r r r и дисперсию
2 1+ zr. Z t Z. −1
7.4. Прогнозирование 245 которая минимальна на множестве всех возможных линейных несмещенных про- гнозов.
r = zr (α − a)+ ε r. Поскольку случайные величины a и ε r не зависят друг от друга, σ2 p 2. r r 2 p = E. (ε r) = E (zr (α − a)(α − a) zr)+ E. ε r. = = zrMaz r+ σ2 (7. 29)
zr (Z r Z)−1 z r. r 1+ r
Эта дисперсия минимальна среди всех возможных дисперсий линейных несмещен- ных прогнозов вслед за аналогичным свойством оценок a. Это является прямым следствием того, что оценки МНК относятся к классу BLUE. Для того чтобы в этом убедиться, достаточно в доказательстве данного свойства оценок a, которое приве- дено в п. 7.2, заменить c rна zr.
i i ожидание, но принципиально другую, существенно меньшую, дисперсию:
2 1 − zi. Z t Z. −1 t
a и ε i коррелированы и поэтому:
2 1+ zi (Z r Z)−1 r
(7. 27) = − L ε g4 где oi — i -йорт =
i i i
Структуру дисперсии ошибки прогноза (7.63) можно пояснить на примере n = 1. В этом случае (используются обозначения исходной формы уравнения ре- грессии, и все z — одномерные величины): . σ2 2 1 (zr − z ¯)2.
1+ + N z ˆ2 . (7.64)
246 Глава 7. Основная модель линейной регрессии
В этом легко убедиться, если перейти к обозначениям исходной формы урав- нения регрессии, подставить в (7.63) вместо zr и Z, соответственно,. zr 1. и. Z 1 N. и сделать необходимые преобразования (правило обращения матрицы (2 × 2) см. в Приложении A.1.2), учитывая, что −1 ξ ξ 1 ξ −ξ 1 2 = 4
2 и Z r Z = z ˆ2 + N z ¯2: ξ3 ξ4 −ξ3 ξ1
−1 σ2 2 .. Z r Z N z ¯ zr = p = σ 1+
zr 1 N z ¯ N 1
= σ21+ 1. . 1 z ¯
r = Z r Z − N z ¯ zr 1 . 2 1 − z ¯ 1 Z r Z 1
= σ2 zr − 2 z ¯ zr + N. z ˆ i + N z ¯
= σ2 1 1+ + N ( zr − z ¯).
Что и требовалось доказать.
Это выражение показывает «вклады» в дисперсию ошибки прогноза собствен- но остаточной дисперсии, ошибки оценки свободного члена и ошибки оценки угло- вого коэффициента. Первые две составляющие постоянны и не зависят от горизон- та прогнозирования, т.е. от того, насколько сильно условия прогноза (в частности, значение zr) отличаются от условий, в которых построена модель (в частности, значение z ¯). Третья составляющая — ошибка оценки углового коэффициента — определяет расширяющийся конус ошибки прогноза. Мы рассмотрели точечный прогноз. Если дополнительно к гипотезам g1 − g4 предположить выполнение гипотезы g5 для i = 1 ,..., N и для r > N, то можно построить также интервальный прогноз. По формуле (7.27) ошибка прогноза имеет вид:
Таким образом, она имеет нормальное распределение: ε p p 2 r = xr − xr ∼ N (0, σ p). Если бы дисперсия ошибки σ2была известна, то на основе того, что xr − xp r σ p ∼ N (0, 1),
7.5. Упражнения и задачи 247 для xr можно было бы построить (1 − θ)100-процентный прогнозный интервал: Таблица 7.1 xr ∈ [ xp ± σ p εˆ1 θ].
2 2 t −1 t Вместо неизвестной дисперсии σ p = σ берется несмещенная оценка (1+ zr (Z Z) zr) s 2 2 t −1 t p = s ˆ e (1 + zr (Z Z) zr). По аналогии с (7.44) можно вывести, что xr − xp r sp ∼ tN − n −1. Тогда в приведенной формуле прогнозного интервала необ- ходимо заменить σ p на sp и εˆ1−θна t ˆ N − n −1, 1−θ: xr ∈. p.. xr ± spt ˆ N − n −1, 1−θ
Поиск по сайту: |
Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав. Студалл.Орг (0.017 сек.) |