|
|||||||
АвтоАвтоматизацияАрхитектураАстрономияАудитБиологияБухгалтерияВоенное делоГенетикаГеографияГеологияГосударствоДомДругоеЖурналистика и СМИИзобретательствоИностранные языкиИнформатикаИскусствоИсторияКомпьютерыКулинарияКультураЛексикологияЛитератураЛогикаМаркетингМатематикаМашиностроениеМедицинаМенеджментМеталлы и СваркаМеханикаМузыкаНаселениеОбразованиеОхрана безопасности жизниОхрана ТрудаПедагогикаПолитикаПравоПриборостроениеПрограммированиеПроизводствоПромышленностьПсихологияРадиоРегилияСвязьСоциологияСпортСтандартизацияСтроительствоТехнологииТорговляТуризмФизикаФизиологияФилософияФинансыХимияХозяйствоЦеннообразованиеЧерчениеЭкологияЭконометрикаЭкономикаЭлектроникаЮриспунденкция |
Оценка точности прогноза на основе уравнения многофакторной линейной регрессииОсновные этапы в построении прогнозов зависимой переменной на основе факторной регрессионной модели могут быть представлены следующей последовательностью шагов: а) вне рамок модели получают прогноз значений всех предопределенных переменных (в том числе независимых, «прогноз» времени, если оно входит в число независимых переменных, лаговых переменных и т.п.), в дальнейшем вектор прогнозных значений предопределенных переменных обозначим как хр; б) осуществляется точечный прогноз среднего значения зависимой переменной по уравнению регрессии (4), исходя из результатов его оценивания:
в) с заданной надежностью строиться доверительный интервал прогноза зависимой переменной y(xp). Построение доверительного интервала прогноза существенно зависит и определяется свойствами распределения случайных отклонений Правомерное использование метода наименьших квадратов возможно лишь в условиях безусловного выполнения ряда обязательных предположений относительно 1) математическое ожидание отклонений М 2) отклонения некоррелированы (свойство взаимной некоррелированности остатков): M 3) отклонения имеют одинаковую конечную дисперсию (свойство гомоскедастичности остатков): D Гипотезы 2 и 3 иногда формулируют как единое требование Кроме того, дополнительно предполагается линейная независимость столбцов матрицы независимых переменных (свойство отсутствия мультиколлинеарности столбцов матрицы Х), т.е. 4) (X 1, X 2, …, Xm) – неслучайные (детерминированные) переменные; 5) rangZ= m +1<< n, где
В общей матричной форме уравнения регрессии и ограничения КЛММР иногда называют условиями Гаусса-Маркова [] и выглядят они следующим образом: (14) где Y = (y 1, y 2, …, yn)T – вектор-столбец наблюдений эндогенной переменной; a = (a 0, a 1, …, am)T – вектор-столбец неизвестных значений параметров; ε = (ε 1, ε 1, …, εn)T – вектор-столбец регрессионных остатков; 0 n = (0, 0, …, 0)T – вектор-столбец, состоящий из n нулей; cov(ε) – матрица коэффициентов ковариации регрессионных остатков; E n – единичная матрица размерности n Выполнение этих условий гарантирует у параметров уравнения регрессии, полученных с помощью МНК наличия следующих определяющих характеристик: свойства несмещенности, эффективности в классе линейных относительно Y несмещенных оценок, а также состоятельности при условии, что наименьшее собственное значение матрицы XTX стремится к бесконечности с неограниченным увеличением объема выборки. Напомним следующие важные для дальнейших рассуждений определения. 1. Оценка a параметра α называется несмещенной, если ее математическое ожидание равно этому параметру: M 2. Оценка называется состоятельной, если по мере роста числа наблюдений она сходится по вероятности к оцениваемому параметру, т.е. если для любого сколь угодно малого ξ > 0 справедливо предельное неравенство: 3. Эффективности, т.е. в классе линейных несмещенных оценок любая другая оценка параметра ЛММР будет иметь большую дисперсию. Иначе говоря, оценка а* называется эффективной оценкой параметра а в классе оценок А, если ее дисперсия является минимальной среди оценок этого класса: Dа* = Покажем наличие у оценок МНК указанных свойств в соответствующих предположениях относительно распределения остатков объясняемой переменной. Докажем несмещенность оценок МНК, для чего вычислим математическое ожидание оценок
Таким образом, оцененные значения параметров уравнения регрессии в точности совпали с их истинными значениями, следовательно, оценки оказались несмещенными. Для доказательства состоятельностиоценок вычислим их дисперсию, т.е. вектор Отдельно рассмотрим выражение М(
Истинное значение параметра s 2 неизвестно. Однако его несмещенной оценкой s2 является средний квадрат отклонений значений y от регрессии, т.е.:
Эта формула доказывается, например, в [3]. Знаменатель формулы (17) представляет собой число степеней свободы: количество наблюдений, уменьшенное на число оцениваемых параметров. Величина s называется стандартной ошибкой оценки параметра уравнения регрессии. Таким образом, окончательно получили
Диагональные элементы матрицы ковариаций оценок выражения (18) есть не что иное, как дисперсии свободного члена и коэффициентов уравнения регрессии. Это важный дополнительный факт для построения доверительных интервалов параметров факторной модели. Кроме того, из соотношения (18) очевидно, что свойство состоятельности оценок (3), полученных с помощью МНК, выполнено. Доказательство эффективности оценок подтверждается теоремой Гаусса-Маркова [39]. Сформулируем ее содержание. Если выполняются следующие три предположения: 1. 2. Z - детерминированная размерностью 3. Тогда оценка некоторого вектора параметров Проведем доказательство. Для простоты рассуждений введём следующее промежуточное обозначение, пусть Любую другую линейную оценку вектора параметров Для проведения дальнейших рассуждений здесь примем за основу следующие уже доказанные факты: 1. Из свойства несмещенности оценок, полученных с помощью МНК, имеем 2. Из следствия свойства состоятельности оценок, полученных с помощью МНК, имеем 3. Кроме того, очевидным является следующее утверждение, если Из условий несмещённости
Таким образом, очевидно для наличия у вектора a* свойства несмещенности необходимо, чтобы выполнялось следующее равенство Оценим ковариацию параметров a*, для чего воспользуемся промежуточной выкладкой, а именно:
Тогда = Что означает выполнение следующего равенства
Установленный факт являются доказательством утверждения о том, что в классе линейных по вектору Найдем теперь окончательно доверительный интервал, в котором с заданной надежностью будет находиться фактическое значение прогнозируемой зависимой переменной у(хр). Как уже ранее было показано разброс этого значения будет определяться двумя случайными величинами: - разбросом значения - случайным отклонением Итак, Оценку Используя соотношение (4) имеем: Отсюда получаем общую оценку дисперсии прогноза, построенного на факторной регрессионной модели:
Обозначив стандартную ошибку прогноза, как
Окончательно, доверительный интервал значения у(хр) с надежностью 100(1-q)% можно определить по формуле:
где t 1- q - 100(1-q)% процентиль (табличное значение) распределения Стьюдента с n=n-m- 1 степенями свободы. Получение фактической оценки ширины доверительного интервала прогноза на ЛММР с помощью соотношения (20) позволяет достаточно детально и комплексно решать задачу определения заданных требований к качеству прогноза. Как известно, с увеличением n значение t 1- q уменьшается, поэтому при увеличении числа наблюдений n доверительный интервал сужается. На величину этого интервала влияет и хр. При этом лишь качественно можно утверждать, что при удалении хр от Зная общий вид величины доверительного интервала прогноза (20) в рамках ЛММР, не трудно вывести формулу доверительного интервала трендовой модели заданного вида. Понятно, что при этом матрица экзогенных переменных примет вид: Для прогнозирования на основе модели линейного тренда доверительный интервал определяется по формуле
где n+L - время, на которое осуществляется прогнозный расчет, т.е. L – период упреждения прогноза; n – длина ретроспективного периода; s - среднее квадратическое отклонение фактических наблюдений от расчетных значений y.
Поиск по сайту: |
Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав. Студалл.Орг (0.01 сек.) |