АвтоАвтоматизацияАрхитектураАстрономияАудитБиологияБухгалтерияВоенное делоГенетикаГеографияГеологияГосударствоДомДругоеЖурналистика и СМИИзобретательствоИностранные языкиИнформатикаИскусствоИсторияКомпьютерыКулинарияКультураЛексикологияЛитератураЛогикаМаркетингМатематикаМашиностроениеМедицинаМенеджментМеталлы и СваркаМеханикаМузыкаНаселениеОбразованиеОхрана безопасности жизниОхрана ТрудаПедагогикаПолитикаПравоПриборостроениеПрограммированиеПроизводствоПромышленностьПсихологияРадиоРегилияСвязьСоциологияСпортСтандартизацияСтроительствоТехнологииТорговляТуризмФизикаФизиологияФилософияФинансыХимияХозяйствоЦеннообразованиеЧерчениеЭкологияЭконометрикаЭкономикаЭлектроникаЮриспунденкция

СЛУЧАЙНОЙ СОСТАВЛЯЮЩЕЙ

Читайте также:
  1. Биноминальная случайная величина, ее мат. ожидание и дисперсия. Случаи применения этой случайной величины.
  2. Вопрос 43. Медиана распределения случайной величины
  3. Доказательство того, что дисперсия случайного члена из разбиения случайной величины равно математическому ожиданию квадрата его величины.
  4. Закон и функция распределения дискретной случайной величины
  5. Измерение и интерпретация случайной составляющей.
  6. Математическое ожидание и дисперсия квазиравномерной случайной величины имеют вид
  7. Моделирование сезонной составляющей при помощи фиктивных переменных.
  8. Обсуждения с уклоном в историю кино – возможны акценты на искусствоведческой составляющей кинофильмов и связка с историей искусства, философия кино
  9. Ожидаемое значение случайной переменной, её дисперсия и среднее квадратическое отклонение.
  10. Оценка дисперсии случайной ошибки модели регрессии
  11. Оценка качества ИКТ-составляющей урока
  12. Рассмотрим выполнение предпосылки гомоскедастичности, или равноизменчивости случайной составляющей (возмущения).

1. ЦЕЛЬ РАБОТЫ

 

Цель работы заключается в освоении инструментария системы Gretl в области построения и анализа регрессионных моделей с гетероскедастичной случайной составляющей для выявления и последующего применения ранее неизвестных закономерностей в имеющихся данных в процессе подготовки и принятия решений менеджерами компаний.

 

2. ТЕОРЕТИЧЕСКИЕ СВЕДЕНИЯ

 

Для регрессионной модели, формула (1), построенной по фактическим данным типа срез данных (cross-sectional) дисперсия случайных отклонений (ошибок) часто представляет собой переменную величину .

, (1)

где y фактическое значение результативного признака;

- модельное значение результативного признака;

ai параметр регрессионной модели;

- признак-фактор;

— случайная ошибка.

Данная ситуация представляет собой проблему гетероскедастичности («неодинакового разброса») - нарушения, возникающего при невыполнении одного из классических предположений линейного регрессионного анализа о постоянстве дисперсий случайных отклонений (гомоскедастичности или «одинакового разброса» ), при этом остальные условия Гаусса-Маркова выполняются:

- математическое ожидание случайной составляющей, М(ui) =0

- отсутствие автокорреляции остатков (взаимосвязи ui и ui-1).

- случайный характер остатков – их независимость от yi и xi.

Случаи гетероскедастичности и гомоскедастичности показаны на рисунках 1 и 2 соответственно.

 

Рисунок 1 - Иллюстрация случайных данных и модели с гомоскедастичностью остатков  

 


Рисунок 2 - Иллюстрация случайных данных и модели с гетероскедастичностью остатков  

 


Гетероскедастичность приводит к тому, что при применении обычного метода наименьших квадратов (1МНК) полученные параметры модели, формула (1), больше не представляют собой наиболее эффективные оценки или не являются оценками с минимальной дисперсией.

Наблюдение, для которого теоретическое распределение ошибки имеет малое стандартное отклонение, будет обычно находится близко к линии регрессии и, следовательно, может стать хорошим ориентиром, указывающим на место этой линии. В противоположность этому наблюдение, где теоретическое распределение имеет большое стандартное отклонение, не сможет в той же мере помочь в определении местоположения линии регрессии. Обычный МНК не делает различия между качеством наблюдений, придавая одинаковые "веса" каждому из них независимо от того, является ли наблюдение существенным или несущественным для определения местоположения этой линии. Следовательно, обычным МНК мы получим неэффективные оценки коэффициентов.

Также результаты t- и F- тестов будут ненадёжными, т.к. мы получим неверные оценки стандартных ошибок параметров (STDERROR), т.к. они вычисляются на основе предположения о том, что остатки модели гомоскедастичны, что скажется на правильности расчёта t- и F- статистик и приведёт к принятию ошибочных гипотез.

Поскольку в данном случае использование обычного метода наименьших квадратов (1МНК) неэффективно, необходимо сделать поправку на гетероскедастичность, применив взвешенный метод наименьших квадратов ВМНК (WLS) для её устранения.

 

Построение гетероскедастичной регрессионной модели состоит из двух этапов:

1. Обнаружение гетероскедастичности случайной составляющей,

2. Оценивание модели с использованием взвешенного метода наименьших квадратов (WLS).

На первом этапе в случае однофакторной регрессии изначально проводится графический анализ остатков – строится и анализируется зависимость квадратов ошибок от или от теоретического значения , или строится - диаграмма рассеяния. При множественной регрессии графический анализ также возможен для каждой из объясняющих переменных. Рост дисперсии с ростом одного из факторов свидетельствует о гетероскедастичности.

Затем проводится один из формальных тестов на гетероскедастичность: тест ранговой корреляции Спирмена, тест Парка (The Park test), тест Голдфелда-Квандта (Goldfeld-Quandt test), тест Бреуша-Погана, тест Глейзера, или тест Уайта (White’s test) и осуществляется интерпретация результатов теста.

В каждом тесте пытаются опровергнуть гипотезу о гомоскедастичности, если это удаётся, то можно сделать вывод, что в модели наблюдается гетероскедастичность.

Рассмотрим алгоритм теста Уайта на гетероскедастичность, не требующего нормальности распределения остатков. Алгоритм состоит из следующих шагов:

- Получение остатков оцененной регрессионной модели

- Оценивание вспомогательного уравнения регрессии квадратов остатков относительно комплекса переменных модели, их произведений и их квадратов

- Проверка общей значимости уравнения с помощью критерия . Тестовой статистикой является величина ( - число наблюдений, - коэффициент детерминации). Число степеней свободы равно числу регрессоров вспомогательного уравнения. Если , то нулевая гипотеза гомоскедастичности Ho: отвергается.

На втором этапе для оценки моделей с гетероскедастичностью используется взвешенный метод наименьших квадратов (ВМНК - WLS). Метод ВМНК, как и 1МНК, применим к однофакторной и множественной линейной регрессии и использует то же правило минимизации суммы квадратов остатков, RSS, но вместо одинаковых весов для каждого наблюдения им приписываются значения, обратные соответствующим дисперсиям ошибки, что отражено формулой (2).

, (2)

где - фактическое и модельное i-е значение зависимой переменной;

– вес i-го наблюдения, ;

- дисперсия i-й случайной составляющей.

Тогда коэффициенты линейной регрессии находятся по формуле (3).

 

, (3)

 

где W=diag{w1,…,wn} - диагональная матрица весов;

n- число наблюдений.

Дисперсия ошибки чаще всего неизвестна, но возможно существование некоторого соотношения между дисперсией ошибки и значением какой-либо объясняющей переменной в регрессионной модели , например, , где с- ненулевая константа и x1i - значение объясняющей переменной х1 в i-ом наблюдении. В случае подобного соотношения можно считать известными, т.к. постоянная величина «c» не влияет на взвешенную процедуру. Тогда значения весов .


1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | 10 | 11 | 12 | 13 | 14 | 15 | 16 | 17 | 18 | 19 | 20 | 21 | 22 | 23 | 24 | 25 | 26 | 27 | 28 |

Поиск по сайту:



Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав. Студалл.Орг (0.004 сек.)