Авто Автоматизация Архитектура Астрономия Аудит Биология Бухгалтерия Военное дело Генетика География Геология Государство Дом Другое Журналистика и СМИ Изобретательство Иностранные языки Информатика Искусство История Компьютеры Кулинария Культура Лексикология Литература Логика Маркетинг Математика Машиностроение Медицина Менеджмент Металлы и Сварка Механика Музыка Население Образование Охрана безопасности жизни Охрана Труда Педагогика Политика Право Приборостроение Программирование Производство Промышленность Психология Радио Регилия Связь Социология Спорт Стандартизация Строительство Технологии Торговля Туризм Физика Физиология Философия Финансы Химия Хозяйство Ценнообразование Черчение Экология Эконометрика Экономика Электроника Юриспунденкция

СЛУЧАЙНОЙ СОСТАВЛЯЮЩЕЙ

Читайте также:

1. ЦЕЛЬ РАБОТЫ

Цель работы заключается в освоении инструментария системы Gretl в области построения и анализа регрессионных моделей с гетероскедастичной случайной составляющей для выявления и последующего применения ранее неизвестных закономерностей в имеющихся данных в процессе подготовки и принятия решений менеджерами компаний.

2. ТЕОРЕТИЧЕСКИЕ СВЕДЕНИЯ

Для регрессионной модели, формула (1), построенной по фактическим данным типа срез данных (cross-sectional) дисперсия случайных отклонений (ошибок) часто представляет собой переменную величину .

, (1)

где y — фактическое значение результативного признака;

- модельное значение результативного признака;

a_i – параметр регрессионной модели;

- признак-фактор;

— случайная ошибка.

Данная ситуация представляет собой проблему гетероскедастичности («неодинакового разброса») - нарушения, возникающего при невыполнении одного из классических предположений линейного регрессионного анализа о постоянстве дисперсий случайных отклонений (гомоскедастичности или «одинакового разброса» ), при этом остальные условия Гаусса-Маркова выполняются:

- математическое ожидание случайной составляющей, М(u_i) =0

- отсутствие автокорреляции остатков (взаимосвязи u_i и u_i_-1).

- случайный характер остатков – их независимость от y_i и x_i.

Случаи гетероскедастичности и гомоскедастичности показаны на рисунках 1 и 2 соответственно.

Рисунок 1 - Иллюстрация случайных данных и модели с гомоскедастичностью остатков

Рисунок 2 - Иллюстрация случайных данных и модели с гетероскедастичностью остатков

Гетероскедастичность приводит к тому, что при применении обычного метода наименьших квадратов (1МНК) полученные параметры модели, формула (1), больше не представляют собой наиболее эффективные оценки или не являются оценками с минимальной дисперсией.

Наблюдение, для которого теоретическое распределение ошибки имеет малое стандартное отклонение, будет обычно находится близко к линии регрессии и, следовательно, может стать хорошим ориентиром, указывающим на место этой линии. В противоположность этому наблюдение, где теоретическое распределение имеет большое стандартное отклонение, не сможет в той же мере помочь в определении местоположения линии регрессии. Обычный МНК не делает различия между качеством наблюдений, придавая одинаковые "веса" каждому из них независимо от того, является ли наблюдение существенным или несущественным для определения местоположения этой линии. Следовательно, обычным МНК мы получим неэффективные оценки коэффициентов.

Также результаты t- и F- тестов будут ненадёжными, т.к. мы получим неверные оценки стандартных ошибок параметров (STDERROR), т.к. они вычисляются на основе предположения о том, что остатки модели гомоскедастичны, что скажется на правильности расчёта t- и F- статистик и приведёт к принятию ошибочных гипотез.

Поскольку в данном случае использование обычного метода наименьших квадратов (1МНК) неэффективно, необходимо сделать поправку на гетероскедастичность, применив взвешенный метод наименьших квадратов ВМНК (WLS) для её устранения.

Построение гетероскедастичной регрессионной модели состоит из двух этапов:

1. Обнаружение гетероскедастичности случайной составляющей,

2. Оценивание модели с использованием взвешенного метода наименьших квадратов (WLS).

На первом этапе в случае однофакторной регрессии изначально проводится графический анализ остатков – строится и анализируется зависимость квадратов ошибок от или от теоретического значения , или строится - диаграмма рассеяния. При множественной регрессии графический анализ также возможен для каждой из объясняющих переменных. Рост дисперсии с ростом одного из факторов свидетельствует о гетероскедастичности.

Затем проводится один из формальных тестов на гетероскедастичность: тест ранговой корреляции Спирмена, тест Парка (The Park test), тест Голдфелда-Квандта (Goldfeld-Quandt test), тест Бреуша-Погана, тест Глейзера, или тест Уайта (White’s test) и осуществляется интерпретация результатов теста.

В каждом тесте пытаются опровергнуть гипотезу о гомоскедастичности, если это удаётся, то можно сделать вывод, что в модели наблюдается гетероскедастичность.

Рассмотрим алгоритм теста Уайта на гетероскедастичность, не требующего нормальности распределения остатков. Алгоритм состоит из следующих шагов:

- Получение остатков оцененной регрессионной модели

- Оценивание вспомогательного уравнения регрессии квадратов остатков относительно комплекса переменных модели, их произведений и их квадратов

- Проверка общей значимости уравнения с помощью критерия . Тестовой статистикой является величина ( - число наблюдений, - коэффициент детерминации). Число степеней свободы равно числу регрессоров вспомогательного уравнения. Если , то нулевая гипотеза гомоскедастичности Ho: отвергается.

На втором этапе для оценки моделей с гетероскедастичностью используется взвешенный метод наименьших квадратов (ВМНК - WLS). Метод ВМНК, как и 1МНК, применим к однофакторной и множественной линейной регрессии и использует то же правило минимизации суммы квадратов остатков, RSS, но вместо одинаковых весов для каждого наблюдения им приписываются значения, обратные соответствующим дисперсиям ошибки, что отражено формулой (2).

, (2)

где - фактическое и модельное i-е значение зависимой переменной;

– вес i-го наблюдения, ;

- дисперсия i-й случайной составляющей.

Тогда коэффициенты линейной регрессии находятся по формуле (3).

, (3)

где W=diag{w₁,…,w_n} - диагональная матрица весов;

n- число наблюдений.

Дисперсия ошибки чаще всего неизвестна, но возможно существование некоторого соотношения между дисперсией ошибки и значением какой-либо объясняющей переменной в регрессионной модели , например, , где с- ненулевая константа и x₁_i - значение объясняющей переменной х₁ в i-ом наблюдении. В случае подобного соотношения можно считать известными, т.к. постоянная величина «c» не влияет на взвешенную процедуру. Тогда значения весов .

1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | 10 | 11 | 12 | 13 | 14 | 15 | 16 | 17 | 18 | 19 | 20 | 21 | 22 | 23 | 24 | 25 | 26 | 27 | 28 |
Поиск по сайту:

Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав. Студалл.Орг (4.373 сек.)

Главная | О проекте | Полезные cсылки | Контакты | Случайная страница