АвтоАвтоматизацияАрхитектураАстрономияАудитБиологияБухгалтерияВоенное делоГенетикаГеографияГеологияГосударствоДомДругоеЖурналистика и СМИИзобретательствоИностранные языкиИнформатикаИскусствоИсторияКомпьютерыКулинарияКультураЛексикологияЛитератураЛогикаМаркетингМатематикаМашиностроениеМедицинаМенеджментМеталлы и СваркаМеханикаМузыкаНаселениеОбразованиеОхрана безопасности жизниОхрана ТрудаПедагогикаПолитикаПравоПриборостроениеПрограммированиеПроизводствоПромышленностьПсихологияРадиоРегилияСвязьСоциологияСпортСтандартизацияСтроительствоТехнологииТорговляТуризмФизикаФизиологияФилософияФинансыХимияХозяйствоЦеннообразованиеЧерчениеЭкологияЭконометрикаЭкономикаЭлектроникаЮриспунденкция
|
Для нижней группы
ВЫВОД ИТОГОВ
|
|
|
|
|
|
|
|
|
|
|
| Регрессионная статистика
|
|
|
|
| Множественный R
| 0,964861689
|
|
|
|
| R-квадрат
| 0,930958079
|
|
|
|
| Нормированный R-квадрат
| 0,913697599
|
|
|
|
| Стандартная ошибка
| 8,389255527
|
|
|
|
| Наблюдения
|
|
|
|
|
|
|
|
|
|
|
| Дисперсионный анализ
|
|
|
|
|
| df
| SS
| MS
| F
| Значимость F
| Регрессия
|
| 3795,982
| 3795,982
| 53,93582
| 0,00183
| Остаток
|
| 281,5184
| 70,37961
|
|
| Итого
|
| 4077,5
|
|
|
|
|
|
|
|
|
|
| Коэффициенты
| Стандартная ошибка
| t-статистика
| P-Значение
| Нижние 95%
| Y-пересечение
| -8,661290323
| 8,753454
| -0,98947
| 0,378445
| -32,9648
| Переменная X 1
| 3,622119816
| 0,493201
| 7,344101
| 0,00183
| 2,252774
| .
Расчетное значение теста получается как отношение большей остаточной дисперсии к меньшей. . Критической значение теста получаем по функции FРАСПОБР, в которой число степеней свободы равно
, в данном случае оно равно 6,59. Поскольку расчетное значение больше критического, остатки признаются гетерокедастичными.
3) Применим тест Уайта, чтобы количественно оценить зависимость дисперсии остатков от значений фактора x.
В эконометрических исследованиях достаточно часто выдвигается гипотезы о том, что
· остатки пропорциональны значениям фактора x: ;
· дисперсия остатков прямопропорциональна самим значениям x, т.е. ;
· зависимость между дисперсией остатков и значениями фактора x квадратичная .
Параметры этих регрессии можно найти МНК. Составим расчетную таблицу.
x
| y
|
| Остатки
|
|
|
| 9,165277
| 2,834723
| 8,035654487
|
|
| 12,39552
| 0,604484
| 0,365400906
|
|
| 15,62576
| 4,374245
| 19,13401932
|
|
| 22,08623
| -3,086233
| 9,52483413
|
|
| 25,31647
| 5,683528
| 32,30249053
|
|
| 31,77695
| -7,77695
| 60,4809513
|
|
| 35,00719
| 5,992811
| 35,91378368
|
|
| 38,23743
| -10,237428
| 104,8049321
|
|
| 47,92815
| 4,071855
| 16,58000314
|
|
| 64,07934
| -9,07934
| 82,43441484
|
|
| 96,38173
| 6,61827
| 43,80149779
| Для регрессии пользуемся Сервис/Анализ данных/Регрессия/…Поставить флажок «Константа-нуль».
Получаем протокол
ВЫВОД ИТОГОВ
|
|
|
|
|
|
|
|
|
|
|
| Регрессионная статистика
|
|
|
|
| Множественный R
| 0,304158793
|
|
|
|
| R-квадрат
| 0,092512571
|
|
|
|
| Нормированный R-квадрат
| -0,01859854
|
|
|
|
| Стандартная ошибка
| 6,104515756
|
|
|
|
| Наблюдения
|
|
|
|
|
|
|
|
|
|
|
| Дисперсионный анализ
|
|
|
|
|
| df
| SS
| MS
| F
| Значимость F
| Регрессия
|
| 34,19047
| 34,19047084
| 0,917493
| 0,366182
| Остаток
|
| 335,386
| 37,26511262
|
|
| Итого
|
| 369,5765
|
|
|
|
|
|
|
|
|
|
| Коэффициенты
| Стандартная ошибка
| t-статистика
| P-Значение
|
| Y-пересечение
|
| #Н/Д
| #Н/Д
| #Н/Д
|
| Переменная X
| -0,172201879
| 0,179778
| -0,957858421
| 0,363156
|
|
Результат неудовлетворительный, коэффициент детерминации всего 0,09.
Аналогично строим регрессию , взяв в качестве входного интервала Y столбец . Получаем протокол
ВЫВОД ИТОГОВ
|
|
|
|
|
|
|
|
|
|
|
| Регрессионная статистика
|
|
|
|
| Множественный R
| 0,864535947
|
|
|
|
| R-квадрат
| 0,747422404
|
|
|
|
| Нормированный R-квадрат
| 0,636311293
|
|
|
|
| Стандартная ошибка
| 26,25750385
|
|
|
|
| Наблюдения
|
|
|
|
|
|
|
|
|
|
|
| Дисперсионный анализ
|
|
|
|
|
| df
| SS
| MS
| F
| Значимость F
| Регрессия
|
| 18362,0291
| 18362,0291
| 26,632614
| 0,000862939
| Остаток
|
| 6205,108576
| 689,4565085
|
|
| Итого
|
| 24567,13768
|
|
|
|
|
|
|
|
|
|
| Коэффициенты
| Стандартная ошибка
| t-статистика
| P-Значение
|
| Y-пересечение
|
| #Н/Д
| #Н/Д
| #Н/Д
|
| Переменная X 1
| 3,990668767
| 0,773283573
| 5,160679613
| 0,0005945
|
|
В данном уравнении достаточная степень детерминации – 0,74, кроме того значимость по критерию Фишера не превосходит допустимые 5% ошибки в расчетах. Принимаем гипотезу о том, что дисперсия остатков прямопропорциональна самим значениям x.
Для проверки гипотезы о квадратичной зависимости решают методом определителей систему уравнений (см. ЛР Нелинейная регрессия):

Определяют индекс корреляции . О наличии или отсутствии гетерокедастичности судят по величине F -критерия Фишера для функции , . При выполнении условия имеет место гетерокедастичность остатков и количественно она выражена значением . По данному расчету предположение о квадратичной зависимости дисперсии остатков от значений x не проверяем (поскольку принята гипотеза ).
5) Улучшим модель, смягчив гетерокедастичность, пользуясь обобщенным методом наименьших квадратов. Если , тогда сами остатки пропорциональны .
Чтобы избавиться от этого, разделим уравнение линейной регрессии на . Получим преобразованное уравнение регрессии, в котором можно сделать замену переменной:
. Пусть , , . Тогда .
Построим вспомогательную таблицу
x
| y
| X
| z
| Y
|
|
| 1,732051
| 0,577350269
| 6,92820323
|
|
|
| 0,5
| 6,5
|
|
| 2,236068
| 0,447213595
| 8,94427191
|
|
| 2,645751
| 0,377964473
| 7,181324987
|
|
| 2,828427
| 0,353553391
| 10,96015511
|
|
| 3,162278
| 0,316227766
| 7,589466384
|
|
| 3,316625
| 0,301511345
| 12,36196513
|
|
| 3,464102
| 0,288675135
| 8,082903769
|
|
| 3,872983
| 0,25819889
| 13,42634227
|
|
| 4,472136
| 0,223606798
| 12,29837388
|
|
| 5,477226
| 0,182574186
| 18,80514114
|
Протокол регрессионного анализа имеет вид:
ВЫВОД ИТОГОВ
|
|
|
|
|
|
|
|
| Регрессионная статистика
|
|
|
| Множественный R
| 0,986894
|
|
|
| R-квадрат
| 0,9739597
|
|
|
| Нормированный R-квадрат
| 0,8599553
|
|
|
| Стандартная ошибка
| 1,9415488
|
|
|
| Наблюдения
|
|
|
|
|
|
|
|
|
| Дисперсионный анализ
|
|
|
| df
| SS
| MS
| F
| Регрессия
|
| 1268,921
| 634,4607182
| 168,3092927
| Остаток
|
| 33,92651
| 3,769611932
|
| Итого
|
| 1302,848
|
|
|
|
|
|
|
|
| Коэффициенты
| Стандартная ошибка
| t-статистика
| P-Значение
| Y-пересечение
|
| #Н/Д
| #Н/Д
| #Н/Д
| X
| 3,02343
| 0,296117
| 10,21024561
| 3,00843E-06
| z
| 1,8246585
| 2,72558
| 0,669456856
| 0,520006975
| Получаем уравнение регрессии . Или .
Показатели статистической значимости уравнения регрессии улучшены. Увеличился коэффициент детерминации с 94% до 97%. Существенно уменьшилась остаточная дисперсия с 413 ед. до 33 ед.
Задание для самостоятельной работы
По своим данным лабораторной работы №1 выполнить анализ гетерокедастичности остатков. А именно:
1. Проверить гипотезу о наличии гетерокедастичности в линейной регрессии с помощью теста ранговой корреляции Спирмена при доверительной вероятности 0,95.
2. Проверить гипотезу о гетерокедастичности с помощью теста Гольфельда-Квандта.
3. Оцените количественно гетерокедастичность остатков, если она присутствует.
4. При наличии гетерокедастичности, применить обобщенный МНК для ее сглаживания.
1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | 10 | 11 | 12 | 13 | 14 | 15 | 16 | 17 | 18 | 19 | 20 | 21 | 22 | Поиск по сайту:
|