АвтоАвтоматизацияАрхитектураАстрономияАудитБиологияБухгалтерияВоенное делоГенетикаГеографияГеологияГосударствоДомДругоеЖурналистика и СМИИзобретательствоИностранные языкиИнформатикаИскусствоИсторияКомпьютерыКулинарияКультураЛексикологияЛитератураЛогикаМаркетингМатематикаМашиностроениеМедицинаМенеджментМеталлы и СваркаМеханикаМузыкаНаселениеОбразованиеОхрана безопасности жизниОхрана ТрудаПедагогикаПолитикаПравоПриборостроениеПрограммированиеПроизводствоПромышленностьПсихологияРадиоРегилияСвязьСоциологияСпортСтандартизацияСтроительствоТехнологииТорговляТуризмФизикаФизиологияФилософияФинансыХимияХозяйствоЦеннообразованиеЧерчениеЭкологияЭконометрикаЭкономикаЭлектроникаЮриспунденкция

Работа 4. Множественный линейный регрессионный анализ – алгоритм пошагового исключения, регрессоров (выполняется с применением программ «Корреляция» и «Регрессия»

Читайте также:
  1. T-FACTORY HRM - управление персоналом и работами
  2. V. САМОСТОЯТЕЛЬНАЯ РАБОТА
  3. V. САМОСТОЯТЕЛЬНАЯ РАБОТА СТУДЕНТОВ
  4. V. Самостоятельная работа студентов с больными.
  5. V2: Работа и энергия
  6. Window - работа с окнами.
  7. Аналитическая работа при выборе и обосновании стратегии развития предприятии
  8. Б) работа врачей поликлиники (амбулатории), диспансера, консультации
  9. В 72-х дневном цикле подвиг длится 8 суток, из которых 2 суток – голод, а 6 – очистительные процедуры и работа над собой. В 12-ти летнем цикле подвиг длится 1 год.
  10. В работах В. Джеймса
  11. В) профилактическая работа
  12. В). Работа с посредниками.

Множественный линейный регрессионный анализ – алгоритм пошагового исключения, регрессоров (выполняется с применением программ «Корреляция» и «Регрессия» надстройки «Анализ данных» пакета Microsoft Excel).

Задача. Изучается линейная (в среднем) зависимость результативного признака Y от пяти факторных Признаков - регрессоров х(1), х(2), х(3), х(4), х(5) по числовым данным, собранным на n = 52 объектах.

Вариант 5.

№ п/п Страна х(6) (результативный признак) Регрессоры
х(1) х(2) х(3) х(8) х(11)
  Австралия            
  Австрия            
  Аргентина            
  Бангладеш            
  Беларусь            
  Бельгия            
  Бразилия            
  Буркина-Фасо            
  Великобритания            
  Вьетнам            
  Гаити            
  Германия            
  Гондурас            
  Гонконг            
  Египет            
  Замбия            
  Индия            
  Ирландия            
  Испания            
  Италия            
  Канада            
  Китай            
  Колумбия            
  Коста-Рика            
  Куба            
  Малайзия            
  Марокко            
  Мексика            
  Нидерланды            
  Новая Зеландия            
  Норвегия            
  ОАЭ            
  Польша            
  Португалия            
  Россия            
  Саудовская Аравия            
  Северная Корея            
  Сингапур            
  США            
  Таиланд            
  Турция            
  Украина            
  Филиппины            
  Финляндия            
  Франция            
  Чили            
  Швейцария            
  Швеция            
  Эфиопия            
  ЮАР            
  Южная Корея            
  Япония            

 

Обозначения:

х(6) - ожидаемая продолжительность жизни мужчины (в годах);

х(1) - численность населения (в тыс. чел.);

х(2) - рождаемость (на 1000 чел.);

х(3) - смертность (на 1000 чел.);

х(8) - ВВП на душу населения (в долл. США по покупательной способности валют);

х(11) - процент грамотных;

 

Требуется:

1. Записать модель множественного линейного регрессионного анализа признака Y, предъявляемые к ней требования и соответствующую функцию регрессии.

2. Рассчитать с помощью программы «Корреляция» матрицу (6 х 6) оценок коэффициентов парной корреляции между признаками и сделать вывод о силе линейной связи результативного признака с каждым из регрессоров и о силе линейной связи каждой пары регрессоров. Найти коллинеарные регрессоры (на практике коллинеарными считаются такие регрессоры, коэффициент корреляции между которыми по модулю больше 0.7 - 0,8). Матрицу (52 х 6) значений признаков сохранить для использования в работе 5.

3. Вычислить оценки и sERL, параметров модели множественной линейной регрессии Y = + e [где e = N (0; sERL)] с помощью программы «Регрессия» с «Выводом остатка», приняв уровень надежности равным 95%; записать уравнение регрессии и его стандартную ошибку (sERL); используя «Остатки», вычислить среднюю относительную ошибку аппроксимации d; привести формулы расчета показателей «Регрессионной статистики», пояснив их смысл.

4. Предположив выполнение условий линейного регрессионного анализа:

а) оценить статистическую значимость уравнения регрессии (проверить на 5%-ном уровне значимости гипотезу Н0: а1 = а2 = а3 = а4 = а5 = 0, используя для этого в таблице «Дисперсионный анализ» F-статистику и значимость F- рассчитанный уровень значимости; привести алгоритм заполнения таблицы «Дисперсионный анализ»;

б) оценить статистическую значимость коэффициентов уравнения регрессии (проверить на 5%-ном уровне значимости гипотезы при альтернативных гипотезах ), используя для этого: t - статистику, Р-значение - рассчитанный уровень значимости, 95%-ную интервальную оценку параметра аj.

5. При наличии в уравнении регрессии хотя бы одного незначимого коэффициента исключить тот регрессор, при котором коэффициент незначим, а соответствующая этому коэффициенту величина Р-значения является наибольшей (или, иначе, значение модуля соответствующей t-статистики является наименьшим). Выполнить пп. 3 - 4 с оставшимися регрессорами. Процедуру пошагового исключения регрессоров продолжать до тех пор, пока не будет получено значимое уравнение регрессии со значимыми коэффициентами.

Замечание. Если после исключения регрессора уравнение становится статистически незначимым или остается значимым, но его нормированный R-квадрат значительно уменьшается, то этот регрессор следует «возвратить» в уравнение и исключить очередной регрессор, коэффициент при котором незначим (конечно, при наличии такого регрессора).

Систематизировать результаты пошаговой регрессии, выписав для каждого шага:

- уравнение регрессии ;

- коэффициент линейной детерминации (R-квадрат), нормированный (нормированный R-квадрат), стандартную ошибку sELR, ошибку аппроксимации d, значение F-статистики и критическую точку f0.05;k;n-k-1, найденную с помощью функции FPACПOБP;

- под оценками параметров аj - 95%-ные доверительные интервалы для этих параметров;

- под доверительными интервалами - числовые значения t-статистик и критическую точку t0.05;m-n-1, найденную с помощью функции СТЬЮДРАСПОБР;

- под значениями t-статистик -соответствующие Р-значения.

6. Выбрать лучшее уравнение и, используя его, ответить на следующие вопросы:

а) Какой процент выборочной дисперсии признака Y обусловлен линейным влиянием включенных в уравнение регрессоров?

б) Каковы точечная и 95%-ная интервальная оценки генерального среднего значения признака Y при значениях регрессоров на первом объекте?

в) Увеличение какого регрессора на единицу его измерения (при неизменных значениях других регрессоров) ведет к наибольшему изменению среднего значения результативного признака; увеличение какого регрессора на единицу его измерения (при неизменных значениях других регрессоров) ведет к наибольшему максимально возможному с 95%-ной вероятностью изменению среднего значения результативного признака?

г) Увеличение среднего значения какого регрессора на 1% (по отношению к его среднему значению) при неизменных значениях других регрессоров ведет к наибольшему процентному изменению среднего значения результативного признака (по отношению к его среднему значению); увеличение среднего значения какого регрессора на 1% (по отношению к его среднему значению) при неизменных значениях других регрессоров ведет к наибольшему максимально возможному с 95%-ной вероятностью процентному изменению среднего значения результативного признака?

 


 


1 | 2 | 3 | 4 |

Поиск по сайту:



Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав. Студалл.Орг (0.007 сек.)