|
||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
АвтоАвтоматизацияАрхитектураАстрономияАудитБиологияБухгалтерияВоенное делоГенетикаГеографияГеологияГосударствоДомДругоеЖурналистика и СМИИзобретательствоИностранные языкиИнформатикаИскусствоИсторияКомпьютерыКулинарияКультураЛексикологияЛитератураЛогикаМаркетингМатематикаМашиностроениеМедицинаМенеджментМеталлы и СваркаМеханикаМузыкаНаселениеОбразованиеОхрана безопасности жизниОхрана ТрудаПедагогикаПолитикаПравоПриборостроениеПрограммированиеПроизводствоПромышленностьПсихологияРадиоРегилияСвязьСоциологияСпортСтандартизацияСтроительствоТехнологииТорговляТуризмФизикаФизиологияФилософияФинансыХимияХозяйствоЦеннообразованиеЧерчениеЭкологияЭконометрикаЭкономикаЭлектроникаЮриспунденкция |
Мерой для оценки включения фактора в модельслужит частный F -критерий, т.е. . Так, если оцениваем значимость влияния фактора после включения в модель факторов , то формула частного F -критерия примет вид: . Если фактическое значение критерия с и степенями свободы больше табличного при заданном уровне значимости, то дополнительное включение фактора в модель статистически оправдано и коэффициент регрессии при данном факторе статистически значим.
Оценка значимости коэффициентов «чистой» регрессии Для каждого фактора используется формула , где – коэффициент «чистой» регрессии при факторе ; – средняя квадратическая ошибка коэффициента регрессии , , где – среднее квадратическое отклонение для признака y; – коэффициент детерминации для уравнения множественной регрессии; – среднее квадратическое отклонение для признака ; – коэффициент детерминации для зависимости фактора со всеми другими факторами уравнения множественной регрессии.
Практические рекомендации по выполнению расчетов с помощью табличного редактора MS Excel Исследуется зависимость производительности труда y (т/ч) от уровня механизации работ (%), среднего возраста работников (лет) и энерговооруженности (кВт/100 работающих) по данным 14 промышленных предприятий.
Необходимо: 1. Рассчитать параметры линейного уравнения множественной регрессии с полным перечнем факторов. 2. Оценить значимость уравнения в целом, используя значение множественного коэффициента корреляции и общего F -критерия Фишера. 3. Оценить статистическую значимость параметров регрессионной модели с помощью t -критерия. 4. Исследовать коллинеарность между факторами. При наличии мультиколлинеарности исключить какой-либо фактор из уравнения регрессии. 5. Построить новое уравнение множественной регрессии, провести все необходимые исследования, аналогичные проведенным выше. 6. На основании результатов п. 5 найти а) средние коэффициенты эластичности фактора y от независимых факторов; б) прогнозное значение результата при значении важнейшей объясняющей переменной, равном максимальному наблюденному значению, увеличенному на 10 %, и при значении второй объясняющей переменной, равном минимальному наблюденному значению, уменьшенному на 15%. в) Интервальное предсказание значения y с надежностью 0,95.
1. Получение протокола расчета. Операция проводится с помощью инструмента Анализ данных/Регрессия. Она аналогична расчету параметров парной линейной регрессии, рассмотренной выше, только в отличие от парной регрессии при заполнении строки входной интервал X в диалоговом окне следует указать сразу все столбцы значений факторных переменных. Результаты анализа имеют вид:
2. Оцениваем статистическую значимость в целом. Изучив результаты, отмечаем, что в целом полученное уравнение линейной множественной регрессии является статистически значимым. Действительно, . Сравним это число с критическим значением критерия Фишера, полученным при числе степеней свободы и , где n – число наблюдений, m – число параметров при переменной x. В нашем случае , . Критическое значение даст функция FРАСПОБР. , что существенно меньше расчетного значения. О доле вариации результативного признака y, объясненной построенным уравнением множественной регрессии лучше всего судить по значению нормированного коэффициента корреляции, в данном случае он равен 0,9363. То есть построенное уравнение объясняет почти 94% всей вариации признака y. 3. Оцениваем статистическую значимость по отдельным параметрам. Чтобы оценить статистическую значимость параметров регрессионной модели с помощью t -критерия, найдем соответствующее нашим параметрам критическое значение с помощью функции СТЬЮДРАСПОБР при заданном уровне значимости 0,05 и числе степеней свободы . Коэффициент признается значимым, если выполняется неравенство . Имеем
Таким образом, ни один из факторов не имеет статистически значимого коэффициента регрессии, и построенное уравнение для прогнозирования непригодно. 4. Исследуем коллинеарность между факторами. Матрицу парных коэффициентов корреляции можно получить, используя инструмент Анализ данных/Корреляция. Заполнив диалоговое окно, получим следующий результат:
Для оценки мультиколлинеарности факторов вычислим определитель матрицы парных коэффициентов корреляции факторов. . Поскольку определитель матрицы межфакторной корреляции близок к нулю, имеем мультиколлинеарность факторов и вытекающую отсюда ненадежность результатов множественной регрессии. Оценка значимости мультиколлинеарности факторов может быть проведена методом испытания гипотезы о независимости переменных, т.е. . Доказано, что величина имеет приближенное распределение с числом степеней свободы . Если фактическое значение превосходит табличное (критическое), то гипотеза отклоняется, и мультиколлинеарность считается доказанной. Имеем . Критическое значение можно найти через статистическую функцию ХИ2ОБР( ), где – уровень значимости (по условию 0,05), а n – число степеней свободы. В нашем случае степеней свободы . Получаем . . Мультиколлинеарностью факторов пренебречь нельзя. Особенно высока коллинеарность факторов и , . Один из этих факторов следует исключить из уравнения регрессии. Логично исключить тот, который имеет меньший коэффициент парной корреляции. Поскольку , а , исключаем фактор . 5. Построим регрессию на факторах и .
Получили результаты: , , , что много больше, чем .
Таким образом, при весьма удовлетворительной значимости уравнения регрессии в целом, мы добились значимости коэффициента регрессии при переменной . 6. а) Найдем коэффициенты эластичности: , (6.18) где – коэффициент «чистой» регрессии при факторе ; – среднее значение результативного признака; – среднее значение признака . Имеем
Таким образом, при изменении фактора ( среднего возраста работников ) на 1%, производительность возрастает незначительно, на 0,03%; при изменении фактора ( энерговооруженности ) на 1%, производительность труда увеличивается на 0,72%. б) Выполним прогнозирование. Максимальное наблюденное значение фактора – 750. Минимальное значение фактора – 31. Прогнозные значения факторов: ; . Тогда . в) Доверительный интервал для данного прогнозного значения y можно найти, зная предельную ошибку прогноза , где – соответствующее критическое значение критерия Стьюдента, а – ошибка прогнозного значения. В нашем случае . Ошибку прогнозного значения функции регрессии получим по формуле . Шаг 1. Параметр S – стандартная ошибка регрессии приведен в последней регрессионной статистике . Шаг 2. Матрица состоит из чисел: . То есть , . Шаг 3. Матрица X состоит из чисел . Составляем вспомогательную таблицу:
В данном случае, .
Шаг 4. Транспонируем матрицу X. Поскольку она симметрическая, то . Шаг 5. Найдем произведение матриц . В Exсel это можно сделать с помощью функции МУМНОЖ.
Шаг 6. Найдем обратную матрицу к матрице произведения . В Exсel это можно сделать с помощью функции МОБР.
Шаг 7. Найдем произведение матриц (размерность матрицы произведения ).
Шаг 8. Найдем произведение матриц (размерность матрицы произведения , то есть только одно число). . Шаг 9. . Шаг 10. . Шаг 11. Таким образом, прогнозное значение результата будет с вероятностью 95% находиться в интервале . Задания для самостоятельной работы Вариант 1
Вариант 2
Вариант 3
Вариант 4
Вариант 5
Вариант 6
Вариант 7
Вариант 8
Вариант 9
Вариант 10
Поиск по сайту: |
Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав. Студалл.Орг (0.018 сек.) |