|
||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
|
АвтоАвтоматизацияАрхитектураАстрономияАудитБиологияБухгалтерияВоенное делоГенетикаГеографияГеологияГосударствоДомДругоеЖурналистика и СМИИзобретательствоИностранные языкиИнформатикаИскусствоИсторияКомпьютерыКулинарияКультураЛексикологияЛитератураЛогикаМаркетингМатематикаМашиностроениеМедицинаМенеджментМеталлы и СваркаМеханикаМузыкаНаселениеОбразованиеОхрана безопасности жизниОхрана ТрудаПедагогикаПолитикаПравоПриборостроениеПрограммированиеПроизводствоПромышленностьПсихологияРадиоРегилияСвязьСоциологияСпортСтандартизацияСтроительствоТехнологииТорговляТуризмФизикаФизиологияФилософияФинансыХимияХозяйствоЦеннообразованиеЧерчениеЭкологияЭконометрикаЭкономикаЭлектроникаЮриспунденкция |
Проверим вычисления в MS Excel. По территориям региона приводятся данные за 2011 годЗадача 1. По территориям региона приводятся данные за 2011 год. Таблица 1.1
Требуется: 1. Построить линейное уравнение парной регрессии y от x. 2. Рассчитать линейный коэффициент парной корреляции и среднюю ошибку аппроксимации. 3. Оценить статистическую значимость параметров регрессии и корреляции с помощью F -критерия Фишера и t -критерия Стьюдента. 4. Выполнить прогноз заработной платы y при прогнозном значении среднедушевого прожиточного минимума x, составляющем 107% от среднего уровня. 5. Оценить точность прогноза, рассчитав ошибку прогноза и его доверительный интервал. 6. На одном графике построить исходные данные и теоретическую прямую. Решение. 1. Для расчета параметров уравнения линейной регрессии построим расчетную таблицу 1.2 Таблица 1.2
Получено уравнение регрессии: С увеличением среднедушевого прожиточного минимума на 1 руб., среднедневная заработная плата возрастает в среднем на 0,9 руб. 2. Тесноту линейной связи оценит коэффициент корреляции:
Это означает, что 27% вариации заработной платы (y) объясняется вариацией фактора x – среднедушевого прожиточного минимума. Качество модели определяет средняя ошибка аппроксимации:
Качество построенной модели оценивается как хорошее, так как 3. Оценку значимости уравнения регрессии в целом проведем с помощью F-критерия Фишера. Фактическое значение F- критерия:
Табличное значение критерия при пятипроцентном уровне значимости и степенях свободы k 1=1 и k 2=12-2=10 составляет Fтабл=4.96. Так как Fфакт=3,7< Fтабл=4,96, то коэффициент детерминации статистически не значим (Найденная оценка уравнения регрессии статистически не надежна). Оценку статистической значимости параметров регрессии проведем с помощью t -статистики Стьюдента и путем расчета доверительного интервала каждого из показателей. Табличное значение t- критерия для числа степеней свободы df = n -2=12-2=10, и Определим случайные ошибки ma, mb,
Тогда
Фактические значения t- статистики меньше табличного значения: ta = 1.7 < tтабл = 2.23; tb = 1.95 < tтабл = 2.23; Рассчитаем доверительные интервалы для параметров регрессии a и b. Для этого определим предельную ошибку для каждого показателя:
Анализ верхней и нижней границ доверительных интервалов приводит к выводу о том, что с вероятностью 4. Полученные оценки уравнения регрессии позволяют использовать его для прогноза. Если прогнозное значение прожиточного минимума составит: 5. Ошибка прогноза составит:
Предельная ошибка прогноза, которая в 95% случаев не будет превышена, составит:
Доверительный интервал прогноза:
Выполненный прогноз среднемесячной заработной платы является надежным ( 6. В заключение решения задачи построим на одном графике исходные данные и теоретическую прямую (рисунок 1.1):
Проверим вычисления в MS Excel. Выбираем Данные®Анализ данных®Регрессия. Заполняем диалоговое окно ввода данных и параметров вывода. Получаем следующие результаты:
Откуда выписываем. Уравнение регрессии:
Коэффициент корреляции:
Коэффициент детерминации:
Фактическое значение
Остаточная дисперсия на одну степень свободы:
Корень квадратный из остаточной дисперсии (стандартная ошибка):
Стандартные ошибки для параметров регрессии:
Фактические значения
Доверительные интервалы:
Как видим, найдены все рассмотренные выше параметры и характеристики уравнения регрессии. Результаты «ручного счета» от машинного отличаются незначительно (отличия связаны с ошибками округления).
Задача 2. По Таблица 2.1
Требуется: 1. Построить линейную модель множественной регрессии. Записать стандартизованное уравнение множественной регрессии. На основе стандартизованных коэффициентов регрессии и средних коэффициентов эластичности ранжировать факторы по степени их влияния на результат. 2. Найти коэффициенты парной, частной и множественной корреляции. Проанализировать их. 3. Найти скорректированный коэффициент множественной детерминации. Сравнить его с нескорректированным (общим) коэффициентом детерминации. 4. С помощью 5. С помощью частных 6. Составить уравнение линейной парной регрессии, оставив лишь один значащий фактор. Решение Для удобства проведения расчетов поместим результаты промежуточных расчетов в таблицу 2.2:
Найдем средние квадратические отклонения признаков:
1. Для нахождения параметров линейного уравнения множественной регрессии Рассчитаем сначала парные коэффициенты корреляции:
Находим по формулам коэффициенты чистой регрессии и параметр
Таким образом, получили следующее уравнение множественной регрессии: Уравнение регрессии показывает, что при увеличении ввода в действие основных фондов на 1% (при неизменном уровне удельного веса рабочих высокой квалификации) выработка продукции на одного рабочего увеличивается в среднем на 1.29 тыс. ден.ед., а при увеличении удельного веса рабочих высокой квалификации в общей численности рабочих на 1% (при неизменном уровне ввода в действие новых основных фондов) выработка продукции на одного рабочего увеличивается в среднем на 0,0199 тыс. ден.ед. После нахождения уравнения регрессии составим новую расчетную таблицу для определения теоретических значений результативного признака, остаточной дисперсии и средней ошибки аппроксимации. Таблица 2.3
Остаточная дисперсия:
Средняя ошибка аппроксимации:
Качество модели, исходя из относительных отклонений по каждому наблюдению, признается хорошим, т.к. средняя ошибка аппроксимации не превышает 10%. Коэффициенты
Т.е. уравнение будет выглядеть следующим образом:
Так как стандартизованные коэффициенты регрессии можно сравнивать между собой, то можно сказать, что ввод в действие новых основных фондов оказывает большее влияние на выработку продукции, чем удельный вес рабочих высокой квалификации. Сравнивать влияние факторов на результат можно также при помощи средних коэффициентов эластичности:
Вычисляем:
Т.е. увеличение только основных фондов (от своего среднего значения) или только удельного веса рабочих высокой квалификации на 1% увеличивает в среднем выработку продукции на 0,799% или 0,043% соответственно. Таким образом, подтверждается большее влияние на результат у фактора
2. Коэффициенты парной корреляции мы уже нашли:
Они указывают на весьма сильную связь каждого фактора с результатом, а также высокую межфакторную зависимость (факторы Частные коэффициенты корреляции характеризуют тесноту связи между результатом и соответствующим фактором при элиминировании (устранении влияния) других факторов, включенных в уравнение регрессии. При двух факторах частные коэффициенты корреляции рассчитываются следующим образом:
Если сравнить коэффициенты парной и частной корреляции, то можно увидеть, что из-за высокой межфакторной зависимости коэффициенты парной корреляции дают завышенные оценки тесноты связи. Именно по этой причине рекомендуется при наличии сильной коллинеарности (взаимосвязи) факторов исключать из исследования тот фактор, у которого теснота парной зависимости меньше, чем теснота межфакторной связи. Коэффициент множественной корреляции можно определить через матрицы парных коэффициентов корреляции:
где
Находим:
Коэффициент множественной корреляции:
Аналогичный результат получим при использовании формул:
Коэффициент множественной корреляции указывает на весьма сильную связь всего набора факторов с результатом. 3. Нескорректированный коэффициент множественной детерминации Скорректированный коэффициент множественной детерминации
определяет тесноту связи с учетом степеней свободы общей и остаточной дисперсий. Он дает такую оценку тесноты связи, которая не зависит от числа факторов и поэтому может сравниваться по разным моделям с разным числом факторов. Оба коэффициента указывают на весьма высокую (более 97%) детерминированность результата 4. Оценку надежности уравнения регрессии в целом и показателя тесноты связи
В нашем случае фактическое значение
Получили, что 5. С помощью частных
Найдем
Имеем
Получили, что Если поменять первоначальный порядок включения факторов в модель и рассмотреть вариант включения 6. Общий вывод состоит в том, что множественная модель с факторами
Найдем его параметры:
Таким образом,
Поиск по сайту: |
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав. Студалл.Орг (0.375 сек.) |