АвтоАвтоматизацияАрхитектураАстрономияАудитБиологияБухгалтерияВоенное делоГенетикаГеографияГеологияГосударствоДомДругоеЖурналистика и СМИИзобретательствоИностранные языкиИнформатикаИскусствоИсторияКомпьютерыКулинарияКультураЛексикологияЛитератураЛогикаМаркетингМатематикаМашиностроениеМедицинаМенеджментМеталлы и СваркаМеханикаМузыкаНаселениеОбразованиеОхрана безопасности жизниОхрана ТрудаПедагогикаПолитикаПравоПриборостроениеПрограммированиеПроизводствоПромышленностьПсихологияРадиоРегилияСвязьСоциологияСпортСтандартизацияСтроительствоТехнологииТорговляТуризмФизикаФизиологияФилософияФинансыХимияХозяйствоЦеннообразованиеЧерчениеЭкологияЭконометрикаЭкономикаЭлектроникаЮриспунденкция

Проверим вычисления в MS Excel. По территориям региона приводятся данные за 2011 год

Читайте также:
  1. Автоматизация ввода: автозавершение, автозаполнение числами, автозаполнение формулами.Excel.
  2. Вычисления в MS Excel
  3. Вычисления в MS Excel
  4. ЕН.Р.02 Финансовые вычисления
  5. Линейная модель множественной регрессии. Порядок ее оценивания МНК в Excel. Смысл выходной статистической информации функции ЛИНЕЙН.
  6. Модель представляет собой систему одновременных уравнений. Проверим каждое ее уравнение на идентификацию
  7. Основные формулы для вычисления финальных вероятностей состояний СМО. Пример использования формул.
  8. Построение графиков в Excel.
  9. Проверим вычисления в MS Excel.
  10. Программа вычисления квадратного корня
  11. Реализация типовой задачи на компьютере с использованием ППП MS Excel.

Задача 1.

По территориям региона приводятся данные за 2011 год.

Таблица 1.1

Номер региона Среднедушевой прожиточный минимум в день одного трудоспособного, руб., x Среднедневная заработная плата, руб., y
     
     
     
     
     
     
     
     
     
     
     
     

Требуется:

1. Построить линейное уравнение парной регрессии y от x.

2. Рассчитать линейный коэффициент парной корреляции и среднюю ошибку аппроксимации.

3. Оценить статистическую значимость параметров регрессии и корреляции с помощью F -критерия Фишера и t -критерия Стьюдента.

4. Выполнить прогноз заработной платы y при прогнозном значении среднедушевого прожиточного минимума x, составляющем 107% от среднего уровня.

5. Оценить точность прогноза, рассчитав ошибку прогноза и его доверительный интервал.

6. На одном графике построить исходные данные и теоретическую прямую.

Решение.

1. Для расчета параметров уравнения линейной регрессии построим расчетную таблицу 1.2

Таблица 1.2

 


;

.

Получено уравнение регрессии:

С увеличением среднедушевого прожиточного минимума на 1 руб., среднедневная заработная плата возрастает в среднем на 0,9 руб.

2. Тесноту линейной связи оценит коэффициент корреляции:

; .

Это означает, что 27% вариации заработной платы (y) объясняется вариацией фактора x – среднедушевого прожиточного минимума.

Качество модели определяет средняя ошибка аппроксимации:

.

Качество построенной модели оценивается как хорошее, так как не превышает 8-10%.

3. Оценку значимости уравнения регрессии в целом проведем с помощью F-критерия Фишера. Фактическое значение F- критерия:

Табличное значение критерия при пятипроцентном уровне значимости и степенях свободы k 1=1 и k 2=12-2=10 составляет Fтабл=4.96. Так как Fфакт=3,7< Fтабл=4,96, то коэффициент детерминации статистически не значим (Найденная оценка уравнения регрессии статистически не надежна).

Оценку статистической значимости параметров регрессии проведем с помощью t -статистики Стьюдента и путем расчета доверительного интервала каждого из показателей.

Табличное значение t- критерия для числа степеней свободы df = n -2=12-2=10, и составит t табл=2,23.

Определим случайные ошибки ma, mb, :

;

;

.

Тогда

;

;

.

Фактические значения t- статистики меньше табличного значения:

ta = 1.7 < tтабл = 2.23; tb = 1.95 < tтабл = 2.23; < tтабл = 2.23, поэтому статистическая значимость параметров a, b и не подтверждается.

Рассчитаем доверительные интервалы для параметров регрессии a и b. Для этого определим предельную ошибку для каждого показателя:

;

.

:

;

;

;

;

;

.

Анализ верхней и нижней границ доверительных интервалов приводит к выводу о том, что с вероятностью можно утверждать, что значение параметров a и b будут лежать в найденном интервале.
Так как точка 0 (ноль) лежит внутри доверительного интервала, то интервальная оценка коэффициентов a и b статистически незначима.

4. Полученные оценки уравнения регрессии позволяют использовать его для прогноза. Если прогнозное значение прожиточного минимума составит: руб., тогда прогнозное значение заработной платы составит: руб.

5. Ошибка прогноза составит:

.

Предельная ошибка прогноза, которая в 95% случаев не будет превышена, составит:

.

Доверительный интервал прогноза:

;

;

.

Выполненный прогноз среднемесячной заработной платы является надежным () и находится в пределах от 85,65 руб. до 277,71 руб.

6. В заключение решения задачи построим на одном графике исходные данные и теоретическую прямую (рисунок 1.1):

 

 

Проверим вычисления в MS Excel.

Выбираем Данные®Анализ данных®Регрессия. Заполняем диалоговое окно ввода данных и параметров вывода. Получаем следующие результаты:

 

Откуда выписываем.

Уравнение регрессии:

.

Коэффициент корреляции:

.

Коэффициент детерминации:

.

Фактическое значение -критерия Фишера:

.

Остаточная дисперсия на одну степень свободы:

.

Корень квадратный из остаточной дисперсии (стандартная ошибка):

.

Стандартные ошибки для параметров регрессии:

, .

Фактические значения -критерия Стьюдента:

, .

Доверительные интервалы:

,

.

Как видим, найдены все рассмотренные выше параметры и характеристики уравнения регрессии. Результаты «ручного счета» от машинного отличаются незначительно (отличия связаны с ошибками округления).

 

 

 

Задача 2.

По предприятиям региона изучается зависимость выработки продукции на одного работника (тыс. руб.) от ввода в действие новых основных фондов ( от стоимости фондов на конец года) и от удельного веса рабочих высокой квалификации в общей численности рабочих ().

Таблица 2.1

Номер предприятия Номер предприятия
  7,0 3,6 9,0   10,0 6,3 21,0
  7,0 3,6 11,0   11,0 6,9 23,0
  7,0 3,7 12,0   11,0 7,2 24,0
  8,0 4,1 16,0   12,0 7,8 25,0
  8,0 4,3 19,0   13,0 8,1 27,0
  8,0 4,5 19,0   13,0 8,2 29,0
  9,0 5,4 20,0   13,0 8,4 31,0
  9,0 5,5 20,0   14,0 8,8 33,0
  10,0 5,8 21,0   14,0 9,5 35,0
  10,0 6,1 21,0   14,0 9,7 34,0

Требуется:

1. Построить линейную модель множественной регрессии. Записать стандартизованное уравнение множественной регрессии. На основе стандартизованных коэффициентов регрессии и средних коэффициентов эластичности ранжировать факторы по степени их влияния на результат.

2. Найти коэффициенты парной, частной и множественной корреляции. Проанализировать их.

3. Найти скорректированный коэффициент множественной детерминации. Сравнить его с нескорректированным (общим) коэффициентом детерминации.

4. С помощью -критерия Фишера оценить статистическую надежность уравнения регрессии и коэффициента детерминации .

5. С помощью частных -критериев Фишера оценить целесообразность включения в уравнение множественной регрессии фактора после и фактора после .

6. Составить уравнение линейной парной регрессии, оставив лишь один значащий фактор.

Решение

Для удобства проведения расчетов поместим результаты промежуточных расчетов в таблицу 2.2:

 

Найдем средние квадратические отклонения признаков:

;

;

.

1. Для нахождения параметров линейного уравнения множественной регрессии воспользуемся готовыми формулами.

Рассчитаем сначала парные коэффициенты корреляции:

;

;

.

Находим по формулам коэффициенты чистой регрессии и параметр :

;

;

Таким образом, получили следующее уравнение множественной регрессии: .

Уравнение регрессии показывает, что при увеличении ввода в действие основных фондов на 1% (при неизменном уровне удельного веса рабочих высокой квалификации) выработка продукции на одного рабочего увеличивается в среднем на 1.29 тыс. ден.ед., а при увеличении удельного веса рабочих высокой квалификации в общей численности рабочих на 1% (при неизменном уровне ввода в действие новых основных фондов) выработка продукции на одного рабочего увеличивается в среднем на 0,0199 тыс. ден.ед.

После нахождения уравнения регрессии составим новую расчетную таблицу для определения теоретических значений результативного признака, остаточной дисперсии и средней ошибки аппроксимации.

Таблица 2.3

y %
    3,6   6,82 0,18 0,032 2,57
    3,6   6,98 0,02 0,000 0,29
    3,7   7,21 -0,21 0,044 -3,00
    4,1   7,47 0,53 0,281 6,63
    4,3   7,64 0,36 0,130 4,50
    4,5   8,54 -0,54 0,292 -6,75
    5,4   9,01 -0,01 0,000 -0,11
    5,5   8,8 0,20 0,040 2,22
    5,8   9,7 0,32 0,102 3,20
    6,1   10,03 -0,03 0,001 -0,30
    6,3   10,29 -0,29 0,084 -2,90
    6,9   10,59 0,41 0,168 3,73
    7,2   11,4 -0,40 0,160 -3,64
    7,8   11,85 0,15 0,023 1,25
    8,1   12,35 0,65 0,423 5,00
    8,2   12,77 0,23 0,053 1,77
    8,4   13,26 -0,26 0,068 -2,00
    8,8   13,32 0,68 0,462 4,86
    9,5   14,48 -0,48 0,230 -3,43
    9,7   15,51 -1,51 2,280 -10,79
  208,0 127,5 450,0 208,00   4,873 68,94
  10,4 6,4 22,5 10,40   0,244 3,44

 

Остаточная дисперсия:

Средняя ошибка аппроксимации:

Качество модели, исходя из относительных отклонений по каждому наблюдению, признается хорошим, т.к. средняя ошибка аппроксимации не превышает 10%.

Коэффициенты и стандартизованного уравнения регрессии , находятся по формуле:

;

.

Т.е. уравнение будет выглядеть следующим образом:

.

Так как стандартизованные коэффициенты регрессии можно сравнивать между собой, то можно сказать, что ввод в действие новых основных фондов оказывает большее влияние на выработку продукции, чем удельный вес рабочих высокой квалификации.

Сравнивать влияние факторов на результат можно также при помощи средних коэффициентов эластичности:

.

Вычисляем:

; .

Т.е. увеличение только основных фондов (от своего среднего значения) или только удельного веса рабочих высокой квалификации на 1% увеличивает в среднем выработку продукции на 0,799% или 0,043% соответственно. Таким образом, подтверждается большее влияние на результат у фактора , чем фактора .

 

2. Коэффициенты парной корреляции мы уже нашли:

; ; .

Они указывают на весьма сильную связь каждого фактора с результатом, а также высокую межфакторную зависимость (факторы и явно коллинеарны, т.к. >0,7). При такой сильной межфакторной зависимости рекомендуется один из факторов исключить из рассмотрения.

Частные коэффициенты корреляции характеризуют тесноту связи между результатом и соответствующим фактором при элиминировании (устранении влияния) других факторов, включенных в уравнение регрессии.

При двух факторах частные коэффициенты корреляции рассчитываются следующим образом:

;

.

Если сравнить коэффициенты парной и частной корреляции, то можно увидеть, что из-за высокой межфакторной зависимости коэффициенты парной корреляции дают завышенные оценки тесноты связи. Именно по этой причине рекомендуется при наличии сильной коллинеарности (взаимосвязи) факторов исключать из исследования тот фактор, у которого теснота парной зависимости меньше, чем теснота межфакторной связи.

Коэффициент множественной корреляции можно определить через матрицы парных коэффициентов корреляции:

,

где – определитель матрицы парных коэффициентов корреляции;

– определитель матрицы межфакторной корреляции.

Находим:

;

.

Коэффициент множественной корреляции:

.

Аналогичный результат получим при использовании формул:

,

.

Коэффициент множественной корреляции указывает на весьма сильную связь всего набора факторов с результатом.

3. Нескорректированный коэффициент множественной детерминации =0,974 оценивает долю дисперсии результата за счет представленных в уравнении факторов в обшей вариации результата. Здесь эта доля составляет 97,4% и указывает на весьма высокую степень обусловленности вариации результата вариацией факторов, иными словами – на весьма тесную связь факторов с результатом.

Скорректированный коэффициент множественной детерминации

определяет тесноту связи с учетом степеней свободы общей и остаточной дисперсий. Он дает такую оценку тесноты связи, которая не зависит от числа факторов и поэтому может сравниваться по разным моделям с разным числом факторов. Оба коэффициента указывают на весьма высокую (более 97%) детерминированность результата в модели факторами и .

4. Оценку надежности уравнения регрессии в целом и показателя тесноты связи дает -критерий Фишера:

.

В нашем случае фактическое значение -критерия Фишера:

Получили, что > =3,59 (при = 20), т.е. вероятность случайно получить такое значение -критерия не превышает допустимый уровень значимости 5%. Следовательно, полученное значение не случайно, оно сформировалось под влиянием существенных факторов, т.е. подтверждается статистическая значимость всего уравнения и показателя тесноты связи .

5. С помощью частных -критериев Фишера оценим целесообразность включения в уравнение множественной регрессии фактора после и фактора после при помощи формул:

;

.

Найдем и .

;

.

Имеем

;

 

.

 

Получили, что . Следовательно, включение в модель фактора после того, как в модель включен фактор статистически нецелесообразно: прирост факторной дисперсии за счет дополнительного признака оказывается незначительным, несущественным; фактор включать в уравнение после фактора не следует.

Если поменять первоначальный порядок включения факторов в модель и рассмотреть вариант включения после , то результат расчета частного -критерия для будет иным. , т.е. вероятность его случайного формирования меньше принятого стандарта . Следовательно, значение частного -критерия для дополнительно включенного фактора не случайно, является статистически значимым, надежным, достоверным: прирост факторной дисперсии за счет дополнительного фактора является существенным. Фактор должен присутствовать в уравнении, в том числе в варианте, когда он дополнительно включается после фактора .

6. Общий вывод состоит в том, что множественная модель с факторами и с содержит неинформативный фактор . Если исключить фактор , то можно ограничиться уравнением парной регрессии:

.

Найдем его параметры:

;

.

Таким образом,

, .


1 | 2 |

Поиск по сайту:



Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав. Студалл.Орг (0.029 сек.)