|
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
АвтоАвтоматизацияАрхитектураАстрономияАудитБиологияБухгалтерияВоенное делоГенетикаГеографияГеологияГосударствоДомДругоеЖурналистика и СМИИзобретательствоИностранные языкиИнформатикаИскусствоИсторияКомпьютерыКулинарияКультураЛексикологияЛитератураЛогикаМаркетингМатематикаМашиностроениеМедицинаМенеджментМеталлы и СваркаМеханикаМузыкаНаселениеОбразованиеОхрана безопасности жизниОхрана ТрудаПедагогикаПолитикаПравоПриборостроениеПрограммированиеПроизводствоПромышленностьПсихологияРадиоРегилияСвязьСоциологияСпортСтандартизацияСтроительствоТехнологииТорговляТуризмФизикаФизиологияФилософияФинансыХимияХозяйствоЦеннообразованиеЧерчениеЭкологияЭконометрикаЭкономикаЭлектроникаЮриспунденкция |
При анализе тесноты линейной корреляционной связи между двумяКонтрольная работа Учебная дисциплина: «Эконометрика» Номер варианта контрольной работы: 1 Наименование направления (специальности, профиля подготовки): «Бухгалтерский учет, анализ и аудит» Ф.И.О. студента: Перфилова Татьяна Владимировна Номер группы: БУП21 Номер зачётной книжки: 121321 Дата регистрации контрольной работы кафедрой «____» _________ 20 г. Проверил (Ф.И.О.):_______________________________________________ Оценочное заключение:
Новосибирск 2013 СОДЕРЖАНИЕ 1. Ситуационная (практическая) часть:………………………………….…..…3 1.1. Текст ситуационной (практической) задачи № 1;…………………….…..3 1.2. Решение задачи № 1;…………………………………………………….….4 1.3. Текст ситуационной (практической) задачи № 2;…………….……….…22 1.4. Решение задачи № 2;……………………………………………………….22 2. Тестовая часть:………………………………………………………...………35 2.1. Тестовые задания……………………………………....................................35 3. Список используемой литературы…………………………………...………38 .
1. Ситуационная (практическая) часть: 1.1. Текст ситуационной (практической) задачи № 1; По 20 предприятиям региона изучается зависимость выработки продукции на одного работника y (тыс. руб.) от удельного веса рабочих высокой квалификации в общей численности рабочих x1 (% от стоимости фондов на конец года) и от ввода в действие новых основных фондов x2 (%).
Требуется: 1. Построить корреляционное поле между выработкой продукции на одного работника и удельным весом рабочих высокой квалификации. Выдвинуть гипотезу о тесноте и виде зависимости между показателями X1 и Y. 2. Оценить тесноту линейной связи между выработкой продукции на одного работника и удельным весом рабочих высокой квалификации с надежностью 0,9. 3. Рассчитать коэффициенты линейного уравнения регрессии для зависимости выработки продукции на одного работника от удельного веса рабочих высокой квалификации. 4. Проверить статистическую значимость параметров уравнения регрессии с надежностью 0,9 и построить для них доверительные интервалы. 5. Рассчитать коэффициент детерминации. С помощью F -критерия Фишера оценить статистическую значимость уравнения регрессии с надежностью 0,9. 6. Дать точечный и интервальный прогноз с надежностью 0,9 выработки продукции на одного работника для предприятия, на котором высокую квалификацию имеют 24% рабочих. 7. Рассчитать коэффициенты линейного уравнения множественной регрессии и пояснить экономический смысл его параметров. 8. Проанализировать статистическую значимость коэффициентов множественного уравнения с надежностью 0,9 и построить для них доверительные интервалы. 9. Найти коэффициенты парной и частной корреляции. Проанализировать их. 10. Найти скорректированный коэффициент множественной детерминации. Сравнить его с нескорректированным (общим) коэффициентом детерминации. 11. С помощью F -критерия Фишера оценить адекватность уравнения регрессии с надежностью 0,9. 12. Дать точечный и интервальный прогноз с надежностью 0,9 выработки продукции на одного работника для предприятия, на котором высокую квалификацию имеют 24% рабочих, а ввод в действие новых основных фондов составляет 5%. 13. Проверить построенное уравнение на наличие мультиколлинеарности по: критерию Стьюдента; критерию χ2. Сравнить полученные результаты.
1.2. Решение задачи № 1; 1. Построить корреляционное поле между выработкой продукции на одного работника и удельным весом рабочих высокой квалификации. Выдвинуть гипотезу о тесноте и виде зависимости между показателями X1 и Y. Построим поле корреляции: Рисунок 1. Поле корреляции между выработкой продукции на одного работника и удельным весом рабочих высокой квалификации.
Поле корреляции показывает, то что связь между всеми значениями удельного веса рабочих высокой квалификации в общей численности рабочих X и выработкой продукции на одного работника Y носит линейный характер и имеет вид . Здесь e. - случайная ошибка (отклонение, возмущение).
2. Оценить тесноту линейной связи между выработкой продукции на одного работника и удельным весом рабочих высокой квалификации с надежностью 0,9. Составим расчетную таблицу.
Выборочные средние.
Выборочные дисперсии:
Среднеквадратическое отклонение
Коэффициент корреляции : ,
Связь между выработкой продукции на одного работника и удельным весом рабочих высокой квалификации прямая и высокая На уровне значимости 0,1 проверим нулевую гипотезу о равенстве нулю генерального коэффициента корреляции нормальной двумерной случайной величины при конкурирующей гипотезе H1 ≠ 0, вычислим наблюдаемое значение критерия
По таблице Стьюдента с уровнем значимости α=0.1 и степенями свободы k=18 находим tкрит: tкрит (n-m-1;α/2) = (18;0.05) = 1.734 где m = 1 - количество объясняющих переменных. Поскольку tнабл > tкрит, то есть 16,93>1,734, то отклоняем гипотезу о равенстве 0 коэффициента корреляции. Другими словами, коэффициент корреляции статистически - значим 3. Рассчитать коэффициенты линейного уравнения регрессии для зависимости выработки продукции на одного работника от удельного веса рабочих высокой квалификации. Уравнение регрессии будет иметь вид y i = а + bx i+ ei, Построим итоговую систему, которая носит название системы нормальных уравнений: Используя данные таблицы, получим систему нормальных уравнений: Решением системы будет: . Таким образом, оценочное уравнение регрессии имеет вид:
4. Проверить статистическую значимость параметров уравнения регрессии с надежностью 0,9 и построить для них доверительные интервалы. Первоначально найдем несмещенную оценку дисперсии возмущений:
Sa - стандартное отклонение случайной величины a.
Sb - стандартное отклонение случайной величины b.
Для оценки статистической значимости коэффициентов регрессии и корреляции рассчитываются t-критерий Стьюдента. Выдвигается гипотеза Н0 о случайной природе показателей, т.е. о незначимом их отличии от нуля. Проверим гипотезу H0 о равенстве отдельных коэффициентов регрессии нулю (при альтернативе H1 не равно) на уровне значимости α=0.1. tкрит (n-m-1;α/2) = (18;0.05) = 1.734
Поскольку 17 > 1.734, то статистическая значимость коэффициента регрессии b подтверждается (отвергаем гипотезу о равенстве нулю этого коэффициента).
Поскольку 2.7 > 1.734, то статистическая значимость коэффициента регрессии a подтверждается (отвергаем гипотезу о равенстве нулю этого коэффициента). Определим доверительные интервалы коэффициентов регрессии, которые с надежность 90% будут следующими: Для коэффициента регрессии b: (b - tкрит Sb; b + tкрит Sb) (0.38 - 1.734* 0.023; 0.38 + 1.734 *0.023) (0.34;0.42) С вероятностью 90% можно утверждать, что значение данного параметра будут лежать в найденном интервале. Для коэффициента регрессии a: (a - tкрит Sa; a + tкрит Sa) (1.44 - 1.734 * 0.53; 1.44 + 1.734 *0.53) (0.52;2.37)
5. Рассчитать коэффициент детерминации. С помощью F -критерия Фишера оценить статистическую значимость уравнения регрессии с надежностью 0,9. Коэффициент детерминации:
Выдвигается нулевая гипотеза о том, что уравнение в целом статистически незначимо: H0: R2=0 на уровне значимости α. Далее определяют фактическое значение F-критерия:
где m=1 для парной регрессии. Табличное значение критерия со степенями свободы: k1=1 и k2=18, Fтабл = 3.01 Поскольку фактическое значение F > Fтабл, то коэффициент детерминации статистически значим (найденная оценка уравнения регрессии статистически надежна). 6. Дать точечный и интервальный прогноз с надежностью 0,9 выработки продукции на одного работника для предприятия, на котором высокую квалификацию имеют 24% рабочих. Точечный прогноз: при х=24 Рассчитаем границы интервала, в котором будет сосредоточено 90% возможных значений Y при неограниченно большом числе наблюдений и Xp = 24 (a + bxp ± ε) где
(1.44 + 0.38*24 ± 0.28) (10.34;10.9) С вероятностью 90% можно гарантировать, что значения Y при неограниченно большом числе наблюдений не выйдет за пределы интервалов от 10.34 до 10.9.
7. Рассчитать коэффициенты линейного уравнения множественной регрессии и пояснить экономический смысл его параметров. Система трех линейных уравнений с тремя неизвестными b0, b1, b2: ∑yi = nb0 + b1∑x1i + b2∑x2i ∑x1iyi = b0∑x1i + b1∑x1i2 + b2∑x1ix2i ∑x2iyi = b0∑x2i + b1∑x1ix2i + b2∑x2i2 Составим расчетную таблицу.
Для наших данных система уравнений имеет вид: 202 = 20 b0 + 453b1 + 125.8b2 4954 = 453b0 + 11251b1 + 3120.5b2 1378.9 = 125.8b0 + 3120.5b1 + 868.98b2 Решая систему методом Крамера, находим: b0 = 1.32 b1 = 0.02 b2 = 1.34 Уравнение регрессии: Y = 1.32 + 0.02 X1 + 1.34 X2 Коэффициент показывает, что с увеличением удельного веса рабочих высокой квалификации в общей численности рабочих на 1% выработка продукции на одного работника повышаются в среднем на 0,02. Коэффициент показывает, что с увеличением ввода в действие новых основных фондов на 1% выработка продукции на одного работника увеличится в среднем на 1,34. Коэффициент формально показывает прогнозируемый уровень у, но только в том случае, если х =0 находится близко с выборочными значениями.
8. Проанализировать статистическую значимость коэффициентов множественного уравнения с надежностью 0,9 и построить для них доверительные интервалы. Составим расчетную таблицу.
Определим дисперсии и стандартные ошибки коэффициентов, а также интервальные оценки коэффициентов. При этом:
где m=2 – количество объясняющих переменных модели.
Стандартные ошибки коэффициентов:
Проверим гипотезу H0 о равенстве отдельных коэффициентов регрессии нулю (при альтернативе H1 не равно) на уровне значимости α=0,9. tкрит (n-m-1;α/2) = (17;0) = 17
Поскольку 4.32 < 17, то статистическая значимость коэффициента регрессии b0 не подтверждается (принимаем гипотезу о равенстве нулю этого коэффициента).
Поскольку 0.26 < 17, то статистическая значимость коэффициента регрессии b1 не подтверждается (принимаем гипотезу о равенстве нулю этого коэффициента).
Поскольку 6.18 < 17, то статистическая значимость коэффициента регрессии b2 не подтверждается (принимаем гипотезу о равенстве нулю этого коэффициента). t-статистика: Tтабл (n-m-1;α) = (17;0.05) = 1.74 Определим доверительные интервалы коэффициентов регрессии, которые с надежность 90% будут следующими: (bi - ti Sbi; bi + ti Sbi) b0: (1.32 - 1.74 *0.48; 1.32 + 1.74 *0.48) = (0.49;2.15) b1: (0.0161 - 1.74* 0.0949; 0.0161 + 1.74* 0.0949) = (-0.15;0.18) b2: (1.34 - 1.74* 0.34; 1.34 + 1.74* 0.34) = (0.75;1.93) 9. Найти коэффициенты парной и частной корреляции. Проанализировать их. Парные коэффициенты корреляции. Для y и x1 Средние значения
Дисперсия
Среднеквадратическое отклонение
Коэффициент корреляции
Для y и x2 Средние значения
Дисперсия
Среднеквадратическое отклонение
Коэффициент корреляции
Для x1 и x2 Средние значения
Дисперсия
Среднеквадратическое отклонение
Коэффициент корреляции
Коэффициент частной корреляции.
Теснота связи низкая.
Теснота связи сильная.
Теснота связи низкая.
Теснота связи не сильная.
Теснота связи сильная.
Теснота связи не сильная. 10. Найти скорректированный коэффициент множественной детерминации. Сравнить его с нескорректированным (общим) коэффициентом детерминации. Коэффициент детерминации:
Скорректированный индекс множественной детерминации, учитывающий поправку на число степеней свободы:
где n - число наблюдений, m – число факторов.
Скорректированный индекс множественной детерминации ниже, чем общий, так как он дает наиболее объективную оценку качества построенной модели и учитывает поправку на число степеней свободы:
11. С помощью F -критерия Фишера оценить адекватность уравнения регрессии с надежностью 0,9. Выдвигается нулевая гипотеза о том, что уравнение в целом статистически незначимо: H0: R2=0 на уровне значимости α.
Табличное значение при степенях свободы: k1 = 2 и k2 = n-m-1 = 20 - 2 -1 = 17, Fkp(2;17) = 2.64 Поскольку фактическое значение F > Fkp, то коэффициент детерминации статистически значим и уравнение регрессии статистически надежно 12. Дать точечный и интервальный прогноз с надежностью 0,9 выработки продукции на одного работника для предприятия, на котором высокую квалификацию имеют 24% рабочих, а ввод в действие новых основных фондов составляет 5%. Точечный прогноз с надежностью 0,9: Х1=24 и Х2=5 Y = 1.32 + 0.02*24.0 + 1.34*5.0 = 8.4 Интервальный прогноз с надежностью 0,9: Матрица X
Матрица XT
Умножаем матрицы, (XTX)
Находим обратную матрицу (XTX)-1
Доверительные интервалы с вероятностью 0.9 для среднего значения результативного признака M(Y). S2 = X0T(XTX)-1X0 где X0T = [ 1; 24.0; 5.0] и (XTX)-1 Умножаем матрицы, находим S2 = 0.0777 Умножаем матрицы, находим S2 = 0.84
(Y – t*SY; Y + t*SY) (8.4 – 1.74*0.37; 8.4 + 1.74*0.37) (7.76;9.04) C вероятностью 0.9 среднее значение Y при X0i находится в указанных пределах. Доверительные интервалы с вероятностью 0.9 для индивидуального значения результативного признака.
(8.4 – 1.74*0.54; 8.4 + 1.74*0.54) (7.46;9.34) 13. Проверить построенное уравнение на наличие мультиколлинеарности по: критерию Стьюдента; критерию χ2. Сравнить полученные результаты. Расчетное значение критерия Х2 определяется по формуле: , где - определитель корреляционной матрицы R-детерминант корреляции. Табличное значение критерия χ2табл= χ2(19;0.05) = 28.41. Исследование наличия мультиколлинеарности в массиве факторов по критерию χ2 в оболочке электронных таблиц Excel. 1. Находим определитель матрицы, используя встроенную функцию МОПРЕД. Корреляционная матрица
Связь между факторами должна быть не более 0.7. Если в матрице есть межфакторный коэффициент корреляции rxjxi > 0.7, то в данной модели множественной регрессии существует мультиколлинеарность. В нашем случае rx1 x2 имеют |r|>0.7, что говорит о мультиколлинеарности факторов и о необходимости исключения одного из них из дальнейшего анализа. R=0,043
2. Находим натуральный логарифм определителя, используя встроенную математическую функцию LN. 20,5
на основании значения детерминанта корреляции =0,0008 (→0) можно сделать предварительный вывод о наличии мультиколлинеарности в массиве факторов; если Х2расч< Х2табл, то нет оснований отклонить гипотезу об отсутствии мультиколлинеарности в массиве факторов, то есть с принятой надежностью можно утверждать, что в массиве факторов мультиколлинеарность отсутствует. Расчетные значения t – критерия для каждой пары факторов определяются по формулам:
, k=1; m, j=1; m, где rkj – соответствующие коэффициенты частичной корреляции.
Для x1 и x2
=20,89 По таблице Стьюдента находим: Tтабл (n-1;α/2) = 1.74 – если tjjрасч>tjjтабл, то отклонить гипотезу об отсутствии мультиколлиниарности между k-тым и j-тым факторами, то есть с принятой надежностью можно утверждать, что между k-тым и j-тым факторами есть мультиколлинеарность. Выводы: с надежностью Р=0,9 можно утверждать, что: – между факторами Х1 и Х2 мультиколлинеарность присутствует; Общий вывод: Таким образом между факторами х1 и х2 модели, присутствует мультиколлинеарность.
1.3. Текст ситуационной (практической) задачи № 2; Имеются помесячные данные по объему платных услуг населению в 2010 г.
Требуется: 1. Проверить гипотезу о наличии тренда во временном ряде. 2. Рассчитать коэффициенты автокорреляции. Проверить наличие сезонных колебаний во временном ряде. 3. Оценить параметры линейной трендовой модели, проверить статистическую значимость соответствующего уравнения регрессии с надежностью 0,99. 4. Дать точечный и интервальный прогноз объема платных услуг на февраль 2011 г. с надежностью 0,99.
1.4. Решение задачи № 2; 1. Проверить гипотезу о наличии тренда во временном ряде. Критерий проверки гипотезы о существовании тренда основан на сравнении средних уровней временного ряда из N наблюдений, который делится на две равные части. Для каждой выборки рассчитываются следующие выборочные характеристики:
Средние арифметические значения (средний уровень ряда): 33,95 Выборочные дисперсии:
При проверке предположения о наличии во временном ряду трендовой компоненты, выдвигается основная гипотеза о равенстве генеральных средних для двух образованных выборочных совокупностей: H0:μi=μj. Гипотеза о равенстве дисперсий проверяется с помощью F-критерия Фишера. Fkp = 4.96 Если наблюдаемое значение F-критерия (вычисленное по выборочным данным) больше критического значения F-критерия Fнабл>Fкрит, то основная гипотеза отклоняется. Следовательно, в исходном временном ряду присутствует трендовая компонента. 2.Рассчитать коэффициенты автокорреляции. Проверить наличие сезонных колебаний во временном ряде. Расчет коэффициента автокорреляции 1-го порядка. Составим расчетную таблицу
Параметры уравнения авторегрессии. Выборочные средние.
Выборочные дисперсии:
Среднеквадратическое отклонение
Линейный коэффициент автокорреляции rt,t-1:
Расчет коэффициента автокорреляции 2-го порядка.
Выборочные средние.
Выборочные дисперсии:
Среднеквадратическое отклонение
Линейный коэффициент автокорреляции rt,t-2:
Расчет коэффициента автокорреляции 3-го порядка.
Выборочные средние.
Выборочные дисперсии:
Среднеквадратическое отклонение
Линейный коэффициент автокорреляции rt,t-3:
Расчет коэффициента автокорреляции 4-го порядка.
Выборочные средние.
Выборочные дисперсии:
Среднеквадратическое отклонение
Линейный коэффициент автокорреляции rt,t-4:
Расчет коэффициента автокорреляции 5-го порядка.
Выборочные средние.
Выборочные дисперсии:
Среднеквадратическое отклонение
Линейный коэффициент автокорреляции rt,t-5:
Расчет коэффициента автокорреляции 6-го порядка.
Выборочные средние.
Выборочные дисперсии:
Среднеквадратическое отклонение
Линейный коэффициент автокорреляции rt,t-6:
Расчет коэффициента автокорреляции 7-го порядка.
Выборочные средние.
Выборочные дисперсии:
Среднеквадратическое отклонение
Линейный коэффициент автокорреляции rt,t-7:
Расчет коэффициента автокорреляции 8-го порядка.
Выборочные средние.
Выборочные дисперсии:
Среднеквадратическое отклонение
Линейный коэффициент автокорреляции rt,t-8:
В данном ряду динамики имеется тенденция. А также имеются периодические колебания с периодом, равным 10 (r=1). 3.Оценить параметры линейной трендовой модели, проверить статистическую значимость соответствующего уравнения регрессии с надежностью 0,99. Линейное уравнение тренда имеет вид y = bt + a Находим параметры уравнения методом наименьших квадратов. Система уравнений МНК: a0n + a1∑t = ∑y a0∑t + a1∑t2 = ∑y*t Составим расчетную таблицу
Для наших данных система уравнений имеет вид: 12a0 + 0a1 = 511.91 0a0 + 572a1 = 896.91 Из первого уравнения выражаем а0 и подставим во второе уравнение Получаем: a0 = 1.57, a1 = 42.66 Уравнение тренда: y = 1.57 t + 42.66
Статистическую значимость соответствующего уравнения регрессии с надежностью 0,99 проверим с помощью F-статистики. Критерий Фишера.
Fkp = 4.96 где m - количество факторов в уравнении тренда (m=1). Поскольку F > Fkp, то коэффициент детерминации (и в целом уравнение тренда) статистически значим 3.Дать точечный и интервальный прогноз объема платных услуг на февраль 2011 г. с надежностью 0,99. Определим среднеквадратическую ошибку прогнозируемого показателя.
m = 1 - количество влияющих факторов в уравнении тренда. Uy = yn+L ± K где
L - период упреждения; уn+L - точечный прогноз по модели на (n + L)-й момент времени; n - количество наблюдений во временном ряду; Sy - стандартная ошибка прогнозируемого показателя; Tтабл - табличное значение критерия Стьюдента для уровня значимости α и для числа степеней свободы, равного n-2. По таблице Стьюдента находим Tтабл Tтабл (n-m-1;α/2) = (10;0.005) = 3.169 Точечный прогноз, t = 12: y(12) = 1.57*12 + 42.66 = 61.5
61.5 - 16.08 = 45.42; 61.5 + 16.08 = 77.58 Интервальный прогноз: t = (44.42;77.58) Объем платных услуг на февраль 2011 г. с надежностью 0,99 в интервале от 44.42 до 77.58 млн. руб.
2. Тестовая часть: Тестовые задания Необходимо из предложенных вариантов ответа на вопрос теста выбрать единственно верный, по Вашему мнению. 1.Остаток в i-м наблюдении – это: a) разница между значением объясняющей переменной в i-м наблюдении и прогнозным значением этой переменной; b) разница между значением переменной Y в i-м наблюдении и прогнозным значением этой переменной, полученным по выборочной линии регрессии; c) разница между значением переменной Y в i-м наблюдении и прогнозным значением этой переменной, полученным по истинной линии регрессии; d) разница между прогнозным значением зависимой переменной, полученным по выборочной линии регрессии и значением объясняющей переменной в этом наблюдении. 2. Дано регрессионное уравнение Y = 10 + 0.5X. Чему равно прогнозное значение переменной Y, если Х = 10: a) 20; b) 15; c) 5; d) 0. При анализе тесноты линейной корреляционной связи между двумя переменными получен коэффициент парной линейной корреляции, равный –1. Это означает, что: a) линейная корреляционная связь отсутствует; b) между переменными существует нелинейная связь; c) парный коэффициент корреляции не может принять такое значение; d) между переменными существует точная обратная линейная зависимость; Поиск по сайту: |
Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав. Студалл.Орг (0.14 сек.) |