|
||||||||||||||||||||||||||
|
АвтоАвтоматизацияАрхитектураАстрономияАудитБиологияБухгалтерияВоенное делоГенетикаГеографияГеологияГосударствоДомДругоеЖурналистика и СМИИзобретательствоИностранные языкиИнформатикаИскусствоИсторияКомпьютерыКулинарияКультураЛексикологияЛитератураЛогикаМаркетингМатематикаМашиностроениеМедицинаМенеджментМеталлы и СваркаМеханикаМузыкаНаселениеОбразованиеОхрана безопасности жизниОхрана ТрудаПедагогикаПолитикаПравоПриборостроениеПрограммированиеПроизводствоПромышленностьПсихологияРадиоРегилияСвязьСоциологияСпортСтандартизацияСтроительствоТехнологииТорговляТуризмФизикаФизиологияФилософияФинансыХимияХозяйствоЦеннообразованиеЧерчениеЭкологияЭконометрикаЭкономикаЭлектроникаЮриспунденкция |
Определение тесноты связи и оценка существенности уравнения регрессии
Коэффициент корреляции находится в пределах: Линейный коэффициент корреляции оценивает тесноту связи рассматриваемых признаков в ее линейной форме. Поэтому близость абсолютного значения линейного коэффициента корреляции к нулю еще не означает отсутствие связи между признаками. При нелинейном виде модели связь может оказаться достаточно тесной. Для оценки качества подбора линейной функции рассчитывается квадрат линейного коэффициента корреляции
Соответственно величина Пусть Линейный коэффициент корреляции по содержанию отличается от коэффициента регрессии. Выступая показателем силы связи, коэффициент регрессии b на первый взгляд может быть использован как измеритель ее тесноты. Из уравнений Линейный коэффициент корреляции как измеритель тесноты линейной связи признаков логически связан не только с коэффициентом регрессии b, но и с коэффициентом эластичности, который является показателем силы связи, выраженным в процентах. При линейной связи признаков х и у средний коэффициент эластичности в целом по совокупности определяется как Несмотря на схожесть этих показателей, измерителем тесноты связи выступает линейный коэффициент корреляции Пусть уравнение регрессии составило
Несмотря на всю важность измерителя тесноты связи, в эконометрике больший практический интерес приобретает коэффициент детерминации После того как построено уравнение линейной регрессии, проводится оценка значимости как уравнения в целом, так и отдельных ее параметров. Оценка значимости уравнения регрессии в целом производится с помощью F -критерия Фишера. С F -критерием тесно связана характеристика, называемая числом степеней свободы, которая применительно к исследуемой проблеме показывает, сколько независимых отклонений из n -возможных требуется для образования данной суммы квадратов. Существует равенство между числом степеней свободы общей, факторной и остаточной суммы квадратов. Число степеней свободы для факторной суммы квадратов равно 1, для общей суммы квадратов равно (n -1), для остаточной суммы квадратов составляет (n -2).
Определение дисперсии на одну степень свободы приводит дисперсии к сравнимому виду. Сопоставляя факторную и остаточную дисперсии в расчете на одну степень свободы, получим величину F -отношения, т. е. F критерий
F -статистика используется для проверки нулевой гипотезы Н0: Если нулевая гипотеза H0 справедлива, то факторная и остаточная дисперсии не отличаются друг от друга. Если H0 несправедлива, то факторная дисперсия превышает остаточную - в несколько раз. Английским статистиком Снедекором разработаны таблицы критических значений F - отношений при разных уровнях значимости нулевой гипотезы и различном числе степеней свободы. Табличное значение F - критерия — это максимальная величина отношения дисперсий, которая может иметь место при случайном расхождении их для данного уровня вероятности наличия нулевой гипотезы. Вычисленное значение F – отношения признается достоверным (отличным от единицы), если оно больше табличного. В этом случае нулевая гипотеза об отсутствии связи признаков отклоняется и делается вывод о существенности этой связи:
Если же величина F окажется меньше табличной, то вероятность нулевой гипотезы выше заданного уровня (например, 0,05) и она не может быть отклонена без риска, сделать, неправильный вывод о наличии связи. В этом случае уравнение регрессии считается статистически незначимым: В рассматриваемом примере 2.1:
Поскольку Величина F - критерия связана с коэффициентом детерминации
а остаточную сумму квадратов — как
Тогда значение F - критерия можно выразить следующим образом:
В нашем примере Оценка значимости уравнения регрессии обычно дается в виде таблицы дисперсионного анализа (табл. 2.2). Таблица 2.2 Дисперсионный анализ результатов регрессии
В линейной регрессии обычно оценивается значимость не только уравнения в целом, но и отдельных его параметров. С этой целью по каждому из параметров определяется его стандартная ошибка: mb и ma. Стандартная ошибка коэффициента регрессии параметра mb рассчитывается по формуле:
где S2 — остаточная дисперсия на одну степень свободы. Для нашего примера величина стандартной ошибки коэффициента регрессии составила:
Отношение коэффициента регрессии к его стандартной ошибке дает t-статистику, которая подчиняется статистике Стьюдента при (n - 2) степенях свободы. Эта статистика применяется для проверки статистической значимости коэффициента регрессии и для расчета его доверительных интервалов. Для оценки значимости коэффициента регрессии его величину сравнивают с его стандартной ошибкой, т. е. определяют фактическое значение t - критерия Стьюдента: В рассматриваемом примере фактическое значение t -критерия для коэффициента регрессии составило:
Этот же результат получим после извлечения квадратного корня из найденного ранее F - критерия, т. е.
Покажем справедливость равенства
При α = 0,05 (для двустороннего критерия) и числе степеней свободы 5 табличное значение t= 2,57. Поскольку фактическое значение t - критерия превышает табличное, гипотезу о несущественности коэффициента регрессии можно отклонить. На основе стандартной ошибки может быть рассчитан доверительный интервал – множество значений, определенных как интервал между нижней и верхней границами неравенства. Доверительный интервал для коэффициента регрессии определяется как
Поскольку коэффициент регрессии в эконометрических исследованиях имеет четкую экономическую интерпретацию, доверительные границы интервала для коэффициента регрессии не должны содержать противоречивых результатов, например, Стандартная ошибка параметра а определяется по формуле:
Процедура оценивания значимости данного параметра не отличается от рассмотренной выше для коэффициента регрессии: вычисляется t - критерий:
его величина сравнивается с табличным значением при Значимость линейного коэффициента корреляции проверяется на основе величины ошибки коэффициента корреляции
Фактическое значение t - критерия Стьюдента определяется как
Данная формула свидетельствует, что в парной линейной регрессии Таким образом, проверка гипотез о значимости коэффициентов регрессии и корреляции равносильна проверке гипотезы о значимости линейного уравнения регрессии. В рассматриваемом примере tr не совпало с tb в результате ошибок округлений. Величина Рассмотренную формулу оценки коэффициента корреляции рекомендуется применять при большом числе наблюдений, а также, если r не близко к + 1 или — 1. Если же величина коэффициента корреляции близка к + 1, то распределение его оценок отличается от нормального, или распределения Стьюдента, так как величина коэффициента корреляции ограничена значениями от -1 до +1. Для того чтобы устранить это затруднение Р.Фишер предложил ввести вспомогательную величину z. (приложение 2, табл. 3), связанную с коэффициентом корреляции следующим отношением:
При изменении r от -1 до +1 величина z изменяется от -∞ до +∞, что соответствует нормальному распределению. Математический анализ доказывает, что распределение величины z мало отличается от нормального даже при близких к единице значениях коэффициента корреляции. Стандартная ошибка величины z рассчитывается по формуле
где n - число наблюдений. При
Величину z можно не рассчитывать, а воспользоваться готовыми таблицами z - преобразования, в которых приведены значения величины z для соответствующих значений r. Далее выдвигаем нулевую гипотезу H0 о том, что корреляция отсутствует, т. е. теоретическое значение коэффициента корреляции равно нулю. Коэффициент корреляции значимо отличен от нуля, если
Ввиду того, что r и z связаны между собой приведенным выше соотношением, можно вычислить критические значения r, соответствующие каждому из значений z. Таблицы критических значений r разработаны для уровней значимости 0,05 и 0,01 и соответствующего числа степеней свободы (приложение 2). Критические значения r предполагают справедливость нулевой гипотезы, т. е. r мало отлично от нуля. Если фактическое значение коэффициента корреляции по абсолютной величине превышает табличное, то данное значение r считается статистически значимым. Если же r оказывается меньше табличного, то фактическое значение r статистически незначимо. В рассматриваемом примере 2.1 при числе степеней свободы (n - 2) = 5 критическое значение r при α= 0,05 составляет 0,754, а при α= 0,01 — 0,874, что ниже фактической величины rух = 0,991. Следовательно, как было уже доказано, полученное значение r существенно отлично от нуля.
Поиск по сайту: |
|||||||||||||||||||||||||
Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав. Студалл.Орг (1.122 сек.) |