|
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
АвтоАвтоматизацияАрхитектураАстрономияАудитБиологияБухгалтерияВоенное делоГенетикаГеографияГеологияГосударствоДомДругоеЖурналистика и СМИИзобретательствоИностранные языкиИнформатикаИскусствоИсторияКомпьютерыКулинарияКультураЛексикологияЛитератураЛогикаМаркетингМатематикаМашиностроениеМедицинаМенеджментМеталлы и СваркаМеханикаМузыкаНаселениеОбразованиеОхрана безопасности жизниОхрана ТрудаПедагогикаПолитикаПравоПриборостроениеПрограммированиеПроизводствоПромышленностьПсихологияРадиоРегилияСвязьСоциологияСпортСтандартизацияСтроительствоТехнологииТорговляТуризмФизикаФизиологияФилософияФинансыХимияХозяйствоЦеннообразованиеЧерчениеЭкологияЭконометрикаЭкономикаЭлектроникаЮриспунденкция |
Проверка значимости и подбор модели с использованием коэффициентов детерминации. Информационные критерииРанее мы неоднократно задавались вопросом о том, как следует интерпретировать значения коэффициента детерминации Естественным было бы построение статистической процедуры проверки значимости линейной связи между переменными, основанной на значениях коэффициента детерминации Представим Отсюда находим: Большим значениям статистики При этом вероятность ошибочного отклонения гипотезы Интересно вычислить критические значения Ограничимся здесь простой линейной регрессией В зависимости от количества наблюдений
Иначе говоря, при большом количестве наблюдений даже весьма малые отклонения наблюдаемого значения Поскольку же значение
Если сравнивать модели по величине коэффициента детерминации R2, то с этой точки зрения полная модель всегда лучше (точнее, не хуже) редуцированной – значение R2 в полной модели всегда не меньше, чем в редуцированной, просто потому, что в полной модели остаточная сумма квадратов не может быть больше, чем в редуцированной. Действительно, в полной модели с по всем возможным значениям коэффициентов по всем возможным значениям коэффициентов Чтобы сделать процедуру выбора модели с использованием в который по-существу вводится штраф за увеличение количества объясняющих переменных. При этом, так что при При использовании коэффициента Замечание. Если при сравнении полной и редуцированных моделей оценивание каждой из альтернативных моделей производится с использованием одного и того же количества наблюдений, то тогда, как следует из формулы, определяющей Пример. Продолжая последний пример, находим значения коэффициента для для для Таким образом, выбирая модель по максимуму В этом конкретном случае сравнение всех трех моделей по величине Наряду со скорректированным коэффициентом детерминации, для выбора между несколькими альтернативными моделями часто используют так называемые информационные критерии: критерий Акаике и критерий Шварца, также «штрафующие» за увеличение количества объясняющих переменных в модели, но несколько отличными способами. Критерий Акаике (Akaike’s information criterion – AIC). При использовании этого критерия, линейной модели с где Критерий Шварца (Schwarz’s information criterion – SC, SIC). При использовании этого критерия, линейной модели с И здесь при увеличении количества объясняющих переменных первое слагаемое в правой части уменьшается, а второе увеличивается. Среди нескольких альтернативных моделей (полной и редуцированных) предпочтение отдается модели с наименьшим значением Пример. В последнем примере получаем для полной модели
Предпочтительной по обоим критериям оказывается опять модель Замечание. В рассмотренном примере все три критерия Включение в модель большого количества объясняющих переменных часто приводит к ситуации, которую называют мультиколлинеарностью. Мы обещали ранее коснуться проблемы мультиколлинеарности и сейчас выполним это обещание. Прежде всего, напомним наше предположение (4) матрица XTX невырождена, т. е. ее определитель отличен от нуля: которое можно заменить условием (4’) столбцы матрицы X линейно независимы. Полная мультиколлинеарность соответствует случаю, когда предположение (4) нарушается, т. е. когда столбцы матрицы ( На практике, указывая на наличие мультиколлинеарности, имеют в виду осложнения со статистическими выводами в ситуациях, когда формально условие (4) выполняется, но при этом определитель матрицы XTX близок к нулю. Указанием на то, что оценки коэффициента при этой переменной вследствие наличия такой «почти линейной» зависимости между этой и остальными объясняющими переменными. Здесь Если Мы можем аналогично определить коэффициент возрастания дисперсии Здесь Пример. Обращаясь опять к данным об импорте товаров и услуг во Францию, находим: Коэффициенты возрастания дисперсии для переменных Полученные значения коэффициентов возрастания дисперсий отражают очень сильную коррелированность переменных При наличии мультиколлинеарности может оказаться невозможным правильное разделение влияния отдельных объясняющих переменных. Удаление одной из переменных может привести к хорошо оцениваемой модели. Однако оставшиеся переменные примут на себя дополнительную нагрузку, так что коэффициент при каждой из этих переменных измеряет уже не собственно влияние этой переменной на объясняемую переменную, а учитывает также и часть влияния исключенных переменных, коррелированных с данной переменной. Пример. Продолжая последний пример, рассмотрим редуцированные модели, получаемые исключением из числа объясняющих переменных переменной c c В каждой из этих двух моделей коэффициенты при Но коэффициент при Приведем значения
Все четыре критерия выбирают в качестве наилучшей модель с исключенной переменной Мы не будем далее углубляться в проблему мультиколлинеарности, обсуждать другие ее последствия и возможные способы преодоления затруднений, связанных с мультиколлинеарностью. Заинтересованный читатель может обратиться по этому вопросу к более полным руководствам по эконометрике.
Поиск по сайту: |
Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав. Студалл.Орг (0.016 сек.) |