АвтоАвтоматизацияАрхитектураАстрономияАудитБиологияБухгалтерияВоенное делоГенетикаГеографияГеологияГосударствоДомДругоеЖурналистика и СМИИзобретательствоИностранные языкиИнформатикаИскусствоИсторияКомпьютерыКулинарияКультураЛексикологияЛитератураЛогикаМаркетингМатематикаМашиностроениеМедицинаМенеджментМеталлы и СваркаМеханикаМузыкаНаселениеОбразованиеОхрана безопасности жизниОхрана ТрудаПедагогикаПолитикаПравоПриборостроениеПрограммированиеПроизводствоПромышленностьПсихологияРадиоРегилияСвязьСоциологияСпортСтандартизацияСтроительствоТехнологииТорговляТуризмФизикаФизиологияФилософияФинансыХимияХозяйствоЦеннообразованиеЧерчениеЭкологияЭконометрикаЭкономикаЭлектроникаЮриспунденкция

Мультиколлинеарность, выявление и устранение

Читайте также:
  1. SWOT-анализ деятельности предприятия ООО «Кока-Кола»: выявление альтернативных стратегических задач
  2. Автокорреляция уровней временного ряда и выявление его структуры
  3. Анизотропия. Выявление анизотропии свойств геологических переменных методами геостатистики.
  4. Возбудитель дифтерии. Таксономия. Характеристика. Микробиологическая диагностика. Выявление антитоксического иммунитета. Специфическая профилактика и лечение.
  5. Выявление заблуждений есть первый шаг на пути познания.
  6. Выявление и анализ проблем
  7. Выявление неклеточных структур соединительной ткани
  8. Выявление потребностей пользователей сервисов 1С:ИТС
  9. Выявление представлений об алкоголе
  10. ВЫЯВЛЕНИЕ ПРОБЛЕМ И РЕКОМЕНДАЦИИ ПО УЛУЧШЕНИЮ ЭФФЕКТИВНОСТИ ДЕЯТЕЛЬНОСТИ ПРЕДПРИЯТИЯ
  11. Информационная насыщенность тестовых слов на выявление вредной привычки в виде чрезмерного употребления спиртных напитков и причин её появления
  12. Лабораторная работа № 3. Композиционное решение фронтальной поверхности и выявление ее пластики в макете

Исследовать построенную КЛММР на наличие мультиколлинеарности с помощью внешних, формальных признаков. В случае наличия, устранить методом «Пошаговой регрессии» с исключением переменных. Провести исследования полученной модели.

Проведя содержательный анализ факторных признаков можно предположить наличие в модели мультиколлинеарности, а именно наличие зависимости между х1 и х2(коэффициент брачности и коэффициент разводимости).

Внешние признаки мультиколлинеарности:

1. Коэффициенты при Х2, Х3, Х5 имеют неправильные знаки.

2. Из 5 коэффициентов, только β1 и β4 являются значимыми, остальные три не значимы.

3. Стандартное отклонение при коэффициентах β3, β5 равны самим коэффициентам.

4. Построим доверительные интервалы для коэффициентов β1, β2, β3, β4, β5.

0,094 ≤ β1 ≤ 1,165

-0,085 ≤ β2 ≤ 0,57

-0,086 ≤ β3 ≤ -0,23

-0,00042 ≤ β4 ≤ -0,0001

-0,001 ≤ β5 ≤ 0,0039

Таким образом, видно, что все доверительные интервалы для коэффициентов, кроме β3 и β4 содержат внутри себя ноль.

Формальные признаки:

1. Расчёт матриц парных коэффициентов корреляции и отбор информативных факторов в модели.

Значения линейных коэффициентов парной корреляции определяют тесноту попарно связанных переменных, использованных в данном уравнении множественной регрессии.

Матрицу парных коэффициентов корреляции переменных можно рассчитать, используя инструмент анализа данных Корреляция (рисунок 3).

Рисунок 3 – Матрица парных коэффициентов корреляции переменных

Между x5 и x4, т.к. и между x3 и x5, т.к. существует умеренная связь.

Среди оценок коэффициентов парной корреляции объясняющих переменных нет, которые по абсолютной величине больше, чем 0,7. Связь между факторами слабая.

Среди коэффициентов детерминации каждого из факторного признака на все остальные, есть такие значения, которые не близки к 1. Отсутствует тесная связь.

На основе внешних признаков можем сказать о присутствии мультиколлинеарности.

Для устранения мультиколлинеарности воспользуемся методом «Пошаговой регрессии» с исключением переменных:

1 На первом шаге строим уравнение регрессии для всех k факторных

признаков.

Проверяем коэффициенты на значимость. Выдвигается гипотеза

Н0j=0 – коэффициенты не значимы. И ей противоположная

Н1: вj≠0 – коэффициенты значимы.

Для проверки гипотезы используется статистика |t|, которая в случае справедливости Н0 имеет распределение Стьюдента с числом степеней свободы υ=n-k-1.

Если |t| > tкр, то H0 отвергается и принимается H1 – коэффициенты

значимы. И наоборот.

Среди коэффициентов есть незначимый – β3, т.к. |tв3| = 0,93, а tкр = 2,0117. Следовательно, приступаем ко 2 шагу.

2 Исключаем незначимый коэффициент, после чего строим уравнение

регрессии для (k-1) признаков. Получаем:

=8,85+0,59х1+0,22х2-0,0002х4+0,0016х5

Повторяем проверку коэффициентов уравнения на значимость.

Среди коэффициентов есть незначимый – β5, т.к. |tв5| = 1,36, а tкр =

2,0117.

3 Исключаем незначимый коэффициент, строим уравнение

Регрессии для (k-2) признаков. Уравнение регрессии примет вид:

=9,6+0,49х1+0,247х2-0,00018х4

Проверяем коэффициенты на значимость. Среди коэффициентов уравнения есть незначимый – β2.

4 Исключаем незначимый коэффициент β2, строим уравнение регрессии для (k-3) коэффициентов. Уравнение регрессии примет вид:

=10,29+0,52х1 -0,00015 х4

Следовательно, коэффициенты β1 и β4 значимые.

Т.к. из 5 взятых изначально коэффициентов значимые только β1, β4, то при увеличении коэффициента брачности на 1% рождаемость увеличится на 0,52‰ в среднем, а с увеличением объема платных услуг на душу населения на 1 рубль рождаемость снизится на 0,00015‰ в среднем.

 


1 | 2 | 3 | 4 | 5 |

Поиск по сайту:



Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав. Студалл.Орг (0.004 сек.)