АвтоАвтоматизацияАрхитектураАстрономияАудитБиологияБухгалтерияВоенное делоГенетикаГеографияГеологияГосударствоДомДругоеЖурналистика и СМИИзобретательствоИностранные языкиИнформатикаИскусствоИсторияКомпьютерыКулинарияКультураЛексикологияЛитератураЛогикаМаркетингМатематикаМашиностроениеМедицинаМенеджментМеталлы и СваркаМеханикаМузыкаНаселениеОбразованиеОхрана безопасности жизниОхрана ТрудаПедагогикаПолитикаПравоПриборостроениеПрограммированиеПроизводствоПромышленностьПсихологияРадиоРегилияСвязьСоциологияСпортСтандартизацияСтроительствоТехнологииТорговляТуризмФизикаФизиологияФилософияФинансыХимияХозяйствоЦеннообразованиеЧерчениеЭкологияЭконометрикаЭкономикаЭлектроникаЮриспунденкция
|
КОЭФФИЦИЕНТЫ СВЯЗИ ДЛЯ НОМИНАЛЬНЫХ ПЕРЕМЕННЫХ
Номинальные. Для номинальных данных (которые не имеют естественного порядка - например, католическое, протестантское, иудейское вероисповедание) можно выбрать одну из следующих статистик: Фи (коэффициент) и V Крамéра, Коэффициент сопряженности, Лямбда.
Коэффициенты связи, основанные на χ2
- Коэффициент сопряженности Пирсона. Мера ассоциативной связи, основанная на хи-квадрат. Значение этого коэффициента заключено между 0 и 1, причем 0 означает отсутствие связи между переменными строки и столбца, а значение, близкое к 1, - высокую степень связи между этими переменными. Максимально возможное значение зависит от числа строк и столбцов в таблице.
- Меры связи фи и V Крамера. Фи - это мера связи, равная корню квадратному из значения хи-квадрат, деленного на объем выборки. V Крамера - это мера связи, основанная на статистике хи-квадрат.
Коэффициенты связи, основанные на прогнозе (Л.Гутман,1941 г.)
- Лямбда. Мера ассоциации, которая отражает относительное снижение ошибки, когда значения независимой переменной используются для предсказания значений зависимой переменной. Значение 1 означает, что независимая переменная полностью предсказывает значения зависимой. Значение 0 означает, что независимая переменная абсолютно бесполезна для предсказания зависимой.
- Коэффициент неопределенности. Мера связи, указывающая относительное снижение ошибки в случае, когда значения одной переменной используются для предсказания значений другой. Например, значение 0.83 указывает на то, что знание одной переменной уменьшает ошибку в предсказании значений другой на 83%. Вычисляются как симметричная, так и несимметричная версии коэффициента неопределенности.
!!!! Достоинством коэф. Лямбда является то, что в отличие от коэффициента χ2 либо производных от него само значение Лямбда имеет непосредственный смысл – это улучшение вероятности правильного предсказания.
КОЭФФИЦИЕНТЫ СВЯЗИ ДЛЯ ПОРЯДКОВЫХ ПЕРЕМЕННЫХ
Конечно, можно применять и предыдущие коэффициенты связи, но эти коэф-ты не используют данные о порядке следования градаций и следовательно, лишают нас возможности использовать всю содержащуюся в переменных информацию. Поэтому используются коэффициенты ранговой корреляции.
Пример, оценка в/связи м/у в какой мере вас устраивает жизнь и как бы вы оценили в наст. Время мат. Положение вашей семьи путем коэф. Пирсона и Крамера покажет в/связь между показателями, но не ответят на? возрастает или падает удовлетворенность жизнью в целом с ростом удовлетворенности материальн. Положением. (Спирмена, тау Кенэла, гамма Гудмена-Краскэла).
Порядковые. Для таблиц, в которых как строки, так и столбцы содержат упорядоченные значения, используются Гамма.
- Гамма. Симметричная мера связи между двумя порядковыми переменными, значения которой меняются между -1 и 1. Значения, близкие по абсолютной величине к 1, указывают на сильную связь переменных, значения, близкие к 0, - на слабую связь или ее отсутствие. Для таблиц сопряженности двух переменных вычисляется гамма нулевого порядка. Если же таблица сопряженности включает более двух переменных, для каждой подтаблицы вычисляется условная гамма.
- d Сомерса. Мера связи между двумя порядковыми переменными, изменяется между -1 и 1. Значения, близкие по абсолютной величине к 1, указывают на сильную связь между двумя переменными, а значения, близкие к 0, - на слабую связь или ее отсутствие. Это асимметричное расширение меры гамма, отличающееся только включением числа пар, не имеющих совпадений (связей) по независимой переменной. Вычисляется также симметричная версия этой статистики.
- Тау-b Кендалла. Непараметрическая мера связи. Предназначена для порядковых или ранговых переменных, учитывает возможные совпадения значений (связи). Знак коэффициента указывает направление связи, а его модуль - силу связи, причем, чем он больше, тем связь сильнее. Значения изменяются в диапазоне между -1 и +1, однако -1 и +1 могут получаться только для квадратных таблиц.
- Тау-c Кендалла. Непараметрическая мера связи для порядковых переменных, игнорирующая возможные совпадения значений (связи). Знак коэффициента указывает направление связи, а его модуль - силу связи, причем, чем он больше, тем связь сильнее. Значения изменяются в диапазоне между -1 и +1, однако -1 и +1 можно получить только для квадратных таблиц.
Пример: в табл. Вывода вычисления коэф. Гамма важны для анализа 2 показателя:
Value – значение коэф. С вероятностью 95% для ген. Совокупности будет находиться в этом интервале+-0,03. 1 | 2 | Поиск по сайту:
|