|
|||||||
АвтоАвтоматизацияАрхитектураАстрономияАудитБиологияБухгалтерияВоенное делоГенетикаГеографияГеологияГосударствоДомДругоеЖурналистика и СМИИзобретательствоИностранные языкиИнформатикаИскусствоИсторияКомпьютерыКулинарияКультураЛексикологияЛитератураЛогикаМаркетингМатематикаМашиностроениеМедицинаМенеджментМеталлы и СваркаМеханикаМузыкаНаселениеОбразованиеОхрана безопасности жизниОхрана ТрудаПедагогикаПолитикаПравоПриборостроениеПрограммированиеПроизводствоПромышленностьПсихологияРадиоРегилияСвязьСоциологияСпортСтандартизацияСтроительствоТехнологииТорговляТуризмФизикаФизиологияФилософияФинансыХимияХозяйствоЦеннообразованиеЧерчениеЭкологияЭконометрикаЭкономикаЭлектроникаЮриспунденкция |
Теоретическая часть. Корреляционная связь - это согласованное изменение двух признаков, отражающее тот факт, что изменчивость одного признака находится в соответствии сКорреляционная связь - это согласованное изменение двух признаков, отражающее тот факт, что изменчивость одного признака находится в соответствии с изменчивостью другого. Корреляционные связи - это вероятностные изменения, которые можно изучать только на представительных выборках методами математической статистики. Корреляция изучается на основании экспериментальных данных, представляющих собой измеренные значения (xi, yi) двух признаков. Корреляция - это мера связи между двумя переменными. Показателем тесноты связи является выборочный коэффициент корреляции (или просто коэффициент корреляции). Коэффициент корреляции может изменяться от -1.00 до +1.00. Значение -1.00 означает полностью отрицательную корреляцию, значение +1.00 означает полностью положительную корреляцию. Значение 0.00 означает отсутствие корреляции. Этапы корреляционного анализа
Практическая реализация корреляционного анализа включает следующие этапы: а) постановка задачи и выбор признаков; б) сбор информации и ее первичная обработка (группировки, исключение аномальных наблюдений, проверка нормальности одномерного распределения); в) предварительная характеристика взаимосвязей (аналитические группировки, графики); г) устранение мультиколлинеарности (взаимозависимости факторов) и уточнение набора показателей путем расчета парных коэффициентов корреляции; д) исследование факторной зависимости и проверка ее значимости; е) оценка результатов анализа и подготовка рекомендаций по их практическому использованию Наиболее часто используемый коэффициент корреляции Пирсона r называется также линейной корреляцией, т.к. измеряет степень линейных связей между переменными. Можно сказать, что корреляция определяет степень, с которой значения двух переменных пропорциональны друг другу. Важно, что значение коэффициента корреляции не зависит от масштаба измерения. Корреляция высокая, если на графике зависимость можно представить прямой линией (с положительным или отрицательным углом наклона). Проведенная прямая называется прямой регрессии или прямой, построенной методом наименьших квадратов. Основные свойства коэффициентов корреляции
К основным свойствам коэффициента корреляции необходимо отнести следующие: - коэффициенты корреляции способны характеризовать только линейные связи, т.е. такие, которые выражаются уравнением линейной функции. При наличии нелинейной зависимости между варьирующими признаками следует использовать другие показатели связи; - значения коэффициентов корреляции – это отвлеченные числа, лежащее в пределах от —1 до +1, т.е. -1 < r < 1; - при независимом варьировании признаков, когда связь между ними отсутствует, r= 0; - при положительной, или прямой, связи, когда с увеличением значений одного признака возрастают значения другого, коэффициент корреляции приобретает положительный знак и находится в пределах от 0 до +1, т.е. 0 < r < 1; - при отрицательной, или обратной, связи, когда с увеличением значений одного признака соответственно уменьшаются значения другого, коэффициент корреляции сопровождается отрицательным знаком и находится в пределах от 0 до –1, т.е. -1 < r <0; - чем сильнее связь между признаками, тем ближе величина коэффициента корреляции к 1. Если r = ±1, то корреляционная связь переходит в функциональную, т.е. каждому значению признака Х будет соответствовать одно или несколько строго определенных значений признака Y; - только по величине коэффициентов корреляции нельзя судить о достоверности корреляционной связи между признаками. Этот параметр зависит от числа степеней свободы f= n –2, где n – число коррелируемых пар показателей Х и Y. Чем больше n, тем выше достоверность связи при одном и том же значении коэффициента корреляции. В статистических исследованиях для исследования зависимости между двумя видами данных применяется диаграмма разброса. Диаграмма разброса строится как график зависимости между двумя параметрами. Если на этом графике провести линию медианы. То он позволяет легко определить имеется ли между этими двумя параметрами корреляционная зависимость. На диаграмме проводится вертикальная и горизонтальная линии медиан. В каждом из четырёх квадрантов, получившихся в результате разделения диаграммы разброса медианами, подсчитывают число точек и обозначают n1, n2, n3, n4 соответственно. Точки, через которые прошла медиана, не учитывают. Отдельно складывают точки в положительных и точки в отрицательных квадрантах по формулам: (1) (2) (3) Для определения наличия и степени корреляции по методу медианы используются специальная таблица (таблица 4.6 в [1]) кодовых k при двух значениях коэффициента риска α (0.01 и 0.05). Если меньше из чисел или оказывается равным или меньше табличного кодового значения, то корреляционная зависимость имеет место. При > существует прямая корреляция; при < - обратная. Для установления формы зависимости между переменными используют уравнения в виде: yx = b0 + b1x; (4) Коэффициент b1 – выборочный коэффициент регрессии Y по X (будем обозначать символом byx). Этот коэффициент показывает, на сколько единиц в среднем изменяется переменная Y при увеличении переменной X на одну единицу. (5) где - выборочная ковариация; (6) где (n – число пар), (7) (8) (9) Sx2 – выборочная дисперсия переменной x: (10) где (11) (12) Тогда уравнение регрессии Y и X: (13) а уравнение регрессии X и Y: (14) где bxy – выборочный коэффициент регрессии X по Y, показывающий на сколько единиц в среднем изменяется переменная X при увеличении переменной Y на одну единицу: (15) Sy2 – выборочная дисперсия переменной x: (16) где (17) (18) Для оценки тесноты корреляционной зависимости используется . (19)
Поиск по сайту: |
Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав. Студалл.Орг (0.004 сек.) |