АвтоАвтоматизацияАрхитектураАстрономияАудитБиологияБухгалтерияВоенное делоГенетикаГеографияГеологияГосударствоДомДругоеЖурналистика и СМИИзобретательствоИностранные языкиИнформатикаИскусствоИсторияКомпьютерыКулинарияКультураЛексикологияЛитератураЛогикаМаркетингМатематикаМашиностроениеМедицинаМенеджментМеталлы и СваркаМеханикаМузыкаНаселениеОбразованиеОхрана безопасности жизниОхрана ТрудаПедагогикаПолитикаПравоПриборостроениеПрограммированиеПроизводствоПромышленностьПсихологияРадиоРегилияСвязьСоциологияСпортСтандартизацияСтроительствоТехнологииТорговляТуризмФизикаФизиологияФилософияФинансыХимияХозяйствоЦеннообразованиеЧерчениеЭкологияЭконометрикаЭкономикаЭлектроникаЮриспунденкция

X. Метод корреляции

Читайте также:
  1. I. ГИМНАСТИКА, ЕЕ ЗАДАЧИ И МЕТОДИЧЕСКИЕ ОСОБЕННОСТИ
  2. I. Методические основы
  3. I. Предмет и метод теоретической экономики
  4. II. Метод упреждающего вписывания
  5. II. МЕТОДИЧЕСКИЕ УКАЗАНИЯ ДЛЯ ВЫПОЛНЕНИЯ САМОСТОЯТЕЛЬНОЙ РАБОТЫ
  6. II. Методы непрямого остеосинтеза.
  7. II. Проблема источника и метода познания.
  8. II. УЧЕБНО-МЕТОДИЧЕСКАЯ КАРТА ДИСЦИПЛИНЫ
  9. III. Методологические основы истории
  10. III. Предмет, метод и функции философии.
  11. III. Социологический метод
  12. III. УЧЕБНО – МЕТОДИЧЕСКИЕ МАТЕРИАЛЫ ПО КУРСУ «ИСТОРИЯ ЗАРУБЕЖНОЙ ЛИТЕРАТУРЫ К. XIX – НАЧ. XX В.»

 

При проведении исследования в биологии или медицине, как правило, регистрируются множество учетных признаков. Представляет интерес вопрос об их взаимном изменении, т.е. обнаружение зависимостей между ними. Выявление наличия таких взаимосвязей является одной из важнейших задач любой науки, в том числе и медицины.

Различают две формы количественных связей между явлениями или процессами: функциональную и корреляционную. Под ФУНКЦИОНАЛЬНОЙ понимают такую связь, при которой любому значению одного из признаков соответствует строго определенное значение другого. В точных науках, таких, как физика, химия и другие, может быть установлена функциональная взаимосвязь. Например, зависимость площади круга от длины окружности в геометрии, или в физике длина пути, пройденной телом в свободном падении, от времени. Наиболее известным видом функциональной зависимости является линейная, которая выражается математической формулой: y = ax+b.

В биологии и медицине установить функциональную зависимость, как правило, не удается. Объекты этих исследований имеют большую изменчивость и зависят от огромного числа факторов, измерить которые просто невозможно. В этом случае определяется наличие КОРРЕЛЯЦИОННОЙ связи, при которой значению каждой средней величины одного признака соответствует несколько значений другого взаимосвязанного с ним признака. Например: связь между ростом и массой тела человека. У группы людей с одинаковым ростом наблюдается различная масса тела, однако она варьирует в определенных пределах вокруг средней величины. Поэтому такую зависимость нужно оценивать с использованием понятия случайной величины с привлечением подходов теории вероятности. Такую форму зависимостей называют «Корреляционной».

 

При поиске зависимости между признаками может быть обнаружена взаимосвязь, различная по направлению и силе:

- Прямая (при увеличении одного признака увеличивается второй);

- Обратная (при увеличении одного признака второй уменьшается).

 

Степень взаимосвязи признаков по силе (тесноте) принято обозначать как:

- Отсутствие;

- Слабая;

- Средняя;

- Сильная;

- Полная.

 

Способами выявления корреляционной взаимосвязи между признаками являются:

- Визуальные (таблицы и графики).

- Статистические (корреляция и регрессия).

 

Следует подчеркнуть, что обнаружение корреляции между двумя признаками еще не говорит о существовании причинной связи между ними, а лишь указывает на возможность таковой или на наличие фактора, определяющего изменение обеих переменных совместно.

Приёмы визуализации данных позволяют обнаружить корреляционную зависимость лишь при небольшом числе наблюдений и только приблизительно. Для обнаружения корреляционной взаимосвязи с помощью таблицы в ней располагают ранжированные вариационные ряды и затем определяют совместное изменение признаков. График более наглядно демонстрирует такую зависимость и позволяет оценить ее форму: линейная, параболическая, тригонометрическая и др.

Наиболее точным способом обнаружения взаимосвязи между признаками является вычисление коэффициента корреляции. В зависимости от природы обрабатываемых данных применяются параметрические или непараметрические методы вычисления этого коэффициента.

При вычислении коэффициента корреляции исследователь получает возможность судить о силе связи (степени сопряженности) и ее направлении, а также с требуемой долей вероятности делать вывод о проявлении этой связи в генеральной совокупности. Чем больше коэффициент корреляции, тем с большей степенью уверенности можно говорить о наличии корреляционной зависимости между признаками. Если каждому заданному значению одного признака соответствуют близкие друг к другу, тесно расположенные около средней величины значения другого признака, то связь является более тесной. Когда эти значения сильно варьируют, связь менее тесная. Таким образом, мера корреляции указывает, насколько тесно связаны между собой параметры.

Коэффициент корреляции может принимать значения от -1 до +1. Направление обнаруженной взаимосвязи определяют по знаку коэффициента корреляции. При его положительном значении обнаруженная связь является прямой, при отрицательном – обратной. Сила связи оценивается по модулю этого коэффициента. Условно выделяют следующие уровни корреляционной связи: отсутствие – 0; слабая – от 0 до 0,3; средняя – от 0,3 до 0,7; сильная – 0,7 и более; полная – 1. Однако обсуждать наличие корреляции имеет смысл только в тех случаях, когда она статистически значима (p<0,05). Поэтому после вычисления коэффициента корреляции производится определение его ошибки репрезентативности и критерия достоверности.

Наиболее часто применяемыми в настоящее время методами обнаружения корреляции являются параметрический анализ по Пирсону и непараметрический анализ по Спирмену. Этими методами проверяется нулевая гипотеза (H0) об отсутствии связи между параметрами. Если такая гипотеза отклоняется при заданном уровне значимости (p), можно говорить о наличии взаимосвязи между параметрами.

 

Корреляционный анализ по Пирсону используется при решении задачи исследования линейной связи двух нормально распределенных параметров. Кроме проверки на нормальность распределения каждого параметра, до проведения корреляционного анализа рекомендуется строить график в координатах оцениваемых параметров, чтобы визуально определить характер зависимости.

Коэффициент корреляции Пирсона (rxy) или коэффициент линейной корреляции, был разработан в 90-х годах XIX века Карлом Пирсон, Фрэнсисом Эджуортом и Рафаэлем Уэлдоном в Англии. Он рассчитывается по формуле:

 

 

где: rxy – коэффициент линейной корреляции Пирсона;

covXY – ковариация признаков X и Y;

σX – среднее квадратическое отклонение признака X;

σY – среднее квадратическое отклонение признака Y;

– средняя арифметическая признака X;

– средняя арифметическая признака Y.

 

В медицинской литературе встречается упрощенная запись этой формулы:

 

где: rxy – коэффициент линейной корреляции Пирсона;

dx – отклонение каждой варианты признака x от средней этого признака: dx = x - Mx,

dy – отклонение каждой варианты признака y от средней этого признака: dy = y - My.

 

В программе Excel значение коэффициент линейной корреляции Пирсона может быть вычислено функцией = КОРРЕЛ(Диапазон ячеек 1-го ряда; Диапазон ячеек 2-го ряда).

Для прогнозирования уровня корреляции в генеральной совокупности определяют ошибку репрезентативности этого коэффициента mr. Она вычисляется по формуле:

,

где: mr – ошибка репрезентативности коэффициента корреляции;

rxy – коэффициент линейной корреляции Пирсона;

n – число парных вариант.

 

Достоверность коэффициента линейной корреляции оценивается по коэффициенту Стьюдента (tr), который вычисляется с использованием его ошибки:

,

где: tr – коэффициент достоверности Стьюдента;

rxy – коэффициент линейной корреляции Пирсона;

mr – ошибка репрезентативности коэффициента корреляции.

 

Если число парных вариант n>30, то при tr >2 связь считается достоверной при уровне значимости p<0,05. Если число парных вариант n<30, то критическое значение tr-Крит. находят по таблице критических значений Стьюдента при степени свободы df = n - 2. В программе Excel это значение вычисляется функцией = СТЬЮДРАСПОБР(Уровень значимости p; Степени свободыdf).

С целью уменьшения объема вычислений может применяться функция =КОРРЕЛ(Диапазон1; Диапазон2) или надстройка «Анализ данных» и ее модуль «Корреляционный анализ».

 

Отсутствие линейной корреляции еще не означает, что параметры полностью независимы. Связь между ними может быть нелинейной, или признаки, используемые в вычислениях, могут не подчиняться нормальному закону распределения. Поэтому, помимо вычисления коэффициента линейной корреляции, прибегают к использованию непараметрических коэффициентов корреляции. К ним относятся:

- Коэффициент ранговой корреляции Спирмена;

- Коэффициент ранговой корреляции Кендалла;

- Коэффициент корреляции знаков Фехнера;

- Коэффициент множественной ранговой корреляции (конкордации).

 

Корреляционный анализ по Спирмену применяется для обнаружения взаимосвязи двух параметров, если распределение хотя бы одного из них отлично от нормального.

Каждому показателю x и y присваивается ранг. На основе полученных рангов рассчитываются их разности d. Затем вычисляется коэффициент корреляции (ρ) по формуле:

где: r – коэффициент корреляции Спирмена;

d – разность рангов;

n – число парных вариант.

 

Ошибка репрезентативности коэффициента корреляции Спирмена определяется по формуле:

,

а коэффициент достоверности Стьюдента:

,

где: tr – коэффициент достоверности Стьюдента;

r – коэффициент корреляции Спирмена;

mr – ошибка репрезентативности коэффициента корреляции Спирмена.

 

Оценка коэффициента корреляции Спирмена и его достоверности выполняется так же, как и коэффициента линейной корреляции Пирсона.

Пример решения задачи на выявление корреляционной зависимости.

Условие задачи: выполнены измерения уровня запыленности на рабочих местах работников с учетом температуры в помещении (таблица 30).

 

 

Таблица 30

Результаты измерений запыленности в помещении с учетом температуры окружающей среды

Измерение на рабочем месте Температура воздуха Со Запыленность мг/м3
1. Слесарь 0,2
2. Электрик 0,25
3. Сварщик 0,24
4. ... 0,08
5. ... 0,08
6. ... 0,07
7. ... 0,3
8. ... 0,28
9. ... 0,33
10. ... 0,31
11. ... 0,26
12. ... 0,27

Задание: определить силу и направление зависимости между температурой окружающей среды и уровнем запыленности помещения с помощью:

а) таблицы;

б) графического изображения взаимосвязи между признаками;

в) коэффициента корреляции Пирсона;

г) коэффициента корреляции Спирмена.

 

Решение: запустите программу Excel, откройте требуемый файл в папке своей учебной группы под именем «Статистика–Фамилии студентов». Создайте НОВЫЙ лист, переименуйте его, обозначив названием «Коррел-я». На этом листе введите данные и решение задачи, как показано ниже, сохраните изменения и покажите результат работы преподавателю.

а) Требуется выполнить ранжирование вариационных рядов и поместить их рядом друг с другом, как показано в таблице 31, а затем проанализировать совместное возрастание или убывание значений.

 

Таблица 31

Ранжированные вариационные ряды

...

1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | 10 | 11 | 12 | 13 | 14 | 15 | 16 | 17 | 18 | 19 | 20 | 21 | 22 | 23 | 24 | 25 | 26 | 27 | 28 | 29 | 30 |



Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав. Студалл.Орг (0.011 сек.)