|
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
АвтоАвтоматизацияАрхитектураАстрономияАудитБиологияБухгалтерияВоенное делоГенетикаГеографияГеологияГосударствоДомДругоеЖурналистика и СМИИзобретательствоИностранные языкиИнформатикаИскусствоИсторияКомпьютерыКулинарияКультураЛексикологияЛитератураЛогикаМаркетингМатематикаМашиностроениеМедицинаМенеджментМеталлы и СваркаМеханикаМузыкаНаселениеОбразованиеОхрана безопасности жизниОхрана ТрудаПедагогикаПолитикаПравоПриборостроениеПрограммированиеПроизводствоПромышленностьПсихологияРадиоРегилияСвязьСоциологияСпортСтандартизацияСтроительствоТехнологииТорговляТуризмФизикаФизиологияФилософияФинансыХимияХозяйствоЦеннообразованиеЧерчениеЭкологияЭконометрикаЭкономикаЭлектроникаЮриспунденкция |
РАСЧЕТ ПОКАЗАТЕЛЕЙ КОРРЕЛЯЦИИ
Цель – познакомить студентов с основными способами расчета показателей корреляции.
В отличие от функциональной связи, когда одному значению аргумента (х) соответствует определенное значение функции (у), при корреляционной связи – одному конкретному значению аргумента соответствует приближенное, или некоторое множество значений функции. Близость этого множества значений функции к друг другу соответствует понятию силы или тесноты корреляционной связи. Биологические объекты всегда в той или иной степени неоднородны по своим наследственным особенностям и, кроме того, в любом, даже тщательно спланированном эксперименте его объекты испытывают не учитываемые воздействия факторов внешней среды. При изучении корреляционных связей возникают два основных вопроса – о тесноте связи и о форме связи. Для измерения тесноты и формы связи используют специальные статистические методы, называемые корреляцией и регрессией. По форме корреляция может быть линейной и криволинейной, по направлению прямой и обратной. В пособии рассматривается только случай линейной корреляции как наиболее простой. Под линейной корреляцией между двумя признаками X и Y понимают такую зависимость, которая носит линейный характер и выражается уравнением прямой линии Y = a + bX. Это уравнение называется уравнением регрессии Y по X, а соответствующая ему прямая линия – выборочной линией регрессии. Пример 5.1. Изучали зависимость между массой тела гамадрилов-матерей и их новорожденных детенышей. Под наблюдением находилось 20 обезьян. Результаты наблюдений приведены в первых двух столбцах таблицы.
Необходимо установить тесноту и направление связи между этими признаками. Для этого наиболее приемлемой статистикой является коэффициент корреляции, который вычисляется по формуле: Коэффициент вариации это отвлеченное число, лежащее в интервалах от – 1 до + 1. При независимом варьировании признаков, когда связь между ними полностью отсутствует, Для расчета коэффициента корреляции нам необходимо найти значения средних арифметических для анализируемой пары признаков. Они равны Далее находим значения средних квадратических отклонений, по формулам известным из предыдущих модулей задачника. Они равны Рассчитаем значение Таким образом, полученная величина эмпирического коэффициента вариации указывает на наличие положительной средней силы корреляционной связи между массой тела гамадрилов матерей и массой тела их детенышей. Эмпирический коэффициент корреляции служит оценкой своего генерального параметра (генерального коэффициента корреляции
Отношение выборочного коэффициента корреляции к своей ошибке служит критерием для проверки нулевой гипотезы – предположения, что в генеральной совокупности этот показатель равен нулю, т.е. Рассчитаем фактический критерий Стьюдента:
По таблице значений критерия Стьюдента находим Таким образом, нулевая гипотеза отвергается при доверительной вероятности P = 95%. После того как установлено наличие корреляционной связи между двумя изученными признаками, можно установить закономерность количественного изменения одного из признаков (функция) при изменении другого (аргумент). С этой целью изучаемую связь выражают аналитически – в виде соответствующего уравнения регрессии и графически – с вычислением точек теоретической кривой по найденному уравнению. Пример 5.2. Необходимо рассчитать уравнение линейной регрессии отражающую зависимость между массой тела гамадрилов-матерей и их новорожденных детенышей и выразить его графически (по данным примера 5.1.). Уравнение регрессии может быть записано следующим образом:
Найдем значение Используя уравнение В результате уравнение регрессии будет выглядеть следующим образом:
На рисунке прямая – теоретическая линия прямолинейной регрессии расположена на фоне эмпирических значений функции. Ошибка уравнения прямолинейной регрессии (ли криволинейной) вычисляется по формуле: Необходимые для определения ошибки регрессии, предварительные расчеты приведены в таблице
Подставим полученные результаты в формулу Коэффициент регрессии – основной параметр уравнения прямой линии, поэтому необходимо оценивать достоверность отличия коэффициента b от нуля ( Критерий Стьюдента рассчитывается по формуле: Фактическое значение коэффициента Стьюдента По таблице при P = 95% Пример 5.3. Требуется объективно подобрать из числа опытных специалистов группу экспертов для оценки сортов декоративных растений. Для этого двум специалистам предлагается оценить 13 сортов одной цветочной культуры. Оценка ведется по комплексу признаков и выражается в виде суммы балов. В этом случае может быть использован показатель корреляции рангов по Спирмэну. Сила корреляционной связи между двумя признаками при помощи этого показателя измеряется в основном для небольших невзвешенных рядов, которые представляют собой качественные оценки признаков. Необходимые данные для расчета показателя корреляции рангов между оценками двух экспертов приведены в таблице.
Последовательность действий при расчете показателя корреляции рангов следующая: Ранжируем данные рядов Х и У от большего к меньшему, присваивая вариантам порядковый номер. Варианта 72 ряда Х получает ранг 1, варианта 67 – ранг 2, варианты 64 и 64 должны были бы получить ранги 3 и 4, но так как они имеют равное значение, то берется средний ранг для обеих вариант: (3+4)/2 = 3,5. Остальные ранги рядов присваиваются по аналогии и представлены в таблице; Получаем разность рангов без учета их знаков; Возводим разности в квадрат и суммируем, получаем Подставляем полученные значения в формулу
Достоверность показателя корреляции рангов оценивается по формуле
Подставим имеющиеся данные и найдем Следовательно, полученный показатель корреляции рангов статистически недостоверен и кандидаты на должность эксперта не подходят или не подходит один из них. Пример 5.4. Необходимо установить связь между плодовитостью самок кролика в системе «родители – дети»
В этом случае показатель наследуемости может служить коэффициент корреляции рангов Спирмэна, способ расчета которого приведен в примере 5.3. Подставим имеющиеся значения в формулу: Достоверность показателя наследуемости (корреляции рангов) оценим по формуле Вопросы для самоконтроля: 1. Что такое корреляция? 2. Какая разница между корреляционной и функциональной зависимостью? 3. Какая разница между положительной и отрицательной корреляциями? 4. Что такое корреляционная решетка? Объясните как она строится. Можно ли судить о характере корреляции по расположению данных в корреляционной решетке? 5. Каковы возможные значения коэффициента корреляции? Какие значения коэффициента корреляции следует считать высокими, средними и почему? 6. Всегда ли при r = 0 корреляционная связь отсутствует? 7. Чему равен коэффициент корреляции при полной корреляционной связи? Поиск по сайту: |
Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав. Студалл.Орг (0.009 сек.) |