|
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
АвтоАвтоматизацияАрхитектураАстрономияАудитБиологияБухгалтерияВоенное делоГенетикаГеографияГеологияГосударствоДомДругоеЖурналистика и СМИИзобретательствоИностранные языкиИнформатикаИскусствоИсторияКомпьютерыКулинарияКультураЛексикологияЛитератураЛогикаМаркетингМатематикаМашиностроениеМедицинаМенеджментМеталлы и СваркаМеханикаМузыкаНаселениеОбразованиеОхрана безопасности жизниОхрана ТрудаПедагогикаПолитикаПравоПриборостроениеПрограммированиеПроизводствоПромышленностьПсихологияРадиоРегилияСвязьСоциологияСпортСтандартизацияСтроительствоТехнологииТорговляТуризмФизикаФизиологияФилософияФинансыХимияХозяйствоЦеннообразованиеЧерчениеЭкологияЭконометрикаЭкономикаЭлектроникаЮриспунденкция |
Вибірковий коефіцієнт кореляціїНехай для дослідження залежності між випадковими величинами та (ознаками генеральної сукупності) маємо вибірку , обсягу . На основі цієї вибірки потрібно визначити напрям і ступінь лінійного кореляційного зв’язку між випадковими величинами та . У найпростіший спосіб наявність кореляційного зв’язку між випадковими величинами визначається шляхом побудови і візуального аналізу діаграми розсіювання, яку отримуємо за допомогою зображення елементів вибірки точками площини При цьому, якщо точки площини розсіяні вздовж прямої лінії, то можна припустити, що між випадковими величинами та існує тісний кореляційний зв’язок.
а) б) Рис.5.1. Лінійна кореляційна залежність між випадковими величинами
Наприклад, розміщення точок , яке зображене на рис.5.1 характеризує лінійну кореляційну залежність між випадковими величинами та , бо ці точки розміщені близько до прямих, які нарисовані суцільними лініями. При цьому, пряма на рис 5.1.а має додатний кутовий коефіцієнт і лінійну кореляційну залежність в цьому випадку називають додатною, а пряма на рис 5.1.б має від’ємний кутовий коефіцієнт і лінійну кореляційну залежність в цьому випадку називають від’ємною. Буває й так, що між випадковими величинами та немає жодного зв’язку (випадкова величина не реагує на випадкову величину ), або є нелінійний кореляційний зв’язок. Такі випадки зображені на рис. 5.2.
а) б)
Рис. 5.2. Нелінійна кореляційна залежність між випадковими величинами .
З теорії ймовірностей відомо, що ступінь зв’язку між випадковими величинами та визначається такими чисельними характеристиками їх сумісного розподілу, як кореляційний момент і коефіцієнт кореляції , які обчислюються за формулами:
(5.7) (5.8)
Зауважимо, що коли випадкові величини і — незалежні, то і . Якщо ж , то випадкові величини і — залежні. Обернені твердження справджуються не завжди, тобто, якщо і , то це не означає, що випадкові величини і є незалежними. Якщо залежність між випадковими величинами та — лінійна, тобто існують числа і такі, що , то Якщо то випадкові величини та називаються некорельованими, а якщо , то випадкові величини та називаються корельованими. Отже основна задача кореляційного аналізу, яка полягає у виявленні залежності між випадковими величинами та на основі двовимірної вибірки, може бути розв’язана шляхом побудови точкових та інтервальних оцінок коефіцієнта кореляції. Точкова оцінка коефіцієнта кореляції обчислюється за формулою:
(5.9) де — вибіркове середнє добутку випадкової величини , яке обчислюється за формулами: · (5.10) у випадку не згрупованої вибірки
· (5.11) у випадку згрупованої вибірки.
Величини — це вибіркові середні та вибіркові середньоквадратичні відхилення випадкових величин та , які обчислюються за формулами (1.11) та (1.14) відповідно. Означення. Точкова оцінка коефіцієнта кореляції випадкових величин та , яка обчислюється за формулою (5.9), називається вибірковим коефіцієнтом кореляції. Вибірковий коефіцієнт кореляції характеризує зв’язок між ознаками генеральної сукупності та , а саме: · Якщо , то зв’язок між випадковими величинами та — додатний; · Якщо , то зв’язок між випадковими величинами та — від’ємний; · Якщо , то випадкові величини та — некорельовані і це означає, що лише відсутність лінійного зв’язку між ними. Слід зауважити, що вибірковий коефіцієнт кореляції справджує нерівність: .
Приклад 5.1. Статистичні дослідження залежності між прибутком підприємства і середньою заробітною платнею працівників на однорідних підприємствах галузі характеризуються наступною вибіркою:
Визначити вибірковий коефіцієнт кореляції та оцінити ступінь лінійного зв’язку між прибутком підприємства і заробітною платою працівників.
Розв’язання. Для зручності обчислень складемо таблицю: Таблиця 5.3
За допомогою даних таблиці і формул (5.5), (5.6) та (5.11) матимемо:
Підставивши отримані результати в формулу (5.9), обчислимо вибірковий коефіцієнт кореляції:
Оскільки — це число, яке близьке до одиниці, то залежність між прибутком підприємства і заробітною платою — близька до лінійної. Вибірковий коефіцієнт кореляції є точковою оцінкою коефіцієнта кореляції генеральної сукупності. Тому дуже важливо встановити, чи коефіцієнт кореляції є значущим (тобто, чи його значення не дорівнює нулю). Оскільки вибірка є випадковою, то з рівності нулю вибіркового коефіцієнта кореляції , взагалі кажучи, не випливає, що й коефіцієнт кореляції генеральної сукупності дорівнює нулю. У зв’язку з цим виникає потреба перевірити гіпотезу про значущість вибіркового коефіцієнта кореляції . Якщо двовимірна генеральна сукупність розподілена за нормальним законом, то за критерій перевірки нульової гіпотези про рівність нулю коефіцієнта кореляції вибирають випадкову величину
де n – осяг вибірки. Випадкова величина T має розподіл Стьюдента з ступенями вільності. Нульова гіпотеза про рівність нулю вибіркового коефіцієнта кореляції нормальної двовимірної випадкової величини за конкуруючої гіпотези про те, що коефіцієнт кореляції не дорівнює нулю, перевіряється за таким правилом: 1. Обчислюємо емпіричне значення критерію :
(5.12)
2. Для заданого рівня значущості і числа ступенів вільності за таблицею критичних точок розподілу Стьюдента (додаток 4) визначаємо критичну точку двосторонньої критичної області. 3. Якщо то нульову гіпотезу про рівність нулю коефіцієнта кореляції генеральної сукупності приймають. Якщо ж то нульову гіпотезу відхиляють. Якщо обсяг вибірки — досить великий, а вибірка є репрезентативною, то висновок про характер лінійної залежності між випадковими величинами та , отриманий на основі вибірки, може бути поширений і на генеральну сукупність. За умови, що обсяг вибірки , для інтервальної оцінки коефіцієнта кореляції можна використати формулу:
(5.13)
де - розв’язок рівняння
Приклад 5.2. Із двовимірної нормальної генеральної сукупності зроблено вибірку обсягом і обчислено вибірковий коефіцієнт кореляції Для рівня значущості перевірити нульову гіпотезу за конкуруючої гіпотези Розв’язання. Гіпотезу перевіримо за правилом, яке сформульоване вище. За формулою (5.12) обчислюємо:
Для заданого рівня значущості і числа ступенів вільності за таблицею додатка 4 знаходимо, що Оскільки , то нульову гіпотезу відхиляємо. Отже вибірковий коефіцієнт кореляції суттєво відмінний від нуля, тому випадкові величини і — корельовано. Знайдемо довірчий інтервал для вибіркового коефіцієнта кореляції. Для його знаходження використаємо формулу (5.13) та таблицю додатка 4, з якої визначимо розв’язок рівняння і отримаємо: Підставивши ці дані в формулу (5.13), матимемо:
або остаточно:
Поиск по сайту: |
Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав. Студалл.Орг (0.012 сек.) |