АвтоАвтоматизацияАрхитектураАстрономияАудитБиологияБухгалтерияВоенное делоГенетикаГеографияГеологияГосударствоДомДругоеЖурналистика и СМИИзобретательствоИностранные языкиИнформатикаИскусствоИсторияКомпьютерыКулинарияКультураЛексикологияЛитератураЛогикаМаркетингМатематикаМашиностроениеМедицинаМенеджментМеталлы и СваркаМеханикаМузыкаНаселениеОбразованиеОхрана безопасности жизниОхрана ТрудаПедагогикаПолитикаПравоПриборостроениеПрограммированиеПроизводствоПромышленностьПсихологияРадиоРегилияСвязьСоциологияСпортСтандартизацияСтроительствоТехнологииТорговляТуризмФизикаФизиологияФилософияФинансыХимияХозяйствоЦеннообразованиеЧерчениеЭкологияЭконометрикаЭкономикаЭлектроникаЮриспунденкция

Непараметричні методи вивчення взаємозв 'язків між явищами

 

Розглядаючи в цій лекції різні методи вивчення статистичного зв'язку, важливо зрозуміти специфіку, умови їх застосування. В КРА факторні та результа­тивні ознаки відносяться до метричної шкали; метод аналітичного групування та дисперсійний анаф мо­жуть бути реалізовані, коли факторна ознака якісна, і нарешті у випадку, коли і факторна, і результативна ознаки якісні, тобто відносяться до номінальної або порядкової шкали, використовуються так звані непа-раметричні методи, тобто такі, які не потребують об­числення параметрів розподілу. В чому полягає їх принцип?

Розглянемо приклад, в якому дані наведені в такій формі (табл. 5.3):

Таблиця 5.3

Залежність ставлення до умов праці на підприємстві від статі

 

Стать Становлення до умов праці на підприємстві
цілком за­дово­лений скоріше задово­лений скоріше незадоволений зовсім незадоволе-ний не знаю
чол.          
жін.          
Разом          

При цьому можна порівнювати два рядки таблиці. тобто два розподіли, перевіряючи гіпотезу про одно­рідність: чи однакові жінки та чоловіки у своєму ставленні до умов праці на нашому підприємстві (див. табл. 5.3)? Але можна поставити питання й інакше: чи не має зв'язку між статтю та ставленням до умов праці?

Тим самим ми переходимо до гіпотези про неза­лежність. Дійсно, якщо відношення до умов праці чоловіків і жінок істотно відрізняються, то можна вес­ти мову про істотний статистичний зв'язок між оз­наками «стать — ставлення до умов праці». Так само і у випадку розподілу студентів за кольором волосся та очей (див. табл. 2.3). Там ми маємо 3 ряди розподілу за кольором волосся або 3 ряди за кольором очей. Якщо розподіл за кольором волосся людей із блакит­ними очима істотно відрізняється від розподілу за тією ж ознакою, але вже сірооких, а тих — від карооких, то між цими ознаками існує статистичний зв'язок.

Таким чином, критерій може бути використаний для доказу наявності істотного зв'язку. Засто­совуючи КРА, ми також визначали форму (напрям) та тісноту. В даному випадку, коли ознаки якісні, вести

мову про форму зв'язку мабуть не має сенсу, щодо напрямку, то його іноді можна визначити візуально за таблицею співзалежності (ТС): між кольором очей та волоссям (або навпаки) зв'язок прямий. Для визна­чення тісноти зв'язку використовують коефіцієнти співзалежності.

Наприклад, для неквадратних таблиць коефіцієнт Чупрова має вигляд [9]:

де k1, k2 — число рядків та стовпчиків таблиці.

Коефіцієнт Крамера обчислюють за формулою

де т = min(k1, k2), n — число елементів сукупності.

У наведених формулах використовується критерій Пірсона χ2 який має вигляд:

де і — номер підгрупи за першою ознакою;

kі - число груп за першою ознакою;

kj — число груп за другою ознакою;

ωіj — частість підгрупи j у групі j;

ωj — частість групи j у всій сукупності;

mi — число одиниць у групі i.

У випадку незалежності ознак ωіj= ωj i χ2=0

Ці коефіцієнти приймають значення від 0, при відсутності зв'язку, до 1, при функціональному зв'язку.

У практиці статистичних досліджень нерідко необ­хідно аналізувати альтернативні розподіли, коли су­купність розподіляється за кожною ознакою на дві групи з протилежними характеристиками. Наприклад можна аналізувати успішність студентів залежно від статі [9], виділивши дві групи: студенти, що здали іспити, та студенти, що не здали іспити (табл. 5.4).

Приклад 5.3

Таблиця 5.4

Залежність успішності студентів від статі

 

 

 

  Стать | Кількість студентів Разом
здали не здали
  Жінки а = 25 Ь = 2 а + b = 27
  Чоловіки с = 20 d=3 c+d=23
  Разом а + с = 45 Ь + d=5  

 

Тісноту зв'язку у даному випадку можна розраху­вати за допомогою коефіцієнта асоціації:

Тобто між статтю та успішністю студентів зв'язок надто незначний, практично він відсутній. Отриманий висновок неодмінно справедливий тому, що істотними факторами успішності є не стать, а відвідування лек­ційних та практичних занять, кількість годин само­стійної роботи і т. п.

Використання таблиць співзалежності дуже поши­рене при вивченні взаємозв'язку ознак різної природи: в економіці, соціології, біології, медицині. В по­рівнянні з КРА їхній вибір легше аргументувати, до­держати необхідні умови застосування, а отримані ре­зультати інтерпретувати. Ми вже згадували про про­блему вибору факторів у КРА, крім того, на практиці не завжди забезпечується виконання відповідних по­стулатів (взаємозв'язок факторів, нормальність розпо­ділу, відповідність шкал та ін.).

Прагнення подолати подібні перешкоди іноді при­водить деяких дослідників до віртуозних математичних трюків, аби тільки «притягнути за вуха» наукові мето­ди. Щоб глибоко зрозуміти і оволодіти досягненнями світової статистичної науки, особливо останніх деся­тиріч, потрібна відповідна підготовка. Ми вважаємо, що спеціалісту з економіки та управління при ви­рішенні своїх прикладних задач за допомогою пакетів статистичних програм перш за все необхідно чітко уя­вити, який статистичний інструмент у яких випадках застосовувати, вміти і нтерпретуватиотримані результати. Саме тому ми настійно рекомендуємо при вирішенні конкретної задачі, поки не буде набуто певного досвіду, користу­ватись прикладами з авторитетних літературних дже­рел. Це дасть змогу:

а) визначити, який метод застосовується в задачі, подібній до вашої;

б) обчисливши контрольний приклад наявними у вас засобами (статистичними програмами), порівняти значення результатів, їхню інтерпретацію та терміно­логію.

У цьому плані із наведеного списку ми насамперед рекомендуємо [1-5, 16, 17].

Звичайно, параметричні та непараметричні методи не є взаємозамінюваними. Але в деяких випадках для зручності замість перших можна застосовувати інші, замінюючи метричні шкали, наприклад, порядковими. Але треба пам'ятати, що менша глибина аналізу, яка буде досягнута при цьому, може бути виправдана ли­ше більшою його аргументованістю, надійністю. Нага­даємо, що за допомогою непараметричних методів можна лише визначити тісноту зв'язку та його істотність, КРА дає змогу до того ж вивчити і його форму. Широко відомі міри взаємозв'язку, які не базу-ються на статистиці £. Для випадків, коли ТС побудо, вана для ознак, одна з яких або обидві виміряні за до­помогою порядкової шкали, наприклад «колір очей -колір волосся», переважно застосовуються так звані методи рангової кореляції: міри Кендала (Kendall); Стыоарта (Stuart) та Спірмена. Якщо ознаки в ТС тільки дискретні («стать», «спеціальність», але не «вік»), то рекомендуються міри Гудмена-Крускала (Goodman, Kruskal). І, нарешті, існує група методів спеціально для ТС розміром 2x2 [1].

Популярний приклад: «Курять - не курять; хво­ріють - не хворіють». Очевидна умовність такого по­ділу. Що значить «хворіють»? Як часто? Якими саме захворюваннями? А що означає «не курить»? Зовсім чи не зовсім? Взагалі, однозначні відповіді не завжди коректні.

Дійсно, є суто альтернативні ознаки, наприклад «стать» (принаймні, так прийнято вважати). Але, якщо є змога, дозволяє обсяг сукупності, треба намагатись «розтягнути» шкалу вимірювання. Наприклад, якщо ви формулюєте питання анкети для соціологічного опитування робітників підприємства, то для запитання «Чи задоволені Ви умовами праці?» слід підказувати такі варіанти відповіді: не задоволений, скоріше неза-доволений, ніж задоволений; важко відповісти; ско­ріше задоволений, ніж незадоволений; задоволений. Якщо ви запропонуєте тільки два варіанти відповіді і тим самим змусите людину відповісти тільки «задоволений» або «незадоволений», то ви не вловите відтінки в настрої людей. Але слід мати на увазі, що іноді корисно зробити і навпаки.

Так, згідно з теорією слід уникати застосування критерію £ в тих випадках, коли значення окремих клітинок ТС менше 5. При бажанні можна знайти в літературі рекомендації, як знайти вихід з цього поло-

^ння. В літературі та розпечатках статистичних па-кетів вони пов'язані з іменами таких авторів, як Ієтс (Yates), Кохрен (Cochranj, Мантель (Mantel). Але їх застосування потребує певної обережності. У таких випадках іноді краще провести об'єднання рядків чи стовпчиків ТС. Зрозуміло, що це можна зробити по відношенню, наприклад, до ознаки «задоволеність умовами праці» або «колір волосся», а не ознаки «спеціальність».

Бажаючих докладніше познайомитись з методами вивчення взаємозв'язку, пов'язаними з ТС, з задово­ленням посилаємо до [1, розділи 2.5; 2.6; 10].

Вважається, що глибокий статистичний аналіз включає не тільки перевірку гіпотези про незалеж­ність, а й порівняння самих критеріїв для більш пов­ного розуміння результатів.

 

 


1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | 10 | 11 | 12 | 13 | 14 | 15 | 16 | 17 | 18 | 19 | 20 | 21 | 22 |

Поиск по сайту:



Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав. Студалл.Орг (0.005 сек.)