АвтоАвтоматизацияАрхитектураАстрономияАудитБиологияБухгалтерияВоенное делоГенетикаГеографияГеологияГосударствоДомДругоеЖурналистика и СМИИзобретательствоИностранные языкиИнформатикаИскусствоИсторияКомпьютерыКулинарияКультураЛексикологияЛитератураЛогикаМаркетингМатематикаМашиностроениеМедицинаМенеджментМеталлы и СваркаМеханикаМузыкаНаселениеОбразованиеОхрана безопасности жизниОхрана ТрудаПедагогикаПолитикаПравоПриборостроениеПрограммированиеПроизводствоПромышленностьПсихологияРадиоРегилияСвязьСоциологияСпортСтандартизацияСтроительствоТехнологииТорговляТуризмФизикаФизиологияФилософияФинансыХимияХозяйствоЦеннообразованиеЧерчениеЭкологияЭконометрикаЭкономикаЭлектроникаЮриспунденкция

Перевірка статистичних гіпотез

Читайте также:
  1. I. ПЕРЕВІРКА ДОМАШНЬОГО ЗАВДАННЯ
  2. III етап. Перевірка господарських операцій по суті
  3. IV. Перевірка застою і перекидання потоку в екрані
  4. L Перевірка виконання домашньої задачі.
  5. Аналіз систематизованих та згрупованих статистичних даних
  6. Введення і перевірка даних
  7. Вибір і перевірка комплексних розподільчих пристроїв та установок захисту.
  8. Вибір перерізу і перевірка стійкості колони
  9. Вибір та перевірка автоматичних вимикачів
  10. Вибір та перевірка високовольтних комутаційних апаратів
  11. Вибір та перевірка запобіжників
  12. Вибір та перевірка струмообмежувальних реакторів

 

У ряді галузей науки і техніки для з’ясування того чи іншого випадкового факту часто висловлюють припущення (гіпотезу), яке можна перевірити, опираючись на результати спостережень у випадковій вибірці, тобто статистично.

п.1. Статистичні гіпотези та їх різновиди. Нехай – спостережувана дискретна або неперервна випадкова величина. Статистичною гіпотезою називають будь-яке припущення про вигляд невідомого розподілу або параметри відомого розподілу ВВ . Висунуту гіпотезу називають основною або нульовою і позначають . Гіпотезу , яка суперечить основній, називають альтернативною або конкуруючою. Наприклад, якщо , то : . Розрізняють гіпотези, що містять одне і більше одного припущень. Простою називають гіпотезу, яка містить тільки одне припущення, що однозначно визначає розподіл ВВ . Гіпотезу, яка складається із скінченної або нескінченної кількості простих гіпотез, називають складною. Наприклад, якщо – невідомий параметр показникового розподілу, то гіпотеза : буде простою, а гіпотеза : – складною, оскільки складається з безлічі простих гіпотез : , де – будь-яке додатне число більше 2.

п.2. Помилки перевірки гіпотез. Висунута гіпотеза може бути вірною або невірною, тому виникає необхідність її перевірити. Перевірка гіпотези здійснюється за даними вибірки ( випадкових спостережень над ВВ ), тобто статистичними методами, а тому її називають статистичною. При перевірці статистичної гіпотези за даними випадкової вибірки можна зробити хибний висновок. Якщо за висновком буде відкинута вірна гіпотеза, то кажуть, що це помилка першого роду. Якщо за висновком буде прийнята невірна гіпотеза, то кажуть, що це помилка другого роду. Ймовірність допустити помилку першого роду позначають і називають рівнем значущості. Число задають малим і найчастіше використовують значення 0,05; 0,01 і т.д. Якщо, наприклад, , то це означає, що в 5 випадках із 100 є ризик допустити помилку першого роду (відкинути гіпотезу ).

п.3. Критерії для перевірки гіпотез та їх властивості. Перевірку статистичної гіпотези можна здійснити лише на основі даних вибірки. Для цього використовують спеціально підібрану випадкову величину , точний або наближений розподіл якої відомий. Цю величину називають статистичним критерієм або просто критерієм чи статистикою. Значення критерію, обчислене за даними вибірки, називають його спостережуваним (емпіричним) значенням і позначають . Існує багато статистичних критеріїв. Після вибору певного критерію, множину всіх його можливих значень розбивають на дві підмножини, що не перетинаються: одна з них містить значення критерію, при яких основна гіпотеза відхиляється, а друга – при яких вона приймається. Сукупність значень критерію, при яких основна гіпотеза відхиляється, називають критичною областю, а сукупність значень, при яких гіпотезу приймають, – областю прийняття гіпотези або областю допустимих значень.

Основний принцип статистичної перевірки статистичних гіпотез полягає в наступному: якщо спостережуване значення критерію належить критичній області, то основну гіпотезу відхиляють; якщо спостережуване значення критерію належить області допустимих значень – основну гіпотезу приймають.

Оскільки критерій – випадкова величина, то всі її можливі значення належать деякому інтервалу числової прямої (або всій числовій прямій). Отже, існують точки, які відокремлюють критичну область від області допустимих значень. Ці точки називають критичними точками критерію і позначають . Розрізняють односторонню (правосторонню і лівосторонню)і двосторонню критичні області. Правосторонньою називають критичну область, яка визначається нерівністю , де (рис. 11.1, а). Лівосторонньою називають критичну область, яка визначається нерівністю , де (рис. 11.1, б). Двосторонньою називають критичну область, яка визначається сукупністю нерівностей: або , де . Зокрема, якщо критичні точки симетричні відносно нуля, то двостороння критична область визначається нерівністю (рис. 11.1, в).

 

                         
                         
0 kkp K kkp 0 K - kkp 0 kkp K

а б в

 

Рис. 11.1

Щоб знайти односторонню критичну область, треба знайти критичну точку . Для цього задають досить малу ймовірність – рівень значущості , а потім шукають критичну точку з врахуванням вимоги (де ) у випадку правосторонньої критичної області або (де ) у випадку лівосторонньої. Для двосторонньої критичної області має виконуватись тотожність , де , яка у випадку, зображеному на рис. 11.1, в, набуває вигляду .

Для кожного практично важливого критерію складено спеціальні таблиці, за допомогою яких знаходять критичну точку , яка задовольняє потрібну умову. Після того, як критична точка критерію знайдена, обчислюють за даними вибірки його спостережуване значення. Порівнявши та , роблять висновок: якщо потрапляє в критичну область, то нульова гіпотеза відхиляється; у протилежному випадку – приймається.

При знаходженні критичної області доцільно врахувати потужність критерію. Потужністю критерію називається ймовірність потрапляння критерію в критичну область за умови, що справедлива конкуруюча гіпотеза. Іншими словами, потужність критерію – ймовірність того, що основна гіпотеза буде відхилена, якщо конкуруюча гіпотеза вірна. Якщо рівень значущості вже вибрано, то критичну область доцільно будувати так, щоб потужність критерію була максимальною. Виконання цієї вимоги забезпечує мінімальну ймовірність помилки другого роду. Єдиним способом одночасного зменшення ймовірностей помилок першого та другого роду є збільшення об’єму вибірки.

п.4. Критерій згоди Пірсона. Критерієм згоди називають критерій перевірки гіпотези про вигляд невідомого закону розподілу. Є ряд критеріїв згоди: Пірсона, Колмогорова, Смірнова та інші. Обмежимось описом застосування критерію згоди Персона для перевірки гіпотези про нормальний закон розподілу генеральної сукупності ВВ .

Нехай за вибіркою об’єму отримано інтервальний статистичний ряд (табл. 1) із частковими інтервалами однакової довжини ().

Таблиця 1

...
...

 

Потрібно при рівні значущості перевірити нульову гіпотезу: генеральна сукупність розподілена за нормальним законом. Критерієм перевірки цієї гіпотези беруть випадкову величину

, (11.1)

де – число часткових інтервалів в статистичному ряді, () – їх частоти (емпіричні частоти), теоретичні частоти, обчислені за припущенням, що генеральна сукупність розподілена нормально (число появ в випробуваннях значень нормально розподіленої ВВ із -го часткового інтервалу). При закон розподілу цієї випадкової величини прямує до закону розподілу з - ступенями вільності. Якщо передбачається нормальний розподіл, то число ступенів вільності , де – число часткових інтервалів. Область прийняття нульової гіпотези визначається нерівністю:

 

. (11.2)

 

Щоб знайти теоретичні частоти нормального розподілу, необхідно:

1) знайти середини часткових інтервалів даного статистичного ряду (усереднені варіанти);

2) обчислити вибіркову середню та вибіркове середнє квадратичне відхилення за даним розподілом вибірки, беручи в якості варіант середини часткових інтервалів:

, (11.3)

де ;

3) нормалізувати випадкову величину , тобто перейти до величини і обчислити кінці інтервалів :

, , (11.4)

покладаючи при цьому ;

4) обчислити теоретичні ймовірності потрапляння в інтервал :

, (11.5)

де – функція Лапласа;

5) знайти теоретичні частоти:

. (11.6)

За формулою (11.1) обчислюємо спостережуване значення критерію . За даним рівнем значущості і числом ступенів вільності із таблиці критичних точок розподілу знаходимо критичну точку . Якщо < , то немає підстав відкинути нульову гіпотезу. Якщо > , то нульову гіпотезу відкидаємо.

п.5. Перевірка гіпотези про вибірковий коефіцієнт кореляції. Нехай із генеральної сукупності двовимірної випадкової величини , розподіленої за нормальним законом, здійснено вибірку об’єму і за даними вибірки обчислено вибірковий коефіцієнт кореляції , який виявився відмінним від нуля. Оскільки вибірка випадкова, то не можна зробити висновок, що коефіцієнт кореляції генеральної сукупності також відмінний від нуля. Тому виникає необхідність при заданому рівні значущості перевірити нульову гіпотезу : при альтернативній гіпотезі : . Якщо нульова гіпотеза буде відхилена, то це означає, що вибірковий коефіцієнт кореляції суттєво відрізняється від нуля, тобто значущий, і випадкові величини і – корельовані. Якщо нульова гіпотеза буде прийнята, то вибірковий коефіцієнт кореляції мало відрізняється від нуля і випадкові величини і – некорельовані.

За критерій перевірки нульової гіпотези беруть випадкову величину:

, (11.7)

яка при справедливості нульової гіпотези маєрозподіл Стьюдента з ступенями вільності. Оскільки альтернативна гіпотеза має вигляд , то критична область – двостороння.

Для перевірки нульової гіпотези при заданому рівні значущості потрібно за формулою (11.7) обчислити спостережуване значення критерію , а за даними таблиці критичних точок розподілу Стьюдента для двосторонньої області при заданому рівні значущості і числі ступенів вільності відшукати критичну точку . Якщо , то нульову гіпотезу приймають, а у випадку – відхиляють.

Приклад. За даним інтервальним розподілом вибірки об’єму = 100 при рівні значущості = 0,05 за критерієм згоди Пірсона перевірити гіпотезу про нормальний розподіл генеральної сукупності.

 

  (3,8)   (8,13)   (13,18)   (18,23)   (23,28)   (28,33)   (33,38)
             

 

Розв’язання. Побудуємо статистичний розподіл, варіантами якого є середини даних інтервалів:

 

  5,5   10,5   15,5   20,5   25,5   30,5   35,5
             

За формулами (11.3) обчислимо вибіркову середню та вибіркове середнє квадратичне відхилення :

; .

Використовуючи формули (11.4)–(11.6), обчислимо теоретичні частоти . Для цього складемо розрахункову таблицю 2:

Таблиця 2

      –1,74 –0,5000 –0,4591 0,0409 4,09
      –1,74 –1,06 –0,4591 –0,3554 0,1037 10,37
      –1,06 –0,37 –0,3554 –0,1443 0,2111 21,11
      –0,37 0,32 –0,1443 0,1255 0,2698 26,98
      0,32 1,00 0,1255 0,3413 0,2158 21,58
      1,00 1,69 0,3413 0,4545 0,1132 11,32
      1,69 0,4545 0,5000 0,0455 4,55
   

Обчислимо спостережуване значення критерію , для чого складемо розрахункову таблицю 3:

Таблиця 3

        /
          1,0000
      –2   0,4000
      –6   1,7143
          6,2593
      –6   1,6364
      –3   0,8181
          0,4000
      12,2281

 

Отже, 12,2281. За даними таблиці критичних точок розподілу при рівні значущості =0,05 та числі ступенів вільності знаходимо критичну точку .

Оскільки > , то гіпотезу про нормальний розподіл генеральної сукупності відкидаємо. Це означає, що емпіричні та теоретичні частоти відрізняються істотно, тобто дані спостережень не узгоджуються з гіпотезою про нормальний розподіл генеральної сукупності.

 


Поиск по сайту:



Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав. Студалл.Орг (0.01 сек.)