Авто Автоматизация Архитектура Астрономия Аудит Биология Бухгалтерия Военное дело Генетика География Геология Государство Дом Другое Журналистика и СМИ Изобретательство Иностранные языки Информатика Искусство История Компьютеры Кулинария Культура Лексикология Литература Логика Маркетинг Математика Машиностроение Медицина Менеджмент Металлы и Сварка Механика Музыка Население Образование Охрана безопасности жизни Охрана Труда Педагогика Политика Право Приборостроение Программирование Производство Промышленность Психология Радио Регилия Связь Социология Спорт Стандартизация Строительство Технологии Торговля Туризм Физика Физиология Философия Финансы Химия Хозяйство Ценнообразование Черчение Экология Эконометрика Экономика Электроника Юриспунденкция

Тема 5. Помилка репрезентативності. Оцінка достовірності вибіркових показників

Читайте также:

Вище були розглянуті статистичні показники вибіркових сукупностей. Чи можна, користуючись ними‚ дати характеристику генеральної сукупності? Наприклад‚ чи можна за вибірками‚ що складаються зі 100 чи 1000 голів симентальських тварин‚ судити про продуктивність всього поголів’я цієї породи.

Біометрія доводить‚ що вибірка‚ складена за принципом випадковості‚ володіє репрезентативністю‚ тобто вона характеризує генеральну сукупність з певним ступенем точності і достовірності. Достовірність вибіркових показників ‚ σ ‚ С‚ r‚ R ‚ та ін. встановлюють за допомогою помилки репрезентативності або середньої помилки (m)‚ яка випливає з самої сутності вибіркового обстеження‚ при якому ціла (генеральна сукупність) характеризується на основі вивчення частини (вибірки).

Якщо генеральна сукупність велика‚ її прирівнюють до нескінченності
().

У цьому випадку помилку вибіркової середньої арифметичної обчислюють за формулою:

(20)

Згідно цієї формули‚ помилка середньої арифметичної залежить від величини σ та n ‚ причому чим менше різновидностей ознак‚ тим менша помилка. При повній однорідності сукупності за вивченою ознакою (σ = 0) середня помилка дорівнює нулю‚ тобто вибірки стає рівною сукупності. Величина середньої помилки знаходиться в зворотній залежності від n. Чим більше варіантів ввійшло у вибірку‚ тим менша помилка вибіркової Х.

В малих вибірках m_x обчислюють за такою формулою:

(21)

Припустимо‚ що у вибірці зі 100 корів середньодобовий надій – Х =21‚26 кг а σ = ± 3‚68. Помилка середньої арифметичної в даному випадку складе:

Це означає‚ що середня помилка на 100 голів складає 0‚368 кг. Отже, середньодобові надої вивченої вибірки характеризуються ± m = 21‚6 ± 0‚368.

Нижче наводиться формула для обчислення помилок вибіркових показників:

Помилка середнього квадратичного відхилення:

(22)

Помилка коефіцієнта варіації:

(23)

Помилка коефіцієнта кореляції:

(24)

Помилка коефіцієнта регресії:

(25)

Величину вибіркового показника записують з величиною його помилки зі знаками ±: ± m ‚ σ ± m ‚ С ±m тощо.

Достовірність вибіркових показників (t) визначається відношенням вибіркового показника до його середньої помилки за формулами:

(26)

5.1 Обчислення допустимих границь для середньої арифметичної генеральної сукупності

Знаючи середню арифметичну () і помилку (m) вибіркової сукупності‚ можна з певним ступенем довіри і точності визначити ті межі‚ в яких лежить середня генеральна сукупність (Х). Ці межі називають допустимими.

Припустимо‚ що для вивчення середнього постригу шерсті у овець було зроблено 100 вибірок (при n >30) і для кожної із них обчислено + m. Доведено‚ що середні величини окремих вибірок групуються навколо середньої генеральної сукупності ()‚ підпорядковуючись закону‚ згідно якому вибіркова Х відхиляється від генеральної сукупності:

в 95 % випадків не більше ніж на 1‚96 m

в 99 % випадків не більше ніж на 2‚58 m

в 99‚9 % випадків не більше ніж на 3‚3 m

Наведені вище показники – 95%‚ 99%‚ 99% - називаються допустимимими (р). Їх позначають не у відсотках‚ а в частках одиниці (р = 0‚95; р = 0‚99; р = 0‚999). Вони вказують на ймовірність безпомилкового прогнозу. Коефіцієнти‚ які стоять біля середньої помилки (1‚96; 2‚58; 3‚3)‚ являють собою нормовані відхилення (t)‚ що відповідають наведеним допустимим ймовірностям.

Використовуючи ці показники‚ можна за даними однієї вибірки визначити допустимі границі‚ в межах яких лежить середня генеральна сукупність (Х). Вона знаходиться між – tm (нижня границя) і + tm (верхня границя). Нормоване відхилення (t) залежить від допустимої ймовірності‚ яку вибирають‚ спираючись на вимоги‚ які ставляться до достовірності висновків (табл. 9).

Таблиця 9

Допустимі ймовірності (ймовірності безпомилкового прогнозу), відповідні їм значення та допустимі границі у великих вибірках ^*

Поріг	Застосування	Допустимі ймовірності	Число помилкових випадків	Нормоване відхилення	Допустимі границі	Мінім. обсяг вибірки
	У виробничих та науково-господарських дослідженнях	0,95 (95 %)	5 з 100	1,96	±1,96
	У більшості біологічних, зоотехнічних, ветеринарних досліджень	0,99 (99 %)	1 з 100	2,58	±2,58
	В роботах з дуже високими вимогами до достовірності висновків	0,999 (99,9 %)	1 з 1000	3,3	±3,3

*- Для малих вибірок стандартні значення (показник надійності) визначається за таблицями Стьюдента (див. додатки, табл. 1)

Нижній рівень достовірності- 95%

р _{(ймовірність)} = 0‚95 або 95%

В _{(значимість)} = 0‚05 або 5%

Розбір вирішення задач.

Середній постриг шерсті у вибірці мериносових овець ( ± m) склав 4‚0 ± 0‚2 кг. Встановити довірні границі для середнього постригу шерсті в генеральній сукупності мериносів.

Візьмемо в якості довірної ймовірності р = 0‚95. Згідно даних таблиці 9‚ при такій ймовірності нормоване відхилення t = 1‚96. Визначаючи довірні границі для Х генеральної сукупності мериносів‚ одержимо: – 1‚96 m = 4‚0 – 1‚96• 0‚2 = 3‚61 кг (нижня границя) і + 1‚96 m = 4‚0 + 1‚96• 0‚2 = 4‚39 кг (верхня границя). Це показує‚ що генеральна середня (тобто середній постриг шерсті всього поголів’я мериносів) знаходиться в інтервалі між 3‚61 та 4‚39 кг. Ймовірність того що дане твердження вірне‚ складає 95 %‚ а ризик помилки –5%.

Якщо вважати‚ що 5 %-ний ризик помилки надто високий‚ то в якості допустимого можна взяти 1 %-ний ризик помилки‚ а відповідно‚ 99 %-ну ймовірність достовірності твердження. При р = 0‚99; t = 2‚58.

Розраховуючи в такому випадку довірні границі для Х генеральної сукупності за формулою ± 2,58 m, одержимо:

нижня границя: 4,0 – 0,52 = 3,48;

верхня границя: 4,0 + 0,52 =4,52.

Іншими словами, можна стверджувати, що генеральна середня знаходиться в межах 3,48 – 4,52. Точність другого ствердження у порівнянні з попереднім зменшилась, так як границі розширились, але зменшився ризик помилки з 5 %- ного до 1 %-ного рівня.

У випадках, які вимагають високої достовірності, використовують у значенні довірної ймовірності значення р,що дорівнює 0,999. При цьому ризик помилки знижується до одного випадку з 1000, але довірний інтервал стає дедалі ширшим.

5.2 Обчислення достовірності різниці між середніми арифметичними

В багатьох дослідженнях виникає потреба порівняти середні арифметичні двох груп тварин (наприклад, середня вага тварин дослідної та контрольної груп, середню продуктивність дочок двох заплідників або двох вибірок, складених із особин різних порід). Середні двох груп, що порівнюються, завжди деякою мірою відрізняються між собою. Тому важливо встановити, чи достовірна відмінність між середніми.

При розв’язанні задач токого роду визначають різницю між двома середніми ( ₁ та ₂). Ця різниця (d) дорівнює:

d = ₁ – ₂

Середню помилку різниці (m_d)обчислюють за формулою:

(27)

Після цього встановлюють нормоване відхилення різниці (t_d):

(28)

Величина t_d дає можливість оцінити достовірність різниці у порівнянні великих вибірок ‚ для цього можна використати дані таблиці 9‚ в якій наведені три стандартні величини t і відповідні їм ймовірності. Так‚ при (t_d):різниця достовірна у 99 випадках із 100 (99 %)‚ а при t_d = 3‚3 вона достовірна в 999 випадках із 1000(99‚9 %). Якщо ж величина t_d менша 1‚96‚ то різниця між середніми порівнюваними групами не може бути визнана достовірною.

При порівнянні малих вибірок m_d за формулою 27 можна обчислювати тільки тоді‚ коли обсяги вибірок (n) не різко відрізняються один від одного; а для визначення достовірності різниці користуються таблицею Стьюдента.

Розбір вирішення задач.

Припустимо‚що треба порівняти молочну продуктивність бестужевських та холмогорських первісток телиць (великі вибірки). В однакових умовах відгодівлі та утримання одержані такі середні надої за лактацію: по бестужевській худобі – ₁ ± m₁ = 2600 ± 30; по холмогорській худобі - ₂ ± m₂ = 3200 ± 40 кг. Необхідно встановити достовірність різниці між надоями худоби цих порід.

Обчислюючи t_d за формулами 27 та 28 маємо:

Отримана величина нормованого відхилення (t_d = 8) значно перевищує дані‚ наведені в таблиці 9. Тому можна з ймовірністю‚ що переважає 99‚9 %‚ стверджувати‚ що холмогорські корови молочніші за бестужевських.

Розглянемо інший приклад. Вивчається ефективність впливу мікроелементів при відгодівлі бичків. З цією метою взято дві групи (дослідна та контрольна) по 14 тварин з однаковою середньою вагою в кожній. Відгодовують їх, використовуючи однакові раціони‚ але в раціон тварин дослідної групи внесені мікроелементи.

По закінченні досліду та обробці початкових даних отримані такі результати: середня вага ( ₁) тварин дослідної групи 300 кг‚ контрольної ( ₂)- 260 кг. Середні помилки в дослідній та контрольній групах відповідно дорівнюють m₁ = 9 кг‚ m₂ = 6 кг.

Чи достовірні відмінності у вазі тварин дослідної та контрольної груп?

Не зважаючи на те‚ що порівнюють малі вибірки‚ помилку різниці можна визначати за формулою 27‚ так як в обох групах однакова кількість тварин - n₁-n₂ = 14. Отже:

Значення ймовірності ‚ які відповідають знайденому t_d ‚ визначаємо за таблицею Стьюдента (додатки‚ табл. 1). Для цього встановлюємо спочатку число ступенів свободи (υ).

В даному прикладі (порівняння двох вибірок) υ = n₁+ n₂ - 2= 14+14- 2 = 26. Знаходимо в таблиці рядок υ = 26. Із п’яти стандартних значень t ‚ які розміщені в цьому рядку‚ вибираємо число‚ рівне або більше за встановлене в нашому досліді (t_d = 3‚7). Таке число стоїть в останній графі. Верхній рядок цієї графи показує шукану ймовірність d = 40 кг. Отриману в даному прикладі ймовірність можна вважати високодостовірною. При р + 0‚999‚ цей результат слід підкреслити трьома рисками‚ при р = 0‚99 – двома‚ при р = 0‚95 – однією рискою.

5.3 Обчислення критерію відповідності.

Використання похибок, вибіркових показників і порівняння двох варіаційних рядів основане на нульовій гіпотезі (Н₀), яка припускає, що між порівнюваними вибірками немає достовірних розходжень. Нульова гіпотеза спростовується або залишається в силі. Критерієм оцінки цих суджень є рівень значимості - p.

Вирахування критерію відповідності (χ² - хі-квадрат) основане також на принципах нульової гіпотези. Критерій відповідності використовують для порівняння двох емпіричних рядів або порівняння емпіричних рядів з теоретичними в гібридологічному аналізі, при перевірці різних гіпотез, при оцінці ефективності лікарських речовин, закономірності розподілу частот в популяціях тощо. Критерій хі-квадрат - показник приближений; його використовують для вибірок чисельністю 20 та більше особин.

Критерій хі-квадрат обчислюють за формулою:

χ²= ∑ (О-Е)²/Е (29)

χ²= ∑ /Е (30)

де О - число особин, яких спостерігають,

Е - теоретично очікуване число особин,

- член 1/2 поправка Йєтса (на неї зменшується абсолютна величина значення О - Е).

Якщо N та очікувані величини великі, то користуються формулою (29) (без поправки).

Розбір вирішення задач

При спарюванні особин, які відрізняються між собою однією парою ознак, (А, а), в потомстві спостерігається розщеплення у співвідношеннях 1:1 або 3:1; при розходженні батьків за двома парами ознак - у співвідношеннях 9:3:3:1 тощо. Ці відношення приймаються за нульову гіпотезу, після чого перевіряється відповідність спостережуваного в досліді розщеплення з даними нульової гіпотези. Результати дозволяють або прийняти її, признавши придатною для пояснення результатів дослідів, або відкинути.

Припустимо, що в другому поколінні моногібридного схрещування, яке складається з 8024 особин, отримано 6023 особини з домінантною ознакою і 2001 особину з рецесивною. Згідно з теорією, очікується розщеплення 3:1. Необхідно оцінити узгодження між спостережуваними і очікуваними даними.

Спостережуване в досліді співвідношення особин з домінантними та рецесивними ознаками (6023:2001) не точно відповідає очікуваному (3:1). Проте, якщо це залежить від випадкових причин, то немає підстав вважати, що спостережувані дані не узгоджуються з нульовою гіпотезою. Вирахуємо критерій хі-квадрат за формулою (для полегшення розрахунків користуються таблицею 10).

Таблиця 10

Вирахування критерію χ²

Класи Спостережувані дані (О) Очікувані дані (Е) (О-Е) (О-Е)² (О-Е)²/Е

Домінантний +5 0,0041

Рецесивний -5 0,0124

∑=8024 ∑=8024 ∑=0,0165

Графу “Очікувані дані ” заповнюють таким чином: спочатку вписують суму, потім, помноживши її на 3/4 і на 1/4 (пропорційно співвідношенню 3:1), отримують очікувану кількість особин з домінантною ознакою (3/4 х 8024 = =6018) і особин з рецесивною ознакою (1/4 х 8024 = 2006). Подальші обчислення (див. таблицю 10) не потребують спеціальних пояснень. Отримана сума - (О-Е)²/Е і є величина хі-квадрат. В нашому прикладі χ^{2 =} 0,0165.

При оцінці узгодження прийнято користуватися трьома рівнями значимості р = 0,05; р = 0,01; р = 0,001, для яких в таблиці 2 додатків наведені стандартні значення хі-квадрат. Якщо вичислене нами значення хі-квадрат більше стандартного, що знаходиться в графі р = 0,01 і тим більш в графі р = 0,001, то вважають, що гіпотеза не узгоджується з отриманими в досліді даними. В таких випадках нульова гіпотеза відкидається. Якщо вичислена нами величина хі-квадрат менша табличної, що знаходиться в графі р = 0,01, але більша тієї, що знаходиться в графі р = 0,005, узгодження спостережуваних даних і очікуваних є сумнівними. Однак, це не дає права відкидати нульову гіпотезу. У випадку, коли вичислена величина хі-квадрат менше табличної з графи р = 0,05, відповідність спостережуваних даних і очікуваних вважається встановленою.

Величина хі-квадрат залежить від числа ступенів свободи. Тому для кожного значення ймовірності (р) дано декілька значень χ², розташованих в графі таблиці 2 додатків під певним рівнем значимості. В прикладах, які ми розглядаємо, число ступенів свободи на одиницю менше числа класів. Так як в досліді є два класи, то число ступенів свободи дорівнює 1. Таким чином, для розв’язання нашої задачі необхідно використовувати з таблиці 2 додатків графу “ ймовірність” і рядок “ ν = 1 ”. Тут стоять 3 значення χ²: 3,84; 6,63; 10,83. Вичислене нами значення цього показника значно менші табличних. Таким чином, спостережуване в досліді розщеплення відповідає очікуваному, а тому нульова гіпотеза, тобто розщеплення 3:1, залишається в силі.

5.3.1 Кількісний аналіз успадкування кольору тіла дрозофілами з використанням критерію відповідності

Схрещують сірих та чорних дрозофіл, в F₁ всі дрозофіли сірі. В F₂ спостерігають розщеплення. Аналіз розщеплення, яке проводив один із студентів, такий: 78 сірих та 18 чорних. Уся група студентів спостерігала розщеплення в F₂ 1199 сірих та 389 чорних. Крім того було проведене зворотнє схрещування сірих з F₂ та чорних з F₁, в результаті якого було отримано 504 сірих та 486 чорних мух.

У F₁ всі дрозофіли сірі, то можна припустити, що сірий колір домінує над чорним.

А – сірий колір, а – чорний колір.

Р₁♀АА х ♂аа

G А а

F₁ Aa

P₂ ♀ Аa х ♂Aа

G A a A a

F₂ AA Aa Aa aa

Сірі сірі сірі чорні

Сірих 78, чорних 18

Сірих 1199, чорних 389

Р_зв♀Аа х ♂аа

G A а a

F_зв Aa аа

Сірі чорні

504 486

Припускаємо, що це моногібридне схрещування, отже колір тіла дрозофіли контролює один ген.

1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | 10 | 11 | 12 | 13 | 14 | 15 | 16 | 17 | 18 |
Поиск по сайту:

Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав. Студалл.Орг (1.088 сек.)

Главная | О проекте | Полезные cсылки | Контакты | Случайная страница