Авто Автоматизация Архитектура Астрономия Аудит Биология Бухгалтерия Военное дело Генетика География Геология Государство Дом Другое Журналистика и СМИ Изобретательство Иностранные языки Информатика Искусство История Компьютеры Кулинария Культура Лексикология Литература Логика Маркетинг Математика Машиностроение Медицина Менеджмент Металлы и Сварка Механика Музыка Население Образование Охрана безопасности жизни Охрана Труда Педагогика Политика Право Приборостроение Программирование Производство Промышленность Психология Радио Регилия Связь Социология Спорт Стандартизация Строительство Технологии Торговля Туризм Физика Физиология Философия Финансы Химия Хозяйство Ценнообразование Черчение Экология Эконометрика Экономика Электроника Юриспунденкция

Тема 1. Складання варіаційних рядів та їх графічне зображення

Читайте также:

ДЕРЖАВНИЙ ВИЩИЙ НАВЧАЛЬНИЙ ЗАКЛАД

“ЗАПОРІЗЬКИЙ НАЦІОНАЛЬНИЙ УНІВЕРСИТЕТ”

МІНІСТЕРСТВА ОСВІТИ І НАУКИ, МОЛОДІ ТА СПОРТУ УКРАЇНИ

В.Д.Бовт, Є.Ю. Гороховський, Л.М. Золотаренко-Горбунова

Навчально-методичний посібник

ОСНОВИ СТАТИСТИЧНОГО АНАЛІЗУ В ЕКОЛОГІЇ

для самостійної роботи студентів денного та заочного відділення

біологічного факультету

спеціальностей

6.070800, 7.070801, 8.070801 — « Екологія та охорона навколишнього середовища»

Затверджено на засіданні

науково-технічної ради ЗНУ

Протокол № ___ від _____

Запоріжжя

УДК: 575(075.8)

ББК:28.04я73

Навчально-методичний посібник «Основи статистичного аналізу в екології» для біологічного факультету спеціальності 6.070800, 7.070801, 8.070801 — « Екологія та охорона навколишнього середовища» / Укладачі: Бовт В.Д., Гороховський Є.Ю., Золотаренко-Горбунова Л.М. – Запоріжжя: ЗНУ, 2011. 84 с.

Видання містить основні поняття параметричної та непараметричної статистики, приклади та вимоги до статистичної обробки експериментального матеріалу курсових і дипломних робіт студентами біологічного факультету спеціальності 6.070800, 7.070801, 8.070801 — « Екологія та охорона навколишнього середовища»

Рецензент професор, д.м.н. Єщенко В.А.

Відповідальний за випуск професор, д.б.н.Бовт В.Д.

ЗМІСТ

ПЕРЕЛІК УМОВНИХ СКОРОЧЕНЬ. 5

ВСТУП.. 6

Тема 1. Складання варіаційних рядів та їх графічне зображення. 10

Тема 2. Вирахування середньої арифметичної 14

2.1. Вирахування середньої арифметичної прямим способом у малих вибірках. 14

2.2. Обчислення середньої арифметичної у великих вибірках. 14

2.3. Вирахування середньої зваженої. 15

Тема 3. Показники різноманітності ознаки в сукупностях. 17

3.1. Вирахування середнього квадратичного відхилення в малих вибірках. 17

3.2. Вирахування середнього квадратичного відхилення великих вибірках. 18

3.4. Вирахування коефіцієнту варіації. 21

3.5. Вирахування нормованого відхилення. 21

Тема 4. Визначення зв’язку між ознаками. 23

4.1 Обчислення коефіцієнту фенотипічної кореляції в малих вибірках. 23

4.2 Обчислення коефіцієнту фенотипічної кореляції у великих вибірках. 25

4.3 Обчислення коефіцієнту прямолінійної регресії 30

4.4 Обчислення коефіцієнту генетичної кореляції 31

Тема 5. Помилка репрезентативності. Оцінка достовірності вибіркових показників. 33

5.1 Обчислення допустимих границь для середньої арифметичної генеральної сукупності 34

5.2 Обчислення достовірності різниці між середніми арифметичними. 36

5.3 Обчислення критерію відповідності. 38

5.3.1 Кількісний аналіз успадкування кольору тіла дрозофілами з використанням критерію відповідності 40

5.3.2 Використання критерію відповідності при порівнянні двох емпіричних рядів. 43

5.3.3 Застосування критерію відповідності при визначенні достовірності між двома групами тварин. 43

Тема 6. Дисперсійний аналіз. 45

6.1 Визначення коефіцієнту спадкування в однофакторному комплексі. 48

Тема 7. Непараметрична статистика. 50

7.1 Перевірка гіпотез про закон розподілу. Застосування коефіцієнтів асиметрії та ексцесу для перевірки нормальності розподілу. 50

7.2 Особливості представлення непараметичних даних. 52

7.2.1 Мода та медіана. 52

7.2.2 Довірчі імовірності та рівні значущості 55

7.2.3 Довірчій інтервал. 56

7.3 Непараметричні критерії 58

7.3.1 U-критерій Манна-Уїтні 58

7.3.2 Т-критерій Уілкоксона. 60

Тема 8. Використання табличного процессору Microsoft Excel для проведення статистичних розрахунків. 62

8.1 Точкове й інтервальне оцінювання параметрів розподілів. 62

8.1.1. Точкове оцінювання. 62

8.1.2. Інтервальне оцінювання. 63

8.2 Перевірка статистичних гіпотез про вид розподілу. 64

8.3 Перевірка гіпотез про рівність дисперсій і математичних очікувань. 67

8.3.1. Критерій Фишера для порівняння дисперсій. 67

8.3.2. Критерій Ст’юдента порівняння середніх. 68

8.4 Основи регресійного й кореляційного аналізу. 70

ДОДАТКИ.. 74

СПИСОК РЕКОМЕНДОВАНОЇ ЛІТЕРАТУРИ.. 83

ПЕРЕЛІК УМОВНИХ СКОРОЧЕНЬ

А – умовна середня;

а – відхилення класів від умовного середнього класу (у кількості класних проміжків);

в – поправка до умовної середньої;

С – сума квадратів центральних відхилень;

С_V – коефіцієнт варіації;

С_y – загальна дисперсія;

C_X – факторіальна дисперсія;

C_Z – залишкова дисперсія;

C_γ – дисперсія генотипічна;

C_π – дисперсія паратипічна;

Cφ – дисперсія фенотипічна;

D – розмах варіації ознаки;

d – різниця між двома середніми;

E – теоретично очікувана кількість особин у групі;

F – показник достовірності Р.Фішера (у дисперсійному аналізі);

F – частоти (кількість варіант у класі);

θ – показник достовірності Н.А.Плохінського (у дисперсійному аналізі);

k – величина класного проміжку;

m – середня похибка (похибка репрезентативності);

Me – медіана

Mo – мода

N - обсяг генеральної сукупності;

n – обсяг вибірки;

О – спостережувана кількість особин у вибірці;

ν – кількість ступенів свободи;

р – імовірність;

R – коефіцієнт регресії;

r – коефіцієнт кореляції;

S – стандартнее відхілення

∑- позначка суми;

σ – середнє квадратичне відхилення;

σ² – варіанса;

t – нормоване відхилення;

t_x – показник достовірності середньої арифметичної;

t_d – показник достовірності різниці;

W – середина класного проміжку;

– середня арифметична;

_взв – середня звішена;

X₂ – варіанта, числове значення ознаки;

χ² - (хі - квадрат) – критерій відповідності.

ВСТУП

Статистичні закономірності широко розповсюджені в природі. Нерідко біологічні закономірності втілюються в формі статистичних. Наприклад, народження особини чоловічої чи жіночої статі зумовлене біологічно, але конкретне встановлення цієї біологічної закономірності можливе лише в рамках законів ймовірності.

Методи статистики широко застосовуються в біології. Їх значимість безсумнівна при вивченні кількісних ознак та вивченні модифікаційної мінливості.

Рослина, гетерозиготна за 16 генами (ознаками), при самозапиленні спроможна утворювати більше 43 мільйонів генотипів. При вивченні спадкування якісних ознак така ступінь гетерозиготності виняткова. В той же час, при дослідженні генетичного контролю ознак продуктивності рослин і тварин - урожайності, молочності, швидкості росту, розщеплення в потомстві –проходить дуже багатьом генам.

Важливою особливістю елементів продуктивності є їх неперервне варіювання, характерне для всіх кількісних (мірних) ознак (зріст, вага, яйценосність та ін.). Теж саме має місце у рослин. Мінливість внаслідок розщеплення за багатьма генами називають полігенною, а зумовлюючі її гени – полігенами.

Результатом дії факторів оточуючого середовища буде мінливість кількісних ознак, яку позначають як зовнішньосередовищну. Паратипічна мінливість зумовлена більшою мірою модифікаціями, дуже важливо знати якою мірою прояв ознаки залежить від генотипа. Для чого вираховується коефіцієнт спадковості (h²), яка частка генотипічної мінливості в спостережуваних варіаціях.

, де

σ_G² варіанса (рівень мінливості, яка залежить від генотипічного різноманіття), а σ_Ph² - загальна фенотипічна варіанса (рівень мінливості, що складається з паратипічної варіанси σ_E² (мінливість під дією зовнішнього середовища)) і генотипічної варіанси для даної групи особин. Чим більший коефіцієнт спадковості, тим ефективніша селекція. В основі отримання цих даних також лежать статистичні закономірності і статистичні методи.

В основі багатьох закономірностей спадкування лежать достатньо складні явища, які здійснюються на хромосомному і клітинному рівні. Деякі з них мають функціональний або динамічний характер, інші ж – статистичні за своєю природою, їх здійснення може бути оцінене ймовірностями. В основі будь-яких розщеплень лежать ймовірносно-статистичні закономірності. Статистичні закономірності не протирічать біологічним. Нерідко біологічні закономірності здійснються у формі статистичних. В статистичних закономірностях можлива передбачуваність.

Як правило, ми маємо справу з вірогідними закономірностями. Наприклад: ймовірність народження дитини Р = 1, але ймовірність народження дівчинки (ХХ) чи хлопчика (ХУ) дорівнює ½. Ймовірність здійснення несумісних подій дорівнює сумі ймовірностей цих подій, тобто одночасно хлопчик та дівчинка не народяться,

Р_{народження} = ½_(ХХ)+ ½_(ХУ)= 1,

якщо тільки вони не близнюки.

Це теорема складення несумісних подій.

Якщо ж події відбуваються одночасно, то має місце теорема множення ймовірностей:

Р_{(А і В)} = Р(_А) х Р_(В)

Наприклад: імовірність розщеплення при моногібридному схрещуванні:

Р Аа х Аа

F АА Аа Аа аа

Р_А- = 3/4 (імовірність проявлення домінантного гена А);

Р_аа= 1/4 (імовірність проявлення рецесивного гена а).

При схрещуванні дигетерозигот ми спостерігаємо:

Р АаВв х АаВв

G АВ Ав аВ ав АВ Ав аВ ав

1) Яка ймовірність проявлення домінантних фенотипів?

Р_(А-В-) = Р_(А-) х Р_(В-) =3/4_А- х 3/4_В- = 9/16

2) Яка ймовірність появи в потомстві повних гетерозигот?

При схрещуванні

Р Аа х Аа

F АААа Аааа

1 2 1

ймовірність появи гетерозигот становить 1/2, а значить

Р_(АаВв)= Р_(Аа) х Р_(Вв) = 1/2 х 1/2 = 1/4

тобто 25% нащадків можуть бути гетерозиготами.

Яка ймовірність при тригетерозиготному схрещуванні появи генотипа ААВвсс?

Р_{(ААВвсс)} = Р_(АА) х Р_(Вв) х Р_(сс) = 1/4 х 1/2 х 1/4 = 1/32

Таким чином, дуже багато закономірностей спадкування зумовлені статистично-ймовірностними особливостями.

Загальні передумови моделі полімерних генів такі:

гени, гетерозиготні за тим чи іншим полімерним геном, займають строго проміжне положення між двома гомозиготами;

за силою дії гени рівні між собою;

дія кількох генів сумується аддитивно;

частоти градацій кількісної ознаки в потомстві відповідають коефіцієнтам розкладення ознаки в потомстві, які відповідають коефіцієнтам розкладення бінома Ньютона (a+b)ⁿ, де n – кількість пар генів, за якими відбувається розщеплення.

Якщо це дигібридне схрещування за кількісними ознаками, то розщеплення буде 1:4:6:4:1, що відповідає коефіцієнтам розкладення бінома Ньютона (a+b)ⁿ , відповідно:

Це розщеплення вже наближене до кривої нормального розподілу. Чим більша кількість полімерних генів братиме участь у схрещуванні, тим більше розщеплення буде наближатися до кривої нормального розподілу.

Таким чином, для вивчення закономірностей спадкування кількісних ознак ймовірносних подій в генетиці необхідне використання методів статистики та біометрії.

Біометрія – це наука про статистичний аналіз групових якостей значень у біології. Об’єктом вивчення в біометрії є різноманітність ознак та організмів. Групові якості можуть вивчатись за характером міжгрупового та внутрішньо групового різноманіття при будь-якій чисельності об’єктів, починаючи з двох.

Методи біометрії основані на теорії ймовірності та теорії помилок. Припустимо, що група тварин, яка нас цікавить, складає 500 000 голів. Усі особини в категорії, що підлягає вивченню, будуть складати генеральну сукупність. Немає ніякої можливості вивчати таку велику групу тварин методом суцільного дослідження. Тому для вивчення властивостей або ознак генеральної сукупності відбирають частину тварин, тобто складають вибірку. У випадках, коли вивчення пов’язане з боєм тварин, метод суцільного обстеження застосовувати неможливо.

Щоб вибірка правильно відображала генеральну сукупність, вона повинна бути правильно складена. Для цього у вибірку слід відібрати в однаковій кількості і пропорційно генеральній сукупності особин з малим, середнім та високим показником ознаки, що практично правильно зробити. Тому відбір з генеральної сукупності проводиться за принципом випадковості. Ймовірність надходження у вибірку тієї чи іншої особини з генеральної сукупності випадкова. Звідси витікає, що при вивченні генеральної сукупності за вибіркою, тобто характеристиці цілого по його частині, і випадковому виборі особин в вибірку з генеральної сукупності неминуча помилка.

Обсяг генеральної сукупності може бути як дуже великим так і дуже малим. Наприклад, група корів, по удою яких оцінюється робота доярки і скотаря, вже представляє собою генеральну сукупність. Для визначення середнього надою по господарству генеральною сукупністю буде усе стадо, а при вивченні продуктивності породи – усе поголів’я породи. Коли об’єм генеральної сукупності дуже великий, то вона прирівнюється до нескінченості. Таким чином, генеральною сукупністю називають таку сукупність, яка містить у собі інформацію, необхідну для вирішення конкретної задачі.

Вибірки складають з урахуванням усіх особливостей тварин: породи, віку, умов годування та утримання.

Матеріалом для складання вибірки служать первинні зоотехнічні, ветеринарні, а також експериментальні дані.

Величина ознаки окремої особини називається варіантою і позначається Х. Розмір варіанти залежить від багатьох умов. Наприклад, добовий надій корови залежить від спадкових факторів, фізіологічного стану організму, умов годування, утримання, кліматичних факторів та ін. При цьому можливими є різноманітні випадкові комбінації факторів, які позитивно і негативно впливають на ознаку та обумовлюючих її різноманітність. Біометрія вивчає спонтанні явища, що в сукупностях знаходять визначені закономірності.

Дуже важливим питанням є чисельність вибірки. Визначення чисельності вибірки залежить від характеру питань,які вивчають, ступеня їх вивченості та інших умов. Чисельність особин у виборці позначається n, а в генеральній сукупності N. Розрізняють великі та маленькі вибірки, а у зв’язку з цим і не однакові методи обробки показників ознак. Великими називають вибірки, чисельність яких складає 30 особин та більше, малі вибірки мають менші значення. У великих вибірках розрахунки ведуться не прямим способом, а шляхом групування. Але за наявності електронної - обчислювальної техніки ділення на великі та маленькі вибірки відпадає.

Методи біометрії дозволяють дати математично точні характеристики якостей та ознак сукупностей. Після того як вибірка складена її починають вивчати.

До числа найважливіших показників, які наприклад, використовуються в генетиці та селекції, відносяться:

1. Середні величини – середня арифметична, середня звішена тощо.

2. Показники різноманітності ознаки –ліміти, середнє квадратичне відхилення, коефіцієнт варіації, дисперсія.

3. Показники зв’язку між ознаками – коефіцієнти генотипічної та фенотипічної кореляції, регресії тощо.

4. Показники відповідності вибіркових даних параметрам генеральної сукупності, тобто репрезентативності.

Крім того використовують ряд інших характеристик.

Тема 1. Складання варіаційних рядів та їх графічне зображення.

При вивченні сукупності корів за добовим надоєм складена така вибірка чисельність 100 голів (об’єм вибірки n=100).

21,9	21,4	27,7	17,0	12,3	21,7	23,4	25,7	21,2	20,3
23,8	24,1	26,9	21,4	20,7	18,5	22,5	23,0	18,5	25,7
20,1	21,3	15,7	24,8	19,3	22,2	27,9	14,9	26,1	20,6
14,6	27,8	22,4	16,7	22,9	25,3	22,7	19,7	15,2	21,3
22,1	20,5	19,7	24,5	29,6	23,3	19,1	23,5	25,9	17,2
15,5	18,1	23,9	25,4	20,4	13,2	19,6	24,4	18,2	24,8
24,2	20,9	20,1	16,5	20,9	23,2	27,2	21,1	26,3	18,6
17,2	17,8	25,0	31,2	20,7	18,3	23,7	16,1	16,2	21,6
23,0	20,7	25,3	23,9	17,3	21,8	14,1	19,0	21,9	18,77
25,8	21,2	19,9	24,8	22,7	16,4	20,6	23,5	22,2	19,5

При вирахуванні середньої арифметичної непрямим способом необхідно групувати результати вимірів і складати варіаційний ряд.

Щоб побудувати варіаційний ряд перш за все треба знайти ліміти, тобто мінімальні та максимальні значення варіант. У наведеній вибірці вони виділені. У даному випадку мінімальна варіанта Х_min – 12,3 кг, максимальна Х_max – 31,2 кг.

Для складання варіаційного ряду потрібно знайти величину класного проміжку, що визначається таким чином:

Кількість класів визначають у залежності від ступеня точності, з якою ведеться обробка, і кількості об’єктів в виборці. Вважається зручним при виборці в межах від 30 до 60 варіант розподіляти їх на 6 - 8 класів, при виборці від 60 до 100 варіант – на 7 - 8 класів, при виборці від 100 і більше варіант – на 9 - 17 класів. У нашому прикладі вибрано 10 класів. Звідси:

У даному випадку величина класного проміжку видалась дробною, що незручно при розрахунках. Зручно округлити її до цілого числа і отримаємо k =2.

Округлюють для зручності часто і недробну величину класного проміжку. Наприклад, при обробці живої ваги тварин k видалась 17 кг; цю величину зручніше округлити до 15 або до 20 кг. Класний проміжок по надою за лактацію, рівний 939 кг, можна округлити до 1000 кг. Таке округлення може впливати на кількість класів: при збільшенні величини класного проміжку кількість класів може зменшитись, а при її зменшенні - збільшуватись.

Класи складають таким чином: мінімальну величину – х _min, що дорівнює в нашому прикладі 12,3, треба округлити до найближчого найменшого круглого числа 12, яке буде служити нижньою границею першого класу. Додавши до неї величину класного проміжку 2, знаходимо нижню границю другого класу 14. Таким же чином знаходимо нижні границі наступних класів: 12, 14, 16, 18, 20 тощо.Щоб варіанта не потрапила на границю між двома класами, умовно позначають, до якого класу відноситься погранична величина. З цією метою зменшують верхню межу кожного класу на величину рівну 0,1 точності виміру ознаки. Зменшивши верхні границі на 0,1 кг, отримаємо границі першого класу 12,0-13,9; другого 14,0-15,9 і т.д. потім треба визначити середини класів (W). Вони будуть дорівнювати напівсумі нижніх границь даного та наступного класів:

Встановивши границі класів, приступають до розноски варіант за класами, для чого складають таблицю з чотирьох граф і числа з рядків, рівного числу класів. У першу чергу вписують границі класів, у другу – середини класів, третя служить для розноски варіант, а в четвертій дані розноски сумують для встановлення кількості варіант у кожному класі. Число варіант в класі називають частотами і позначають символом f.

З метою розноски почергово читають кожну варіанту і відмічають її в графі “розноска”, в рядку відповідного класу за допомогою точок та тире так:

1	²
● ● ● ●	● ● ● ●	● ● ● ●	● ● ● ●	● ● ● ●	● ● ● ●	● ● ● ●	● ● ● ●	● ● ● ●	● ● ● ●

Розноска за класами даних добового надою корів наведена в таблиці 1. Таблиця 1

1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | 10 | 11 | 12 | 13 | 14 | 15 | 16 | 17 | 18 |

Поиск по сайту:

Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав. Студалл.Орг (2.077 сек.)

Главная | О проекте | Полезные cсылки | Контакты | Случайная страница