|
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
АвтоАвтоматизацияАрхитектураАстрономияАудитБиологияБухгалтерияВоенное делоГенетикаГеографияГеологияГосударствоДомДругоеЖурналистика и СМИИзобретательствоИностранные языкиИнформатикаИскусствоИсторияКомпьютерыКулинарияКультураЛексикологияЛитератураЛогикаМаркетингМатематикаМашиностроениеМедицинаМенеджментМеталлы и СваркаМеханикаМузыкаНаселениеОбразованиеОхрана безопасности жизниОхрана ТрудаПедагогикаПолитикаПравоПриборостроениеПрограммированиеПроизводствоПромышленностьПсихологияРадиоРегилияСвязьСоциологияСпортСтандартизацияСтроительствоТехнологииТорговляТуризмФизикаФизиологияФилософияФинансыХимияХозяйствоЦеннообразованиеЧерчениеЭкологияЭконометрикаЭкономикаЭлектроникаЮриспунденкция |
ГЕНЕРАЛЬНОЇ СУКУПНОСТІ
§ 1. Точкові статистичні оцінки параметрів
Розглянемо наступну загальну задачу. Маємо випадкову величину Х, закон розподілу якої має невідомий параметр а. Потрібно на основі даних вибірки знайти добру оцінку параметру а. Нехай а* - статистична оцінка невідомого параметру а теоретичного розподілу (генеральної сукупності). Припустимо, що по вибірці об’єму n знайдена оцінка Повторимо експеримент, тобто візьмемо знову вибірку об’єму n з генеральної сукупності і по ній знайдемо оцінку Припустимо, що оцінка а* дає наближене значення а з надлишком; тоді кожне знайдене за даними вибірок число Таким чином, використання статистичної оцінки, математичне сподівання якої не рівне оцінюючому параметру, привело б до систематичних (одного знаку) похибок. Тому потрібно вимагати, щоб математичне сподівання оцінки було рівне шуканому параметру. Хоча дотримання цієї вимоги не усуне похибку, проте похибки різних знаків будуть взаємно компенсуватись. Тобто дотримання умови M[a*]=a гарантує відсутність систематичних похибок. Незміщеною називають статистичну оцінку а*, математичне сподівання якої дорівнює параметру, що оцінюється при будь-якому об’ємі вибірки, тобто M[a*]=a. (1) Зміщеною будемо називати статистичну оцінку, для якої порушується умова (1), тобто Проте помилково було б вважати, що незміщена оцінка завжди дає добрі наближення оціненого параметру. Справа в тому, що можливі значення а* можуть бути сильно розсіяні навколо свого середнього значення. Наприклад, Ефективною називається статистична оцінка, яка при заданому обсязі вибірки n має найменшу дисперсію. При вибірці великого обсягу (n велике) до статистичних оцінок ставляться вимоги змістовності. Змістовною (спроможною) називають статистичну оцінку, яка при
Для виконання вимоги (2) досить, щоб дисперсія оцінки прямувала до нуля, коли
і, крім того, щоб оцінка була незміщеною. Від формули (2) легко перейти до виразу (3), якщо скористатись нерівністю Чебишева. Прикладом змістовної оцінки можуть слугувати закони великих чисел, наприклад, теорема Бернуллі. Очевидно, такій умові повинна задовольняти всяка оцінка, придатна для практичного використання. Як уже згадувалось, для генеральної сукупності, заданої розподілом (для простоти обмежимось випадком дискретної випадкової величини):
середня генеральна
Аналогічна формула справедлива і для вибірки
Але зауважимо, що вибіркова середня, знайдена за даними вибірки є певним (випадковим) числом. При інших вибірках з тієї ж генеральної сукупності, середня вибіркова, взагалі кажучи, змінює свої значення, тобто характеристику Крім того, в теоретичних міркуваннях значення вибірки x1,x2,…xk випадкової величини Х, одержані в результаті незалежних випробувань, розглядаються як випадкові величини X1,X2,…Xk, що мають ті ж числові характеристики і той же розподіл, що й Х. Звідси, як для однаково розподілених випадкових величин З іншої сторони, як для однаково розподілених випадкових величин
Тобто Якщо допустити, що вибіркові величини Х1,...Хk мають обмежені дисперсії, то за теоремою Чебишева для однаково розподілених випадкових величин
Дисперсії розраховуються за формулами:
Перетворимо вирази до вигляду:
де Перший доданок рівності (1) збігається за ймовірністю до Якщо ж в ролі оцінки генеральної дисперсії взяти вибіркову дисперсію, то ця оцінка буде приводити до системних похибок (одного знаку, бо
Легко “виправити” вибіркову дисперсію так, щоб її математичне сподівання було рівне генеральній дисперсії. Для цього досить помножити DВ на
Виправлена дисперсія є незміщеною оцінкою генеральної дисперсії. Дійсно,
Зауважимо, що і “виправлене” середнє квадратичне відхилення:
є незміщеною оцінкою. Крім того, при великих об’ємах вибіркова і виправлена дисперсії відрізняються мало. На практиці користуються виправленою дисперсію приблизно при n<30. У цьому випадку значення множника Приклад. З булочок, що їх випікає хлібозавод, зроблено вибірку. Зважування булочок, що попали у вибірку, дало такі результати (в грамах): 100,3 101,2 99,6 102,4 100,3 100,4 102,7 98,6 101,2 98,3 99,5 101,2 100,7 99,8 100,7 100,6 99,2 99,7 100,4 101,1 100,1 100,7 99,3 98,9 100,2 98,8 98,9 98,2 97,6 99,2 98,3 99,7 101,3 98,7 99,7 101,6 103,2 99,4 101,5 Знайти: Рішення. Результати вибірки та їх обчислення зводимо в таблицю:
Для знаходження Мо будемо користуватись формулою:
де xr – ліва межа модального інтервалу, nr –частота модального інтервалу; nr-1, nr+1 – частоти відповідного попереднього і наступного інтервалів; h - ширина модального інтервалу. В нашому прикладі: xr=100,0, nr=7, nr-1=6, nr+1=4, h=0,5. А тому
Для знаходження Ме припускаємо рівномірний розподіл ознаки в медіанному інтервалі, тому
Маємо: xr=99,5; nr=6, nr+1=14, h=0,5;
§2. Інтервальні статистичні оцінки параметрів
Статистичні оцінки діляться на точкові та інтервальні. Точковою називається оцінка, яка визначається одним числом. Такими були оцінки з §І. При вибірці малого обсягу точкові оцінки можуть значно відхилятись від параметру, тобто приводять до грубих похибок. Тому більш точними є інтервальні оцінки. Інтервальною називають оцінку, яка визначається двома числами – кінцями інтервалу. Інтервальні оцінки дозволяють встановити точність і надійність оцінок. Нехай знайдена по даних вибірки статистична характеристика а* служить оцінкою невідомого параметру а. Будемо вважати а постійною величиною (може бути і випадковою). Зрозуміло, що а* тим точніше визначає параметр а, чим менша абсолютна величина різниці В зв’язку з тим, що вибіркові параметри (середні, дисперсія і т.д.) є випадковими величинами, то і їх відхилення від генеральних параметрів (похибки) також будуть випадковими величинами. Таким чином, задачу про оцінку цих відхилень носить ймовірнісний характер і полягає в оцінці ймовірності
1. Довірчі інтервали для оцінки математичного сподівання при відомому Припускаючи, що випадкова величина Х розподілена нормально, причому середнє квадратичне відхилення Так як величина
Вимагаємо, щоб виконувалась рівність:
де Як відомо
де Знайшовши з останньої рівності
Зауважимо, що ймовірність Р (надійність) задана, і рівна
Смисл одержаного співвідношення такий: з надійністю Поставлена задача розв’язана, причому зауважимо, що число t визначається з рівності З класичної оцінки Приклад 1. Статистичні дослідження рівня доходу на працюючого в день дали такі результати:
З надійністю Рішення. Допустимо, що рівень доходу розподілений за нормальним законом. Тоді побудова інтервалу довір’я здійснюється за формулою де
9,676<m<11,244
2. Довірчі інтервали для математичного сподівання при невідомому Нехай тепер випадкова величина Х генеральної сукупності розподілена нормально, але середнє квадратичне відхилення Перш ніж розв’язувати цю задачу, введемо деякі поняття. Незалежні умови, що накладаються на ni (чи Wi), називаються в’язами. Наприклад, Отже, користуючись розподілом Стьюдента, можна знайти довірчий інтервал:
що накриває параметр m з надійністю Приклад 2. вибіркове обслідування прибутків за місяць підприємців дало результати, дані яких записані у вигляді розподілу:
Побудувати інтервал довір’я для математичного сподівання m, допустивши, що генеральна сукупність Х розподілена нормально з надійністю Рішення. Обчислимо
За надійністю
§3. Довірчий інтервал для оцінки середнього квадратичного відхилення
Нехай випадкова величина Х генеральної сукупності розподілена нормально. Потрібно оцінити невідомий параметр – генеральне середнє квадратичне відхилення Вимагаємо виконання рівності Для того, щоб можна було користуватись таблицею 4 (див. додаток), перетворимо нерівність в рівносильну нерівність Поклавши
Залишається знайти q. Практично для знаходження q користуються таблицею додатку 4. Для цього по вибірці обчислюємо S і по таблиці q, а згідно (1) знаходимо довірчий інтервал, що накриває Приклад 1. (приклад 2 з §2) n=10, Рішення. З таблиці 4 знайдемо по Зауваження. Якщо q>1, то
Поиск по сайту: |
Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав. Студалл.Орг (0.024 сек.) |