|
|||||||
АвтоАвтоматизацияАрхитектураАстрономияАудитБиологияБухгалтерияВоенное делоГенетикаГеографияГеологияГосударствоДомДругоеЖурналистика и СМИИзобретательствоИностранные языкиИнформатикаИскусствоИсторияКомпьютерыКулинарияКультураЛексикологияЛитератураЛогикаМаркетингМатематикаМашиностроениеМедицинаМенеджментМеталлы и СваркаМеханикаМузыкаНаселениеОбразованиеОхрана безопасности жизниОхрана ТрудаПедагогикаПолитикаПравоПриборостроениеПрограммированиеПроизводствоПромышленностьПсихологияРадиоРегилияСвязьСоциологияСпортСтандартизацияСтроительствоТехнологииТорговляТуризмФизикаФизиологияФилософияФинансыХимияХозяйствоЦеннообразованиеЧерчениеЭкологияЭконометрикаЭкономикаЭлектроникаЮриспунденкция |
Характеристики варіаціїВаріація ознаки є властивістю статистичної сукупності і зумовлена дією безлічі взаємопов'язаних причин, серед яких є основні і другорядні. Основні формують центр розподілу, другорядні - варіацію ознак, сукупна їх дія - форму розподілу [2]. Чим менша варіація, тим більш надійними, типовішими є характеристики центру, насамперед середня. Для характеристики варіації застосовують систему таких оцінок. Розмах варіації - це різниця між найбільшим і найменшим значенням ознаки R= xmax - xmln. В інтервальному ряді розподілу R визначають як різницю між верхньою межею останнього інтервалу і нижньою межею першого або ж різницю між середніми значеннями цих інтервалів. Як міра варіації R не завжди може бути надійним, оскільки залежить від двох крайніх значень, які часто не є типовими для сукупності, або мають випадковий характер. Вони отримали назву «викиди». В практиці статистичних досліджень крайні значення підлягають обробці або, принаймні, уважному розгляданню. Як правило, це помилки кодування або реєстрації, іноді вони мають випадковий характер. Тому їх часто просто викидають, звужуючи тим самим розмах і роблячи сукупність більш однорідною. Також зменшує вплив випадкових причин так званий квартальний розмах, обчислений за формулою Rq= Q3 – Q1 В усякому разі, відкидаючи крайні значення, слід, пам'ятати, що інколи з ними може бути пов'язане щось цікаве або навіть феноменальне. Замість простого відкидання пропонують процедури обчислення оцінок розподілу, які нечутливі до структури даних і отримали назву робастних [1]. Робастними оцінками називають також оцінки розподілу, які отримують при застосуванні цих методів. Програми статистичних пакетів часто передбачають обчислення оцінок Хампеля, Ендрюса та Т'юки. Наприклад, Т'юки (Tukey) запропонував один з видів робастних оцінок, а саме вінзорізовані оцінки. Суть в тому, що крайні значення не відкидаються а замінюються. Якщо маємо упорядкований ряд значень х1, х2,..., хп, то х1, надається значення х2, а хп -значення хп-1. Якщо така операція не дає бажаних наслідків, тобто сукупність ще не стає досить однорідною, то процедуру повторюють (наприклад, за допомогою пакета статистичних програм BMDP до 5 разів). Так, при двократній вінзорізації х1 та х2 присвоюється величина варіанти х3, а двом останнім у ряді — величина хп-2. Важливо підкреслити, що статистичний аналіз відноситься до таких робіт, де від ретельності підготовки матеріалу може залежати успіх всієї справи. Щодо всіляких процедур «чистки» або попередньої обробки даних, то тут окрім професійного боку справи існує ще й етичний. Дослідник повинен прагнути до об'єктивного, науково обгрунтованого результату, а він може виявитись і не таким, як хотілось би. Середнє відхилення обчислюється як: 1) середнє лінійне відхилення: а) незважене: б) зважене: 2) середнє квадратичне відхилення: а) незважене: б) зважене: Характеристика варіації має назву дисперсії: а) незважена: б) зважена: На практиці застосовують більш просту формулу розрахунку дисперсії: Чим менше середнє відхилення, тим типовіша середня, тим більш однорідна сукупність, а завжди більша за d. В симетричних та помірковано асиметричних розподілах = 1,25d. Характеристики R, d та — іменовані величини, які мають одиниці виміру варіюючої ознаки. При порівнюванні степеня варіації однієї і тієї ж ознаки в різних сукупностях використовують коефіцієнт варіації: , Лінійний коефіцієнт варіації: . З його допомогою можна оцінити також однорідність сукупності. Однорідною прийнято вважати сукупність, для якої Va < 33%, що приймають до уваги при попередній обробці даних. Розглянемо особливості обчислення деяких характеристик для альтернативної ознаки. Позначимо наявність ознаки через 1, її відсутність — через 0. Частку одиниць, які мають дану ознаку позначимо через р, які не мають — через q. Тоді: , , або Очевидно, при відсутності варіації ; максимальне значення дисперсії становить 0,25 при р = q =0,5. Якщо номінальна ознака приймає більше двох значень, оцінка її варіації дорівнює добутку часток: Поиск по сайту: |
Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав. Студалл.Орг (0.003 сек.) |