|
|||||||
АвтоАвтоматизацияАрхитектураАстрономияАудитБиологияБухгалтерияВоенное делоГенетикаГеографияГеологияГосударствоДомДругоеЖурналистика и СМИИзобретательствоИностранные языкиИнформатикаИскусствоИсторияКомпьютерыКулинарияКультураЛексикологияЛитератураЛогикаМаркетингМатематикаМашиностроениеМедицинаМенеджментМеталлы и СваркаМеханикаМузыкаНаселениеОбразованиеОхрана безопасности жизниОхрана ТрудаПедагогикаПолитикаПравоПриборостроениеПрограммированиеПроизводствоПромышленностьПсихологияРадиоРегилияСвязьСоциологияСпортСтандартизацияСтроительствоТехнологииТорговляТуризмФизикаФизиологияФилософияФинансыХимияХозяйствоЦеннообразованиеЧерчениеЭкологияЭконометрикаЭкономикаЭлектроникаЮриспунденкция |
Нормальное распределениеНаиболее характерный тип распределения непрерывных слу- чайных величин, из него можно вывести (к нему сводятся) все остальные. Термин «нормальное распределение» введен в биоло- гическую лексику Ф. Гальтоном в 1889 году. Однако ещё задолго до этого оно было хорошо известно математикам, которые это распределение часто называют законом Гаусса – Лапласа. Назва- ние распределения, конечно, не означает, что все другие законы распределения «ненормальные», или атипичные. Просто подоб- ное распределение значений признака так часто встречается в самых различных областях науки и практики, что первоначально принималось за «норму» случайного проявления признаков. Графически нормальное распределение выглядит как симмет- ричная колоколообразная кривая. Основная закономерность при нормальном распределении значений признака заключается в том, что крайние значения (наибольшие и наименьшие) появ- ляются редко, но чем ближе значения признака к центру (к сред- ней арифметической), тем они чаще встречаются (рис. 3.3). Рис. 3.3. Кривая нормального распределения Действительно, если взять такой признак, как человеческий рост, и построить распределение, то можно убедиться, что люди с неким средним ростом будут встречаться очень часто (центр рас- пределения), а вероятность обнаружить людей с очень высоким (например, выше 2 м) или очень низким (например, менее 1 м) ростом будет значительно меньше (края распределения). Это означает, что человеческий рост – признак, подчиняющийся нор- мальному закону распределения. Важной особенностью нормального распределения является то, что форма и положение его графика определяется только 2 па- раметрами: средним значением признака и стандартным откло- нением. При этом для оценки степени отклонения отдельных зна- чений признака от среднего значения используют не само стан- дартное отклонение, а величины так называемого нормирован- ного отклонения (t) – отношения отклонений отдельных значений признака от среднего значения к стандартному отклонению: t = (i) X X . Отсюда () t i X X . Таким образом, закон нормального распределения факти- чески описывает функциональную зависимость между вероятно- стью Р (ось ординат, у) и нормированным отклонением t (ось абсцисс, х). Он утверждает, что вероятность отклонения любого значения признака от центра распределения (т. е. среднего значения) определяется функцией нормированного отклонения. Закон нормального распределения может быть охарактеризован довольно сложной математической формулой: () 2 Р 1 Xi X e , где π – отношение длины окружности к диаметру (равно 3.1416), е – основание натуральных логарифмов (равно 2.718). Остальные параметры уравнения читателю уже известны, отметим лишь, что в показателе степени величины е находится возведенное в квадрат нормированное отклонение t (i) X X . Данное уравнение определяет ход кривой нормального распределения, т. е. позволяет вычислить ординаты нормальной кривой, или «плотность вероятности» (Р). Нормальная кривая со средним значением, равным 0, и σ = 1 называется стандартизованной и описывается следующей мате- матической формулой: t2 2 Р 1 e . Если данную формулу несколько модифицировать, то на её основе можно вычислять уже не вероятности, а теоретические частоты вариационного ряда и строить, соответственно, теоре- тические (нормальные) кривые распределения. Эти кривые будут плавными, и, сопоставляя их с ломаными эмпирическими кри- выми (т. е. с вариационными кривыми или гистограммами рас- пределения, полученными по выборке), исследователь может в первом приближении определять соответствие изучаемого признака нормальному закону распределения. Кратко опишем свойства нормального распределения: 1. Нормальная кривая приближается к оси абсцисс асимпто- тически, т. е. никогда не касаясь её. 2. Все значения признака лежат в интервале плюс – минус бесконечность. Иными словами, с вероятностью P = 1 мы вправе ожидать появление нового значения в пределах от –∞ до +∞. 3. Нормальная кривая имеет характерный изгиб по мере уда- ления от центра распределения: точка перегиба лежит точно на расстоянии в 1σ от X. 4. Для нормального распределения характерно совпадение средней арифметической, моды и медианы. 5. Площадь между стандартизованной нормальной кривой и осью абсцисс равна 1. Таким образом, площадь под кривой ин- терпретируется как вероятность. Из этих свойств вытекает важное следствие, получившее на- звание правила 3-х сигм: отдельные значения любого признака, имеющего нормальное распределение, отклоняются от среднего значения (т. е. от центра распределения) с вероятностью 0.997 не более чем на 3 сигмы влево и вправо (±3σ). И только с веро- ятностью 0.003 отдельное значение признака может не попасть в пределы интервала ±3σ (рис. 3.4). Откуда появились в этом правиле вероятности 0.997 и 0.003? Как мы уже знаем, отклонение каждого отдельного значения признака от центра нормального распределения характеризуется определенным значением t, т. е. (Xi X) t . Другими словами, зная t, можно установить, в какую сторону и насколько откло- няется варианта от центра распределения. Рис. 3.4. Иллюстрация правила 3-х сигм Так, при t = +1 значение признака будет находиться справа от центра распределения и отклоняться от него (т. е. от X) на величину 1σ; при t = -1.5 значение признака будет находиться слева от центра распределения и отклоняться от него на величину 1.5σ. Кроме того, из математической формулы нормального распределения, связывающей вероятность с нормированным отклонением, следует, что в границах от –t до +t всегда будет заключена постоянная вероятность нахождения определенного значения признака. Так вот, в пределах ±1σ (т. е. при t = 1) всегда отсекается 68.3% от общей площади фигуры под кривой нормального распределения (рис. 3.4). Это значит, что с веро- ятностью 0.683 значение случайной величины попадет в интервал от -1σ до +1σ, а с вероятностью 0.317 (1 – 0.683) это значение может попасть за пределы данного интервала. Если интервал расширить до ±2σ (т. е. при t = 2), то отсекаться будет уже 95.4% от общей площади фигуры под кривой нормального распре- деления (рис. 3.4). Другими словами, в интервал от -2σ до +2σ наугад отобранная варианта попадет уже с вероятностью 0.954, и лишь с вероятностью 0.046 (1 – 0.954) она может не попасть в этот интервал. И, наконец, в пределах ±3σ (т. е. при t = 3) заключено 99.7% от общей площади фигуры под кривой нормального распределения (рис. 3.4). Фактически можно утверждать (предсказать), что с вероятностью 0.997 все значения признака будут отклоняться от центра распределения (средней арифметической) на величину, не превышающую ±3σ. И лишь с вероятностью 0.003 (1 – 0.997) наугад отобранная варианта может не попасть в заданные границы. Примечание. Нормальные распределения встречаются очень часто, когда некая величина отклоняется от средней под дейст- вием множества слабых, случайных, независимых друг от друга факторов, которые приводят к формированию симметричного распределения. Таким образом, нормальное распределение является моделью идеального равновесного состояния, не под- верженного действию какого-либо одного специфического фактора. Однако в естественных условиях нормальные распреде- ления признаков часто нарушаются. Поиск по сайту: |
Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав. Студалл.Орг (0.008 сек.) |