АвтоАвтоматизацияАрхитектураАстрономияАудитБиологияБухгалтерияВоенное делоГенетикаГеографияГеологияГосударствоДомДругоеЖурналистика и СМИИзобретательствоИностранные языкиИнформатикаИскусствоИсторияКомпьютерыКулинарияКультураЛексикологияЛитератураЛогикаМаркетингМатематикаМашиностроениеМедицинаМенеджментМеталлы и СваркаМеханикаМузыкаНаселениеОбразованиеОхрана безопасности жизниОхрана ТрудаПедагогикаПолитикаПравоПриборостроениеПрограммированиеПроизводствоПромышленностьПсихологияРадиоРегилияСвязьСоциологияСпортСтандартизацияСтроительствоТехнологииТорговляТуризмФизикаФизиологияФилософияФинансыХимияХозяйствоЦеннообразованиеЧерчениеЭкологияЭконометрикаЭкономикаЭлектроникаЮриспунденкция

Для среднего значения

Читайте также:
  1. Административная ответственность: основания и особенности. Порядок назначения административных наказаний.
  2. Анатомической особенностью среднего уха у детей раннего возраста является какая слуховая труба
  3. Анатомия среднего уха
  4. Атипичное течение острого среднего отита.
  5. Бойцы специального Божьего назначения
  6. Буквенные позиционные обозначения основных элементов
  7. В сердце моём просыпается семя предназначения
  8. Версии назначения Баальбека
  9. Во всех последующих расчетных циклах используются уточненные значения.
  10. Вопрос 20: Особенности лечения острого среднего отита в стадии перфорации
  11. Гигиеническое воспитание детей среднего и старшего школьного возраста
  12. Горячие клавиши общего назначения

Стандартная ошибка характеризует лишь средние пределы

варьирования выборочных средних около истинного генерально-

го среднего значения. Если средняя ошибка оказывается равной

2 см, как в нашем предыдущем примере, это свидетельствует

лишь о том, что некоторые из выборочных средних будут

отклоняться от генерального среднего меньше чем на 2 см, а дру-

гие, наоборот, могут отстоять от него больше чем на 2 см,

вследствие чего разница в 2 см и является средней характерис-

тикой всех возможных отклонений этих выборочных средних

от их общего генерального среднего. Однако часто исследователя

может интересовать не столько средняя величина этих разностей,

сколько предельно возможное отклонение выборочных средних

от генеральной средней, другими словами, не средняя, а макси-

мальная ошибка.

Определить максимальное отклонение выборочной средней

от истинной генеральной средней можно лишь с определенной

вероятностью. В случае нормального распределения изучаемого

признака это можно сделать на основе правила 3 сигм. Рассмот-

рим следующий пример: пусть имеется бесконечно большая

генеральная совокупность, например популяция какого-либо вида

животного. Отберем из этой популяции 10 000 выборок, в каждой

из которых будет по 100 особей, и измерим у всех особей длину

тела. В итоге мы можем рассчитать 10 000 выборочных средних

значений длины тела. Если признак соответствует нормальному

закону, то распределение этих выборочных средних на графике

примет уже известный читателю ォколоколообразныйサ вид.

В центре данного распределения будет находиться истинная

генеральная средняя (μ), от неё влево и вправо будут отклоняться

выборочные средние значения (1 X … 10000 X), как характеристики,

случайно варьирующие около μ (рис. 4.1).

3m 2m 1m μ 1m 2m 3m

Рис. 4.1. График, иллюстрирующий отклонения выборочных средних

значений от истинного генерального среднего

Причем можно установить с определенной вероятностью

границы, в пределах которых будут происходить подобные

отклонения. Читатель уже знаком с подобными вероятностями

и границами. Так, например, с вероятностью 0.683 выборочные

средние будут отклоняться от истинного генерального значения

в пределах μア1m (одна стандартная ошибка), а с вероятностью

0.997 в пределах μア3m (три стандартные ошибки). В данном

случае используется не сигма (стандартное отклонение), а стан-

дартная ошибка, поскольку именно она, как было показано выше,

является стандартным отклонением, характеризующим разброс

выборочных средних относительно генерального среднего. Верно

и обратное заключение: можно утверждать, что с вероятностью

0.997 истинная генеральная средняя окажется внутри интервала

X ア3m. Таким образом, мы подошли к понятию доверительного

интервала. Приведем определение.

Доверительный интервал – границы, в которых с заданной

вероятностью (степенью достоверности) находится изучаемый

генеральный параметр. В экологии и биологии наиболее часто

используется доверительный интервал для среднего значения.

При расчетах (построениях) доверительных интервалов,

однако, не применяются вероятности, которыми мы оперировали

в правиле трех сигм (Р = 0.683; 0.954; 0.997). Напомню, что раз-

ным значениям アt соответствуют строго определенные вероят-

ности, так:

t = 1 => Р = 0.683; t = 2 => Р = 0.954; t = 3 => Р = 0.997

В случае с доверительными интервалами важнейшее

значение имеет так называемое ォсоглашение о 95%-й вероят-

ностиサ. В соответствии с ним совокупности, состоящей из 95%

особей (объектов), мы доверяем так же, как и 100%-й. Другими

словами, данная вероятность принята как наименьшая, которой

можно доверять как 100%-й при принятии того или иного

решения, связанного с математической обработкой данных.

Поэтому подобная вероятность получила обозначение ォ довери-

тельная вероятность» – вероятность, признанная достаточной

для уверенного суждения о генеральных параметрах на основа-

нии известных выборочных характеристик. Применительно

к доверительному интервалу это вероятность того, что

генеральный параметр (среднее значение) действительно

окажется внутри доверительного интервала. Если вероятность

0.95 является наименьшей в рейтинге доверия, то, значит,

существуют и другие доверительные вероятности. Действи-

тельно, если решение, которое нужно принять при математи-

ческой обработке данных, является очень ответственным, то его

стараются принимать с ещё большей вероятностью, к примеру

0.99 или 0.999, чтобы свести возможные ошибки практически

к нулю. Все эти три вероятности относятся к доверительным,

и именно они используются при построении доверительных

интервалов. Какие же значения t соответствуют этим вероят-

ностям? Ответ читатель найдет ниже:

Р = 0.683 t = 1 => Р = 0.95 t = 1.96

Р = 0.954 t = 2 => Р = 0.99 t = 2.58

Р = 0.997 t = 3 => Р = 0.999 t = 3.29

Теперь настало время ввести ещё одно важное понятие

в математической статистике, его обозначают как уровень

значимости (р или α). Данное понятие имеет много определений,

в общем виде это вероятность допустить ошибку, принимая то

или иное решение, связанное с математической обработкой

данных, или вероятность, противоположная доверительной.

Более конкретное определение применительно к доверительному

интервалу – это вероятность того, что генеральный параметр

(среднее значение) при заданной доверительной вероятности

(Р=0.95, Р=0.99, Р=0.999) окажется за границами довери-

тельного интервала.

В статистике приняты 3 уровня значимости, соответст-

вующие доверительным вероятностям:

Р = 0.95 р = 0.05 (1-0.95)

Р = 0.99 => р = 0.01 (1-0.99)

Р = 0.999 р = 0.001 (1-0.999)

Отсюда следует, что при р = 0.05 риск ошибиться составляет

1 раз на 20 случаев (5%), при р = 0.01 – 1 раз на 100 случаев (1%),

при р = 0.001 – 1 раз на 1000 случаев (0.1%). Таким образом, чем

меньше уровень значимости и, соответственно, выше довери-

тельная вероятность, тем меньше риск ошибки.

Доверительный интервал для оценки генерального среднего

значения можно рассчитать, исходя из 3-х параметров:

1. Выборочное среднее значение – X.

2. Стандартная ошибка выборочного среднего (m) в данном

случае является стандартным отклонением выборочных средних

от генеральной средней.

3. Нормированное отклонение (t) необходимо для установле-

ния доверительной вероятности, с которой будет рассчитан

доверительный интервал.

Таким образом, генеральное среднее значение находится

в интервале:

X  t m

В зависимости от заданной доверительной вероятности

можно рассчитать следующие виды доверительных интервалов:

95%-й доверительный интервал X ア 1.96m

99%-й доверительный интервал X ア 2.58m

99.9%-й доверительный интервал X ア 3.29m

Примечание 2. Если выборка невелика (n < 20), то необходимо

вводить поправки на объем выборки, расширяя область возмож-

ного пребывания генерального параметра. Это понятно, поскольку

при дефиците информации любые заключения не могут быть очень

точными. Фактически в этих случаях поправки представляют собой

более высокие значения t, чем те, которые были представлены. Так,

если объем выборки равен n = 4, то для расчета 95%-го

доверительного интервала необходимо взять значение t, равное

3.18, а не 1.96. Данные поправки читатель при желании может

найти в любом пособии по статистике в виде так называемой

таблицы критических точек t-критерия Стьюдента. Однако если

расчеты производятся с использованием статистических программ,

то в поисках данной таблицы нет необходимости.

Биологическая (экологическая) интерпретация доверитель-

ного интервала довольно проста: в примере с расчетом стандарт-

ной ошибки для длины тела ォнеизвестногоサ вида животного

первая выборочная средняя оказалась равна 17 см, рассчитанный

для неё 95%-й доверительный интервал составляет ア10.9 см. Это

означает, что с вероятностью 0.95 истинная генеральная средняя

длины тела находится внутри границ от 6.1 см до 27.9 см (т. е.

17ア10.9 см), но с вероятностью 0.05 средняя генеральной сово-

купности может находиться вне границ данного интервала.

Генеральная средняя в данном примере была равна 20 см

и действительно попадает в рассчитанный интервал, а большие

размеры интервала, как было сказано, объясняются малочислен-

ностью выборки (n = 4).

Программное обеспечение. Расчет стандартной ошибки

и доверительного интервала для среднего значения проводится

в известном читателю модуле ォ Описательная статистика»,

который имеется в большинстве статистических программ (см.

выше). Кроме того, в MS EXCEL можно воспользоваться

функцией ДОВЕРИТ. Часто удобно представлять интервальные

оценки генеральных параметров графически в виде отрезков,

откладываемых от среднего значения в обе стороны (ア).

Подобные графики можно назвать диаграммами размаха,

в программе STATISTICA они обозначаются как ォящики

с усамиサ (Box & Whisker plot) (рис. 4.2).

Рис. 4.2. Диаграммы размаха, визуализирующие

интервальные оценки генеральных параметров.

На левом графике: столбец – выборочное среднее, отрезок – стандартная

ошибка либо доверительный интервал. На правом графике:

точка – выборочное среднее, прямоугольник – стандартная ошибка,

отрезок – доверительный интервал

Примечание 3. Выбор доверительной вероятности осущест-

вляется исследователем в зависимости от той ответственности,

с какой должны быть сделаны выводы о генеральном параметре.

Если, к примеру, исследование связано с токсичностью вещества

или с дозами лекарственных препаратов, от которых зависит

жизнь пациентов, то для уверенного суждения о генеральных

параметрах необходимо оперировать более высокими вероятнос-

тями – 0.99 или даже 0.999. С другой стороны, важно понимать,

что чем выше доверительная вероятность, тем шире будет

доверительный интервал и тем менее чёткой становится оценка

генерального параметра. В большинстве экологических и биоло-

гических исследований достаточно надежной считается 95%-я

доверительная вероятность (или 5% уровень значимости), кото-

рые и используются наиболее часто.

Примечание 4. Рассмотренный в данной главе способ рас-

чета доверительного интервала применим лишь в случае нор-

мальности распределения изучаемых признаков. Более широкие

возможности использования доверительного интервала читатель

может найти в модуле ォ Описательная статистика» программы

ATTESTAT.

Глава 5. Проверка статистических гипотез

В данной главе будут обсуждаться сравнительные оценки ге-

неральных параметров, т. е. методы, позволяющие установить, на-

сколько различия между выборками ォправильноサ отражают разли-

чия между генеральными совокупностями, из которых они взяты.

В биологических и экологических исследованиях анализ

отдельных выборок редко является конечной целью. Очень часто

приходится сравнивать эти выборки между собой. Метод срав-

нения является наиболее общим способом эмпирического позна-

ния __________и используется для получения информации об объекте

исследования как в естественных, так и в гуманитарных науках.

Ни одно исследование биологов и экологов не обходится без

сравнения, сравнивать приходится данные опытной и контроль-

ной групп (выборок) в эксперименте, показатели качества воды за

разные промежутки времени, степень загрязнения тех или иных

участков, популяции по численности и структуре, продук-

тивность разных озер, морфофизиологические особенности

разных групп людей и животных и т. д. При этом сравнение двух

выборок не может быть самоцелью ни биологического, ни

экологического исследования, поскольку современную науку

интересуют не просто факты, но причина их возникновения.

В этом ключе сравнение двух выборок выступает в роли метода

поиска отличий в причинах, обеспечивших существование двух

групп объектов (выборок) разного качества; в конце концов, это

поиск влияния фактора, поиск закономерности, отделение её от

случайности (Ивантер, Коросов, 2005).

При сравнении двух выборок всегда возникает вопрос, до-

стоверны ли наблюдаемые отличия между выборками или они

обусловлены лишь какими-то случайными причинами? Другими

словами, можно ли данное различие считать закономерным, харак-

терным для всей генеральной совокупности и рассматривать его

как результат реально действующих в системе факторов или же оно

случайно и является следствием недостаточного количества

данных и в следующих опытах (наблюдениях) может не

проявиться? Поясним сказанное на примере. Вернемся к росту

детей дошкольного возраста, в главе 2 мы установили, что в полу-

ченных выборках девочки в среднем выше мальчиков, причем

выборочная разность роста составила 6 см (средний рост девочек

127 см, а мальчиков – 121 см). Можно ли сразу утверждать, что и

в генеральных совокупностях, из которых извлечены 2 выборки

детей, наблюдается такое же различие между генеральными

средними значениями (т. е. теми, которые можно было бы

получить, изучив всех детей данного возраста)? Ответ очевиден –

нет! В предыдущем разделе было показано, что любые выборочные

средние являются величинами случайными, отклоняющимися от

истинных генеральных средних и поэтому с ними не

совпадающими. Эту среднюю величину отклонения оценивает

стандартная ошибка. Фактически это означает, что в ォреальностиサ

средний рост мальчиков и девочек может быть равным (например,

и мальчики и девочки могут иметь средний рост μ1 = μ2 = 125 см) и

только в силу случайности, возникающей при отборе выборок из

генеральных совокупностей, полученные исследователем выбороч-

ные средние (1 X = 127 см и 2 X = 121 см) могут отличаться друг от

друга, т. е. их разность может быть недостоверна. Но, с другой

стороны, поскольку исследователь никогда не знает истинных

генеральных средних, полученная разность между выборочными

средними вполне может оказаться не случайной, а закономерной,

т. е. реально существующей в генеральной совокупности.

Приведенный пример показывает, что при сравнении любых

выборок исследователю всегда необходимо каким-то образом

устанавливать достоверность наблюдаемых различий, для того

чтобы подтверждать реальность их существования.

Прежде чем приступить к практическому освоению методов,

позволяющих устанавливать достоверность выборочной разнос-

ти, остановимся на основополагающих понятиях.


1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | 10 | 11 | 12 | 13 | 14 | 15 | 16 | 17 | 18 | 19 | 20 | 21 | 22 | 23 | 24 | 25 | 26 |

Поиск по сайту:



Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав. Студалл.Орг (0.017 сек.)