|
|||||||||||||
АвтоАвтоматизацияАрхитектураАстрономияАудитБиологияБухгалтерияВоенное делоГенетикаГеографияГеологияГосударствоДомДругоеЖурналистика и СМИИзобретательствоИностранные языкиИнформатикаИскусствоИсторияКомпьютерыКулинарияКультураЛексикологияЛитератураЛогикаМаркетингМатематикаМашиностроениеМедицинаМенеджментМеталлы и СваркаМеханикаМузыкаНаселениеОбразованиеОхрана безопасности жизниОхрана ТрудаПедагогикаПолитикаПравоПриборостроениеПрограммированиеПроизводствоПромышленностьПсихологияРадиоРегилияСвязьСоциологияСпортСтандартизацияСтроительствоТехнологииТорговляТуризмФизикаФизиологияФилософияФинансыХимияХозяйствоЦеннообразованиеЧерчениеЭкологияЭконометрикаЭкономикаЭлектроникаЮриспунденкция |
VI. Проверка статистических гипотез, критерий СтьюдентаВ научно-исследовательской практике часто требуется сопоставить средние арифметические, например, при сравнении результатов в контрольной и экспериментальной группах, при оценке показателей здоровья населения в различных местностях за несколько лет и т. д. Методологической основой любого исследования является формулировка рабочей гипотезы. При этом основной целью исследования является получение данных, на основании которых выдвинутую еще до начала исследования (априори) гипотезу можно было бы принять, т.е признать истинной, либо отвергнуть - признать ложной. Выдвинутую гипотезу называют основной или нулевой ( H0 ). Гипотезу, которая противоречит нулевой и является ее логическим отрицанием, называют конкурирующей или альтернативной (H1). Гипотезы H0 и Н1 предоставляют выбор только одного из двух вариантов. Например, если нулевая гипотеза предполагает, что среднее арифметическое М = 15, то логическим отрицанием будет М ≠ 15. Коротко это записывается так: H0: М =15; Н1: М ≠15. В медико-биологических исследованиях при сравнении регистрируемых признаков в качестве нулевой гипотезы принимают гипотезу об отсутствии различий. Например, при оценке токсичности какого-либо вещества обычно берутся две группы лабораторных животных. Подбираются животные одинакового возраста, пола, одинакового содержания и т. п. Таким образом, делается все, чтобы эти группы животных представляли собой единую, как можно более однородную статистическую совокупность, с тем, чтобы максимально снизить исходную вариабельность анализируемых данных. Оптимальным с этой точки зрения считается ситуация, когда отличия сравниваемых групп заключаются только в том, что одна из групп (опытная) подвергается воздействию токсического вещества, а другая (контрольная) - нет. В любом случае, произошли ли после воздействия токсического вещества изменения в опытной группе или нет, различия средних показателей в обеих группах обязательно будут. Вопрос состоит в следующем: являются ли эти различия только следствием выборочного исследования, или разница возникла из-за того, что произошли существенные сдвиги физиологических функций животных опытной группы, которые будут обнаруживаться всегда, т.е. в генеральной совокупности. Значит, проверяется вопрос: принадлежат ли животные опытной и контрольной групп к той же самой генеральной совокупности или опытная группа принадлежит к другой генеральной совокупности (совокупности с измененными физиологическими параметрами)? Методы оценки достоверности различий средних величин позволяют установить, насколько выявленные различия существенны (носят ли они закономерный характер или являются результатом действия случайных причин). Эту оценку можно выполнить только с определенной степенью вероятности, когда после установленного уровня вероятности допущение о наличии различий могут считаться закономерными или, наоборот, отвергаются. Выдвинутая гипотеза может оказаться правильной или неправильной. При ее статистической проверке может быть отвергнута правильная гипотеза. Вероятность совершить такую ошибку называют уровнем значимости. Этот параметр принято обозначать через α или p. В биологии и медицине уровень значимости, как правило, принимают не выше 0,05. Это означает, что в 5 случаях из 100 (в 5%) мы рискуем отвергнуть правильную гипотезу. Соответственно, вероятность принятия такой гипотезы (P) равняется (P = 1 ‑ p) 0,95 (или 95%.) Таким образом, статистическая значимость выборочных характеристик представляет собой меру уверенности в их «истинности». Уровень значимости находится в убывающей зависимости от надежности результата. Более высокая статистическая значимость соответствует более низкому уровню доверия к найденной в выборке средней величине. Именно уровень значимости представляет собой вероятность ошибки, связанной с распространением наблюдаемого результата на всю генеральную совокупность. Выбор порога уровня значимости, выше которого результаты отвергаются как статистически не подтвержденные, во многом произвольный. Как правило, окончательное решение обычно зависит от традиций и накопленного практического опыта в данной области исследований. Верхняя граница p <0,05 статистической значимости содержит довольно большую вероятность ошибки (5%). Поэтому в тех случаях, когда требуется особая уверенность в достоверности полученных результатов, принимается значимость p <0,01 или даже p <0,001. В практике медико-биологических исследований наиболее часто используются следующие значения показателей значимости: 0,1; 0,05; 0,01; 0,001. Традиционная интерпретация уровней значимости, принятая в этих исследованиях, представлена в таблице 19.
Таблица 19 Интерпретация уровня значимости (p).
Приблизительно о наличии достоверных различий между средними величинами можно судить по их доверительным границам. Если они имеют пересечение верхней границы одного из интервалов и нижней границы 2-го, можно предположить, что полученная разница средних является случайной и может не повториться в следующих экспериментах с вероятностью, которая использовалась при вычислении этих границ (как правило, 95%). Если изучаемый признак подчиняется закону нормального распределения Гауса, может использоваться расчет критерия достоверности Стьюдента (t) (коэффициента достоверности). Величина этого коэффициента определяется модулем отношения разности сравниваемых средних величин к ошибке их разности. Ошибка разности равна корню квадратному из суммы квадратов средних ошибок сравниваемых величин: .
Таким образом, коэффициент достоверности (t) определяется по формуле: ,
где: M1 – средняя арифметическая 1-го вариационного ряда, M2 – средняя арифметическая 2-го вариационного ряда, m1 – ошибка репрезентативности 1-го вариационного ряда, m2 – ошибка репрезентативности 2-го вариационного ряда.
Для сравнения относительных величин (показателей) применяется модифицированная формула:
где: P1 – относительная величина (показатель) 1-й группы; P2 – относительная величина (показатель) 2-й группы; m1 – ошибка репрезентативности 1-го показателя; m2 – ошибка репрезентативности 2-го показателя.
При этом ошибка репрезентативности относительной величины может быть вычислена по формуле:
,
где: Р – величина относительного показателя; q – величина, обратная Р и вычисленная как (1- Р), (100- Р), (100- Р) и т. д., в зависимости от основания, на которое рассчитан показатель; n – число наблюдений.
В медико-биологических исследованиях, где число наблюдений больше 30, допускается использовать сравнение вычисленного значения t с критическим значением 2. Если t -критерий больше 2, тогда выявленные различия считаются закономерными (не случайными, достоверными), т.е. они статистически подтверждены с вероятностью более 95%. Если значение критерия меньше 2, то разница не доказана и носит случайный характер, статистически не подтверждается (вероятность менее 95%). При меньшем числе наблюдений значение критического уровня для сравнения с расчетным значением t-критерия необходимо искать в книгах с таблицами Стьюдента или вычислять в статистической компьютерной программе.
Пример определения достоверности различий между средними величинами по критерию Стьюдента.
Условие задачи: сравнение средней частоты сердечных сокращений (ЧСС) детей 1‑го года жизни в отделениях №1, №2 (см. раздел III). Задание: а) оценить достоверность различий между средним пульсом пациентов 1‑го и 2-го отделений с помощью доверительных границ; б) вычислить критерий Стьюдента для сравнения ЧСС детей в этих отделениях, сделать вывод о достоверности различий средних величин.
Решение: Запустите программу Excel, откройте требуемый файл в папке своей учебной группы под именем «Статистика–Фамилии студентов». Создайте НОВЫЙ лист, переименуйте его, обозначив названием «Крит_Стьюдента». На этом листе введите данные и решение задачи, как показано ниже, сохраните изменения и покажите результат работы преподавателю.
а) доверительные границы колебаний средних в каждом отделении при уровне значимости p <0,05, т.е. с вероятностью прогноза более 95%, составляет M ±2 m, где M – средняя арифметическая, m – ошибка репрезентативности. По условию задачи в 1-м отделении M1 =121,9, m 1 =1,64. Т.е. 121,9 ± 2*1,64 = 121,9 ± 3,28 уд/мин. В ячейке таблицы Excel вводятся формулы =121,9+3,28 и =121,9-3,28. Получаем доверительные границы колебаний средней частоты пульса в 1-м отделении от 118,62 до 125,18 уд/мин. Аналогично определяем доверительные границы средней ЧСС во 2-м отделении. По условию задачи M2 =126,2, m2 =2,04. Т.е. 126,29 ± 2 * 2,04 = 126,2 ± 4,08 уд/мин. Формулы вычисления =126,29+4,08 и =126,29-4,08. Получаем доверительные границы колебаний средней частоты пульса в 2-м отделении от 122,21 до 130,37 уд/мин. Величина доверительных границ частоты пульса в 2-х отделениях больницы позволяют утверждать, что при повторных экспериментах в 95% случаях будут получены средние величины, укладывающиеся в пределах вычисленных значений границ в 1-м отделении от 118,62 до 125,18 уд/мин, во 2-ом - от 122,21 до 130,37 уд/мин. Поскольку доверительные границы этих отделений имеют пересечение верхней границы 1-го и нижней границы 2-го отделений, можно предположить, что полученная разница средних является случайной и может не повториться в следующих экспериментах. б) оценка достоверности различий средней частоты пульса детей, поступающих в 1‑е и 2-е отделение больницы по критерию Стьюдента.
Формула вычисления критерия Стьюдента:,
где: M1 – средняя арифметическая 1-го вариационного ряда - 121,8, M2 – средняя арифметическая 2-го вариационного ряда - 126,2, m1 – ошибка репрезентативности 1-го вариационного ряда - 1,64, m2 – ошибка репрезентативности 2-го вариационного ряда - 2,04.
В программе Excel эта формула принимает вид: =(121,8 – 126,2)/КОРЕНЬ(1,64^2+2,04^2) = -1,64667.
Модуль числа может быть получен с помощью функции =ABS(Число) = ABS(-1,64667) = 1,64667. Округление числа выполняется функцией =ОКРУГЛ(Число; Разрядность) = ОКРУГЛ(1,64667;2) = 1,65. Вычисленное значение t -критерия (-1,65) оценивается по модулю числа (1,65) в сравнении с критическим значением, которое при числе наблюдений n >30 составляет 2. При числе наблюдений n <30 критическое значение находят по таблицам Стьюдента при степенях свободы df = n1 + n2 – 2 = 16 + 17 – 2 = 31. В программе Excel критическое значение критерия Стьюдента вычисляется функцией = СТЬЮДРАСПОБР(Уровень значимости p; Степени свободы df) = = СТЬЮДРАСПОБР(0,05;(16+17-2)) = 2,04. Если t >2,04 – статистическая гипотеза о равенстве средних с уровнем значимости p<0,05 опровергается, следовательно, истинной будет являться гипотеза об их различии. Если t <2,04 – гипотеза равенства средних подтверждается. В нашем примере получаем: t = 1,65 < 2,04. Если в сравниваемых вариационных рядах равное число наблюдений (n 1= n 2), программа Excel позволяет выполнить вычисления при помощи функции =ТТЕСТ(Диапазон1;Диапазон2;H;Тип), где: Диапазон1 – первый вариационный ряд (множество данных); Диапазон2 – второй вариационный ряд (множество данных); H – число хвостов распределения (1 или 2), как правило, используется число 2. Если Н = 1, то функция ТТЕСТ использует одностороннее распределение, при Н = 2 используется двустороннее распределение. Тип – цифра модификации теста 1, 2 или 3. Как правило используется цифра 3. Если указана цифра 1 – это парный тест для связанных выборок, 2 – двухвыборочный с равными дисперсиями, 3 – двухвыборочный с неравными дисперсиями. В большинстве задач статистической обработки медицинских данных эта функция применяется с параметрами =ТТЕСТ(Диапазон1;Диапазон2;2;3), что считается более грубой оценкой, но вполне достаточной для опровержения нулевой гипотезы.
Функция ТТЕСТ возвращает уровень значимости основной гипотезы при сравнении 2-х числовых массивов, вычисленный по критерию Стьюдента. Он выражает вероятность того, что две выборки взяты из генеральных совокупностей, которые имеют одно и то же среднее. В нашем случае можно выполнить вычисление этой функцией на основе данных 16-и человек в каждой группе. Получаем опытный уровень значимости 0,12. Это означает, что выдвинутая гипотеза о равенстве средних в генеральной совокупности подтверждается с вероятностью 12%. Поскольку значение опытного уровня значимости больше принятого критического уровня (p =0,05 или 5%), то альтернативная гипотеза о различии средних величин не может быть принята, и значит, различия не подтверждены. В такой ситуации можно провести дополнительное исследование с теми же условиями опыта, но с увеличенным числом единиц наблюдения, что на более качественном уровне подтвердит или опровергнет рабочую гипотезу.
Вывод: Различия средней частоты пульса пациентов 1-го и 2-го отделений НЕдостоверны. Значит, более высокая средняя частота пульса во 2-м отделении больницы (126,2 уд/мин) по сравнению с ЧСС в 1-м отделении (121,9 уд/мин) не подтверждается при уровне значимости p =0,05.
Пример сравнения относительных величин и определения достоверности различий между ними по критерию Стьюдента.
Условие задачи: группа животных в количестве 120 особей получала препарат А. Из них у 98 животных произошло восстановление функций организма. Контрольная группа животных в составе 50 особей содержалась в аналогичных условиях без применения этого препарата, из них восстановление наблюдалось у 15 особей. Задание: а) вычислить показатели частоты восстановления функций организма животных (интенсивные относительные величины) в 1-ой и 2-ой группах животных; б) вычислить ошибки репрезентативности относительных величин; в) определить доверительные границы колебаний относительной величины в каждой группе; г) вычислить критерий Стьюдента для оценки достоверности различий относительных величин в изучаемых группах; д) сделать вывод о проявления эффекта препарата в генеральной совокупности с вероятностью более 95%. Решение: запустите программу Excel, откройте файл в папке своей учебной группы под именем «Статистика–Фамилии студентов», на листе «Крит_Стьюдента» этого файла выполните вычисления, как показано ниже, сохраните изменения и покажите результат работы преподавателю.
а) расчет относительных величин частоты восстановления функций организма животных в 2-х группах:,
P1 = 98/120*100 = 81,67%; P2 = 15/98*100 = 15,31%.
б) вычисление ошибок репрезентативности относительных величин: , m 1= 3,53%;
m 2= 3,64%.
в) определение доверительных границ относительных величин в каждой группе: при уровне значимости p<0,05, т.е. с вероятностью прогноза более 95%, границы вычисляют по формуле P ±2 m, где P – относительная величина, m – ошибка репрезентативности. По условию задачи в 1-й группе животных P1 =81,67, m 1 =15,31. Следовательно, 81,67 ± 2*3,53 = 81,67 ± 7,06%. Получаем доверительные границы колебаний относительных величин в 1-й группе от 74,61% до 88,73%, во 2-й группе - от 8,03% до 22,59%. Поскольку доверительные границы не пересекаются, с вероятностью 95% справедливо утверждение, что полученная разница относительных величин не случайна.[a15]
г) вычисление критерия Стьюдента для относительных величин:
t = ABS((81,67 - 15,31) / КОРЕНЬ(3,53^2 + 3,64^2)) = 13,088901 > 2
Вывод: восстановление функций организма животных на фоне действия препарата А проявляется в 81%. Этот показатель достоверно выше, чем в контрольной группе животных, не получавших препарат, при уровне значимости p <0,05. Поиск по сайту: |
Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав. Студалл.Орг (0.013 сек.) |