|
|||||||
АвтоАвтоматизацияАрхитектураАстрономияАудитБиологияБухгалтерияВоенное делоГенетикаГеографияГеологияГосударствоДомДругоеЖурналистика и СМИИзобретательствоИностранные языкиИнформатикаИскусствоИсторияКомпьютерыКулинарияКультураЛексикологияЛитератураЛогикаМаркетингМатематикаМашиностроениеМедицинаМенеджментМеталлы и СваркаМеханикаМузыкаНаселениеОбразованиеОхрана безопасности жизниОхрана ТрудаПедагогикаПолитикаПравоПриборостроениеПрограммированиеПроизводствоПромышленностьПсихологияРадиоРегилияСвязьСоциологияСпортСтандартизацияСтроительствоТехнологииТорговляТуризмФизикаФизиологияФилософияФинансыХимияХозяйствоЦеннообразованиеЧерчениеЭкологияЭконометрикаЭкономикаЭлектроникаЮриспунденкция |
Лекционный комплекс (тезисы лекций)Тема 1. Введение. Изменчивость и пути ее изучения. Биометрия как наука. Научно-технический прогресс, превращение науки в непосредственную производительную силу общества предъявляют к подготовке специалистов все более высокие требования. Современный биолог, агроном, зоотехник или врач, инженер, учитель или психолог должны не только хорошо знать свою специальность, но и приобщаться к исследовательской работе, вносить посильный вклад в сокровищницу знаний о природе. Знания о природе приобретаются путем наблюдения, сравнения и опыта. Под наблюдением подразумевают процесс планомерного добывания и накопления фактов независимо от того, как оно осуществляется - в эксперименте или непосредственным описанием изучаемого предмета. «Истинная наука, - по словам Тимирязева, - основывается только на фактах и на логике и постоянно продвигается по пути достоверности своего знания». «Факты - это воздух ученого, - писал И. П. Павлов.- Без них ваши «теории» - пустые потуги». «Факты, если взять их в их целом, в их связи, не только «упрямая», но и безусловно доказательная вещь», - указывал В. И. Ленин. Но факты - это еще не наука. Как груда строительных материалов не является зданием, так и масса накопленных фактов не составляет содержание науки. Только сведенные в некую систему факты приобретают определенный смысл, позволяют извлечь заключенную в них информацию. Эта работа требует от исследователя не только профессионального мастерства, но и умения правильно планировать эксперименты, анализировать их результаты, делать из фактов научно обоснованные выводы. Система таких знаний и составляет содержание биометрии — науки, призванной играть хотя и вспомогательную, но весьма важную роль в биологических исследованиях. Биометрия в своем историческом развитии прошла долгий и сложный путь — от чисто словесного описания биологических объектов к их измерениям, от статистических сводок и таблиц к статистическому анализу массовых явлений. В истории биометрии можно отметить несколько периодов, или этапов. Первый период, описательный, берет свое начало в XVII столетии. В это время происходит переход от словесного описания и элементарного количественного учета биологических объектов к их числовым характеристикам. Измерения рассматриваются как метод научного познания живой природы. Второй период, начавшийся в первой половине XIX в., ознаменован работами А. Кетле. В это время закладываются основы биометрии как науки, целью которой является не описание явлений, а их анализ, направленный на открытие статистических закономерностей, которые действуют в сфере массовых явлений. Биометрию рассматривают одновременно и как науку, и как метод научного познания. Третий период, формалистический, характеризуется возникновением и развитием английской биометрической школы во главе с Ф. Гальтоном и К. Пирсоном. В это время создают математический аппарат биометрии и предпринимают попытки применить его к изучению проблемы наследственности и изменчивости организмов. Четвертый период, рационалистический, начинается с 1902 г. классическими исследованиями Иогансена, показавшего, что в области биологических исследований первое место должно принадлежать биологическому эксперименту, а не математике. Математические методы должны применяться как вспомогательный аппарат при обработке экспериментальных данных. Пятый период в развитии биометрии открывают классические работы Стьюдента и Р. Фишера. В это время создаются основы теории малой выборки, теории планирования экспериментов, вводятся в содержание биометрии новые термины и понятия. Все эти новшества связаны с революцией в биологии, с ломкой устаревших принципов и понятий в области исследовательской работы, с усилением процесса математизации биологии. Происходит все более заметная специализация биометрии, применения ее методов в самых различных областях биологии, медицины, антропологии и других смежных науках. Основные понятия биометрии. группировка первичных данных. Предмет и основные понятия биометрии Предметом биометрии служит любой биологический объект, изучаемый с применением счета или меры, т.е. с количественной стороны в целях более или менее точной оценки его качественного состояния. При этом, как уже сообщалось, имеются в виду не единичные, а групповые объекты, т.е. явления массовые, в сфере которых проявляют свое действие статистические законы. Например, врач принял больного и назначил необходимое ему лекарство - это единичное явление, отдельный акт. Если же врач принял несколько больных или подверг неоднократному осмотру одного и того же больного, - это массовое явление независимо от того, каким был объект наблюдения - единичным или групповым. Обычно наблюдения проводят на групповых объектах, например на особях одного и того же вида, пола и возраста, которые рассматривают как составные элементы, или члены группового объекта, и называют единицами наблюдения. Множество относительно однородных, но индивидуально различимых единиц, объединенных для совместного (группового) изучения, называют статистической совокупностью. Основная литература: [1-7] Дополнительная литература: [8-14; 15-17] Тема 2 . Разбивка вариант на классы. Составление гистограмм, замена гистограмм кривыми. Двухвершинные и многовершинные кривые, протуберанцы ошибок. Различают прерывное варьирование и непрерывное. Прерывное варьирование изучается путем подсчетов и называется так потому, что разница между отдельными особями всегда выражается в целых числах и не может быть меньше единицы. (В колосе пшеницы может быть 10, 15, 46 и т.д. зерен, но не может быть 10,5 зерна). Непрерывное варьирование определяется путем измерения, взвешивания, химических анализов. В этих случаях изучаемые количественные признаки выражаются как целыми, так и дробными числами. Чем больше точность измерения, тем меньше возможная разница между близкими объектами. (Например, расстояние между двумя точками мы можем измерять километрами, метрами, сантиметрами, миллиметрами, и чем точнее будет измерение, тем меньше разница между соседними измерениями). Переход от минимального к максимальному значению постепенный. Отбор выборок без преднамеренного подбора, случайно, называется рендомизированным отбором. К этой же категории отбора выборок относится взятие для анализа каждого 10-го, 20-го и т. д. экземпляра, например, при изучении изменчивости рыб или анализе початков кукурузы, а также в ряде других случаев. Рассмотрим конкретный пример. Нам надо определить число колосков в колосьях пшеницы данного сорта. Размер выборки - 50 колосьев. Отобрав рендомизированно необходимое количество (50) колосьев, мы приступаем к подсчетам (табл. 1). Сначала пишем: «Число колосков и колосе (Казахстанской 126 или другого изучаемого сорта)». Поскольку мы растения брали без выбора, то в таблице 1 цифры расположены без каких-либо закономерностей и из нее нельзя сделать никаких выводов. Количественное выражение признака называется вариантой или (у некоторых авторов) датой и изображается буквами V или х. Варианты, расположенные в восходящем или нисходящем порядке, образуют вариационный ряд. Чтобы составить вариационный ряд, найдем и отметим максимальную и минимальную варианты. В нашем примере минимальная варианта - 12, максимальная - 20. Разность между минимальной и максимальной вариантами называется размахом варьирования или амплитудой изменчивости. Для составления вариационного ряда расположим варианты в восходящем порядке и определим, сколько раз каждая варианта встречается в нашей выборке. Число, показывающее, сколько раз встречается в данной выборке каждая варианта, называется частотой и изображается буквами f или р. Для определения частот произведем разноску: зачеркиваем первую цифру таблицы 2 и против варианты 18 ставим точку, затем зачеркиваем вторую цифру – 13, ставим точку против варианты 13, зачеркиваем третью цифру и ставим точку против варианты 20 и т. д. Числа 1, 2, 3, 4 изображаются точками; 5 и 6 - диагоналями, 7, 8, 9, 10 - сторонами квадрата. Закончив разноску наших данных, заменим точки и черточки цифрами - узнаем частоты. Сумма частот должна быть равна количеству взятых для исследования объектов. В нашем примере 2+6+8+12+8...+1 = 50, следовательно, разноска произведена правильно. Правильность разноски обязательно надо проверять, иначе допущенная и незамеченная своевременно ошибка при разноске сделает неверной всю дальнейшую работу. Сумма в вариационной статистике изображается заглавной буквой «сигма» греческого алфавита - Σ, количество объектов исследования — латинской буквой n. Запишем первую формулу: Изобразим наш вариационный ряд графически (рис.1); на горизонтальной оси отложим варианты, на вертикальной - частоты. Рабочие графики удобно делать на клетчатой или миллиметровой бумаге.
Таблица 2
Графическое изображение вариационного ряда называется вариационной кривой, наиболее часто встречающаяся в вариационном ряду варианта - модой. В нашем примере мода равна 15. Варианта, расположенная в середине вариационного ряда, называется медианой. Мода изображается Мо, медиана - Me. В биологических исследованиях мода имеет большое значение.
Рис. 1. Число колосков в колосс пшеницы Казахстанская 126.
Разбивка вариант на классы. составление гистограмм. замена гистограмм кривыми. Двухвершинные и многовершинные кривые, протуберанцы ошибок. Исследуя непрерывную изменчивость, а также анализируя данные, полученные при изучении npеpывной изменчивости при большом размахе варьирования, необходимо разбивать варианты на классы. Например, число икринок у рыб одного вида и возраста нередко изменяется более чем на 500. Совершенно ясно, что выписывать столбиком все варианты невозможно. При непрерывной изменчивости варианты чаще всего представлены смешанными числами: высота растений - 1,25; 2,15; 3,45 м и т. д. Содержание белка в зерне пшеницы - 15,2; 16,01; 16,5% и т. д. Между двумя целыми числами может располагаться 100 вариант, различающихся на 0,01 м или 0,01%. В этих случаях варианты разбиваются на классы. При этом следует соблюдать следующие правила: 1. Границы классов должны быть такими, чтобы каждая варианта могла быть отнесена только к одному классу: 5-9, 10-14, 15-19 т.д., но не 5-10, 10-15,15-20 и т.д. 2. Размеры всех классов должны быть равными. 3. Первый и последний классы могут быть неполными. Например, при размере класса 10 и амплитуде изменчивости 76, размер последнего класса 70-79, хотя варианты 77-79 в нашем примере отсутствуют. 4. Количество классов должно быть не более 10-15 и не менее 6-7. 5. Для определения размера классов находят минимальную и максимальную варианты, определяют амплитуду изменчивости и делят ее на установленное количество классов, округляя полученное число до целого. Например: измерения высоты стеблей кукурузы 25/VIII 1972 г. дало результаты, приведенные в таблице 3. Таблица 3 Амплитуда варьирования 100-179 = 79 см. Если примем размер класса за 10, то 79:10 = 7,9=8 классов. Наметим границы классов и составим таблицу 4. При разноске мы зачеркиваем в нашей таблице очередную цифру и ставим точку или черточку против соответствующего класса. Так, в класс 100-109 мы отнесем варианты 100, 102, 103, 105, 106, 108. Мы получили вариационный ряд. Мода его - класс 130-139. Графическое изображение вариационного ряда, разбитого на классы, называется гистрограммой. При составлении гистрограммы на горизонтальной оси наносятся размеры классов, на вертикальной — частоты. Гистрограмму можно превратить в вариационную кривую. Для этого надо соединить прямыми линиями середины классов. Изобразим при помощи гистрограммы полученные нами данные по высоте растений кукурузы (рис.2).
При анализе количественных данных исследователь обычно получает много чисел. Построение гистограмм и вариационных кривых помогает осмыслить эти числа, наметить определенные закономерности. Графики чисто помещают в печатных изданиях и в отчетах научно-исследовательской работе. Для удобства сравнения на одном чертеже помещают несколько кривых. На рабочих чертежах удобно эти кривые чертить цветной тушью или карандашами. Для печати кривые обычно чертят черной тушью, но разными шрифтами. Каждый чертеж сопровождается экспликацией, показывающей, как изображен тот или другой вариант опыта. Например, мы провели измерение высоты пяти гибридов кукурузы. Экспликация будет выглядеть следующим образом: Гибрид ВИР156 (контроль) Юбилейный, Днепровский 56, Краснодарский 4, Южный 3
На одном чертеже неудобно располагать больше 5-6 вариантов опыта, поэтому если сравнивается большее количество вариантов опыта, то составляется несколько графиков, причем вариант, служащий контролем, помещается на каждом чертеже. Чтобы на одном чертеже можно было поместить несколько кривых, при разбивке вариант на классы надо границы классов устанавливать не по минимальной варианте каждого варианта опыта, а брать границы классов, общие для всех вариантов. Например, если минимальная высота растений в одном варианте опыта 100, в другом - 113, в третьем - 98 см, а размер класса принят за 10 см, то границы классов должны быть 90-99, 100-109, 110-119 и т.д. То, что первые классы могут отсутствовать или быть неполными, не имеет значения. Для большинства признаков сельскохозяйственных и биологических объектов характерно нормальное распределение. Его отличительной чертой является то, что, чем больше отклоняется значение отдельной варианты от средней, тем реже она наблюдается. Например, большинство людей имеет средний рост. Великаны (более 200 см) и карлики (менее 100 см) встречаются крайне редко. Наиболее часто отклоняются от нормального скошенное (асимметрия), крутовершинное (эксцесс), двух- и многовершинное распределения (рис. 3). Рис. 3. Типы распределений. Пунктиром показано нормальное распределение.
В практической работе иногда наблюдается резкое снижение или возрастание частоты отдельных вариант. Такие выступы на кривых называются протуберанцами ошибок. Причины их возникновения: 1. Недостаточное количество объектов исследования. 2. Слишком мелкие градации изучаемых признаков. 3. Допущенные ошибки в измерениях или подсчетах.
Например, изучая количество зерен в колосьях пшеницы определенного сорта, мы получили данные, представленные в таблице 5. Если мы объединим количество зерен в классы по два, то кривая примет нормальный вид (рис. 5). Это естественно, так как разница в одно зерно может быть случайной. Основная литература: [1-7] Дополнительная литература: [8-14; 15-17]
Тема 3. Вычисление арифметического среднего, основного (квадратического) отклонения, коэффициента вариации. Одна из основных задач статистической обработки материала - найти показатели, характеризующие особенности эмпирических совокупностей, дающие возможность сравнивать их друг с другом. Статистические совокупности с достаточной полнотой характеризуют два показателя: 1. Средняя величина признака; 2. Степень варьирования или рассеяния. Рассмотрим понятие «средняя величина признака». В статистике используются средняя арифметическая, средняя взвешенная, средняя гармоническая, средняя геометрическая. Наибольшее значение в биологических и сельскохозяйственных исследованиях имеет средняя арифметическая. Средней арифметической называется такая величина, сумма отрицательных и положительных отклонений от которой равна нулю. Например, количество плодов на растениях составляет 4; 5; 9. Среднее количество плодов - 6; 4 отклоняется от 6 на минус 2; 5 - на минус 1; 9 - на плюс 3: Чтобы найти арифметическое среднее, надо сложить все варианты и разделить их на число наблюдений. Средняя арифметическая в вариационной статистике обозначается как М или х (читается как икс покрытое). Формула определения среднего арифметического: При небольшом количестве наблюдений или при использовании электронных счетных машин вычисление среднего арифметического производится таким образом. При обработке сложных вариационных рядов при большом количестве вариант такой способ вычисления слишком трудоемок. Применяется способ вычисления среднего «по способу моментов», или «от произвольного начала». Рассмотрим этот способ вычисления на примере простого вариационного ряда (табл. 6). (Вариационный ряд, в котором каждая варианта встречается один раз называется простым, несколько раз - сложным). Отклонения от произвольно взятого среднего обозначаются а или х-х. В качестве произвольно и взятого среднего (или условного среднего) берем любую варианту, лежащую в средине или близко к средине вариационного ряда. Отграничиваем ее прямыми линиями. Мы взяли в нашем примере в качестве произвольного среднего варианту 13.
Таблица 6 Таблица 7
Вычислим отклонения от произвольной средней каждой варианты. Поскольку наш ряд построен в восходящем порядке, варианты, лежащие выше произвольного среднего, имеют знак -, ниже его + Найдем алгебраическую сумму отклонений:
Мы знаем, что сумма отрицательных и положительных отклонений от среднего равна 0. Разделив полученную нами сумму отклонений на число наблюдений (8), получаем поправку. I Формула поправки , а истинное среднее равно произвольно взятому среднему Мо + поправка.
Нельзя забывать, что речь идет об алгебраической сумме: если мы получили поправку с отрицательным знаком, то В нашем примере М или Проверим наше вычисление: Мы получили одинаковые результаты, что и при вычислении с помощью произвольно взятой средней. Если в качестве произвольного среднего мы возьмем варианту 14, то сумма отрицательных отклонений будет равна - 10; сумма положительных +6, поправка
b = -10+6/8= - 0,5. Среднее = 14+(-0,5) = 13,5.
Для проверки правильности вычисления среднего рекомендуется повторить вычисление, взяв за произвольное среднее другую варианту. В сложных вариационных рядах, где варианты встречаются по нескольку раз, также берут одну из вариант, лежащих в средине ряда, за произвольную среднюю, вычисляют отклонение от среднего (х—х или а), умножают отклонения на соответствующие частоты, находят суммы положительных и отрицательных отклонений (а х f), делят на количество наблюдений и найденную таким образом поправку добавляют или вычитают произвольно взятого среднего (в зависимости от знака). Рассмотрим пример (табл. 7). Поправка b= -19+31/34=0,35, п=34. Вычисления производятся с точностью до 0,01. Средняя равна 13+0,35 = 13,35. При вычислении среднего в рядах, разбитых на классы, во избежание получения слишком больших чисел при расчетах, отклонения от произвольно взятого среднего каждого класса принимают за единицу, а затем полученную поправку умножают на размер классового промежутка, обозначаемого К или l, и добавляют или вычитают (в зависимости от знака) к центральному значению класса, взятого в качестве произвольного среднего. Центральное значение класса обозначается W, X или х. В качестве примера вычислим среднее по данным таблицы 8. Сумма произведений частот на отклонение с отрицательным знаком равна - 20, с положительным знаком 34. Алгебраическая сумма составляет 14. Найдем b, для этого 14 разделим на получим 0,34. W — центральное значение класса, принятого за среднее, равно 37. Отсюда М= 37 +0,34 х5= 38,70.
Таблица 8
Формула вычислении среднего вариационного ряда, разбитого на классы: M=W+bl
При исчислении следует следить за правильностью знаков gлюс или минус у b. Основная литература: [1-7] Дополнительная литература: [8-14; 15-17]
Тема 4. В каждой частной совокупности, взятой для исследования, отдельные экземпляры в различной степени отклоняются от средней величины, поэтому для характеристики изучаемой выборки одного среднего недостаточно; необходимо привести показатели, характеризующие степень этого разнообразия. Показателями разнообразия признаков служат лимиты, амплитуды изменчивости, среднее квадратическое отклонение (сигма), варианса и коэффициент вариации. Общим свойством показателей разнообразия является их способность отмечать различные степени и особенности разнообразия.
Основная литература: [1-7] Дополнительная литература: [8-14; 15-17] Тема 5. Среднее квадратическое отклонение (сигма). Ошибка среднего арифметического . Квадратическое (основное) отклонение (сигма) используется для вычисления очень важного статистического показателя — ошибки среднего арифметического. Точное среднее арифметическое может быть определено, если мы исследуем всю генеральную совокупность. Практически же мы имеем дело с более или менее большими по объему выборками. В таких случаях среднее всегда бывает не вполне точным. Возьмем 100 растений, измерим их высоту, вычислим среднюю арифметическую. Допустим, что средний рост растений данной выборки 50,5 см. Разобьем эти растения на группы по 20 экз. в каждой. Вновь проведем измерения и вычислим средние. Эти новые средние точно не совпадут с уже установленным средним 50,5, а будут в каждом отдельном случае отклоняться от него в ту или другую сторону: 49,8; 50,9; 50,1; 51,3; 50,4 в зависимости от того, попадут ли во взятую для измерения группу более высокие или более низкие растения. Поэтому, называя среднее арифметическое, необходимо указать и возможные колебания этой средней величины. Это достигается путем вычисления ошибки среднего арифметического, которая обозначается m или Sx и определяется по формуле Приводя среднее арифметическое, указывают и его ошибку: Это показывает, что среднее в исследованной выборке колеблется от 140 до 150. Ошибка средней арифметической зависит от двух величин: от степени разнообразия признака в генеральной совокупности и от размера выборки: чем больше выборка, тем меньше ошибка. Поэтому при вычислении ошибки квадратическое отклонение делится на корень квадратный из числа наблюдений. Часть никогда не может полностью характеризовать целое, поэтому характеристика генеральной совокупности на основе выборочных данных всегда будет иметь некоторую большую или меньшую ошибку. Такие ошибки являются ошибками обобщения, связанными с перенесением результатов, полученных при изучении выборки, на всю генеральную совокупность, и называются ошибками репрезентативности. (Репрезентативность происходит от французского слова representative - представительный). Помимо ошибок репрезентативности при исследовании могут встретиться ошибки самого разнообразного характера. К ним относятся: 1. Методические ошибки (нарушение правильной методики проведения фиксации материала для цитологических и биохимических исследований, невыравненность условий в опытных вариантах и контроле). 2. Ошибки точности (использование непроверенных измерительных приборов, расчеты с недостаточной точностью и т. д.). 3. Случайные ошибки (ошибки, просчеты, путаница в материале и т. д.). 4. Ошибки, связанные с неправильным отбором проб для изучения. Все эти причины повлекут за собой очень сильное увеличение ошибки среднего. (Иногда у начинающих работников ошибка бывает почти равна среднему. Ясно, что такие данные должны выбраковываться). Поиск по сайту: |
Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав. Студалл.Орг (0.017 сек.) |