|
|||||||
АвтоАвтоматизацияАрхитектураАстрономияАудитБиологияБухгалтерияВоенное делоГенетикаГеографияГеологияГосударствоДомДругоеЖурналистика и СМИИзобретательствоИностранные языкиИнформатикаИскусствоИсторияКомпьютерыКулинарияКультураЛексикологияЛитератураЛогикаМаркетингМатематикаМашиностроениеМедицинаМенеджментМеталлы и СваркаМеханикаМузыкаНаселениеОбразованиеОхрана безопасности жизниОхрана ТрудаПедагогикаПолитикаПравоПриборостроениеПрограммированиеПроизводствоПромышленностьПсихологияРадиоРегилияСвязьСоциологияСпортСтандартизацияСтроительствоТехнологииТорговляТуризмФизикаФизиологияФилософияФинансыХимияХозяйствоЦеннообразованиеЧерчениеЭкологияЭконометрикаЭкономикаЭлектроникаЮриспунденкция |
Изучим сначала случай отсутствия дублированных опытов в основном экспериментеДля получения дисперсий коэффициентов регрессии используют матрицу базисных функций Х. Рассмотрим матрицу (ХТХ)-1, элементы которой обозначим через cij. Это – квадратная матрица размера , называемая ковариационной матрицей: Умножим каждый ее элемент на оценку дисперсии воспроизводимости . Можно показать, что полученная матрица имеет вид (4.30) Следовательно, . По главной диагонали матрицы (4.30) стоят дисперсии коэффициентов регрессии, а недиагональные элементы – это ковариации между коэффициентами регрессии. Ковариация, так же как и коэффициент корреляции, является мерой линейной статистической связи между двумя случайными величинами. Оценка ковариации двух случайных величин x и y, принимающих в однородной серии из n опытов значения х 1, у 1, х 2, у 2,..., хпуп, равна Легко заметить, что числитель формулы совпадает с числителем формулы для выборочного коэффициента корреляции (см. (1.26)). Поэтому аналогично коэффициенту корреляции ковариация между независимыми случайными величинами равна нулю. Таким образом, для отыскания дисперсии коэффициентов регрессии требуется проделать сложные матричные преобразования. Перейдем к случаю дублирования опытов. Матрицу Х будем формировать, учитывая только основные опыты; тогда каждая ее строка будет содержать условия проведения серии дублированных опытов. Рассмотрим отдельно случай равномерного дублирования. Для получения оценок дисперсий и ковариаций коэффициентов регрессии следует каждый элемент матрицы (см. формулу (4.30)) разделить на число n дублированных опытов. Если дублирование неравномерное, то оценки дисперсий и ковариаций коэффициентов регрессии являются элементами матрицы , где Р – матрица дублирования. Для большинства планов, рекомендуемых теорией эксперимента, существуют простые формулы для отыскания дисперсий коэффициентов регрессии, их дисперсий и ковариаций между ними. Более того, ряд таких планов составлен исходя из требования равенства нулю ковариаций между коэффициентами регрессии. Это так называемые ортогональные планы, к которым относятся, в частности, полный и дробный факторные планы. При ортогональном планировании отбрасывание незначимых коэффициентов регрессии не приводит к изменению оценок остальных коэффициентов. После того как найдены дисперсии коэффициентов регрессии, следует выявить незначимые коэффициенты, т.е. те, которые в математической модели можно приравнять нулю. Для этого используется t -критерий Стьюдента. Для каждого коэффициента регрессии bi отыскивается t -отношение: (4.31) Можно анализировать значимость коэффициентов регрессии по уравнению с натуральными факторами. В этом случае В обеих формулах в числителе стоит абсолютная величина коэффициента регрессии, в знаменателе – его эмпирический стандарт – корень квадратный из дисперсии. Вычисленную величину ti сравнивают с табличным значением t табл t -критерия Стьюдента (см. табл. 1.1) для заданного уровня значимости q и числа степеней свободы fy, с которым определялась дисперсия воспроизводимости . Если ti < t табл, то коэффициент регрессии bi незначим и соответствующий член в уравнении регрессии должен быть отброшен. С учетом (4.31) условие того, что коэффициент регрессии незначим, можно записать в более удобном виде: . (4.32) При отбрасывании незначимых членов возникает определенное неудобство, связанное со статистической зависимостью коэффициентов регрессии. Эта зависимость проявляется в том, что после того как незначимые коэффициенты регрессии приравняли нулю, оценки остальных коэффициентов регрессии изменяются. Практический вывод: после отбрасывания незначимых коэффициентов регрессии желательно снова воспользоваться МНК для уточнения оставшихся значимых коэффициентов регрессии. С помощью t -критерия можно найти и доверительный интервал для произвольного коэффициента регрессии bi. Обозначим истинную величину этого коэффициента через β i. Тогда (4.33) Даже простейшая линейная модель позволяет получить важную информацию об объекте исследования. Запишем ее в нормализованных обозначениях факторов (4.34) Коэффициенты этой математической модели имеют четкий физический смысл. Коэффициент b 0 равен, очевидно, значению выходной величины, рассчитанному по уравнению регрессии, если все факторы зафиксированы на основном уровне, т.е. в середине диапазона варьирования. Знак коэффициента bi свидетельствует о характере влияния соответствующего фактора. Если bi > 0, то с ростом значения фактора Хi выходная величина растет. Если bi < 0, то с ростом Хi выходная величина уменьшается. Величина bi равна приросту выходной величины, полученному при увеличении значения фактора Хi на половину диапазона его варьирования, например, с основного уровня до верхнего уровня . Как уже указывалось, из вида модели (4.34) следует, что графиком зависимости величины y от любого фактора Хi является прямая. Рассмотрение зависимостей выходной величины y от этого фактора при разных фиксированных значениях других факторов позволит получить семейство прямых, причем все эти прямые будут параллельны. Это связано с тем, что представление регрессионной модели в линейном виде (4.34) предполагает отсутствие взаимодействий факторов (см. п. 3.1). Чем больше абсолютная величина линейного коэффициента регрессии в модели (4.34), тем сильнее влияние соответствующего фактора. Если, например, оказалось, что , то можно сделать вывод о том, что изменение фактора Х 3 в пределах его диапазона варьирования оказывает большее влияние на изменение отклика, чем варьирование фактора Х 1 в его диапазоне. Таким образом, с помощью линейной регрессионной модели можно сравнить степень влияния факторов на выходную величину и выявить важнейшие факторы. Если уравнение регрессии отличается от линейного вида, то степень влияния фактора может изменяться от начала к концу диапазона варьирования и зависит от уровней варьирования других факторов. Проверка адекватности регрессионной модели. Регрессионная модель, построенная по результатам эксперимента, позволяет рассчитать значения отклика в разных точках области варьирования факторов. Для этого в уравнение регрессии подставляют соответствующие значения варьируемых факторов. Проверка адекватности математической модели дает возможность экспериментатору ответить на вопрос, будет ли построенная модель предсказывать значения выходной величины с той точностью, что и результаты эксперимента. Пусть N – число опытов экспериментального плана или число серий параллельных опытов, если опыты дублируются; p – число оцениваемых коэффициентов регрессии математической модели. Проверка адекватности возможна только при N > p, т.е. если план эксперимента является ненасыщенным. Для проверки адекватности модели необходимо знать оценку дисперсии воспроизводимости , которую можно вычислить в зависимости от методики дублирования опытов по одной из формул, приведенных в п. 3.5. Порядок проверки адекватности модели. 1. Определяют сумму квадратов, характеризующую адекватность модели Sad. При равномерном дублировании ее рассчитывают по формуле (4.35) Здесь n – число дублированных опытов в каждой серии; – среднее значение результатов эксперимента в j -й серии дублированных опытов, j = 1, 2, 3,..., N; – значение выходной величины, рассчитанное по уравнению регрессии для j -го основного опыта. В случае неравномерного дублирования (4.36) где nj – число дублированных опытов в j -й серии. При отсутствии дублирования опытов (4.37) где yj – результат j -го опыта. 2. Вычисляют число степеней свободы f ад дисперсии адекватности. При любой методике дублирования опытов оно равно f ад = N – p. (4.38) 3. Вычисляют дисперсию адекватности (4.39) 4. С помощью критерия Фишера F проверяют однородность дисперсии адекватности и дисперсии воспроизводимости . При этом вычисляют значение критерия Фишера F расч (4.40) которое сравнивают с табличным значением критерия Фишера, найденным при выбранном уровне значимости q для чисел степеней свободы f ад в числителе и fу в знаменателе. Если F расч < F табл, то модель считается адекватной и может быть использована для описания объекта. В противном случае модель неадекватна. Рассмотренный метод проверки адекватности модели имеет простой физический смысл. В основе этой процедуры лежит проверка гипотезы об однородности дисперсии адекватности и дисперсии, характеризующей ошибку эксперимента. Заметим, что дисперсия адекватности характеризует расхождение между результатами эксперимента yj и значениями выходной величины , вычисленными по уравнению регрессии. Логично принять, что модель удовлетворительно описывает объект исследования, т.е. является адекватной, если указанное расхождение вызвано только экспериментальными ошибками, а не связано, например, с неудачным выбором вида математической модели. Проверка гипотезы об однородности рассматриваемых дисперсий и выясняет «общность происхождения» экспериментальных ошибок и расхождения между yj и . Кроме проверки адекватности модели можно оценить ее эффективность, информационную ценность. При отсутствии дублированных опытов эффективность регрессионной модели оценивают следующим образом. 1. Вычисляют дисперсию относительно среднего значения отклика (4.41) где – среднее значение отклика по всем опытам: 2. Рассчитывают остаточную дисперсию: (4.42) 3. Вычисляют отношение (4.43) Величина Fu показывает, во сколько раз уравнение регрессии описывает результаты эксперимента точнее, чем простое среднее арифметическое, взятое по всем опытам. Регрессионная модель считается эффективной, если Fu > (3 – 5). Для экспериментов с дублированными опытами формула (4.43) остается в силе, а выражения для дисперсий и примут вид:
где yju – значение отклика в u -м дублированном опыте j -й серии; N – число серий дублированных опытов; Поиск по сайту: |
Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав. Студалл.Орг (0.007 сек.) |