АвтоАвтоматизацияАрхитектураАстрономияАудитБиологияБухгалтерияВоенное делоГенетикаГеографияГеологияГосударствоДомДругоеЖурналистика и СМИИзобретательствоИностранные языкиИнформатикаИскусствоИсторияКомпьютерыКулинарияКультураЛексикологияЛитератураЛогикаМаркетингМатематикаМашиностроениеМедицинаМенеджментМеталлы и СваркаМеханикаМузыкаНаселениеОбразованиеОхрана безопасности жизниОхрана ТрудаПедагогикаПолитикаПравоПриборостроениеПрограммированиеПроизводствоПромышленностьПсихологияРадиоРегилияСвязьСоциологияСпортСтандартизацияСтроительствоТехнологииТорговляТуризмФизикаФизиологияФилософияФинансыХимияХозяйствоЦеннообразованиеЧерчениеЭкологияЭконометрикаЭкономикаЭлектроникаЮриспунденкция

Краткая характеристика статистических критериев сравнения

Читайте также:
  1. I. Общая характеристика.
  2. I. Пограничное состояние у новорожденных детей. Определение, характеристика, тактика медицинского работника.
  3. II. Исследование пульса, его характеристика. Места определения пульса.
  4. III. Краткая теоретическая часть.
  5. III.2. Преступление: общая характеристика
  6. IS-LM как теория совокупного спроса. Сравнительная характеристика монетарной и фискальной политики в закрытой экономике.
  7. IV. Контрольная работа, ее характеристика
  8. VI. КРАТКАЯ ИСТОРИЯ ВЫЧИСЛИТЕЛЬНОЙ ТЕХНИКИ
  9. VI. Проверка статистических гипотез, критерий Стьюдента
  10. VII. Проверка статистических гипотез, критерий Хи-квадрат
  11. XI. КРАТКАЯ БИОГРАФИЯ ЧОГЬЯАА НАМКАЯ НОРБУ
  12. XV. 1. Загальна характеристика електрохімічних процесів

 

Тип критерия Название критерия Сравниваемые показатели Мощность критерия
параметрический Стьюдента среднее арифметическое высокая
Фишера дисперсии высокая
Кохрена дисперсии высокая
непараметрический Розенбаума среднее арифметическое низкая
Знаков среднее арифметическое низкая
Вилкоксона среднее арифметическое низкая
Вилкоксона – Манна - Уишни среднее арифметическое высокая
Сиджела - Тьюки дисперсии высокая

2.1.1. Параметрические критерии сравнения

2.1.1.1. Критерий Стьюдента (t - критерий)

При проверке гипотезы по критерию Стьюдента возможны два варианта:

Ø сравнение среднего арифметического значения выборки с эталоном (генеральной средней);

Ø сравнение средних арифметических значений двух выборок.

1 - й вариант: Среднее арифметическое значение выборки не отличается от эталона, если выполняется следующее неравенство:

где

· - среднее арифметическое значение случайной величины в испытуемой выборке;

· - значение случайной величины в базовой выборке (эталон);

· - среднеквадратическое отклонение случайной величины;

· n – объем выборки;

· - табличное значение критерия Стьюдента для уровня значимости α /2 и числа степеней свободы m = n - 1.

2 - й вариант: Средние арифметические значения двух выборок а и b не отличаются, если выполняется следующее неравенство

(72)

где

(73)

2.1.1.2. Критерий Фишера (F- критерий)

Дисперсии двух выборок не отличаются, т.е. верна нулевая гипотеза если выполняется следующее неравенство:

(74)

где

· F – расчетное значение критерия Фишера;

· - соответственно большее и меньшее значения дисперсий двух сравниваемых выборок;

· Fтабол – табличное значение критерия Фишера для заданного уровня значимости α и числа степеней свободы m1= n1 – 1; m2 = n2 - 1 при объеме выборок n1 и n2. (табл. 10).

 

Таблица 10

Значения F - критерия при α = 0,05

m2 m1
           
  6,4 6,2 6,0 6,0 5,9 5,8
  5,2 5,0 4,8 4,7 4,7 4,5
  4,5 4,3 4,2 4,1 4,0 3,8
  4,1 3,9 3,7 3,6 3,6 3,4
  3,8 3,6 3,4 3,4 3,3 3,1
  3,6 3,4 3,2 3,1 3,1 2,9
  3,5 3,2 3,1 3,0 2,9 2,7
  3,1 2,8 2,6 2,5 2,5 2,3
  2,9 2,6 2,5 2,3 2,3 2,1
  2,7 2,4 2,3 2,1 2,0 1,8

2.1.1.3. Критерий Кохрена (G - критерий))

При наличии нескольких выборок одинакового объема нередко выдвигается гипотеза о том, что наибольшая из дисперсий неотличима от дисперсий остальных выборок

Но : Dmax = D1 = D2 = … = Dn.

Для проверки этой гипотезы используют критерий Кохрена (табл.11).

, (75)

где

· Di- дисперсия i-ой выборки при общем числе выборок равной k;

· Gтабл – табличное значение критерия Кохрена для заданного уровня значимости α и числа степеней свободы m1 = k (где k- число выборок) и m2 = (n-1),

где

· n - объём отдельной выборки.

Таблица 11

Значения критерия Кохрена G при a = 0.05

 

m1 m2
           
  0,7977 0,7071 0,6530 0,6025 0,5466 0,4748
  0,6841 0,5897 0,5365 0,4884 0,4366 0,3720
  0,5981 0,5065 0,4564 0,4118 0,3645 0,3066
  0,5321 0,4447 0,3980 0,3568 0,3135 0,2612

 

2.1.2. Непараметрические критерии сравнения

2.1.2.1. Критерий Розенбаума (Q – критерий)

Гипотеза верна, если выполняется следующее неравенство:

Q = S + k < Qтабл, (76)

где

· Q - расчетное значение критерия Розенбаума;

· S – число значений случайной величины (СВ) одной ранжированной выборки, превышающих максимальное значение СВ другой ранжированной выборки;

· k - число значений случайной величины одной ранжированной выборки, меньших максимального значения СВ другой ранжированной выборки;

· Qтабл - табличное значение критерия Розенбаума, которое при α = 0,05 может быть принято равным 7.

Пример 4. Даны результаты измерений времени начала схватывания (в мин) двух тампонажных растворов с В/Ц = 0,5, приготовленных из цементов Карадагского (выборки х1) и Новороссийского (выборки х2) заводов.

Цель: Установить, обеспечивают ли данные цементы одинаковое время начала схватывания тампонажных растворов: S = 5; k = 6; Q = 5 + 6 = 11; 11<7.

Таблица 12

Схема использования критерия Розенбаума

 

х1 k  
                             
х2                              
  S  

 

Вывод. Так как условие (76) не выполняется, то нулевую гипотезу следует отвергнуть, т.е. между временем начала схватывания тампонажных растворов есть разница.

2.1.2.2. Критерий Знаков (Д - критерий)

Используется для сравнения средних арифметических значений двух равных по объему выборок, полученных по результатам параллельных опытов. Нулевая гипотеза верна, если выполняется следующее неравенство

,

где

· Д - расчетное значение критерия знаков;

· К – разность между числом параллельных опытов, в которых значения случайных величин первой выборки (х1) больше значений случайных величин второй выборки (х2), и числом параллельных опытов, в которых значения случайных величин первой выборки (х1) меньше значений случайных величин второй выборки (х2).

Неравенство х1 > х2 принято обозначать знаком плюс (+), а х1 < х2 – знаком (-).

Отсюда К = Σ (+) – Σ (-). N – сумма плюсов (+) и минусов (-), т.е. N = Σ (+) + Σ (-). Дкр – критическое значение критерия знаков, величина которого при α = 0,05 равна 2,0, а при α = 0,1 - 1,6. Дкр (0,05) = 2;

Дкр (0,1) = 1,6.

2.1.2.3. Критерий Вилкоксона (Т - критерий)

Для определения расчетной величины этого критерия необходимо:

· расположить данные двух сравниваемых выборок по мере возрастания их значений в два раза таким образом, чтобы в каждом столбце находилось только одно значение случайной величины;

· присвоить ранги (номера) каждому значению случайной величины от первого до (n1+n2), при этом учесть, что несколько значений ранжированного ряда совпадают по величине, то каждому из них присваивается ранг, равный среднему арифметическому их номеров;

· просуммировать ранги первой (Т1) и второй (Т2) выборок;

· если n1 и n2 ≤ 10, то меньшую из найденных сумм рангов (Тmin) сравнить с табличным значением критерия Вилкоксона (Ттабл) при α = 0,05 (табл. 13).

Таблица 13

Значение критерия Вилкоксона при α = 0,05

 

n2 n1 (большая по объему выборка)
           
             
             
  -          
  - -        
  - - -      
  - - - -    
  - - - - -  

 

Нулевая гипотеза верна, если Тmin < Ттабл.;

· если n1 и n2 >10, если хотя бы одна выборка больше 10, то расчетное значение критерия Вилкоксона (Трасч) определить по формуле:

, (79)

где

· – объем выборки с меньшей суммой рангов ;

· n1, n2 – объем соответственно первой и второй выборок;

· n = n1 + n2 – объем обеих выборок.

Нулевая гипотеза верна, если

Трасч < Ткр, (80)

где

· Ткр – критическое значение критерия Вилкоксона, которое при α = 0,05 равно 1,13.

2.1.2.4. Критерий Вилкоксона – Манна - Уитни (V - критерий)

Наиболее мощный непараметрический критерий, обычно применятся для сравнения выборок с n ≤ 20.

Для определения расчетной величины этого критерия необходимо:

1. Расположить данные двух сравниваемых выборок по мере возрастания их значений в два ряда таким образом, чтобы в каждом столбце находилось только одно значение случайной величины (порядок операций, как при определении критерия Вилкоксона).

2. Для каждого значения СВ определить число инверсий (число нарушения в порядке расположения данных двух выборок).

Таблица 14

Значение критерия Вилкоксона - Манна - Уитни при α = 0,05

n2 n1
                     
                       
                       
                       
                       
                       
                       
                       
                       
                       
                       
                       

Если перед каким-либо значением случайной величины из первого (второго) ряда оказывается Vi значений случайной величины из второго (первого) ряда, то число этих значений дает инверсию для рассматриваемого значения случайной величины первой (второй) выборки.

3. Определить сумму инверсий для каждой из выборок (сумма инверсий равна произведению объемов двух выборок).

4. Меньшую сумму инверсий (Vmin) сравнить с табличным значением критерия Вилкоксона – Манна - Уитни - Vтабл (табл. 14).

Нулевая гипотеза верна, если Vmin < Vтабл. (81)

2.1.2.5. Критерий Сиджела - Тьюки (Z - критерий)

Используется для проверки различия дисперсий двух выборок разного объема (n1 < n2).

Нулевая гипотеза Но: D1 = D2 верна, если выполняется следующее неравенство

, (82)

где

· n1, n2 – объем соответственно первой и второй выборок;

· R1 – сумма рангов для выборок меньшего объема (для выборки n1);

· Zкр – критическое значение критерия Сиджела - Тьюки: при α = 0,05; Zкр(0,05) = 1,282; при α = 0,1; Zкр(0,1) = 1,960.

2.2. Обработка результатов отсеивающих экспериментов

При проведении экспериментальных исследований возникают два противоречивых стремления:

1) упростить процесс исследований путем минимизации числа опытов, что даже в случае активного эксперимента возможно лишь при включении в рассмотрение минимального числа факторов;

2) получить в результате эксперимента наиболее полные сведения об исследуемом объекте, не упустив при этом из рассмотрения ни одного существенного фактора.

Устранить такое противоречие удается лишь путем проведения двухэтапных исследований. На первом этапе проводится отсеивающий эксперимент, в процессе которого по минимально возможному числу опытов выявляются факторы, действительно оказывающие на выходной параметр существенное влияние. На втором же этапе проводятся основные исследования, при которых берутся в рассмотрение только существенные факторы.

Существует целый ряд методов проведения отсеивающих экспериментов, речь о которых и пойдет ниже.

2.2.1. Дисперсионный анализ

Метод предложен в 20‑х годах нынешнего столетия английским математиком Р.Фишером.

Основная задача дисперсионного анализа - оценить влияние каждого из факторов и их комбинаций на выходной параметр, т.е. выделить из всего многообразия воздействующих на изучаемый процесс факторов лишь те, влияние которых наиболее существенно.

Суть дисперсионного анализа заключается в следующем:

Если на выходной параметр действуют взаимно независимые факторы х12, …хn, то общую дисперсию обходного параметра Dу можно представить в виде суммы дисперсий, обусловленных отдельными факторами и их комбинациями

Dy = Dx1 + Dx2 +Dx1x2 +…+Dxn.

Анализируя составляющие общей дисперсии, можно оценить вклад (влияние) каждого из исследуемых факторов на выходной параметр.

В том случае, когда надо оценить дисперсии отдельных факторов необходимо изменить их в опытах на нескольких уровнях, а для оценки так называемой остаточной дисперсии, характеризующей разброс величины выходного параметра, опыты необходимо многократно дублировать (не путать с повторными измерениями выходного параметра в опытах).

Отсюда следует, что дисперсионного анализа необходимо иметь экспериментальный материал достаточно большого объема. Кроме высокой трудоемкости предварительных исследований, дисперсионный анализ характеризуется и довольно трудоемкой и сложной вычислительной процедурой. Но и это еще не всё. Изучаемые факторы должны быть независимыми, а выходной параметр - иметь нормальное распределение.

По указанным выше причинам на этом рассмотрение дисперсионного анализа мы и закончим, поскольку с полной уверенностью можно говорить о том, что вы им в своей инженерной практике едва ли захотите воспользоваться.

Если желающие все же найдутся, то на этот случай я их адресую к наиболее популярному и полному изложению дисперсионного анализа, представленному в следующей книге: Хьютсон А. Дисперсионный анализ. - М.: Статистика, 1971. – 375 с.

2.2.2. Метод случайного баланса

Метод предложен в 1956 г. Саттерэвайтом. Метод случайного баланса используется для количественного выявления факторов, действительно оказывающих существенное влияние на выходной параметр, т.е. для выявления так называемых доминирующих факторов.

Применение метода случайного баланса предполагает, что при проведении отсеивающего эксперимента имеется возможность изменять входные параметры по определенному плану (активный эксперимент).

Для проведения отсеивающего эксперимента по методу случайного баланса обычно используют матрицу полного или дробного факторного эксперимента, выбрав из нее случайным образом определенное число опытов. В результате такого отбора полученная матрица отсеивающего эксперимента является случайно сбалансированной. Отсюда и название метода - метод случайного баланса.

Процедуру выбора доминирующих факторов в методе случайного баланса рассмотрим на конкретном примере.

Пример 5. По данным дробного факторного эксперимента, представляющего собой 1/16 реплики от полного факторного эксперимента типа 27, оценить влияние на механическую скорость бурения (y, м/с) следующих 7 факторов:

· нагрузки на долото, х1, т×с;

· частоты вращения ротора, х2, об/мин;

· интенсивности промывки (расходы бурового раствора), х4, с;

· показателя фильтрации бурового раствора, х5, см3/30 мин;

· диаметра насадки гидромониторного долота, х6, мм;

· плотности бурового раствора, х7, кг/м3;

Уровни факторов приведены в табл. 15, а матрица планирования и результаты опытов – в табл. 16.

Таблица 15

Уровни факторов

Уровень Значение факторов
х1 х2 х3 х4 х5 х6 х7
верхний (+1)              
нижний (-1)              

 

Таблица 16

Матрица планирования и результаты опытов

Номера опытов Уровни факторов у
х1 х2 х3 х4 х5 х6 х7
                 
  +1 -1 +1 -1 +1 -1 -1  
  +1 +1 +1 +1 +1 +1 +1  
  -1 -1 +1 +1 -1 -1 +1  
  -1 +1 +1 -1 -1 +1 -1  
  +1 -1 -1 -1 -1 +1 +1  

Продолжение таблицы 16

 

                 
  +1 +1 -1 +1 -1 -1 -1  
  -1 -1 -1 +1 +1 +1 -1  
  -1 +1 -1 -1 +1 -1 +1  

 

Для визуального выделения доминирующих факторов по результатам эксперимента строят диаграммы рассеяния, число которых равно числу факторов.

В качестве иллюстрации рассмотрим построение диаграммы рассеяния для фактора х1. Для этого определим среднее значение выходного параметра у в опытах, когда фактор х1 находился на нижнем (–1) и верхнем (+1) уровнях:

;

.

По полученным данным в масштабе построим диаграмму рассеяния для факторов х1.

Рис. 15. Диаграмма рассеяния

Аналогичным образом строится диаграмма рассеяния и для других факторов. Расстояние, обозначенное стрелками, характеризует различия между средними значениями выходного параметра на двух уровнях рассматриваемого фактора и показывает, насколько существенно он влияет на величину выходного параметра (чем больше расстояние, тем больше влияние). Сравнение расстояний на соответствующих диаграммах позволяет расположить исследуемые факторы в порядке снижения их влияния на механическую скорость бурения в следующий ряд: х3, х1, х5, х7, х2 и х6, х4. При этом факторы х2 (частоты вращения ротора), х6 (диаметр насадки) и х4 (условная вязкость бурового раствора) могут быть признаны как незначимые, т.е. не оказывающие на выходной параметр у существенного влияния. Матрицу планирования опытов, приведенную в табл. 16, можно использовать для проведения отсеивающего эксперимента и при меньшем числе входных факторов.

2.2.3. Метод отсеивания несущественных факторов

с помощью планов Плекетта - Бермана

При числе факторов бóльшем 8, использование случайных выборок из матриц полного или дробного факторного эксперимента, а следовательно, и применение метода случайного баланса в целом становиться нерациональным. Обусловлено это тем, что при числе входных факторов от 9 до 15 приходиться приводить, как минимум, 16 опытов, а при 16 и бóльшем числе факторов – уже 32 опыта.

Для снижения трудоемкости отсеивающих экспериментов, Плекеттом и Берманом были разработаны специальные насыщенные планы, матрица которых имеет размерность и×(и-1), где первый сомножитель – число опытов, а второй – число факторов, каждый из которых зменяяется на двух уровнях: верхнем (+1) и нижнем (-1).

В специальной литературе приводятся планы Плекетта - Бермана для определения влияния на выходной параметр от 7 до 71 фактора.

В бурении возможность одновременно изменять на двух уровнях значения более, чем 10 факторов маловероятно, поэтому в качестве примера использования планов Плекетта - Бермана для отсеивания несущественных факторов рассмотрим матрицу с размерностью 12×(12-1).

Пример 6. По результатам отсеивающего эксперимента, выполненного с использованием планов Плекетта - Бермана для n = 12, оценить существенность влияния на показатель фильтрации бурового раствора (у,см3/30 мин) концентрации (кг/м3) следующих компонентов:

· глинопорошка марки ПББ – (х1);

· барита – (х2);

· Ca(OH)2 – (х3);

· CaCl2 - (х4);

· окзила – (х5);

· КМЦ - 600 (х6);

· нефти – (х7);

· графита – (х8).

Факторы х9, х10 и х11 принять фиктивными. Уровни исследуемых факторов приведены в табл. 17, а матрица планирования и результаты опытов – в табл. 18.

Таблица 17

Уровни факторов

Уровень Значение фактора
х1 х2 х3 х4 х5 х6 х7 х8 х9 х10 х11
нижний (-1)           2,5 6, 2, - - -
верхний (+1)           7,5     - - -

 

Таблица 18

 

Матрица планирования и результаты опытов

№ п.п. Уровни факторов y
х1 х2 х3 х4 х5 х6 х7 х8 х9 х10 х11  
  +1 +1 -1 +1 +1 +1 -1 -1 -1 +1 -1  
  +1 -1 +1 +1 +1 -1 -1 -1 +1 -1 +1  
  -1 +1 +1 +1 -1 -1 -1 +1 -1 +1 +1  
  +1 +1 +1 -1 -1 -1 +1 -1 +1 +1 -1  
  +1 +1 -1 -1 -1 +1 -1 +1 +1 -1 +1  
  +1 -1 -1 -1 +1 -1 +1 +1 -1 +1 +1  
  -1 -1 -1 +1 -1 +1 +1 -1 +1 +1 +1  
  -1 -1 +1 -1 +1 +1 -1 +1 +1 +1 -1  
  -1 +1 -1 +1 +1 -1 +1 +1 +1 -1 -1  
  +1 -1 +1 +1 -1 +1 +1 +1 -1 -1 -1  
  -1 +1 +1 -1 +1 +1 +1 -1 -1 -1 -1  
  -1 -1 -1 -1 -1 -1 -1 -1 -1 -1 -1  
                           

 

Решение.

1. Найти оценки коэффициентов линейной модели при каждом из факторов по следующей формуле:

, (83)

где

xij - уровень j - го фактора в i - м опыте;

yi -значение выходного параметра в I - м опыте; N - число опытов.

;

;

;

;

;

;

;

;

;

;

.

 

2. Определить дисперсию воспроизводимости эксперимента с фиктивными факторами (наличие их для этой цели обязательно, в противном случае необходимо дублировать опыты).

, (84)

где

· - число степеней свободы;

· m = 12 - (12 - 1 - 3) - 1 = 12 - 8 - 1 = 3;

· (N -1) - общее число факторов в матрице;

· l - число фиктивных факторов;

· a li -оценка коэффициентов при фиктивных факторах.

.

3. Определить дисперсию оценок коэффициентов по формуле

; (85)

.

4. Определить существенность влияния исследуемых факторов на выходной параметр.

Фактор оказывает на выходной параметр существенное влияние, если выполняется следующее неравенство:

, (86)

где

· - табличное значение критерия Стъюдента для уровня значимости α и числа степеней свободы .

Примем α = 0,1, тогда по формуле (17) при m = 3 .

Отсюда следует вывод, что на показатель фильтрации исследуемого бурового раствора существенное влияние оказывают только 2 фактора:

х1 – концентрация глинопорошка;

х6 – концентрация КМЦ.

Влияние же остальных компонентов бурового раствора на показатель его фильтрации несущественно.

 

 

3. МЕТОДЫ ПЛАНИРОВАНИЯ ЭКСПЕРИМЕНТА

3.1. Методы планирования экспериментов для изучения

механизма явлений

При изучении механизма явлений целью экспериментальных исследований является получение зависимости выходного параметра от входных факторов , анализ которой позволяет оценить степень и характер влияния каждого из факторов на выходной параметр, т.е. установить механизм влияния. Основными методами планирования эксперимента, используемыми для изучения механизма явлений, являются следующие:

Ø полный факторный эксперимент (ПФЭ);

Ø дробный факторный эксперимент (ДФЭ);

Ø латинские, греко - латинские, гипергреко - латинские и комбинационные квадраты.

3.1.1. Полный факторный эксперимент

В теории планирования эксперимента связь называется функцией отклика (показывает, как откликается у на изменения хi). Функция отклика может быть представлена графически и аналитически.

Графическое представление функции отклика называется поверхностью отклика (наглядно только в трехмерном пространстве). Аналитическое представление (выражение) функции отклика называется математической моделью. Найти модель, значит найти вид функции отклика, записать ее уравнение. Всегда, когда предоставляется возможность, искать модель нужно среди полиномов. Полином – это многочлен, т.е. алгебраическое выражение, состоящее из одночленов, соединённых между собой математическими символами сложения или вычитания.

Простейшие полиномиальные модели для 2-х, 3-х и 4-х факторов, соответственно, можно представить в виде (87) - (89).

Уравнения (87) – (89) в математической статистике называются уравнениями регрессии, а константы в0, в1, в2,…, вi,…, вij, - rj – коэффициентами регрессии.

Эффект взаимодействия двух факторов х1х2 называется эффектом взаимодействия первого порядка, трех факторов х1х2х3 – второго порядка и т.д.:

(87 – 89)

Полное число всех возможных эффектов, включая в0, линейные эффекты и взаимодействия всех порядков, равно числу опытов полного факторного эксперимента.

Нетрудно определить, что для двух факторов число опытов полного факторного эксперимента равно 4, для трех факторов – 8, для четырех факторов – 16.

Перечисленное нами число факторов (от 2 до 4) обычно удовлетворяет нуждам большинства экспериментов.

Так, установлено, что в исследовательской практике в 87% случаев исследуется влияние двух факторов, в 10% - 3 – 4 и только в 3% - более четырех.

Итак, выбор нужной модели определен (запрограммирован) числом воздействующих на объект исследования факторов.

Теперь остается спланировать и провести эксперимент для оценки численных значений коэффициентов регрессии выбранной модели.

Однако, прежде чем приступить к планированию эксперимента, необходимо убедиться в том, что опыты воспроизводимы.

3.1.1.1. Проверка воспроизводимости опытов

В связи с субъективными и объективными ошибками при измерении факторов, параметров, опытов и невозможностью полного исключения влияния неучтенных факторов, повторное воспроизведение опытных данных не дает результатов, которые бы полностью совпадали.

Суммарная величина всех ошибок называется ошибкой опыта или ошибкой воспроизводимости. Эту ошибку необходимо оценить и по возможности свести к минимуму.

С этой целью каждый опыт повторяется в идентичных (максимально одинаковых) условиях несколько раз. Для экономии времени исследователи обычно ограничиваются двух – или трехкратным повторением каждого опыта или так называемым равномерным их дублированием.

Повторные опыты нельзя путать с повторными измерениями параметра в одном и том же опыте.

Проверку воспроизводимости по схеме с равномерным дублированием опытов проводят в следующей последовательности:

1. Результаты повторных опытов сводят в таблицу, пример которой приведён ниже (табл.19).

Таблица 19

Сводная таблица результатов повторных опытов

Номер серии опыта Результаты повторных опытов
  у11 у12   у1m
  y21 y22   y2m
... ... ... ... ... ... ...
i  
... ... ... ... ... ... ...
N  

 

2. Для каждой серии повторных опытов вычисляют среднее арифметическое значение выходного параметра и дисперсию (Di).

(90)

где

· yij – значение выходного параметра в j - м повторном опыте i-ой серии опытов;

· m – число повторных опытов;

· i = 1, 2, 3, …, n; j = 1, 2, 3, …, m.

3. Проводят проверку воспроизводимости опытов с помощью критерия Кохрена (разд. 2.1.1.3.). Для этого из всех дисперсий находят наибольшую Dmax, и делят её на сумму всех дисперсий (формула 75). Табличные значения критерия Кохрена (Gтабл) при α = 0,05 приведены в табл. 10. С Gтабл связаны следующие числа степеней свободы: m1 = N; где N – число серий опытов; m2 = m - 1; где m – число повторных опытов. Если неравенство (75) соблюдается, т.е. G < Gтабл, то опыты считаются воспроизводимыми.

4. Если опыты воспроизводимы, то определяют дисперсию воспроизводимости эксперимента (дисперсию, характеризующую ошибку эксперимента).

. (91)

Число степеней свободы этой дисперсии m2 = N(m - 1).

Найденное значение D(y) понадобится в дальнейшем при проверке адекватности полученной модели.

Если опыты не воспроизводимы, то нужно попытаться достичь воспроизводимости выявлением и устранением источников нестабильности эксперимента, а также использованием более точных методов и средств измерений.

Если никакими способами добиться воспроизводимости опытов не удается, то к такому эксперименту данный метод планирования неприменим.

3.1.1.2. Методика построения полного факторного

эксперимента типа 2k

1. Выбор границ области определения каждого входного фактора

Если изучать влияние широко используемых химических реагентов на свойства бурового раствора, то такой выбор может быть полностью формализованным, потому что в справочной литературе проводятся рекомендации по оптимальным добавкам тех или иных реагентов для определенных условий.

Например, оптимальные добавки КМЦ для пресных растворов составляют от 0,2 до 0,5% (на сухое вещество).

Таким образом, на основе априорной информации, т.е. информации, полученной до начала эксперимента, мы установили не только границы области определения данного фактора (0,2 - 0,5), но и выбрали два уровня – 0,2% и 0,5%, на которых данный фактор будет изменяться в эксперименте.

Один из этих уровней принято называть верхним, а - другой нижним. За верхний уровень принимается тот, который соответствует большему значению фактора.

Для упрощения, записи условий присвоения эксперимента и обработки экспериментальных данных верхний уровень обозначается как (+1) будет соответствовать концентрации КМЦ равной 0,5%, а(-1) – концентрации 0,2%.

Чаще всего выбор границ определения факторов требует эвристических (интуитивных, творческих) решений.

Однако во всех случаях и для любых объектов исследований выбору экспериментальной области факторного пространства должен предшествовать тщательный анализ априорной информации или предварительный эксперимент (критические опыты).

2. Выбор основного уровня и интервалов варьирования факторов

Основной (нулевой) уровень фактора равен среднему арифметическому его значений на верхнем и нижнем уровнях:

Интервал варьирования фактора равен среднему арифметическому разности его значений на верхнем и нижнем уровнях:

Другими словами, интервал варьирования фактора - это некоторое число, прибавление которого к основному уровню дает верхний уровень, а вычитание из основного – нижний уровень.

3. Выбор матрицы планирования опытов. Проведение опытов

Если число факторов и уровней каждого фактора равно двум, то имеем полный факторный эксперимент типа 22. Если число факторов равно трем, то – 23 и т.д. Все возможные комбинации для двух, трех и т.д. факторов, варьируемых на верхнем и нижнем уровнях, можно записать в виде таблицы, в которой строки соответствуют различным опытам, а столбцы – значениям факторов. Такие таблицы называются матрицами планирования эксперимента.

Таблица 20

Матрица планирования эксперимента типа 22

 

Номер опыта х1 х2 у
  -1 -1 у1
  +1 -1 у2
  -1 +1 у3
  +1 +1 у4

 

Каждый столбец в матрице планирования называют вектор - столбцом, а каждую строку – вектор – строкой. Первая строка в таблице А соответствует первому опыту, в котором оба фактора х1 и х2 находятся на нижнем уровне. Во втором опыте фактор х1 находится на верхнем уровне, х2 – на нижнем уровне и т.д.

Ниже приведены матрицы планирования экспериментов при трех и четырех факторах (табл. 21, 22).

Таблица 21

Матрица планирования ПФЭ типа 23

 

Номер опыта х1 х2 х3 у
  -1 -1 -1 у1
  +1 -1 -1 у2
  -1 +1 -1 у3
  +1 +1 -1 у4
  -1 -1 +1 у5
  +1 -1 +1 у6
  -1 +1 +1 у7
  +1 +1 +1 у8

 

Таблица 22

Матрица планирования ПФЭ типа 24

 

Номер опыта х1 х2 х3 х4 у
           
  +1 +1 +1 +1 у1
  -1 +1 +1 +1 у2
  +1 -1 +1 +1 у3
  -1 -1 +1 +1 у4
  +1 +1 -1 +1 у5

Продолжение таблицы 22

           
  -1 +1 -1 +1 у6
  +1 -1 -1 +1 у7
  -1 -1 -1 +1 у8
  +1 +1 +1 -1 у9
  -1 +1 +1 -1 у10
  +1 -1 +1 -1 у11
  -1 -1 +1 -1 у12
  +1 +1 -1 -1 у13
  -1 +1 -1 -1 у14
  +1 -1 -1 -1 у15
  -1 -1 -1 -1 у16

Правила построения матриц планирования полного факторного эксперимента типа 2k:

· число вектор - строк равно числу опытов N = 2k;

· число вектор - столбцов равно числу факторов;

· в каждом векторе столбце число плюсов (+1) равно числу минусов (-1);

· в первом векторе - столбце знаки чередуются через один (один плюс, один минус или наоборот), во втором – через два (два плюса, два минуса), далее – через 4, 8, 16 и т.д.

Матрицы планирования, независимо от числа факторов, обладают следующими свойствами:

1. Алгебраическая сумма элементов вектора - столбца каждого фактора равна нулю:

(92)

где

· j – номер фактора ;

· N – число опытов;

· i – номер опыта.

Это свойство называется свойством симметричности относительно центра (основного или нулевого уровня).

2. Сумма квадратов элементов каждого вектора - столбца равна числу опытов.

(93)

Условие (93) называют условием нормировки.

3. Сумма почленных произведений любых двух вектор - столбцов матрицы равна нулю:

(94)

где j ≠ u.

Это важное свойство называется ортогональностью матрицы. Ортогональность матрицы позволяет получать оценки коэффициентов регрессии, независимыми друг от друга, что дает возможность оценить влияние каждого фактора на выходной параметр и отбросить те факторы, коэффициенты при которых не значимы.

При планировании эксперимента с помощью таких матриц расчет коэффициентов любого из уравнений регрессии типа (87) – (89) превращается в простую арифметическую процедуру.

1. Расчет значений коэффициентов регрессии.

Процедуру расчета коэффициентов регрессии рассмотрим на примере типа 22. Для вычисления коэффициентов b0, b1, b2, b12 уравнения

составим расчетную матрицу, приведенную в (табл.23).

Таблица 23

Расчетная матрица эксперимента типа 22

 

Номер опыта х0 х1 х2 х1 · х2 у
  +1 -1 -1 +1 у1
  +1 +1 -1 -1 у2
  +1 -1 +1 -1 у3
  +1 +1 +1 +1 у4

 

В (табл.23) столбцы х1 и х2 задают планирование – по ним непосредственно определяют условия опытов, а столбцы х0 и х1 · х2 служат только для расчетов. Для расчета коэффициента b0 используется столбец х0 (фиктивная переменная), для расчета коэффициента b1 – столбец х1, b2 – столбец х2, b12 – столбец х х2.

Для любого числа факторов вычисление оценок коэффициентов регрессии ведется по следующим формулам:

(95)

(96)

j ¹ u.

Формула (95) используется для вычисления коэффициента b0 и коэффициентов линейных эффектов (b1,b2,…), а формула (96) – для вычисления коэффициентов взаимодействий всех порядков (b12,b23,b123,..,).

Воспользуемся формулами (95), (96) для расчета коэффициентов регрессии b0, b1, b2, b12 и получим:

Таким образом, вычисления сводятся к приписыванию столбцу у знаков соответствующего фактору столбца и алгебраическому сложению полученных значений. Деление результата на число опытов в матрице планирования дает искомый коэффициент. При числе факторов, равном 3 и 4, расчет коэффициентов регрессии выполняется аналогично описанному выше, но по своим расчетным матрицам, принцип составления которых рассмотрим на примере полного факторного эксперимента типа 23.

Таблица 24

Расчетная матрица эксперимента типа 23

№№ опыта х0 х1 х2 х3 х1 · х2 х1 · х3 х2 · х3 х1 · х2 · х3 у
  +1 -1 -1 -1 +1 +1 +1 -1 у1
  +1 +1 -1 -1 -1 -1 +1 +1 у2
  +1 -1 +1 -1 -1 +1 -1 +1 у3
  +1 +1 +1 -1 +1 -1 -1 -1 у4
  +1 -1 -1 +1 +1 -1 -1 +1 у5
  +1 +1 -1 +1 -1 +1 -1 -1 у6
  +1 -1 +1 +1 -1 -1 +1 -1 у7
  +1 +1 +1 +1 +1 +1 +1 +1 у8

 

3.1.1.3. Обработка результатов полного факторного эксперимента

1. Проверка адекватности модели. Первый вопрос, который нас интересует после вычисления коэффициентов регрессии или коэффициентов математической модели, это проверка ее пригодности. Такую проверку называют проверкой на адекватность.

Под адекватностью понимается способность математической модели предсказывать результаты эксперимента в некоторой области с требуемой точностью или, иными словами, способность полученного уравнения регрессии достаточно точно описывать объект исследования.

Гипотезу об адекватности модели проверяют с помощью F – критерия (критерия Фишера):

(97)

где

· - дисперсия воспроизводимости (формула 91) с числом степеней свободы m2 = N(m – 1);

· - табличное значение критерия Фишера при заданном уровне значимости α и числе степеней свободы m1 и m2;

· - дисперсия адекватности (остаточная дисперсия).

(98)

где

· уi – экспериментальное значение выходного параметра в i - м опыте;

· - значение выходного параметра в i - м опыте, рассчитанное по уравнению регрессии;

· m1 – число степеней свободы дисперсии адекватности.

где

· N – число опытов, результаты которых используются при подсчете коэффициентов регрессии;

· k* - число факторов и их взаимодействий, включенных в уравнение регрессии. Отсюда для полного факторного эксперимента

22 - m1 = 4 – 3 – 1 = 0;

23 - m1 = 8 – 7 – 1 = 0;

24 - m1 = 16 – 15 – 1 = 0.

Что делать в таком случае? На первом этапе для расчета из уравнений регрессии исключают все эффекты взаимодействия, т.е. приводят уравнения к линейному виду и проверяют адекватность линейных моделей:

(99)

(100)

. (101)

Определив дисперсию адекватности для линейных моделей, находят расчетное значение критерия Фишера и сравнивают его с табличным значением. Если неравенство (97) выполняется, то гипотеза об адекватности линейной модели принимается. Если же линейная модель оказалась неадекватной, то следует прибегнуть к одному из приемов:

· Включить в уравнения (100) и (101) для расчета эффекты взаимодействия, коэффициенты при которых имеют наибольшую абсолютную величину (можно включить все эффекты взаимодействия, кроме одного, так как в противном случае m1 = 0).

· Для того, чтобы m1 = 1 и можно было включать в уравнения (99) – (101) все эффекты взаимодействия выполняют дополнительный опыт в центре области эксперимента (на основном уровне), результаты которого используют только для проверки гипотезы об адекватности модели. Если ни одним из этих приёмов адекватность модели не достигнута, то нужно построить новый план эксперимента, уменьшив интервалы варьирования факторов.


1 | 2 | 3 |

Поиск по сайту:



Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав. Студалл.Орг (0.098 сек.)