|
||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
АвтоАвтоматизацияАрхитектураАстрономияАудитБиологияБухгалтерияВоенное делоГенетикаГеографияГеологияГосударствоДомДругоеЖурналистика и СМИИзобретательствоИностранные языкиИнформатикаИскусствоИсторияКомпьютерыКулинарияКультураЛексикологияЛитератураЛогикаМаркетингМатематикаМашиностроениеМедицинаМенеджментМеталлы и СваркаМеханикаМузыкаНаселениеОбразованиеОхрана безопасности жизниОхрана ТрудаПедагогикаПолитикаПравоПриборостроениеПрограммированиеПроизводствоПромышленностьПсихологияРадиоРегилияСвязьСоциологияСпортСтандартизацияСтроительствоТехнологииТорговляТуризмФизикаФизиологияФилософияФинансыХимияХозяйствоЦеннообразованиеЧерчениеЭкологияЭконометрикаЭкономикаЭлектроникаЮриспунденкция |
Определение коэффициентов уравнения регрессии
Определение коэффициентов уравнения регрессии производят методом наименьших квадратов (МНК) с помощью ЭВМ. Исходными данными являются: § массив экспериментальных данных Xij, Yij, где i=1…N – номер опыта, j=1…n – номер повторного измерения в i-том опыте; § вид модели. Массив должен быть предварительно очищен от промахов. МНК дает возможность рассчитать коэффициенты a0 … an линейной зависимости
Y=a0+a1x1+a2x2+ …. +akxk
Если искомая зависимость не является линейной, ее нужно привести к линейной заменой переменных. Например, зависимость
Y=a0+ a1x + a2ln(x)
Приводится к виду: Y=a0 + a1x1 + a2x2 заменой переменных: x1=x, x2=ln(x) Поиск аппроксимирующей зависимости по МНК производится по принципу минимизации суммы квадратов отклонений экспериментальных значений от расчетных: N – число опытов;
yi – центр распределения в i – том опыте; f(xi) – расчетное значение отклика по аппроксимирующей функции.
Условия применения МНК [5]
1. МНК надежно дает правильные результаты только в том случае, если поле рассеяния результатов измерения вытянуто вдоль аппроксимирующей кривой. Практический критерий достаточной близости экспериментальных точек к аппроксимирующей кривой: Коэффициентом множественной корреляции называют коэффициент корреляции между экспериментальными значениями yi и полученными по модели y=f(x) при различных значениях x. Коэффициент множественной корреляции (КМК) характеризует степень разброса экспериментальных данных от аппроксимирующей кривой y=f(x). Чем больше значение коэффициента множественной корреляции, тем, следовательно, лучше соответствует аппроксимирующая кривая экспериментальным данным. Для вычисления КМК нужно отобразить экспериментальные данные и аппроксимирующую кривую в пространство с осями Y-Y^, где Y^ - значения, вычисляемые по аппроксимирующей функции, т.е. F(X). Аппроксимирующая кривая всегда отобразится в прямую, проходящую под углом 45 градусов. Поле экспериментальных точек, вытянутое вдоль аппроксимирующей кривой y=f(x), отобразится в поле точек, вытянутое вдоль прямой y=y^ (рис.15Б). Исходные данные для графика рис..15 приведены в табл. 5. А Б Рис. 15
На рис. 16а-в отображены случаи различной степени корреляционной связи для линейной аппроксимирующей функции, когда коэффициент корреляции равен 1, находится в интервале от 0 до 1, равен 0 соответственно.
Рис. 16 Если экспериментальные данные не соответствуют этому практическому критерию, то применение МНК может приводить к неправильным результатам. В такой ситуации вместо МНК для нахождения численных значений
Табл. 5. Таблица для построения кривых рис. 15 коэффициентов уравнения регрессии должны использоваться другие методы - например, метод главных компонент и, как его частный случай, метод ортогональной регрессии [5]. 2.Второе важное условие надежности результатов, полученных с помощью МНК, - обусловленность (устойчивость) полученного решения. Поскольку МНК применяется по отношению к данным, содержащим случайные ошибки, то естественно, что коэффициенты уравнения регрессии, определенные с помощью МНК, также содержат случайные ошибки. Уверенность в том, что эти случайные ошибки не слишком велики, дает повторный расчет коэффициентов уравнения регрессии по МНК при удалении одного, наиболее удаленного от центра поля экспериментальных точек результата наблюдения. Если коэффициенты уравнения регрессии изменяются при этом незначительно - считается, что решение, полученное с помощью МНК обусловлено (устойчиво). На рис. 17 в графической форме представлены результаты 18-ти измерений (6 опытов, по 3 повторных измерения в каждом).
Рис. 17 В результате использования МНК будут получены значения коэффициентов уравнения регрессии, которое определит кривую, близкую к показанной в центре, проходящей через точку 2. Очевидно, что если из выборки удалить точку 1 или 3, то вид аппроксимирующей кривой резко изменится. Поэтому полученное с помощью МНК решение нельзя считать обусловленным (устойчивым).
3. МНК наиболее эффективен в том случае, если закон распределения случайной погрешности измерений - нормальный. Эффективность использования МНК снижается (т.е. дисперсия экспериментальных данных относительно аппроксимирующей кривой увеличивается), если закон распределения ошибки отличается от нормального. В частности, МНК неэффективен для закона распределения Коши, внешне похожего на нормальный.Однако нельзя утверждать, что МНК применим только в том случае, если закон распределения погрешности - нормальный. Эффективность МНК достаточно высока для широкого класса распределений, для которых значение контрэксцесса находится в пределах от 0,5 до 0,7 (для нормального закона распределения значение контрэксцесса равно 0,577, для большинства часто встречающихся распределений значение контрэксцесса находится в пределах от 0 до 0,8 (см. табл. 5)). Табл. 6
Конрэксцесс является одной из числовых характеристик закона распределения - центральным моментом четвертого порядка. Центральным моментом порядка S называется МО S-й степени центрированной случайной величины В частности МО, для центрированной случайной величины МО=0 дисперсия характеризует асимметрию (скошенность) распределения характеризует протяженность распределения Относительное значение четвертого момента называют эксцессом. Число 3 в этой формуле вычитается потому, чтобы для нормального распределения эксцесс был равен нулю. При этом менеепротяженные, чем нормальный, распределения будут иметь положительный эксцесс, а более протяженные - отрицательный. В качестве характеристики протяженности часто вместо эксцесса используют контрэксцесс Величина контрэксцесса для любых распределений изменяется от 0 до 1. Контрэксцесс равен 0 для распределения Коши. Определение вида закона распределения может производиться различными способами [5]. Наиболее часто используют построение по экспериментальным данным гистограммы или полигона распределения (рис.18) и последующее определение вида закона распределения с использованием математического аппарата проверки статистических гипотез о законах распределения, например, критерия согласия хи-квадрат [7,8]. Для построения гистограммы или полигона исходные данные должны быть сгруппированы в m столбцов шириной d. Количество столбцов нужно взять с учетом объема выборки (количества измерений) и формы закона распределения. При слишком большом числе столбцов гистограмма оказывается изрезанной глубокими провалами (рис.18а), что затрудняет проведение аппроксимации аналитической функцией. Эта изрезанность сглаживается при уменьшении количества и, соответственно, увеличении ширины столбцов (рис.18б). Однако слишком малое количество столбцов также недопустимо, так как чрезмерное сглаживание формы распределения не позволит правильно его описать. Оптимальное количество столбцов может быть определено формулой [5]: Округлять полученное по этой формуле значение m следует в сторону ближайшего нечетного числа, располагая центральный столбец гистограммы симметрично относительно найденного центра распределения. При необходимости выбора m до оценки значения эксцесса можно считать, что значение эксцесса равно 0,6. (Для большинства законов распределения значение эксцесса не выходит за пределы интервала 0,4 …0,75). Это приводит к простой практической формуле Совсем простое практическое правило - брать количество столбцов в пределах от 7 до 21. При компьютерной обработке данных в среде LabWindows/CVI для расчета центральных моментов и построения гистограммы предназначены функции Moment и Histogram класса Statistics библиотеки Advanced Analysis Library. В качестве альтернативного метода определения коэффициентов уравнения регрессии может успешно использоваться метод наименьших модулей, когда значение контрэксцесса находится в пределах от 0 до 0,51.
4. МНК применим не только для линейных аппроксимирующих функций. В общем случае можно использовать аппроксимирующую функцию вида где
Рис. 18
Базисные функции должны удовлетворять условию линейной независимости. Этому условию удовлетворяют, например, степенные функции: С точки зрения минимизации погрешности вычислений по МНК при расчете коэффициентов аппроксимирующей функции в качестве базисных функций используют ортогональные полиномы Чебышева, Лежандра, Лагерра, Якоби. Для упрощения процедуры вычислений по МНК в качестве базисных функций используют полиномы Хана, Мейкснера, Кравчука, Шарлье. Примечание.Применение МНК возможно также в качестве критерия, методом же нахождения коэффициентов аппроксимирующей функции может быть оптимизация. В этом случае ограничения на вид аппроксимирующей функции снимаются. Наиболее часто используется аппроксимация полиномиальная, экспоненциальная, произвольная нелинейная.
Поиск по сайту: |
Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав. Студалл.Орг (0.007 сек.) |