|
||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
АвтоАвтоматизацияАрхитектураАстрономияАудитБиологияБухгалтерияВоенное делоГенетикаГеографияГеологияГосударствоДомДругоеЖурналистика и СМИИзобретательствоИностранные языкиИнформатикаИскусствоИсторияКомпьютерыКулинарияКультураЛексикологияЛитератураЛогикаМаркетингМатематикаМашиностроениеМедицинаМенеджментМеталлы и СваркаМеханикаМузыкаНаселениеОбразованиеОхрана безопасности жизниОхрана ТрудаПедагогикаПолитикаПравоПриборостроениеПрограммированиеПроизводствоПромышленностьПсихологияРадиоРегилияСвязьСоциологияСпортСтандартизацияСтроительствоТехнологииТорговляТуризмФизикаФизиологияФилософияФинансыХимияХозяйствоЦеннообразованиеЧерчениеЭкологияЭконометрикаЭкономикаЭлектроникаЮриспунденкция |
Розділ 16.2. Метод найменших квадратів (загальні поняття)Будь-які випадкові величини можуть бути пов’язані функціональною залежністю, що буває досить рідко, або залежністю іншого роду, яку називають статистичною, або будуть незалежними. Означення: Статистичною називається залежність, при якій зміна однієї з величин веде до зміни розподілу іншої. Якщо зміна однієї з величин веде до зміни середнього значення іншої, тоді статистична залежність називається кореляційною. При вивченні закономірностей в деяких дослідженнях інженерної справи, економіки, біології, медицини і т.п. приходиться аналітично описувати (у вигляді формули) зв'язок між двома змінними x та y. Для цього в процесі експериментів та спостережень вимірюють з можливою точністю окремі значення xi і відповідні їм значення yi (i=1,2,…,n), або отримують такі значення як статистичні дані. В результаті маємо таблицю значень.
Побудуємо у вибраній системі координат XOY точки Mi(xi, yi), координати яких відповідають даним таблиці. Тепер виникає необхідність вибору відповідної функції y=f(x), яка б описувала зв'язок між x і y. Таку функцію називають емпіричною. В загальному випадку вибір емпіричної функції не є однозначним. Можна знайти лінію, яка б проходила через кожну з точок Mi, це може бути так званий інтерполяційний багаточлен (на рис. 1 це пунктирна лінія), порядок якого буде досить високим (на одиницю меншим, ніж кількість точок в таблиці). Крім того, дані таблиці можуть бути не досить точними внаслідок наявності похибок вимірювання, а також впливу інших факторів, які ми не завжди можемо врахувати. Тому дослідники віддають перевагу більш простим і зручнішим функціям, таким, як лінійна , квадратична , показникові , гіперболічна і ін. Обрана функція повинна "найкращим" чином згладжувати експериментальні дані. В залежності від того, як вводиться поняття "найкраще згладжування" встановлюється той або інший метод вибору емпіричної залежності (на рис. 1 – суцільна лінія). Найбільш часто застосовується так званий метод найменших квадратів, який дозволяє знаходити параметри обраної залежності Позначимо через відхилення емпіричної функції в точці від відповідного табличного (експериментального) значення . Зрозуміло (див. рис. 1), що можуть бути для одних додатніми, а для інших від'ємними. Тому їх сума може навіть дорівнювати нулю. Краще було б брати суму їх абсолютних величин але досліджувати суму, яка містить модулі величин складніше, ніж суму квадратів цих величин. Тому зупиняються на останньому
, (16.1)
де - теоретичне значення функції; - статистичне значення функції. Параметри функції обирають так, щоб сума квадратів S приймала найменше значення.
Розділ 16.3. Побудова рівняння лінійної функції Розглянемо випадок, коли є лінійною функцією з невідомими параметрами a i b. Тоді величина відхилення , а сума їх квадратів . (16.2) є функцією двох змінних a i b (xi, yi – числа з таблиці). За необхідною умовою існування екстремуму, функція S (a,b) приймає мінімальне значення при тих значеннях a i b, при яких частинні похідні по цих змінних дорівнюють нулю, тобто коли
Із формули (16.2) знаходимо
Прирівнюючи до нуля частинні похідні, отримуємо систему рівнянь
(16.3)
Система (16.3) називається нормальною системою методу найменших квадратів. Розв'язуючи систему рівнянь (16.3), знаходять числа a i b, які підставляють у рівняння що і дає формулу шуканої залежності. Метод найменших квадратів був запропонований німецьким математиком К. Гауссом.
Приклад: Статистичні дані чистого прибутку П підприємства і обсягів виробленої продукції наведено у вигляді таблиці.
Припускаючи, що між змінними і П існує лінійна залежність, знайти емпіричну формулу за методом найменших квадратів.
Рішення
Складемо розрахункову таблицю.
За формулою (16.3) знайдемо коефіцієнти рівняння прямої лінії регресії
За формулами Крамера знайдемо розв’язок системи
Таким чином, рівняння прямої лінії регресії набуде вигляду
За допомогою знайденого рівняння заповнимо два останні стовпці таблиці. Як видно із значення суми, рівняння знайдено правильно. На рисунку 2 представлено кореляційне поле, побудоване за статистичними даними, та рівняння прямої, побудоване за допомогою знайденого рівняння прямої лінії регресії. Рис.2 Поиск по сайту: |
Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав. Студалл.Орг (0.006 сек.) |