АвтоАвтоматизацияАрхитектураАстрономияАудитБиологияБухгалтерияВоенное делоГенетикаГеографияГеологияГосударствоДомДругоеЖурналистика и СМИИзобретательствоИностранные языкиИнформатикаИскусствоИсторияКомпьютерыКулинарияКультураЛексикологияЛитератураЛогикаМаркетингМатематикаМашиностроениеМедицинаМенеджментМеталлы и СваркаМеханикаМузыкаНаселениеОбразованиеОхрана безопасности жизниОхрана ТрудаПедагогикаПолитикаПравоПриборостроениеПрограммированиеПроизводствоПромышленностьПсихологияРадиоРегилияСвязьСоциологияСпортСтандартизацияСтроительствоТехнологииТорговляТуризмФизикаФизиологияФилософияФинансыХимияХозяйствоЦеннообразованиеЧерчениеЭкологияЭконометрикаЭкономикаЭлектроникаЮриспунденкция
|
Основні поняття і методи регресійного аналізу
Якщо кореляційний аналіз досліджує наявність і характер зв’язку між випадковими величинами і , то регресійний аналіз встановлює аналітичну форму цієї залежності.
Нехай — незалежна змінна (факторна ознака), а — залежна змінна (результативна ознака) і припустимо, що:
· розподіл результативної ознаки генеральної сукупності — нормальний;
· дисперсія результативної ознаки не залежить від факторної ознаки
· між результативною та факторною ознаками існує лінійний зв’язок.
Ці обмеження приводять до дослідження найпростішої регресійної моделі — лінійної регресії, коли вибіркове рівняння регресії має вигляд:
(5.14)
В цьому випадку точкові оцінки параметрів і справджують основні вимоги до точкових оцінок, які описані в підрозділі 2.2, а тому для них можна побудувати довірчі інтервали та оцінити їх значущість.
Основним методом отримання точкових оцінок для параметрів і рівняння регресії (5.14) є метод найменших квадратів.
Нехай задана вибірка обсягу з діаграмою розсіяння, як на рис.5.1. Ідея методу найменших квадратів полягає в тому, що за точкові оцінки і параметрів і вибирають такі числа, для яких пряма є «найближчою» до точок . За міру відхилення шуканої прямої від точок виберемо величину:
(5.15)
За точкові оцінки і параметрів і рівнянні регресії (5.14) виберемо такі числа, для яких функція з (5.15) набуває мінімального значення. Метод знаходження таких оцінок параметрів і , які мінімізують функцію , називають методом найменших квадратів.
Для знаходження точкових оцінок і невідомих параметрів і запишемо систему рівнянь:
(5.16)
яку елементарними перетвореннями зведемо до вигляду:
(5.17)
Оскільки визначник лінійної відносно невідомих і системи рівнянь (5.17)
то система (5.17) має єдиний розв’язок:
(5.18)
де
Підставивши значення і з (5.18) в рівняння (5.14), отримаємо шукане рівняння лінійної регресії:
Коефіцієнт називається коефіцієнтом регресії.
Зауважимо, що лінійне рівняння регресії можна подати також через точкову оцінку коефіцієнта кореляції, а саме:
(5.19)
Зауваження. У разі, коли припущення про лінійність зв’язку між ознаками та не справджується, то будують нелінійні регресійні моделі.Ці моделі виражаються, наприклад, рівняннями:
Точкові оцінки параметрів у цих нелінійних моделях також можна знайти методом найменших квадратів.
Приклад 5.3. Залежність між обсягом (тис.грн.) товару, який перевозиться через митний пост за кордон, і відсотком (%) не задекларованої частини цього обсягу характеризується вибіркою:
Визначити:
а) емпіричний закон розподілу системи випадкових величин та ;
б) точкові оцінки чисельних характеристик випадкових величин та ;
в) вибірковий коефіцієнт кореляції;
г) при рівні значущості перевірити гіпотезу про статистичну значимість коефіцієнта кореляції
Розв’язання.
а) Знайдемо емпіричний закон розподілу системи випадкових величин у вигляді таблиці:
б) за формулами (5.3)-(5.6) знайдемо точкові оцінки чисельних характеристик випадкових величин та . Маємо:
в) вибірковий коефіцієнт кореляції обчислимо за формулою (5.9):
г) перевіряємо гіпотезу про статистичну значимість коефіцієнта кореляції. За формулою (5.12) обчислюємо .
Для заданого рівня значущості і числа ступенів вільності за таблицею додатка 4 знаходимо, що . Оскільки , то нульова гіпотеза про некорельованість випадкових величин відхиляється.
Додатки
Додаток 1
Значення функції
X
|
|
|
|
|
|
|
|
|
|
| 0,0
0,1
0,2
0,3
0,4
0,5
0,6
0,7
0,8
0,9
1,0
1,1
1,2
1,3
1,4
1,5
1,6
1,7
1,8
1,9
2,0
2,1
2,2
2,3
2,4
2,5
2,6
2,7
2,8
2,9
3,0
3,1
3,2
3,3
3,4
3,5
3,6
3,7
3,8
3,9
|
|
|
|
|
|
|
|
|
|
|
Додаток 2
Значення функції Лапласа .
x
|
|
|
|
|
|
|
|
|
|
| 0,0
0,1
0,2
0,3
0,4
0,5
0,6
0,7
0,8
0,9
1,0
1,1
1,2
1,3
1,4
1,5
1,6
1,7
1,8
1,9
2,0
2,1
2,2
2,3
2,4
2,5
2,6
2,7
2,8
2,9
3,0
3,5
4,0
| 0,00000
0,49865
|
|
3,1
3,6
|
|
3,2
3,7
|
|
3,3
3,8
|
|
3,4
3,9
|
|
Додаток 3
Значення розподілу Пуассона
l
m
| 0,1
| 0,2
| 0,3
| 0,4
| 0,5
| 0,6
|
| 0,904837
0,904084
0,004524
0,000151
0,000004
| 0,818731
0,163746
0,016375
0,001091
0,000055
0,000002
| 0,740818
0,222245
0,033337
0,003334
0,000250
0,000015
0,000001
| 0,670320
0,268128
0,053626
0,007150
0,000715
0,000057
0,000004
| 0,606531
0,303265
0,075816
0,012636
0,001580
0,000158
0,000013
0,000001
| 0,548812
0,329287
0,098786
0,019757
0,002964
0,000356
0,000035
0,000003
| l m
| 0,7
| 0,8
| 0,9
| 1,0
| 2,0
| 3,0
|
| 0,496585
0,347610
0,121663
0,028388
0,004968
0,000695
0,000081
0,000008
| 0,449329
0,359463
0,143785
0,038343
0,007669
0,001227
0,000164
0,000019
0,000002
| 0,406570
0,365913
0,164661
0,049398
0,011115
0,002001
0,000300
0,000039
0,000004
| 0,367879
0,367879
0,183940
0,061313
0,015328
0,003066
0,000511
0,000073
0,000009
0,000001
| 0,135335
0,270671
0,270671
0,180447
0,090224
0,036089
0,012030
0,003437
0,000859
0,000191
0,000038
0,000007
0,000001
| 0,049787
0,149631
0,224042
0,224042
0,168031
0,100819
0,050409
0,021604
0,008101
0,002701
0,000810
0,000221
0,000055
0,000013
0,000002
0,000001
|
Додаток 4
Значення для t -розподілу Стьюдента.
визначається рівністю , .
g
n
| 0,95
| 0,99
| 0,999
| g
n
| 0,95
| 0,99
| 0,999
|
| 2,78
2,57
2,45
2,37
2,31
2,26
2,23
2,20
2,18
2,16
2,15
2,13
2,12
2,11
2,10
| 4,60
4,03
3,71
3,50
3,36
3,25
3,17
3,11
3,06
3,01
2,98
2,95
2,92
2,90
2,88
| 8,61
6,86
5,96
5,41
5,04
4,78
4,59
4,44
4,32
4,22
4,14
4,07
4,02
3,97
3,92
|
∞
| 2,093
2,086
2,064
2,045
2,032
2,023
2,016
2,009
2,001
1,996
1,991
1,987
1,984
1,980
1,960
| 2,861
2,845
2,797
2,756
2,729
2,708
2,692
2,679
2,662
2,649
2,640
2,633
2,627
2,617
2,576
| 3,883
3,849
3,745
3,659
3,600
3,558
3,527
3,502
3,464
3,439
3,418
3,403
3,392
3,374
3,291
|
Додаток 5
Значення для розподілу Пірсона
Ймовірність ()
Число ступенів вільності k
|
| 0,99
| 0,98
| 0,95
| 0,90
| 0,80
| 0,70
| 0,50
| 0,30
| 0,20
| 0,10
| 0,05
| 0,02
| 0,01
| 0,005
| 0,002
| 0,001
|
| 0,00016
0,020
0,115
0,30
0,55
0,187
1,24
1,65
2,09
2,56
3,1
3,6
4,1
4,7
5,2
5,8
6,4
7,0
7,6
8,3
8,9
9,5
10,2
10,9
11,5
12,2
12,9
13,6
14,3
15,0
| 0,0006
0,040
0,185
0,43
0,75
1,13
1,56
2,03
2,53
3,06
3,6
4,2
4,8
5,4
6,0
6,6
7,3
7,9
8,6
9,2
9,9
10,6
11,3
12,0
12,7
13,4
14,1
14,8
15,6
16,3
| 0,0039
0,103
0,352
0,71
1,14
1,63
2,17
2,73
3,32
3,94
4,6
5,2
5,9
6,6
7,3
8,0
8,7
9,4
10,1
10,9
11,6
12,3
13,1
13,8
14,6
15,4
16,2
16,9
17,7
18,5
| 0,016
0,211
0,584
1,06
1,61
2,20
2,83
3,49
4,17
4,86
5,6
6,3
7,0
7,8
8,5
9,3
10,1
10,9
11,7
12,4
13,2
14,0
14,8
15,7
16,5
17,3
18,1
18,9
19,8
20,6
| 0,064
0,446
1,005
1,65
2,34
3,07
3,82
4,59
5,38
6,18
7,0
7,8
8,6
9,5
10,3
11,2
12,0
12,9
13,7
14,6
15,4
16,3
17,2
18,1
18,9
19,8
20,7
21,6
22,5
23,4
| 0,148
0,713
1,424
2,19
3,00
3,83
4,67
5,53
6,39
7,27
8,1
9,0
9,9
10,8
11,7
12,6
13,5
14,4
18,3
19,3
20,3
21,3
22,3
23,3
24,3
25,3
26,3
27,3
28,3
29,3
| 0,455
1,386
2,366
3,36
4,35
5,35
6,34
7,34
8,35
9,34
10,3
11,3
12,3
13,3
14,3
15,3
16,3
17,3
21,7
22,8
23,9
24,9
26,0
27,1
28,1
29,3
30,3
31,4
32,5
33,5
| 1,07
2,41
3,66
4,9
6,1
7,2
8,4
9,5
10,7
11,8
12,9
14,0
15,1
16,2
17,3
18,4
19,5
20,6
23,9
25,0
26,2
27,3
28,4
29,6
30,7
31,8
32,9
34,0
35,1
36,3
| 1,64
3,22
4,64
6,0
7,3
8,6
9,8
11,0
12,2
13,4
14,6
15,8
17,0
18,2
19,3
20,5
21,6
22,8
27,2
28,4
29,6
30,8
32,0
33,2
34,4
35,6
36,7
37,9
39,1
40,3
| 2,7
4,6
6,3
7,8
9,2
10,6
12,0
13,4
14,7
16,0
17,3
18,5
19,8
21,1
22,3
23,5
24,8
26,0
30,1
31,4
32,7
33,9
35,2
36,4
37,7
38,9
40,1
41,3
42,6
43,8
| 3,8
6,0
7,8
9,5
11,1
12,6
14,1
15,5
16,9
18,3
19,7
21,0
22,4
23,7
25,0
26,3
27,6
28,9
33,7
35,0
36,3
37,7
39,0
40,3
41,6
42,9
44,1
45,4
46,7
48,0
| 5,4
7,8
9,8
11,7
13,4
15,0
16,6
18,2
19,7
21,2
22,6
24,1
25,5
26,9
28,3
29,6
31,0
32,3
36,2
37,6
38,9
40,3
41,6
43,0
44,3
45,6
47,0
48,3
49,6
50,9
| 6,6
9,2
11,3
13,3
15,1
16,8
18,5
20,1
21,7
23,2
24,7
26,2
27,7
29,1
30,6
32,0
33,4
34,8
36,2
37,6
38,9
40,3
41,6
43,0
44,3
45,6
47,0
48,3
49,6
50,9
| 7,9
11,6
12,8
14, 9
16,3
18,6
20,3
21,9
23,6
25,2
26,8
28,3
29,8
31,0
32,5
34,0
35,5
37,0
38,5
40,0
41,5
42,5
44,0
45,5
47,0
48,0
49,5
51,0
52,5
54,0
| 9,5
12,4
14,8
16,9
18,9
20,7
22,6
24,3
26,1
27,7
29,4
31,0
32,5
34,0
35,5
37,0
38,5
40,0
41,5
43,0
44,5
46,0
47,5
48,5
50,0
51,5
53,0
54,5
56,0
57,5
| 10,83
13,8
16,3
18,5
20,5
22,5
24,4
21,6
27,9
29,6
31,3
32,9
34,5
36,1
37,7
39,2
40,8
42,3
43,8
45,3
46,8
48,3
49,7
51,2
52,6
54,1
55,5
56,9
58,3
59,7
|
Додаток 6
Критичні точки розподілення F Фішера-Снедекора
(k1 — число степенів свободи великої дисперсії,
k2 — число степенів свободи малої дисперсії)
Рівень значимості a=0,01
|
| k1
|
|
|
|
|
|
|
|
|
|
|
|
| k2
|
|
|
|
|
|
|
|
|
|
|
|
|
|
| 98,49
| 99,01
| 90,17
| 99,25
| 99,33
| 99,30
| 99,34
| 99,36
| 99,36
| 99,40
| 99,41
| 99,42
|
| 34,12
| 30,81
| 29,46
| 28,71
| 28,24
| 27,91
| 27,63
| 27,49
| 27,34
| 27,23
| 27,13
| 27,05
|
| 21,20
| 18,00
| 16,69
| 15,98
| 15,52
| 15,21
| 14,98
| 14,80
| 14,66
| 14,54
| 14,45
| 14,37
|
| 16,26
| 13,27
| 12,06
| 11,39
| 10,97
| 10,67
| 10,45
| 10,27
| 10,15
| 10,05
| 9,96
| 9,89
|
| 13,74
| 10.92
| 9,78
| 9,15
| 8,75
| 8,47
| 8,26
| 8,10
| 7,98
| 7,87
| 7,79
| 7,72
|
| 12,25
| 9,55
| 8,45
| 7,85
| 7,46
| 7,19
| 7,00
| 6,84
| 6,71
| 6,62
| 6,54
| 6,47
|
| 11,26
| 8,65
| 7,59
| 7,01
| 6,63
| 6,37
| 6,19
| 6,03
| 5,91
| 5,82
| 5,74
| 5,67
|
| 10,56
| 8,02
| 6,99
| 6,42
| 6,06
| 5,80
| 5,62
| 5,47
| 5,35
| 5,26
| 5,18
| 5,11
|
| 10,04
| 7,56
| 6,55
| 5,99
| 5,64
| 5,39
| 5,21
| 5,06
| 4,95
| 4,85
| 4,78
| 4.71
|
| 9,86
| 7,20
| 6,22
| 5,67
| 5,32
| 5,07
| 4,88
| 4,74
| 4,63
| 4,54
| 4,46
| 4,40
|
| 9,33
| 6,93
| 5,95
| 5,41
| 5,06
| 4,82
| 4,65
| 4,50
| 4,39
| 4,30
| 4,22
| 4,16
|
| 9,07
| 6,70
| 5,74
| 5,20
| 4,86
| 4,62
| 4,44
| 4,30
| 4,19
| 4,10
| 4,02
| 3,96
|
| 8,86
| 6,51
| 5,56
| 5,03
| 4,69
| 4,46
| 4,28
| 4,14
| 4,03
| 3,94
| 3,86
| 3,80
|
| 8,68
| 6,36
| 5,42
| 4,89
| 4,56
| 4,32
| 4,14
| 4,00
| 3,89
| 3,80
| 3,73
| 3,67
|
| 8,53
| 6,23
| 5,29
| 4,77
| 4.44
| 4,20
| 4,03
| 3,89
| 3,78
| 3,69
| 3,61
| 3,55
|
| 8,40
| 6,11
| 5,18
| 4,67
| 4,34
| 4,10
| 3,93
| 3,79
| 3,68
| 3,59
| 3,52
| 3,45
| Рівень значимості a=0,05
|
| k1
|
|
|
|
|
|
|
|
|
|
|
|
| k2
|
|
|
|
|
|
|
|
|
|
|
|
|
|
| 18,51
| 19,00
| 19,16
| 19,25
| 19,30
| 19.33
| 19,36
| 19,37
| 19,38
| 19,39
| 19,40
| 19,41
|
| 10,13
| 9,55
| 9,28
| 9,12
| 9,01
| 8,94
| 8,88
| 8.84
| 8,81
| 8,78
| 8,76,
| 8,74
|
| 7,71
| 6,94
| 6,59
| 6,39
| 6,26
| 6,16
| 6,09
| 6,04
| 6,00
| 5,96
| 5,93
| 5,91
|
| 6,61
| 5,79
| 5,41
| 5,19
| 5,05
| 4.95
| 4,88
| 4,82
| 4,78
| 4.74
| 4,70
| 4.68
|
| 5,99
| 5,14
| 4,76
| 4,53
| 4,39
| 4,28
| 4,2)
| 4,15
| 4,10
| 4,06
| 4,03
| 4,00
|
| 5,59
| 4.74
| 4,35
| 4,12
| 3,97
| 3,87
| 3,79
| 3,73
| 3,68
| 3,63
| 3,60
| 3,57
|
| 5,32
| 4,46
| 4,07
| 3,84
| 3,69
| 3,58
| 3,50.
| 3,44
| 3,39
| 3,34
| 3,31
| 3,28
|
| 5,12
| 4,26
| 3,86
| 3,63
| 3,48
| 3,37
| 3,29
| 3,23
| 3,18
| 3,13
| 3,10
| 3,07
|
| 4,96
| 4,10
| 3,71
| 3,48
| 3,33
| 3,22
| 3,14
| 3,07
| 3,02
| 2,97
| 2,94
| 2,91
|
| 4,84
| 3,98
| 3,59
| 3,36
| 3,20
| 3,09
| 3,01
| 2,95
| 2,90
| 2,86
| 2,82
| 2,79
|
| 4,75
| 3,88
| 3,49
| 3,26
| 3,11
| 3,00
| 2,92
| 2,85
| 2,80
| 2.76
| 2,72
| 2,69
|
| 4,67
| 3,80
| 3,41
| 3,18
| 3,02
| 2,92
| 2,84
| 2,77
| 2,72
| 2,67
| 2,63
| 2,60
|
| 4,60
| 3,74
| 3,34
| 3,11
| 2,96
| 2,85
| 2,77
| 2,70
| 2,65
| 2,60
| 2,56
| 2,53
|
| 4,54
| 3,68
| 3,29
| 3,06
| 2,90
| 2,79
| 2,70
| 2,64
| 2,59
| 2,55
| 2,51
| 2,48
|
| 4,49
| 3,63
| 3,24
| 3,01
| 2,85
| 2,74
| 2,66
| 2,59
| 2,54
| 2,49
| 2,45
| 2,42
|
| 4,45
| 3,59
| 3,20
| 2,96
| 2,81
| 2,70
| 2,62
| 2,55
| 2,50
| 2,45
| 2,41
| 2,38
| | | | | | | | | | | | | | | СПИСОК ВИКОРИСТАНОЇ ЛІТЕРАТУРИ
- Гмурман В.Е. Теория вероятностей и математическая статистика. – М.: ВШ.2001. – 480 с.
- Гмурман В.Е. Руководство к решению задач по теории вероятностей и математической статистике. – М.: ВШ, 2001. – 400 с.
- Барковський В.В., Барковська Н.В., Лопатін О.К. Теорія ймовірностей і математична статистика. – К.; ЦУЛ, 2002. – 448 с.
- Жлуктенко В.І., Наконечний С.І. Теорія ймовірностей і математична статистика: Навч.-метод. Посібник: у 2-х ч. – К.:КНЕУ, 2000. – ч.2. – 334 с.
- Бобик О.І., Берегова Г.І., Копитко Б.І. Теорія ймовірностей і математична статистика. – Київ.: ВД «Професіонал», 2007. – 558 с.
ЗМІСТ
| 1.
| Основні поняття математичної статистики
|
| 2.
| Оцінки невідомих параметрів розподілу
|
| 2.1
| Точкові оцінки
|
| 2.2
| Точкові оцінки математичного сподівання, дисперсії та середнього квадратичного відхилення
|
| 2.3
| Інтервальні оцінки параметрів розподілу
|
| 2.4
| Розподіл - «хі-квадрат»
|
| 2.5
| Розподіл Стьюдента
|
| 2.6
| Розподіл Фішера-Снедекора
|
| 2.7
| Інтервальні оцінки математичного сподівання випадкової величини, яка розподілена за нормальним законом
|
| 3.
| Статистична перевірка гіпотез
|
| 3.1
| Статистичні гіпотези та їх різновиди.
|
| 3.2
| Похибки перевірки гіпотез
|
| 3.3
| Статистичний критерій перевірки основної гіпотези.
|
| 3.4
| Критична область
|
| 3.5
| Знаходження критичних областей
|
| 3.6
| Порядок дій при перевірці статистичних гіпотез
|
| 3.7
| Критерій узгодження Пірсона
|
| 3.8
| Перевірка гіпотез про параметри нормального розподілу
|
| 3.9
| Гіпотези про математичні сподівання
|
| 3.9.1
| Перевірка гіпотези про значення математичного сподівання за відомої дисперсії
|
| 3.9.2
| Перевірка гіпотези про рівність дисперсій двох незалежних випадкових величин
|
| 4.
| Однофакторний дисперсійний аналіз
|
| 5.
| Основні поняття кореляційного та регресійного аналізу
|
| 5.1
| Статистичний опис системи двох випадкових величин
|
| 5.2
| Вибірковий коефіцієнт кореляції
|
| 5.3
| Основні поняття і методи регресійного аналізу
|
|
| Додатки
|
|
| Список використаної літератури
|
| 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | 10 | 11 | 12 | 13 | 14 | Поиск по сайту:
|