АвтоАвтоматизацияАрхитектураАстрономияАудитБиологияБухгалтерияВоенное делоГенетикаГеографияГеологияГосударствоДомДругоеЖурналистика и СМИИзобретательствоИностранные языкиИнформатикаИскусствоИсторияКомпьютерыКулинарияКультураЛексикологияЛитератураЛогикаМаркетингМатематикаМашиностроениеМедицинаМенеджментМеталлы и СваркаМеханикаМузыкаНаселениеОбразованиеОхрана безопасности жизниОхрана ТрудаПедагогикаПолитикаПравоПриборостроениеПрограммированиеПроизводствоПромышленностьПсихологияРадиоРегилияСвязьСоциологияСпортСтандартизацияСтроительствоТехнологииТорговляТуризмФизикаФизиологияФилософияФинансыХимияХозяйствоЦеннообразованиеЧерчениеЭкологияЭконометрикаЭкономикаЭлектроникаЮриспунденкция

Интервальный вариационный ряд

Читайте также:
  1. Вариационный метод
  2. Вариационный принцип
  3. Дискретный вариационный ряд
  4. Линейный вариационный метод, уравнения Рутаана

Пример 2. Нас интересует средний рост студентов СГУ. Для этого мы отбираем случайно 100 студентов и измеряем их рост. Получили 100 чисел: . Случайную величину X, равную величине роста студента, уже нельзя считать дискретной. Нужно найти среднее значение роста 100 студентов

и приближенно считать это значение средним ростом студентов СГУ. Можно упростить вычисления и составить таблицу, которая и будет называться интервальным вариационным рядом. Имеем выборку

Пусть см, см.

Число см называется вариационным размахом.

Интервал ‑ вариационный интервал. Для удобства мы можем немного сдвигать влево, а ‑ вправо. Удобно разделить на 5 частей, то есть разделить интервал на пять интервалов .

Составим таблицу

[150,160) [160,170) [170,180) [180,190) [190,200]
ni          
0,04 0,23 0,48 0,17 0,08
0,04 0,27 0,75 0,92  

Здесь ni ‑ частота , она равна числу студентов, рост которых попал в интервал . ‑ частость , ‑ накопленная частость.

Используя составленную таблицу, легко подсчитать

.

Конечно, вычисляя таким образом среднее значение роста, мы немного теряем точность вычисления, но немного упрощаем процедуру вычисления. Важно найти «золотую» середину: на какое количество интервалов необходимо разбить вариационный интервал, чтобы не слишком потерять точность вычислений и не усложнить сами вычисления. Для определения оптимальной длины h интервала используют формулу Стэрджеса:

.

В нашем примере . Мы разбили вариационный интервал на 5 интервалов, потеряв при этом точность вычисления, но упростив их.

2.2.3. Графическое изображение вариационных рядов

Очень удобно вариационные ряды, как дискретные, так и интервальные, изображать графически.

Пусть

xi x 1 x 2 xk
ni n 1 n 2 nk

‑ дискретный вариационный ряд.

Полигоном частот (или частостей) называется ломаная линия с вершинами в точках .

Гистограммой частот (или частостей) интервального вариационного ряда называется фигура, которая строится так: на оси OX откладывается вариационный интервал [ x min, x max], разделенный на интервалы . Над каждым интервалом выстраивают прямоугольник с высотой ni (или ).

 
 

Гистограмма или полигон частостей для интервального ряда (для непрерывной случайной величины X) дает приближенное представление о плотности вероятностей X.

Примеры

Пример 1. Имеются следующие данные о дневном поступлении денежных средств во вклады по 30-ти учреждениям сберегательного банка (млн руб.):

205,2; 209,6; 222,6; 236,7; 62,0; 53,1; 172,1; 56,5; 52,5; 172,1; 56,5; 52,6; 46,6; 53,2; 30,1; 146,4; 18,1; 13,6; 89,8; 62,5; 46,3; 103,5; 73,3; 76,6; 73,0; 32,3; 199,6; 59,1; 71,2; 90,8.

Постройте интервальный ряд; изобразите гистограмму и полигон частот; найдите среднее ‑ коэффициент вариации.

Решение. Найдем вариационный интервал. ; .

‑ вариационный интервал. Для удобства считаем, что интервал есть вариационный. R =224 ‑ вариационный размах. По формуле Стэрджеса имеем

.

Интервальный ряд:

 

[13,45) [45,77) [77,109) [109,141) [141,173) [173,205] [205,237]
 
 

ni

             

.

; ;

.

Пример 2. Имеются данные об установленной мощности 20 сахарных заводов (в 100 т.):

15, 16, 17, 13, 14, 12, 16, 14, 16, 18, 25, 17, 11, 3, 9, 10, 15, 4, 6, 28.

Вычислить среднюю мощность заводов: а) непосредственно; б) на основе построенного ряда. Изобразить гистограмму и полигон частот. Найти среднее квадратическое отклонение и коэффициент вариации.

Решение. ; .

Разделим вариационный интервал [3,28] на 5 интервалов и построим вариационный ряд

[3,8) [8,13) [13,18) [18,23) [23,28]
ni          

а)

 
 

;

б) .

; . .

Пример 3. Произведено обследование 40 магазинов города, составлен интервальный вариационный ряд ( ‑ интервал товарооборота, млн. руб.).

[100,150) [150,200) [200,250) [250,300) [300,350) ³350
ni            

По данным ряда распределения определите средний товарооборот для магазина; среднее квадратическое отклонение S, коэффициент вариации V.

Изобразите полученный ряд графически в виде гистограммы распределения.

С вероятностью 0,996 определите возможные пределы величины среднего товарооборота для всех магазинов.

Решение.

.

 
 

; .

Найдем доверительный интервал среднего товарооборота для магазинов. Он равен . Имеем . Число найдем по таблице из равенства: , отсюда . Окончательно

.

2.2.4. Статистическое изучение связи

Важнейшей задачей экономических исследований является выявление факторов, определяющих уровень и динамику экономического процесса. Такая задача чаще всего решается методами корреляционного и регрессионного анализа.

Главной задачей корреляционного анализа является оценка взаимосвязи между случайными величинами на основе выборочных данных.

Различают два вида зависимостей между экономическими явлениями: функциональную и стохастическую. Функциональная зависимость подразумевает существование однозначного отображения множеств исследуемых величин, например, объем выпускаемой продукции Z зависит от производительности труда Y и затрат рабочего времени X: Z = f (X, Y).

При изучении реальных явлений сказывается влияние многих незначительных факторов, поэтому каждому значению аргумента X соответствует множество значений переменной Y. Такая неоднозначность есть проявление стохастической зависимости. Например, при изучении производительности труда Y в зависимости от среднегодовой стоимости основных фондов X каждому значению X соответствует множество значений Y и наоборот. В этом случае говорят о наличии стохастической связи.

Пусть X и Y ‑ две случайные величины, заданные на одном и том же вероятностном пространстве, MX = a ‑ математическое ожидание (среднее) X, MY = b ‑ математическое ожидание Y. Величина

называется корреляцией случайных величин X и Y. Пусть

‑ дисперсия X;

‑ дисперсия Y.

Величина

называется коэффициентом корреляции случайных величин X и Y. Коэффициент корреляции обладает свойством . Если случайные величины X и Y независимы, то

.

Таким образом, если X и Y независимы, то коэффициент корреляции r =0.

Если же или , то X и Y, будут зависимы, более того, это есть линейная функциональная зависимость: Y = kX + d, где k, d ‑ некоторые постоянные числа. Действительно, пусть Y = kX + d. Тогда ; , откуда . В этом случае коэффициент корреляции r равен

.

Итак, .

Положительный знак у r указывает на положительную корреляцию, то есть с увеличением X признак Y растет. Отрицательный знак свидетельствует об отрицательной корреляции. Чем ближе к 1, тем зависимость между признаками более существенная, чем ближе к нулю, тем признаки более независимы.

Пусть X и Y ‑ две дискретные случайные величины, принимающие значения xi и yi с вероятностями .

Можно считать, что X и Y ‑ две выборки из генеральных совокупностей

 

xi x 1 x 2 xk
ni n 1 n 2 nk

 

yi y 1 y 2 yp
mi m1 m2 mp

. Тогда ‑ средние X и Y. (с учетом повторений xi и yi), , , ‑ коэффициент корреляции.

Регрессионная зависимость ‑ это зависимость между средними значениями признаков X и Y. Уравнение линейной регрессии имеет вид

.

Пример. Экономист, изучая зависимость выборки Y (тыс. руб.) на одного работника торговли от величины товарооборота X (тыс. руб.) магазина обследовал за отчетный период 15 магазинов торга (n =15) и получил следующие данные:

X                              
Y 7,2 4,5 8,4 4,4 7,5 5,8 7,0 5,0 6,4 8,0 6,0 7,8 6,2 5,8 6,0

Полагая, что между признаками X и Y имеет место линейная корреляционная связь, определить выборочное уравнение линейной регрессии . Построить диаграмму рассеяния и линию регрессии. Используя полученное уравнение регрессии, оценить ожидаемое среднее значение признака Y при тыс. рублей.

Решение.

Построим диаграмму рассеяния.

Вычислим числовые характеристики:

.

Запишем уравнение линейной регрессии

или

.

Изобразим эту прямую на графике.

При , получаем

 
 

(тыс. руб.).

Контрольная работа № 2.1

Задача 1. Постоянная величина измерена k раз с помощью прибора, систематическая ошибка которого равна нулю, а случайные ошибки измерения распределены нормально со средним квадратическим отклонением s. Определить доверительный интервал для значения измеряемой величины при доверительной вероятности a, если среднее измерений равно .

Задача 2. Среднее значение дальности до ориентира, полученное по четырем независимым измерениям, . Средняя квадратическая ошибка прибора s. Найти с надежностью a доверительный интервал для оценки значения измеряемой величины.

Задача 3. В качестве оценки расстояния до навигационного знака принимают среднее значение n независимых измерений дальномерами. Измерения не содержат систематической ошибки, а случайные ошибки расположены нормально со среднеквадратическим отклонением s. Найти доверительный интервал для истинного расстояния с доверительной вероятностью a.

Задача 4. На основании 100 ответов было определено, что в среднем для производства детали требуется с. Предположив, что время для производства детали есть нормальная случайная величина со средним квадратическим отклонением s, определить доверительный интервал для истинного математического ожидания t с надежностью a.

Задача 5. По 15 независимым измерениям было определено среднее значение максимальной скорости самолета . Считая выборку нормальной со среднеквадратическим отклонением s найти доверительный интервал для истинного математического ожидания максимальной скорости самолета с надежностью a.

 

Номер   s a Задача
  k =25   0,99  
  k =100   0,9  
  k =16   0,95  
  =91   0,9  
  =110   0,99  
  =75   0,9  
  =1500   0,9  
  =1200, n =25   0,9  
  =2640, n =15   0,95  
  =5,5   0,99  
  =8,5   0,95  
  =12   0,9  
  =424,7   0,95  
  =530   0,99  
  =625   0,9  
  =742   0,95  
  k =50   0,9  
  k =10   0,95  
  k =20   0,99  
  =720   0,9  
  =850   0,95  
  =710   0,99  
  =2150   0,9  
  =3100   0,95  
  =2600   0,9  
  =22   0,95  
  =15   0,9  
  =25   0,95  
  =930   0,9  
  =840   0,95  

Контрольная работа № 2.2

В следующих задачах найти: а) среднее , среднеквадратическое отклонение S и коэффициент V; б) построить гистограмму и полигон частот.

1. Дан интервальный ряд испытания на разрыв 100 образцов дюралюминия ( ‑ предел прочности на разрыв, кг/мм2; ‑ число образцов).

40‑42 42‑44 44‑46 46‑48 48‑50
         

2. Имеются следующие данные о величине товарооборота для 50 магазинов города ( ‑ товарооборот, млн руб.; ‑ число магазинов).

100‑150 150‑200 200‑250 250‑300 300‑350 350‑400
           

3. Проведено выборочное обследование магазинов города. Имеются следующие данные о величине товарооборота для 50 магазинов города ( ‑ товарооборот, млн руб.; ‑ число магазинов).

25‑75 75‑125 125‑175 175‑225 225‑275 275‑325
           

4. Даны результаты исследования грануляции партий порошка ( ‑ грануляции, мкм; ‑ число партий).

0‑40 40‑80 80‑120 120‑160 160‑200
         

5. Даны результаты исследования 50 образцов на прочность напыленного слоя ( ‑ прочность, кг/мм2; ‑ число образцов).

2,0‑2,2 2,2‑2,4 2,4‑2,6 2,6‑2,8 2,8‑3,0
         

6. Даны результаты измерения диаметров валиков ( ‑ диаметры валиков, мм; ‑ число валиков).

9,4‑9,6 9,6‑9,8 9,8‑10,0 10,0‑10,2 10,2‑10,4
         

7. Имеются данные о среднесуточном пробеге 50 автомобилей ЗИЛ ( ‑ пробег, сотни км; ‑ число автомобилей).

1,2‑1,6 1,6‑2,0 2,0‑2,4 2,4‑2,8 2,8‑3,2
         

8. Даны результаты измерения твердости (xi, у.е.) сверл ( ‑ число сверл).

20‑30 30‑40 40‑50 50‑60 60‑70
         

9. Даны результаты испытаний стойкости 100 фрез ( ‑ стойкость в час, кг/мм2; ‑ число фрез).

32‑36 36‑40 40‑44 44‑48 48‑52
         

10. Даны результаты измерения толщины (xi, мм) 50 смоляных прокладок ( ‑ число прокладок).

0,24‑0,28 0,28‑0,32 0,32‑0,36 0,36‑0,40 0,40‑0,44
         

11. Даны результаты определения содержания фосфора в 100 чугунных образцах (xi ‑ содержание в % фосфора; ‑ число образцов).

0,10‑0,2 0,2‑0,3 0,3‑0,4 0,4‑0,5 0,5‑0,6
         

12. Имеются статистические данные о трудоемкости операции (xi, мин) ремонта валика водяного насоса ( ‑ число валиков).

0‑10 10‑20 20‑30 30‑40 40‑50
         

13. Даны результаты испытания стойкости (xi, ч) 200 сверл ( ‑ число сверл).

3,0‑3,2 3,2‑3,4 3,4‑3,6 3,6‑3,8 3,8‑4,0
         

14. Дан интервальный ряд испытания на разрыв 100 образцов дюралюминия ( ‑ предел прочности, кг/мм2; ‑ число образцов).

20‑22 22‑24 24‑26 26‑28 28‑30
         

15. Имеются данные о величине товарооборота для 50 магазинов ( ‑ товарооборот, млн руб.; ‑ число магазинов).

100‑140 140‑180 180‑220 220‑260 260‑300
         

16. Имеются следующие данные о величине товарооборота для 40 магазинов города ( ‑ товарооборот, усл. руб.; ‑ число магазинов):

[100,150) [150,200) [200,250) [250,300) [300,350) [350,400)
           

17. Имеются следующие данные о величине товарооборота для 50 магазинов города ( ‑ товарооборот, усл. руб.; ‑ число магазинов):

[0,50) [50,100) [100,150) [150,200) [200,250) [250,300)
           

18. В целях изучения норм расходования сырья при изготовлении продукции проведена выборка, в результате которой получено следующее распределение изделий по массе ( ‑ число изделий):

Масса, г 19‑20 20‑21 21‑22 22‑23 23‑24 24‑25
           

19. В целях изучения урожайности подсолнечника проведено выборочное обследование 100 га посевов, в результате которого получены данные ( ‑ посевная площадь, га).

Урожайность, ц/га 11‑13 13‑15 15‑17 17‑19 19‑21
         

20. Даны результаты исследования грануляции партий порошка ( ‑ грануляции, мкм; ‑ число партий).

[15,25) [25,35) [35,45) [45,55) [55,65)
         

21. В целях изучения норм расходования сырья при изготовлении продукции проведена выборка, в результате которой получено следующее распределение изделий по массе ( ‑ масса изделия, г; ‑ число изделий).

19‑21 21‑23 23‑25 25‑27 27‑29 29‑31
           

22. Проведено выборочное обследование магазинов города. Имеются следующие данные о величине товарооборота для 50 магазинов ( ‑ товарооборот, млн руб.; ‑ число магазинов).

25‑75 75‑125 125‑175 175‑225 225‑275 275‑325
           

23. Проведено выборочное обследование 100 га посевов, в результате которых получены данные ( ‑ урожайность, ц/га; ‑ посевная площадь, га).

21‑23 23‑25 25‑27 27‑29 29‑31
         

24. Даны результаты исследования 50 образцов на прочность напыленного слоя ( ‑ прочность, кг/мм2; ‑ число образцов).

4,0‑4,2 4,2‑4,4 4,4‑4,6 4,6‑4,8 4,8‑5,0
         

25. Даны результаты измерения твердости (xi, у.е.) сверл ( ‑ число сверл).

20‑40 40‑60 60‑80 80‑100 100‑120
         

26. Даны результаты измерения диаметров валиков ( ‑ диаметры валиков, мм; ‑ число валиков).

19,4‑19,6 19,6‑19,8 19,8‑20,0 20,0‑20,2 20,2‑20,4
         

27. Имеются данные о среднемесячном пробеге (xi ‑ пробег, сотни км) 50 автомобилей ЗИЛ ( ‑ число автомобилей).

40‑42 42‑44 44‑46 46‑48 48‑50
         

28. Даны результаты испытания стойкости 100 фрез ( ‑ стойкость, ч; ‑ число фрез).

32‑34 34‑36 36‑38 38‑40 40‑42
         

29. Даны результаты измерения толщины (xi, мм) 50 слюдяных прокладок ( ‑ число прокладок).

0,32‑0,34 0,34‑0,36 0,36‑0,38 0,38‑0,40 0,40‑0,42
         

30. Имеются статистические данные о трудоемкости операции (xi, мин) ремонта валика водяного насоса ( ‑ число валиков).

6‑10 10‑14 14‑18 18‑22 22‑26
         

Контрольная работа № 2.3

Задача. Экономист, изучая зависимость выработки Y (у.е.) на одного работника торговли от величины товарооборота X (у.е.) магазина обследовал 10 магазинов торга (n =10) и получил следующие данные (см. табл.). Полагая, что между признаками X и Y имеет место линейная корреляционная связь, определить выборочное уравнение линейной регрессии и выборочный коэффициент линейной корреляции rxy. Построить диаграмму рассеяния и линию регрессии. Используя полученное уравнение регрессии, оценить ожидаемое среднее значение Y при X *.

Таблица


1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | 10 |

Поиск по сайту:



Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав. Студалл.Орг (0.024 сек.)