|
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
АвтоАвтоматизацияАрхитектураАстрономияАудитБиологияБухгалтерияВоенное делоГенетикаГеографияГеологияГосударствоДомДругоеЖурналистика и СМИИзобретательствоИностранные языкиИнформатикаИскусствоИсторияКомпьютерыКулинарияКультураЛексикологияЛитератураЛогикаМаркетингМатематикаМашиностроениеМедицинаМенеджментМеталлы и СваркаМеханикаМузыкаНаселениеОбразованиеОхрана безопасности жизниОхрана ТрудаПедагогикаПолитикаПравоПриборостроениеПрограммированиеПроизводствоПромышленностьПсихологияРадиоРегилияСвязьСоциологияСпортСтандартизацияСтроительствоТехнологииТорговляТуризмФизикаФизиологияФилософияФинансыХимияХозяйствоЦеннообразованиеЧерчениеЭкологияЭконометрикаЭкономикаЭлектроникаЮриспунденкция |
Интервальный вариационный ряд
Пример 2. Нас интересует средний рост студентов СГУ. Для этого мы отбираем случайно 100 студентов и измеряем их рост. Получили 100 чисел: . Случайную величину X, равную величине роста студента, уже нельзя считать дискретной. Нужно найти среднее значение роста 100 студентов и приближенно считать это значение средним ростом студентов СГУ. Можно упростить вычисления и составить таблицу, которая и будет называться интервальным вариационным рядом. Имеем выборку Пусть см, см. Число см называется вариационным размахом. Интервал ‑ вариационный интервал. Для удобства мы можем немного сдвигать влево, а ‑ вправо. Удобно разделить на 5 частей, то есть разделить интервал на пять интервалов . Составим таблицу
Здесь ni ‑ частота , она равна числу студентов, рост которых попал в интервал . ‑ частость , ‑ накопленная частость. Используя составленную таблицу, легко подсчитать . Конечно, вычисляя таким образом среднее значение роста, мы немного теряем точность вычисления, но немного упрощаем процедуру вычисления. Важно найти «золотую» середину: на какое количество интервалов необходимо разбить вариационный интервал, чтобы не слишком потерять точность вычислений и не усложнить сами вычисления. Для определения оптимальной длины h интервала используют формулу Стэрджеса: . В нашем примере . Мы разбили вариационный интервал на 5 интервалов, потеряв при этом точность вычисления, но упростив их. 2.2.3. Графическое изображение вариационных рядов Очень удобно вариационные ряды, как дискретные, так и интервальные, изображать графически. Пусть
‑ дискретный вариационный ряд. Полигоном частот (или частостей) называется ломаная линия с вершинами в точках . Гистограммой частот (или частостей) интервального вариационного ряда называется фигура, которая строится так: на оси OX откладывается вариационный интервал [ x min, x max], разделенный на интервалы . Над каждым интервалом выстраивают прямоугольник с высотой ni (или ). Гистограмма или полигон частостей для интервального ряда (для непрерывной случайной величины X) дает приближенное представление о плотности вероятностей X. Примеры Пример 1. Имеются следующие данные о дневном поступлении денежных средств во вклады по 30-ти учреждениям сберегательного банка (млн руб.): 205,2; 209,6; 222,6; 236,7; 62,0; 53,1; 172,1; 56,5; 52,5; 172,1; 56,5; 52,6; 46,6; 53,2; 30,1; 146,4; 18,1; 13,6; 89,8; 62,5; 46,3; 103,5; 73,3; 76,6; 73,0; 32,3; 199,6; 59,1; 71,2; 90,8. Постройте интервальный ряд; изобразите гистограмму и полигон частот; найдите среднее ‑ коэффициент вариации. Решение. Найдем вариационный интервал. ; . ‑ вариационный интервал. Для удобства считаем, что интервал есть вариационный. R =224 ‑ вариационный размах. По формуле Стэрджеса имеем . Интервальный ряд:
. ; ; . Пример 2. Имеются данные об установленной мощности 20 сахарных заводов (в 100 т.): 15, 16, 17, 13, 14, 12, 16, 14, 16, 18, 25, 17, 11, 3, 9, 10, 15, 4, 6, 28. Вычислить среднюю мощность заводов: а) непосредственно; б) на основе построенного ряда. Изобразить гистограмму и полигон частот. Найти среднее квадратическое отклонение и коэффициент вариации. Решение. ; . Разделим вариационный интервал [3,28] на 5 интервалов и построим вариационный ряд
а) ; б) . ; . . Пример 3. Произведено обследование 40 магазинов города, составлен интервальный вариационный ряд ( ‑ интервал товарооборота, млн. руб.).
По данным ряда распределения определите средний товарооборот для магазина; среднее квадратическое отклонение S, коэффициент вариации V. Изобразите полученный ряд графически в виде гистограммы распределения. С вероятностью 0,996 определите возможные пределы величины среднего товарооборота для всех магазинов. Решение. . ; . Найдем доверительный интервал среднего товарооборота для магазинов. Он равен . Имеем . Число найдем по таблице из равенства: , отсюда . Окончательно . 2.2.4. Статистическое изучение связи Важнейшей задачей экономических исследований является выявление факторов, определяющих уровень и динамику экономического процесса. Такая задача чаще всего решается методами корреляционного и регрессионного анализа. Главной задачей корреляционного анализа является оценка взаимосвязи между случайными величинами на основе выборочных данных. Различают два вида зависимостей между экономическими явлениями: функциональную и стохастическую. Функциональная зависимость подразумевает существование однозначного отображения множеств исследуемых величин, например, объем выпускаемой продукции Z зависит от производительности труда Y и затрат рабочего времени X: Z = f (X, Y). При изучении реальных явлений сказывается влияние многих незначительных факторов, поэтому каждому значению аргумента X соответствует множество значений переменной Y. Такая неоднозначность есть проявление стохастической зависимости. Например, при изучении производительности труда Y в зависимости от среднегодовой стоимости основных фондов X каждому значению X соответствует множество значений Y и наоборот. В этом случае говорят о наличии стохастической связи. Пусть X и Y ‑ две случайные величины, заданные на одном и том же вероятностном пространстве, MX = a ‑ математическое ожидание (среднее) X, MY = b ‑ математическое ожидание Y. Величина называется корреляцией случайных величин X и Y. Пусть ‑ дисперсия X; ‑ дисперсия Y. Величина называется коэффициентом корреляции случайных величин X и Y. Коэффициент корреляции обладает свойством . Если случайные величины X и Y независимы, то . Таким образом, если X и Y независимы, то коэффициент корреляции r =0. Если же или , то X и Y, будут зависимы, более того, это есть линейная функциональная зависимость: Y = kX + d, где k, d ‑ некоторые постоянные числа. Действительно, пусть Y = kX + d. Тогда ; , откуда . В этом случае коэффициент корреляции r равен . Итак, . Положительный знак у r указывает на положительную корреляцию, то есть с увеличением X признак Y растет. Отрицательный знак свидетельствует об отрицательной корреляции. Чем ближе к 1, тем зависимость между признаками более существенная, чем ближе к нулю, тем признаки более независимы. Пусть X и Y ‑ две дискретные случайные величины, принимающие значения xi и yi с вероятностями . Можно считать, что X и Y ‑ две выборки из генеральных совокупностей
. Тогда ‑ средние X и Y. (с учетом повторений xi и yi), , , ‑ коэффициент корреляции. Регрессионная зависимость ‑ это зависимость между средними значениями признаков X и Y. Уравнение линейной регрессии имеет вид . Пример. Экономист, изучая зависимость выборки Y (тыс. руб.) на одного работника торговли от величины товарооборота X (тыс. руб.) магазина обследовал за отчетный период 15 магазинов торга (n =15) и получил следующие данные:
Полагая, что между признаками X и Y имеет место линейная корреляционная связь, определить выборочное уравнение линейной регрессии . Построить диаграмму рассеяния и линию регрессии. Используя полученное уравнение регрессии, оценить ожидаемое среднее значение признака Y при тыс. рублей. Решение. Построим диаграмму рассеяния. Вычислим числовые характеристики: . Запишем уравнение линейной регрессии или . Изобразим эту прямую на графике. При , получаем (тыс. руб.). Контрольная работа № 2.1 Задача 1. Постоянная величина измерена k раз с помощью прибора, систематическая ошибка которого равна нулю, а случайные ошибки измерения распределены нормально со средним квадратическим отклонением s. Определить доверительный интервал для значения измеряемой величины при доверительной вероятности a, если среднее измерений равно . Задача 2. Среднее значение дальности до ориентира, полученное по четырем независимым измерениям, . Средняя квадратическая ошибка прибора s. Найти с надежностью a доверительный интервал для оценки значения измеряемой величины. Задача 3. В качестве оценки расстояния до навигационного знака принимают среднее значение n независимых измерений дальномерами. Измерения не содержат систематической ошибки, а случайные ошибки расположены нормально со среднеквадратическим отклонением s. Найти доверительный интервал для истинного расстояния с доверительной вероятностью a. Задача 4. На основании 100 ответов было определено, что в среднем для производства детали требуется с. Предположив, что время для производства детали есть нормальная случайная величина со средним квадратическим отклонением s, определить доверительный интервал для истинного математического ожидания t с надежностью a. Задача 5. По 15 независимым измерениям было определено среднее значение максимальной скорости самолета . Считая выборку нормальной со среднеквадратическим отклонением s найти доверительный интервал для истинного математического ожидания максимальной скорости самолета с надежностью a.
Контрольная работа № 2.2 В следующих задачах найти: а) среднее , среднеквадратическое отклонение S и коэффициент V; б) построить гистограмму и полигон частот. 1. Дан интервальный ряд испытания на разрыв 100 образцов дюралюминия ( ‑ предел прочности на разрыв, кг/мм2; ‑ число образцов).
2. Имеются следующие данные о величине товарооборота для 50 магазинов города ( ‑ товарооборот, млн руб.; ‑ число магазинов).
3. Проведено выборочное обследование магазинов города. Имеются следующие данные о величине товарооборота для 50 магазинов города ( ‑ товарооборот, млн руб.; ‑ число магазинов).
4. Даны результаты исследования грануляции партий порошка ( ‑ грануляции, мкм; ‑ число партий).
5. Даны результаты исследования 50 образцов на прочность напыленного слоя ( ‑ прочность, кг/мм2; ‑ число образцов).
6. Даны результаты измерения диаметров валиков ( ‑ диаметры валиков, мм; ‑ число валиков).
7. Имеются данные о среднесуточном пробеге 50 автомобилей ЗИЛ ( ‑ пробег, сотни км; ‑ число автомобилей).
8. Даны результаты измерения твердости (xi, у.е.) сверл ( ‑ число сверл).
9. Даны результаты испытаний стойкости 100 фрез ( ‑ стойкость в час, кг/мм2; ‑ число фрез).
10. Даны результаты измерения толщины (xi, мм) 50 смоляных прокладок ( ‑ число прокладок).
11. Даны результаты определения содержания фосфора в 100 чугунных образцах (xi ‑ содержание в % фосфора; ‑ число образцов).
12. Имеются статистические данные о трудоемкости операции (xi, мин) ремонта валика водяного насоса ( ‑ число валиков).
13. Даны результаты испытания стойкости (xi, ч) 200 сверл ( ‑ число сверл).
14. Дан интервальный ряд испытания на разрыв 100 образцов дюралюминия ( ‑ предел прочности, кг/мм2; ‑ число образцов).
15. Имеются данные о величине товарооборота для 50 магазинов ( ‑ товарооборот, млн руб.; ‑ число магазинов).
16. Имеются следующие данные о величине товарооборота для 40 магазинов города ( ‑ товарооборот, усл. руб.; ‑ число магазинов):
17. Имеются следующие данные о величине товарооборота для 50 магазинов города ( ‑ товарооборот, усл. руб.; ‑ число магазинов):
18. В целях изучения норм расходования сырья при изготовлении продукции проведена выборка, в результате которой получено следующее распределение изделий по массе ( ‑ число изделий):
19. В целях изучения урожайности подсолнечника проведено выборочное обследование 100 га посевов, в результате которого получены данные ( ‑ посевная площадь, га).
20. Даны результаты исследования грануляции партий порошка ( ‑ грануляции, мкм; ‑ число партий).
21. В целях изучения норм расходования сырья при изготовлении продукции проведена выборка, в результате которой получено следующее распределение изделий по массе ( ‑ масса изделия, г; ‑ число изделий).
22. Проведено выборочное обследование магазинов города. Имеются следующие данные о величине товарооборота для 50 магазинов ( ‑ товарооборот, млн руб.; ‑ число магазинов).
23. Проведено выборочное обследование 100 га посевов, в результате которых получены данные ( ‑ урожайность, ц/га; ‑ посевная площадь, га).
24. Даны результаты исследования 50 образцов на прочность напыленного слоя ( ‑ прочность, кг/мм2; ‑ число образцов).
25. Даны результаты измерения твердости (xi, у.е.) сверл ( ‑ число сверл).
26. Даны результаты измерения диаметров валиков ( ‑ диаметры валиков, мм; ‑ число валиков).
27. Имеются данные о среднемесячном пробеге (xi ‑ пробег, сотни км) 50 автомобилей ЗИЛ ( ‑ число автомобилей).
28. Даны результаты испытания стойкости 100 фрез ( ‑ стойкость, ч; ‑ число фрез).
29. Даны результаты измерения толщины (xi, мм) 50 слюдяных прокладок ( ‑ число прокладок).
30. Имеются статистические данные о трудоемкости операции (xi, мин) ремонта валика водяного насоса ( ‑ число валиков).
Контрольная работа № 2.3 Задача. Экономист, изучая зависимость выработки Y (у.е.) на одного работника торговли от величины товарооборота X (у.е.) магазина обследовал 10 магазинов торга (n =10) и получил следующие данные (см. табл.). Полагая, что между признаками X и Y имеет место линейная корреляционная связь, определить выборочное уравнение линейной регрессии и выборочный коэффициент линейной корреляции rxy. Построить диаграмму рассеяния и линию регрессии. Используя полученное уравнение регрессии, оценить ожидаемое среднее значение Y при X *. Таблица Поиск по сайту: |
Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав. Студалл.Орг (0.024 сек.) |