|
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
АвтоАвтоматизацияАрхитектураАстрономияАудитБиологияБухгалтерияВоенное делоГенетикаГеографияГеологияГосударствоДомДругоеЖурналистика и СМИИзобретательствоИностранные языкиИнформатикаИскусствоИсторияКомпьютерыКулинарияКультураЛексикологияЛитератураЛогикаМаркетингМатематикаМашиностроениеМедицинаМенеджментМеталлы и СваркаМеханикаМузыкаНаселениеОбразованиеОхрана безопасности жизниОхрана ТрудаПедагогикаПолитикаПравоПриборостроениеПрограммированиеПроизводствоПромышленностьПсихологияРадиоРегилияСвязьСоциологияСпортСтандартизацияСтроительствоТехнологииТорговляТуризмФизикаФизиологияФилософияФинансыХимияХозяйствоЦеннообразованиеЧерчениеЭкологияЭконометрикаЭкономикаЭлектроникаЮриспунденкция |
Введение. Данная работа посвящена анализу и прогнозированию количества квадратных метров введенной в действие жилой площади в Российской Федерации
Данная работа посвящена анализу и прогнозированию количества квадратных метров введенной в действие жилой площади в Российской Федерации. Государственная политика в сфере строительства, содержания и реконструкции жилья рассматривается в контексте антикризисных мер, принятых правительством Российской федерации на среднесрочную перспективу. Общая площадь жилищного фонда Российской Федерации составляет около 3,17 млрд кв. м.Наиболее интенсивный рост его объема пришелся на 70-80-е годы прошлого века, когда ежегодно в эксплуатацию вводилось 59-76 млн кв. м общей площади жилья. Только за последние 10 лет существования СССР жилищный фонд России увеличился почти в 1,5 раза. С 1992 г. ввод жилья стал быстро сокращаться и в течение 12 лет варьировался в пределах 30-41 млн кв. м в год. Восстановление объемов строительства началось лишь в 2005 г., однако пока они существенно ниже «пиковых» показателей советского периода. За десятилетие 2000-2009 гг. жилищный фонд страны вырос всего на 14,8%. Уровень обеспеченности жильем в России достаточно скромен. К началу 2010 г. в среднем на 1 человека в РФ приходилось примерно 22,3 кв. м жилья, что в 2-3 раза ниже аналогичного показателя в развитых странах. Так, в США обеспеченность жильем составляет около 75 кв. м/чел., в Великобритании – 62 кв. м, Германии – 45 кв. м. В связи с падением объемов жилищного строительства, к середине 90-х годов рост показателя жилищной обеспеченности стал замедляться, несмотря на сокращение численности населения страны. Так, в 1980-1994 гг. обеспеченность жильем повысилась почти на 6 кв. м на человека при росте населения на 10 млн чел. Уровень строительной активности в первом десятилетии текущего века колебался в РФ в пределах ХХ кв. м/чел. в год.В то же время опыт зарубежных стран показывает, что для кардинального улучшения жилищной обеспеченности в приемлемые сроки (на протяжении жизненного цикла одного поколения), строительная активность должна составлять около 1 кв. м/чел. в год.
Кластерный анализ По данным, представленным в таблице, провести классификацию n = 4 предприятий по двум показателям
1.Классификация на основе обычного евклидова расстояния принцип “ближайшего соседа”. ρ (1,2)= =5 ρ (2,1)= =5 ρ (2,3)= =7,21 ρ (3,2)= =7,21 ρ (1,3)= =7,28 ρ (3,1)= =7,28 ρ (1,4)= =3,16 ρ (4,1)= =3,16 ρ (2,4)= =2,24 ρ (4,2)= =2,24 ρ (3,4)= =7,81 ρ (4,3)= =7,81
Построим матрицу расстояний R1 Из матрицы расстояний следует, что объекты 4 и 2 наиболее близки, ρ4,2=2,24 и поэтому объединим их в один кластер. После объединения объектов имеем четыре кластера:S1, S2, S3, S(4,2). S(4,2),1= ρ(S1, S(4,2))= 3,16
S(4,2,1)S3= ρ(S3, S(4,2,1))= 7,21
2.Классификация на основе обычного евклидова расстояния и принципа “дальнего соседа”. Как и в случае (1), мы используем обычное евклидово расстояние, поэтому матрица R 1 остается без изменения. Согласно агломеративному алгоритму объединяются в один кластер объекты 4 и 2, как наиболее близкие ρ4,2=2,24.
S(4,2)1= ρ(S1, S(4,2))= 5
S(4,2,1)S3= =7,81
3.Классификация на основе обычного евклидова расстояния принцип “центра тяжести ”.
S(2,4)1= 4,03
S(2,4,1)(3)= =7,13
4.Классификация на основе обычного евклидова расстояния принцип «средней связи»
S(4,2)1= ρ(S1, S(4,2))=1/2(ρ (2,4)+ρ (1,4))=4,08 S(2,4)(3)=1/2(ρ (2,3)+ρ (1,3))=7,51 S(2,4,1)(3)= 1/3(ρ (2,3)+ ρ (4,3)+ρ (1,3))=1/3(7,21+7.81+7,28)=7,43
5.Классификация на основе взвешенного евклидова расстояния принцип “ближайшего соседа”. Предположим, что показатель х (1) менее важен для классификации, чем х (2). В этой связи припишем им “веса” ω1=0,05 и ω2=0,95
ρ (1,2)= =3.96 ρ (2,1)= =3.96 ρ (2,3)= =5.92 ρ (3,2)= =5.92 ρ (1,3)= =2.5 ρ (3,1)= =2.5 ρ (1,4)= =2.93 ρ (4,1)= =2.93 ρ (2,4)= =1.07 ρ (4,2)= =1.07 ρ (3,4)= =5.05 ρ (4,3)= =5.05
S(4,2),1= ρ(S1, S(4,2))= 2.93
6.Классификация на основе взвешенного евклидова расстояния принцип “дальнего соседа”.
S(4,2)1= ρ(S1, S(4,2))= 3.96
S(4,2,1)S3= =5.92
7.Классификация на основе взвешенного евклидова расстояния принцип “центра тяжести ”.
S(2,4)1= 3.42
S(2,4,1)(3)= =5.4
S(2,4,1)(3)= =4.41
8.Классификация на основе взвешенного евклидова расстояния принцип «средней связи» S(4,2)1= ρ(S1, S(4,2))=1/2(ρ (2,4)+ρ (1,4))=3.44
S(2,4)(3)=1/2(ρ (2,3)+ρ (1,3))=5.49 S(2,4,1)(3)= 1/3(ρ (2,3)+ ρ (4,3)+ρ (1,3))=4.43 Отдадим предпочтение разбиению на 2 кластера S(3) и S(1,2,4)
Нелинейная регрессия Зависимость объема производства y (тыс. ед) от численности занятых x (чел.) некоторой фирмы приводятся в таблице.
Для характеристики зависимости y от x рассчитайте параметры показательной функции у= а*bx Построению уравнения показательной кривой у= а*bx предшествует процедура линеаризации переменных при логарифмировании обеих частей уравнения lgy=lga+x *lgb Обозначив Y= lg y, А= lg а, В = lg b, получим: Y=А+B* x
Значения параметров регрессии А и В составили 0.05 2.874433
Получено линейное уравнение: Y(x)=2.874433+0.05x Произведем потенцирование полученного уравнения и запишем его в обычной форме: Y(x)=102.874433*100.05x=749*100.05x
σx= 4.6 σy= 0.23 Уравнение регрессии всегда дополняется показателем тесноты связи. При использовании линейной регрессии в качестве такого показателя выступает линейный коэффициент корреляции rxy, который можно рассчитать по следующей формуле: 0,963 Линейный коэффициент корреляции находится в пределах .Чем ближе абсолютное значение rxy к единице, тем сильнее линейная связь между факторами (при rxy = ±1 имеем строгую функциональную зависимость). Но следует иметь в виду, что близость абсолютной величины линейного коэффициента корреляции к нулю еще не означает отсутствия связи между признаками. При другой (нелинейной) спецификации модели связь между признаками может оказаться достаточно тесной. Для оценки качества подбора линейной функции рассчитывается квадрат линейного коэффициента корреляции r2xy называемый коэффициентом детерминации. Коэффициент детерминации характеризует долю дисперсии результативного признака y, объясняемую регрессией, в общей дисперсии результативного признака. r2xy=0,927719 Чтобы иметь общее суждение о качестве модели из относительных отклонений по каждому наблюдению, определяют среднюю ошибку аппроксимации: =1,2% Средняя ошибка аппроксимации не должна превышать 8–10%. Средний коэффициент эластичности: 12,864 Оценка значимости уравнения регрессии в целом производится на основе F -критерия Фишера, которому предшествует дисперсионный анализ. В математической статистике дисперсионный анализ рассматривается как самостоятельный инструмент статистического анализа. В эконометрике он применяется как вспомогательное средство для изучения качества регрессионной модели. F-критерий Фишера: 51,339 Фактическое значение F -критерия Фишера сравнивается с табличным значением Fтабл (α;k1;k2) при уровне значимости α и степенях cвободы k1=m и k2= n-m-1. При этом, если фактическое значение F -критерия больше табличного, то признается статистическая значимость уравнения в целом. Для парной линейной регрессии m=1, следовательно k1=1, k2=4 и Fтабл=7,71. В парной линейной регрессии оценивается значимость не только уравнения в целом, но и отдельных его параметров. С этой целью по каждому из параметров определяется его стандартная ошибка: mb и ma. Стандартная ошибка коэффициента регрессии определяется по формуле: 0,006623, где 0,00558 Величина стандартной ошибки совместно с t –распределение Стьюдента при n −2 степенях свободы применяется для проверки существенности коэффициента регрессии. Для оценки существенности коэффициента регрессии его величина сравнивается с его стандартной ошибкой, т.е. определяется фактическое значение t -критерия Стьюдента 7,165, которое затем сравнивается с табличным значением при определенном уровне значимости α и числе степеней свободы (n-2). Стандартная ошибка параметра a определяется по формуле: 0,112 Процедура оценивания существенности данного параметра не отличается от рассмотренной выше для коэффициента регрессии. Вычисляется t –критерий 25,572. Значимость линейного коэффициента корреляции проверяется на основе величины ошибки коэффициента корреляции mr: 0,1344 Фактическое значение t -критерия Стьюдента определяется как 7,2 Табличное значение t-критерия Стьюдента при α=0,05 и числе степеней V=n-2=4, есть 2,7764. Т.к.tb>tтабл., ta>tтабл.,tr>tтабл., то признаем статистическую значимость параметров регрессии и показателя тесноты связи.
Исследуемые данные и их график Ввод в действие жилых домов в Российской Федерации (млн.кв.м общей площади)
Статистические показатели изменения уровней рядов динамики.
При анализе изменений явления во времени на практике часто определяют средние показатели, в том числе средний уровень ряда. Средний уровень — это важная обобщающая характеристика для рядов динамики, изменение которых стабилизировалось в исследуемом периоде и при этом подвержено ощутимым случайным колебаниям. Для интервальных рядов динамики с равноотстоящими во времени уровнями расчет среднего уровня проводится по формуле простой средней арифметической:
, где n — число уровней или длина ряда; yt— уровень ряда динамики (t — 1, 2,..., n). 42.68
На практике для количественной оценки динамики явлений широко применяются следующие основные аналитические показатели: • абсолютные приросты; • темпы роста; • темпы прироста. Причем каждый из указанных показателей может быть трех видов: • цепной; • базисный; • средний. В основе расчета этих показателей динамики лежит сравнение уровней временного ряда. Если сравнение осуществляется с одним и тем же уровнем, принятым за базу сравнения, то эти показатели называются базисными. Если сравнение осуществляется при переменной базе и каждый последующий уровень сравнивается с предыдущим, вычисленные таким образом показатели называются цепными. Абсолютный прирост равен разности двух сравниваемых уровней и характеризует изменение показателя за определенный промежуток времени. В общем случае абсолютный прирост может быть представлен в виде: , где у, — текущий уровень ряда динамики; t = 2, 3,..., n; k= 1, 2,..., n-1. При k = 1 из текущего уровня у, вычитается предыдущий уровень уt-1 и получается формула для расчета цепного абсолютного прироста: При к = t - 1 из формулы (1.4) вытекает выражение для базисного абсолютного прироста, определяемого относительно начального уровня ряда: Средний абсолютный прирост — это обобщающая характеристика скорости изменения исследуемого показателя во времени (скоростью будем называть прирост в единицу времени). Для его определения за весь период наблюдения используется формула простой средней арифметической: , где - цепной абсолютный прирост, n - длина временного ряда. Темп роста Т характеризует отношение двух сравниваемых уровней ряда, как правило, выраженное в процентах. Темп роста может быть представлен в виде: , где —текущий уровень ряда динамики; t =2,3,..., n; k=1, 2,...,n-1. Цепной темп роста равен: Базисный темп роста может быть представлен в виде: , где —уровень временного ряда, принятый за базу сравнения. Темп роста всегда положителен. Если темп роста равен 100%,то значение уровня не изменилось, если меньше 100%, то значение уровня понизилось, больше 100% —- повысилось. Средний темп роста — обобщающая характеристика динамики, отражающая интенсивность изменения уровней ряда. Он показывает, сколько в среднем процентов последующий уровень составляет от предыдущего на всем периоде наблюдения. Этот показатель рассчитывается по формуле средней геометрической из цепных темпов роста: Темп прироста характеризует абсолютный прирост в относительных величинах. Определенный в процентах темп прироста показывает, на сколько процентов изменился сравниваемый уровень по отношению к уровню, принятому за базу сравнения. Темп прироста есть выраженное в процентах отношение абсолютного прироста к уровню, принятому за базу сравнения: , где —текущий уровень ряда динамики; t =2,3,..., n; k=1, 2,...,n-1. Очевидно, что темп прироста может быть положительным, отрицательным или равным нулю. При k - 1 получаем цепной темп прироста: Базисный темп прироста равен отношению базисного абсолютного прироста к уровню ряда, принятому за базу сравнения: Соответственно средний темп прироста может быть выражен через средний темп роста:
42,68 =0,5 =100,88% =0,88%
Автокорреляция уровней временного ряда. При наличии во временном ряде тенденции и циклических колебаний значения каждого последующего уровня ряда зависят от предыдущих. Корреляционную зависимость между последовательными уровнями временного ряда называют автокорреляцией уровней ряда. Количественно ее можно измерить с помощью линейного коэффициента корреляции между уровнями исходного временного ряда и уровнями этого ряда, сдвинутыми на несколько шагов во времени. Формула для расчета коэффициента автокорреляции имеет вид: где Эту величину называют коэффициентом автокорреляции уровней ряда первого порядка, так как он измеряет зависимость между соседними уровнями ряда и . Аналогично можно определить коэффициенты автокорреляции второго и более высоких порядков. Так, коэффициент автокорреляции второго порядка характеризует тесноту связи между уровнями и и определяется по формуле: где Число периодов, по которым рассчитывается коэффициент автокорреляции, называют лагом. С увеличением лага число пар значений, по которым рассчитывается коэффициент автокорреляции, уменьшается. Считается целесообразным для обеспечения статистической достоверности коэффициентов автокорреляции использовать правило – максимальный лаг должен быть не больше . Поскольку данная совокупность имеет 20 элементов, следовательно максимальный лаг равен 5. Последовательность коэффициентов автокорреляции уровней первого, второго и т.д. порядков называют автокорреляционной функцией временного ряда. График зависимости ее значений от величины лага (порядка коэффициента автокорреляции) называется коррелограммой. Рассчитаем несколько последовательных коэффициентов автокорреляции. Для этого составляем первую вспомогательную таблицу.
Теперь вычисляем коэффициент автокорреляции первого порядка по формуле: Составляем вспомогательную таблицу для расчета коэффициента автокорреляции второго порядка.
Следовательно,
Аналогично находим коэффициенты автокорреляции более высоких порядков, а все полученные значения заносим в сводную таблицу
Коррелограмма: Поскольку наиболее высоким оказался коэффициент автокорреляции первого порядка, исследуемый ряд содержит только тенденцию (тренд). Также, автокорреляционная функция не демонстрирует свойство монотонного убывания по абсолютной величине, следовательно, исследуемый ряд не является стационарным.
Сглаживание ряда методом скользящих средних
Восстановление краевых значений Весовые коэффициенты для восстановления последних уровней ряда: • при t = 1 {восстановление предпоследнего уровня ряда) 1/35[ - 5; 6; 12; 13; 9]; • при t = 2 (восстановление последнего уровня ряда) 1/35[ 3;-5;- 3; 9; 31 ] Последние 5 уровней ряда: 50,6; 61,2; 64,1; 59,9;58,4.Восстановление двух последних значений осуществляется следующим образом: 1/35[(-5*50,6)+(6*61,2)+(12*64,1)+(13*59,9)+(58,4*9)]=62,5 =1/35[(3*50,6)+(-5*61,2)+(-3*64,1)+(9*59,9)+(31*58,4)]=57,23
Проверка гипотезы о существовании тренда на основе критерия «восходящих и нисходящих» серий.
1) На первом шаге образуется последовательность знаков — плюсов и минусов.Для временного ряда с уровнями y1, y2… yn определена вспомогательная последовательность, исходя из следующих условий: 2) Подсчитывается общее число серий у(n) и протяженность самой длинной серии τmax. Очевидно, что при этом каждая серия, состоящая из плюсов, соответствует возрастанию уровней ряда («восходящая» серия), а последовательность минусов — их убыванию («нисходящая» серия). 3) Для того чтобы не была отвергнута гипотеза, должны выполняться следующие неравенства (при уровне значимости а, заключенном между 0,05 и 0,0975): τmax(n)< τ0(n), где τ0(n)-табличное значение, зависящее от n-длины временного ряда. Если хотя бы одно из неравенств нарушается, то нулевая гипотеза отвергается (следовательно, подтверждается наличие зависящей от времени неслучайной составляющей).
Анализ полученной последовательности знаков позволил установить: • число серий v(20) = 9, • протяженность самой длинной серии τmax(20) = 8. Т.к. табличное значение τ0(n)=5, следовательно, динамика временного ряда характеризуется наличием систематической составляющей — в изменении введенных в действие площадей жилых домов присутствует тенденция.
Подбор параметров уравнения регрессии с помощью полиномиальной модели.
Вопрос о выборе кривой — основной при выравнивании ряда. Существует несколько подходов крещению этой задачи, однако все они предполагают знакомство с основными свойствами используемых кривых роста. Поэтому остановимся на характеристике отдельных типов кривых, наиболее часто применяемых на практике. Среди кривых роста I класса прежде всего следует выделить класс полиномов: , где аi(i=0,1,2,3…р) - параметры многочлена t- независимая переменная (время) Для прямой параметры многочлена вычисляются по формулам:
Для параболы:
Для нахождения параметров полинома третьей степени необходимо решить систему из 4х линейных уравнений: Расчет параметров линейной и параболической модели
Линейная модель: y=42.68+0,97t Параболическая модель: y=195,9296+0,97t-0,44t2 Составим вспомогательную таблицу для расчета параметров полиномиальной модели 3 степени.
Согласно МНК, составим систему линейных уравнений Поиск по сайту: |
Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав. Студалл.Орг (0.066 сек.) |