АвтоАвтоматизацияАрхитектураАстрономияАудитБиологияБухгалтерияВоенное делоГенетикаГеографияГеологияГосударствоДомДругоеЖурналистика и СМИИзобретательствоИностранные языкиИнформатикаИскусствоИсторияКомпьютерыКулинарияКультураЛексикологияЛитератураЛогикаМаркетингМатематикаМашиностроениеМедицинаМенеджментМеталлы и СваркаМеханикаМузыкаНаселениеОбразованиеОхрана безопасности жизниОхрана ТрудаПедагогикаПолитикаПравоПриборостроениеПрограммированиеПроизводствоПромышленностьПсихологияРадиоРегилияСвязьСоциологияСпортСтандартизацияСтроительствоТехнологииТорговляТуризмФизикаФизиологияФилософияФинансыХимияХозяйствоЦеннообразованиеЧерчениеЭкологияЭконометрикаЭкономикаЭлектроникаЮриспунденкция

Многомерная обработка данных с использованием интегрированной системы Statistica. Корреляционный анализ данных

Читайте также:
  1. B) должен хорошо знать только физико-химические методы анализа
  2. ERP (Enterprise Resource Planning)- системы управления ресурсами предприятия.
  3. I. Анализ социального окружения
  4. II. ИСТОРИЯ НАШЕЙ КАНАЛИЗАЦИИ
  5. II. Расчет силы сопротивления движению поезда на каждом элементе профиля пути для всех заданных скоростях движения.
  6. III. Психологический анализ деятельности
  7. III. СИСТЕМЫ УБЕЖДЕНИЙ И ГЛУБИННЫЕ УБЕЖДЕНИЯ
  8. III. Требования к организации системы обращения с медицинскими отходами
  9. IV. Расчет механической мощности, реализуемой электровозом при движении с установившимися скоростями на заданных элементах профиля пути.
  10. IV. Схема анализа внеклассного мероприятия
  11. IX. ЛЕКСИЧЕСКИЙ АНАЛИЗ
  12. L.1.1. Однокомпонентные системы.

Цель: Изучить возможности ППП Statistica при установлении зависимости между переменными и оценке характера зависимости. Провести графический анализ данных (общее и контрольное задание).

 

Совокупность методов оценки корреляционных характеристик и проверка статистических гипотез о них по выборочным данным называется корреляционным анализом. В корреляционном анализе используются следующие основные приемы:

1) построение корреляционного поля (диаграммы рассеяния) для двух экономических показателей или двумерных сечений;

2) определение выборочных коэффициентов корреляции или составление корреляционных матриц;

3) проверка статистических гипотез о значимости связи между показателями.

Коэффициент корреляции является мерой линейной зависимости двух величин. Чем больше коэффициент корреляции по модулю, тем сильнее линейная зависимость. Значение коэффициента корреляции лежит в интервале [-1; 1].

Ориентировочно определить значение коэффициента корреляции можно, анализируя диаграмму рассеяния. Чем теснее расположены точки относительно некоторой прямой (существует линейная тенденция), тем больше по абсолютной величине он стремится к единице, и наоборот, чем более расплывчата диаграмм рассеяния, тем ближе к нулю коэффициент корреляции.

Пример:

Рассмотрим построение корреляционной матрицы на примере анализа показателей хозяйственной деятельности 25 предприятий отрасли. Исследуется зависимость выработки продукции на 1 работника (у), тыс.руб. от ввода в действие основных фондов в % от стоимости фондов на конец года (x1), от удельного веса (%) рабочих высокой квалификации в общей численности рабочих (x2), среднего возраста работников (лет) (x3). Проведем графический анализ полученной матрицы (данные по предприятиям приведены в таблице на рис. 5).

Рисунок 5

Шаг1. Запустите программу Statistica. Создайте таблицу данных. Переключитесь в модуль Статистика/Основные статистики.

Шаг 2. В стартовой панели модуля Основные статистики выберите пункт Correlation matrices (Корреляционные матрицы). Откроется окно Product-Moment Correlation (Корреляция Пирсона) (рис.6)

Нажмите на кнопку Two lists (Два списка), откроется окно выбора переменных. Выберите переменные 2-4 в Fist variables list (Первый список и переменную 1 в Second variables list (Второй список переменных). Подсчитаем корреляции между переменной 1 (результат) и переменными 2-4 (факторами). Нажмите в окне кнопку ОК, вернетесь в предыдущее окно.

Шаг 3. В окне Product-Moment Correlation нажмите кнопку Summary. На экране вы увидите корреляционную матрицу (рис. 7)

 

 

 

 

В этой матрице имеется только один столбец, так как во втором списке выбрана одна зависимая переменная. Красным цветом автоматически выделены коэффициенты, значимые на уровне р<0,05. Именно на эти коэффициенты следует обратить наибольшее внимание. Грубо говоря, зависимость между переменными с выделенными красным цветом коэффициентами корреляции наиболее значимая. В нашем случае переменная 1 (Выработка) чуть более зависима от переменной 2 (Фонды). Хотя от переменной 3 (Рабочие) установлена также тесная зависимость, чего нельзя сказать о переменной 4 (Средний возраст). Все три коэффициента корреляции положительны, значит делаем вывод, что при увеличении каждой из переменных 2-4 увеличивается переменная 1. Просмотрим зависимость между переменными 1 и 2, 1 и 3 графически.

Шаг 4. В вернитесь в окно Product-Moment Correlation. Нажмите на кнопку Two lists. Откроется окно выбора переменных. Выберите в первом списке переменную 2, во втором переменную 1 (связь 2-1) и нажмите кнопку ОК. Перейдите в окне Product-Moment Correlation к вкладке Advanced/plot. Нажмите кнопку 2D scatterplot (2D диаграмма рассеяния). Появится окно диаграммы рассеяния (рис.8) для выбранных переменных.

 

 

 

Из графика отчетливо видно, что зависимость линейная, за исключением некоторых точек, отдаленных от линии. На графике системой дана лучшая прямая. При смене коэффициента наклона подгонка будет хуже. Постройте графики для двух других переменных.

Для случая связи 4-1 график выглядит следующим образом (рис. 9).

 

Рисунок 9

 

Зависимость явно не линейная. С помощью специального инструмента дополнительно исследуем эту связь.

Шаг 5. Выберите инструмент Кисть, щелкнув на панели инструментов по кнопке Откроется панель Brushing (Кисть). На панели сделайте установки как показано на рис. 10. и пометьте кистью все точки, которые выходят за диапазон пунктирной линии. Далее нажмите кнопку Update, на экране появятся номера предприятий, к которым относятся выделенные значения (рис.11).

 

Эти случаи требуют дополнительного исследования. Например, исключение их (всех или самых отдаленных) из рассмотрения при анализе может привести к значительному изменению исследуемого коэффициента корреляции.

 

Рисунок 11

Шаг 6. Вернитесь в окно Product-Moment Correlation. Щелкните по кнопке One variable list (Один список переменных).Выберите переменные 1, 2-4. Нажмите кнопку ОК. Далее в окне Product-Moment Correlation нажмите кнопку Scatterplot matrix. В окне выбора переменных выберите все переменные. Нажмите ОК. На экране появится корреляционная матрица в графическом виде, позволяющая оценить линейные связи визуально (рис.12).


1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | 10 | 11 | 12 | 13 | 14 | 15 | 16 | 17 | 18 | 19 | 20 | 21 |

Поиск по сайту:



Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав. Студалл.Орг (0.007 сек.)