воскресенье, 3 апреля 2011 г.

регрессионный анализ

1. Цель работы: изучить основные принципы регрессионного анализа, его предпосылки и предположения, построить математическую модель (уравнение регрессии) и оценить ее адекватность.


2. Ход работы

Рассматриваются следующие показатели:

Y1-призводительность труда;

Построим модель вида Y1=F(X4, X5, X6) с помощью регрессионного анализа в ППП «STATISTICA»



X4-трудемкость единицы продукции;

X5- удельный вес рабочих в составе предприятия;

X6- удельный вес покупных изделий.

2.1 Получите таблицу результатов регрессионного анализа и проанализируйте все ее параметры



Рисунок 2.1 - Таблица результатов построения модели с использованием многомерного регрессионного анализа

Табличный критерий Фишера F≈2. Рассчитанный в лабораторной работе F≈6.38. Таким образом, можно утверждать, что модель не является хорошей, исходя из данного критерия.

Коэффициент детерминации R2=0,23 или 23%. Коэффициент детерминации указывает на то, что независимые переменные Х (X4 – трудоемкость единицы продукции; X5 – удельный вес рабочих в составе предприятия; X6 – удельный вес покупных изделий) объясняют 23,0% производительность труда.

Стандартная ошибка в оценке производительность труда, Se =2,28 говорит о том, что фактиче¬ская производительность труда, как правило, отклоня¬ются от прогнозируемой не более чем на 2.28(речь идет о стандарт¬ном отклонении).

На основании анализа данной таблицы предварительно можно сделать вывод о нецелесообразности использования данной модели, из-за ее невысокой адекватности.



2.2 На закладке Quick войдите в опцию Итоговый результат регрессии- Summary: Regression results (рисунок 5.3). Проанализируйте данные таблицы.





Рисунок 2.2 - Результаты регрессионного анализа

На основании данных таблицы построим уравнение регрессии:

Y1=19.2935-15.9047*X4-7.5376*X5-3.3076*X6

Коэффициенты X5,X6 в данном уравнении не значимы.

2.3 Просмотрите и проанализируйте основные таблицы регрессионного анализа.



Рисунок 2.3 - Дисперсионная таблица

На основании этой таблицы можно судить о значимости дисперсии относительно регрессии и дисперсии остатков. Их отношение показывает коэффициент F. Если сравнивать значение с табличным, то оно окажется приблизительно в 3 раза больше, что не позволяет говорить о высокой значимости дисперсии относительно регрессии и дисперсии остатков.



Рисунок 2.4 - Ковариационная матрица

Ковариационная матрица показывает наличие линейной статистической связи между входными переменными. Ковариация вне диагонали не стремится к нулю, что дает возможность утверждать о наличии широких доверительных интервалов, а также о ковариации между коэффициентами.



Рисунок 2.5 – Current sweep matrix

Матрица показывает статистическую связь между всеми переменными (коэффициентами корреляции). На главной диагонали коэффициенты стремятся к единице, а вне диагонали стремятся к нулю. Можно сделать вывод о достаточно сильной связи между коэффициентами корреляции. Анализ таблицы показывает, что между Х5 и Х4 имеет место достаточно сильная связь. Между Х5 и Х6 – так же сильная связь. Эта связь может привести к плохой обусловленности информационной матрицы ХTX.





Рисунок 2.6 – Частный коэффициент корреляции

Частный коэффициент корреляции показывает линейную связь между переменными без учета влияния промежуточных вычислений. Так, например, Х4 связан с Y без учета влияния Х5 и Х6, значения которых равны -0,157 и -0,161 соответственно. Далее, Х5 связан с Y без учета влияния Х4 и Х6 значения которых равны -0,499 и -0,161 соответственно.

2.4 Выполните проверку адекватности модели (с помощью анализа остатков).

Таблица 2.1 - Остатки и предсказания

Комментариев нет:

Отправить комментарий