Парная регрессия

Контрольная работа

По теме: “Парная линейная регрессия”

Данные, характеризующие прибыль торговой компании “Все для себя” за первые 10 месяцев 2004 года (в тыс. руб.), даны в следующей таблице:

ЯнварьФевральМартАпрельМайИюньИюльАвгустСентябрьОктябрь
367418412470485470525568538558

В контрольной работе с использованием табличного процессора Ехсе l необходимо выполнить следующие вычисления и построения:

1. Построить диаграмму рассеяния.

2. Убедится в наличии тенденции (тренда) в заданных значениях прибыли фирмы и возможности принятия гипотезы о линейном тренде.

3. Построить линейную парную регрессию (регрессию вида ). Вычисление коэффициентов b 0 , b 1 выполнить методом наименьших квадратов.

4. Нанести график регрессии на диаграмму рассеяния.

5. Вычислить значения статистики F и коэффициента детерминации R 2 . Проверить гипотезу о значимости построенного уравнения регрессии.

6. Вычислить выборочный коэффициент корреляции и проверить гипотезу о ненулевом его значении.

7. Вычислить оценку дисперсии случайной составляющей эконометрической модели.

8. Проверить гипотезы о значимости вычисленных коэффициентов b 0 , b 1 .

9. Построить доверительные интервалы для коэффициентов b 0 , b 1 .

10. Построить доверительные интервалы для дисперсии случайной составляющей эконометрической модели.

11. Построить доверительную область для условного математического ожидания М()( по оси Х откладывать месяцы январь – декабрь). Нанести границы этой области на диаграмму рассеяния.

12. С помощью линейной парной регрессии сделать прогноз величины прибыли на ноябрь и декабрь месяц и нанести эти значения на диаграмму рассеяния. Сопоставить эти значения с границами доверительной области для условного математического ожидания М( ) и сделать вывод о точности прогнозирования с помощью построенной регрессионной модели.

Решение.

Используя исходные данные, строим диаграмму рассеяния:

На основе анализа диаграммы рассеяния убеждаемся в наличии тенденции увеличения прибыли фирмы и выдвигаем гипотезу о линейном тренде.

Полагаем, что связь между факторами Х и У может быть описана линейной функцией. Решение задачи нахождения коэффициентов b 0 , b 1 основывается на применении метода наименьших квадратов исводится к решению системы двух линейных уравнений с двумя неизвестными b 0 , b 1 :

B 0 n + b 1 Уxi = Уyi,

B 0 Уxi + b 1 Уxi2 = Уxi yi.

Составляем вспомогательную таблицу:

ХYX2ХуY2
113671367134689
224184836174724
3341291236169744
44470161880220900
55485252425235225
66470362820220900
77525493675275625
88568644544322624
99538814842289444
10105581005580311364
Сумма554811385282052355239

Для нашей задачи система имеет вид:

Решение этой системы можно получить по правилу Крамера:

Получаем:

, .

Таким образом, искомое уравнение регрессии имеет вид:

Y =364,8 + 21,145x.

4. Нанесем график регрессии на диаграмму рассеяния.

5. Вычислим значения статистики F и коэффициента детерминации R 2 . Коэффициент детерминации рассчитаем по формуле R2 = rxy2 = 0,9522 = 0,907. Проверим адекватность модели (уравнения регрессии) в целом с помощью F-критерия. Рассчитаем значение статистики F через коэффициент детерминации R2 по формуле:

Получаем: . Зададим уровень значимости б =0,01, по таблице находим квантиль распределения Фишера F0,01;1;8 = 11,26, где 1 – число степеней свободы.

Fфакт. > F0,01;1;8 , т. к. 78,098 > 11,26.

Следовательно, делаем вывод о значимости уравнения регрессии при 99% – м уровне значимости.

6. Вычислим выборочный коэффициент корреляции и проверим гипотезу о ненулевом его значении.

Рассчитаем выборочный коэффициент корреляции по формуле:

Получаем:

Проверка существенности отличия коэффициента корреляции от нуля проводится по схеме:если , то гипотеза о существенном отличии коэффициента корреляции от нуля принимается, в противном случае отвергается.

Здесь t1-б/2,n-2 – квантиль распределения Стьюдента, б – уровень значимости или уровень доверия, n – число наблюдений, (n-2) – число степеней свободы. Значение б задается. Примем б = 0,05, тогда t1-б/2,n-2 = t0,975,8 = 2,37. Получаем:

.

Следовательно, коэффициент корреляции существенно отличается от нуля и существует сильная линейная связь между х и у.

С использованием табличного процессора Ехсеl проведем регрессионную статистику:

Вывод итогов:

Регрессионная статистика
Множественный R0,952409
R-квадрат0,907083
Нормированный R-квадрат0,895468
Стандартная ошибка21,7332
Наблюдения10
Дисперсионный анализ
DfSSMSFЗначимость F
Регрессия136888,24536888,2578,098162,119E-05
Остаток83778,6545472,3318
Итого940666,9
Коэфф.Станд. ошибкаT-статистикаP-ЗначениеНижние 95%Верхние 95%
Y-пересечение364,814,84659924,571288,04E-09330,56368399,0363
Переменная X 121,145452,39274628,8373162,12E-0515,62777226,66314

Вычисленные значения коэффициентов b 0 , b 1 , значения статистики F, коэффициента детерминации R 2 выборочного коэффициента корреляции rxy совпадают с выделенными в таблице.

7. Оценка дисперсии случайной составляющей эконометрической модели вычисляется по формуле .

Используя результаты регрессионной статистики, получаем:

.

8. Проверим значимость вычисленных коэффициентов b 0 , b 1 по t-критерию Стьюдента. Для этого проверяем выполнение неравенств:

и ,

Где

, , , .

Используем результаты регрессионной статистики:

КоэффициентыСтандартная ошибкаT-статистикаP-ЗначениеНижние 95%Верхние 95%
Y-пересечение364,814,84659924,571288,04E-09330,56368399,0363
Переменная X 121,145452,39274628,8373162,12E-0515,62777226,66314

Получаем: ; Примем б = 0,05, тогда t1-б/2,n-2 = t0,975,8 = 2,37.

Так как и , делаем вывод о значимости коэффициентов линейного уравнения регрессии.

9. Доверительные интервалы для коэффициентов b 0 , b 1 получаем с помощью результатов регрессионной статистики.

Доверительный интервал для коэффициента b 0 уравнения регрессии:

Доверительный интервал для коэффициента b 1 уравнения регрессии:

10. Построим доверительный интервал для дисперсии случайной составляющей эконометрической модели по формуле:

.

Примем б = 0,05, тогда по таблице для 10-элементной выборки q = 0,65.

Получаем:

,

.

11. Построим доверительную область для условного математического ожидания М().

Доверительные интервалы для уравнения линейной регрессии: находятся по формуле:

Где соответственно верхняя и нижняя границы доверительного интервала; Значение независимой переменной для которого определяется доверительный интервал, Квантиль распределения Стьюдента, Доверительная вероятность, (n-2) – число степеней свободы;

Рассмотрим уравнение: y =364,8 + 21,145x. Пусть тогда . Зная и , заполним таблицу:

1385,9520,254,634377,327394,564
2407,0912,255,215397,391416,791
3428,246,255,738417,564438,908
4449,382,256,217437,819460,945
5470,530,256,661458,138482,917
6491,670,257,078478,508504,838
7512,822,257,471498,921526,715
8533,966,257,845519,372548,556
9555,1112,258,202539,854570,365
10576,2520,258,544560,363592,146
Сумма82,5
11597,430,258,873580,897613,903
12618,5542,259,190601,453635,638

График уравнения регрессии, доверительная полоса, диаграмма рассеяния:

12. С помощью линейной парной регрессии сделаем прогноз величины прибыли на ноябрь и декабрь месяц:

597,4, 618,55.

Нанесем эти значения на диаграмму рассеяния.

Эти значения сопоставимы с границами доверительной области для условного математического ожидания М( ).

Точность прогнозирования: с вероятностью 0,95 прибыль в ноябре находится в интервале (487,292; 515,508); прибыль в декабре находится в интервале (497,152; 526,376).


Зараз ви читаєте: Парная регрессия