Cтатистическая надежность регрессионного моделирования


Вариант 4-1

1. Рассчитайте параметры уравнения линейной регрессии

2. Оцените тесноту связи с помощью показателей корреляции и детерминации

3. Определите среднюю ошибку аппроксимации. Сделайте выводы

4. Оцените статистическую надежность регрессионного моделирования с помощью F-критерия Фишера и t-критерия Стьюдента

5. Оцените полученные результаты, оформите выводы

№ набл.

Район

Средний размер назначенных ежемесячных пенсий, тыс. руб., y

Прожиточный минимум в среднем на одного пенсионера в месяц, тыс. руб., x

1

Брянская обл.

240

178

2

Владимирская обл.

226

202

3

Ивановская обл.

221

197

4

Калужская обл.

226

201

5

Костромская обл.

220

189

6

Г. Моска

250

302

7

Москавская обл.

237

215

8

Орловская обл.

232

166

9

Рязанская обл.

215

199

10

Смоленская обл.

220

180

11

Тверская обл.

222

181

12

Тульская обл.

231

186

13

Ярославская обл.

229

250

Fтабл.=4,84( α =0,05)

=9,29

=34,75

1. Расчет параметров уравнения линейной регрессии по данным таблицы:

Решение:

1. Уравнение линейной регрессии имеет следующий вид:

№ наблюдения

Х

Y

X2

X·Y

Yx

Y – yx

Ai

1

178

240

31684

42720

222,51

17,49

7,29

2

202

226

40804

45652

227,67

-1,67

0,74

3

197

221

38809

43537

226,59

-5,59

2,53

4

201

226

40401

45426

227,45

-1,45

0,64

5

189

220

35721

41580

224,87

-4,87

2,22

6

302

250

91204

75500

249,17

0,83

0,33

7

215

237

46225

50955

230,46

6,54

2,76

8

166

232

27556

38512

219,93

12,07

5,20

9

199

215

39601

42785

227,02

-12,02

5,59

10

180

220

32400

39600

222,94

-2,94

1,34

11

181

222

32761

40182

223,15

-1,15

0,52

12

186

231

34596

42966

224,23

6,77

2,93

13

250

229

62500

57250

237,99

-8,99

3,93

Сумма

2646

2969

554262

606665

Ср. значение

203,54

228,38

42635,54

46666,54

2,77

Найдем b:

Тогда

Уравнение линейной регрессии имеет вид:

ŷx =184,239+0,215x

2. а) Рассчитываем коэффициент корреляции:

По формуле:

Rxy = b – = 0,21 =0,78

С помощью статистической функции КОРРЕЛ-r =0,78

Связь между переменными x и y прямая, средняя, близкая к сильной, т. е. величина среднемесячной пенсии в значительной мере зависит от прожиточного минимума в среднем на одного пенсионера в месяц

Б) Для определения средней ошибки аппроксимации рассчитываем столбцы

Yx, y – yx, Ai :

Ai = y – yx * 100, А = 1/n∑ni=1 Ai

Получаем значение средней ошибки аппроксимации

А = 2,77%

Величина ошибки аппроксимации говорит о хорошем качестве модели.

В) Величина коэффициента детерминации получена с помощью функции

ЛИНЕЙН R2 = rxy2 = 0,61,

То есть в 61% случаев изменения среднемесячного прожиточного минимума на одного пенсионера приводят к изменению среднемесячной пенсии. Другими словами – точность подбора регрессии 61 % – средняя.

3. Оценка статистической значимости

А) по критерию Фишера:

1. Выдвигаем нулевую гипотезу о статистической незначимости параметров регрессии и показателя корреляции а = b = rxy =0;

2. Фактическое значение критерия получено из функции ЛИНЕЙН

∑(ỹx-y)²/m r²xy0,61

Fфакт= = (n-2) = (13-2) = 1,56*11 = 17,2;

∑(y-ỹ)² /(n-m-1) 1-r²xy 1-0,61

3. Fтабл =4,84

4. Сравниваем фактическое и табличное значения критерия Fфакт> Fтабл, т. е.нулевую гипотезу отклоняем и делаем вывод о статистической значимости и надежности полученной модели.

Б) по критерию Стьюдента:

1. Выдвигаем гипотезу о статистически незначимом отличии показателей от нуля: a = b = r²xy = 0;

2. Табличное значение t – критерия зависит от числа степеней свободы и заданного уровня значимости α. Уровень значимости – это вероятность отвергнуть правильную гипотезу.

Rxy √(n-m)

T=

√(1- r2xy )

Где n – количество наблюдений; m – количество факторов.

T= 0,78√(13-2)= 2,59=4,18

√(1-0,61)0,62

3. Фактические значения t-критерия рассчитываются отдельно для каждого параметра модели. С этой целью сначала определяются случайные ошибки параметров mа, mb, mrxy.

Mа=Sост √∑х2 = 1,65;

Mb= Sост = 0,004

Nσх σх√n

Mrxy= √(1- r2xy ) = 0,062

N-m-1

Где Sост=√(∑ (y – yx ) ) = 5 = 0,5

N-m-110

Рассчитываем фактические значения t – критерия:

Tфа =a/ mа =111,66

Tфb =b/ mb =53,75

Tфrxy = rxy /mrxy = 12,58

Tфа>tтабл ; tфb>tтабл ; tфrxy >tтабл. Нулевую гипотезу отклоняем, параметры a, b, rxy – не случайно отличаются от нуля и являются статистически значимыми и надежными.



Зараз ви читаєте: Cтатистическая надежность регрессионного моделирования