Эконометрический анализ основных числовых характеристик

Введем обозначения: Х1 – удельный вес пашни в с/х угодьях, %;

Х2 – удельный вес лугов и пастбищ, %

У – уровень убыточности продукции животноводства, %

Найдем основные числовые характеристики:

1. Объем выборки – суммарное количество наблюдений: n = 15.

2. Минимальное значение х1 – min х1 = 68,1%

Максимальное значение х1 – max х1 = 94,7%

Значит, удельный вес пашни в с/х угодьях изменяется от 68,1% до 94,7%.

3. min х2 = 9,2%, max х2 = 28,7%.

Значит, удельный вес лугов и пастбищ изменяется от 9,2%, до 28,7%.

4. min у = 15%, max у = 45,6%.

Значит, уровень убыточности продукции животноводства изменяется от 15%% до 45,6%.

5. Среднее значение вычисляется по формуле

Среднее значение удельного веса пашни в с/х угодьях и составляет x1 =80,98%

Среднее значение удельного веса лугов и пастбищ составляет х2 = 17,02%

Среднее значение уровня убыточности продукции животноводства составляет у = 28,2%.

6. Дисперсия вычисляется по формуле

Дисперсия по х1 : D(х1 ) = 58,83;

По х2 : D(х2 ) = 42,45;

По у: D(у) = 92,96.

7. Среднеквадратичное отклонение вычисляется по формуле:

σх1 = 7,67 – значит, среднее отклонение удельного веса пашни в с/х угодьях от среднего значения составляет 7,67%

σх2 = 6,52 – значит, среднее отклонение удельного веса лугов и пастбищ от среднего значения составляет 6,52%

σу = 9,642 – значит, среднее отклонение уровня убыточности продукции животноводства от среднего значения составляет 9,642%.

Эконометрический анализ

По таблице строим корреляционное поле (диаграмму рассеивания). Нанесем точки хi, уi на координатную плоскость.

Точка с координатами (х; у) = (80,98; 17,15) называется центром рассеивания.

По виду корреляционного поля можно предположить, что зависимость между х и у линейная.

Для определения линейной связи найдем коэффициент корреляции.

R =0,776111538

Т. к. в данном случае коэффициент корреляции 0,6 ≤| r | ≤ 0,9, то линейная связь между х и у достаточная.

Попытаемся описать связь между х и у зависимостью у = b0 + b1 x

Параметры b0 и b1 находим по методу наименьших квадратов.

B1 = rху σу / σх =-0,6520, b0 = у – b1 x = 69,9498

Т. к. b1 <0, то зависимость между х и у обратная. Т. е. с ростом удельного веса пашни в с/х угодьях, уровень убыточности продукции животноводства уменьшается.

Проверим значимость коэффициентов bi. Значимость может быть проверена с помощью критерия Стьюдента.

Для коэффициента b0 :

=5,854852846

Значимость t наблюдаемого: α·tнабл = 0,0001, т. е. 0,01%<5%, значит, коэффициент b0 статистически значим.

Для коэффициента b1 :

= -4,437566168

Значимость t наблюдаемого: α·tнабл = 0,0010, т. е. 0,1%<5%,

Значит, коэффициент b1 статистически значим.

Получим модель зависимости уровня убыточности продукции животноводства от удельного веса пашни в с/х угодьях и удельного веса лугов и пастбищ.

У = -0,652х + 69,9498.

После того, как была построена модель, проверяем ее на адекватность.

Разброс данных, объясняемый регрессией:

SSP = 350,083702

Остатки необъясняемые – разброс:

SSЕ = 231,1136313

Общий разброс данных:

SSY = 581,1973333

Для анализа общего качества модели найдем коэффициент детерминации.

R2 = SSR/ SSY = 0,57176059

Разброс данных объясняется: линейной моделью на 57,26% и на 42,74% случайными ошибками ((1 – R2 )·100%).

Качество модели плохое.

Проверим с помощью критерия Фишера. Для проверки найдем величины:

MSR = SSR / R1 = 350,083702 и MSЕ = SSЕ / R2 = 17,77797164.

Вычисляем k1 = 1 и k2 = 14.

Находим наблюдаемое значение критерия Фишера.

Fнабл = MSR / MSE = 19,6919935.

Значимость этого значения: α = 0,000669742, т. е. процент ошибки равен ≈0,067% < 5%.

Следовательно, модель у = -0,652х + 69,9498 считается адекватной с гарантией более 95%.

Найдем прогноз на основании линейной регрессии. Выберем произвольную точку из области прогноза.

X [xmin, xmax ]; хпр = 88

Рассчитываем прогнозируемые значения по модели для всех точек выборки и для точки прогноза.

У(х=88) = у = -0,652х + 69,9498= 12,577

Найдем полуширину доверительного интервала в каждой точке и в точке прогноза.

,

Где σе – среднеквадратическое отклонение выборочных точек от линии регрессии

= 4,216393

Tγ – критическая точка распределения Стьюдента для надежности

γ =0,95 R = 13;

N = 15 – объем выборки;

Сумма знаменателя – ,

Где D(x) – дисперсия выборки,

Хпр – точка прогноза.

Прогнозируемый доверительный интервал для любой точки х:

, где δ для точки прогноза – δ (х=88) = 9,668, т. е. доверительный интервал для хпр составляет от 2,909 до 22,244 с гарантией 95%.

Совокупность доверительных интервалов для всех х из области прогнозов образует доверительную область.

Т. е. при удельном весе пашни в с/х угодьях 1,458%. уровень убыточности продукции животноводства составит от 2,909% до 22,244%.

Найдем эластичность. Для линейной модели эластичность Ех вычисляется по формуле:

Коэффициент эластичности показывает, что при изменении удельного веса пашни в с/х угодьях на 1% уровень убыточности продукции животноводства уменьшится на 4,593%.

Эконометрический анализ

По таблице строим корреляционное поле (диаграмму рассеивания). Нанесем точки хi, уi на координатную плоскость.

Точка с координатами (х; у) = (17,02; 28,2) называется центром рассеивания.

По виду корреляционного поля можно предположить, что зависимость между х и у нелинейная.

Попытаемся описать связь между х и у зависимостью:

Y = a ln x + b.

Перейдем к линейной модели. Делаем линеаризующую подстановку:

U= ln x; V = y.

Для этих данных строим линейную модель:

V = b0 + b1 U.

Для определения линейной связи найдем коэффициент корреляции.

R =0,864

Т. к. в данном случае коэффициент корреляции | r | > 0,9, то линейная связь между U и V сильная.

Попытаемся описать связь между U и V зависимостью

V = b0 + b1 U.

Параметры b0 и b1 находим по методу наименьших квадратов.

B1 = r UV σ V / σ U = 370.76, b0 =... V – b1 U = 3.53.

Т. к. b1 > 0, то зависимость между U и V прямая. Т. е. с ростом удельного веса лугов и пастбищ, уровень убыточности продукции животноводства повышается.

Проверим значимость коэффициентов bi. Значимость может быть проверена с помощью критерия Стьюдента.

Для коэффициента b0 :

=0,845

Значимость t наблюдаемого: α·tнабл = 0,413221639, т. е. 41%>5%,

Значит, коэффициент b0 статистически не значим.

Для коэффициента b1 :

=6,2

Значимость t наблюдаемого: α·tнабл = 3,23039E-05, т. е. ≈0%<5%,

Значит, коэффициент b1 статистически значим.

Получим модель зависимости уровня убыточности продукции животноводства от удельного веса лугов и пастбищ.

V = 370,76U +3,53.

После того, как была построена модель, проверяем ее на адекватность.

Разброс данных, объясняемый регрессией:

SSP = 972,42

Остатки необъясняемые – разброс:

SSЕ = 329,1

Общий разброс данных:

SSY = 1301,51

Для анализа общего качества модели найдем коэффициент детерминации.

R2 = SSR/ SSY = 0.747

Разброс данных объясняется: линейной моделью на 74,7% и на 25,3% случайными ошибками ((1 – R2 )·100%).

Качество модели хорошее.

Проверим с помощью критерия Фишера. Для проверки найдем величины: MSR = SSR / R1 = 972,42 и MSЕ = SSЕ / R2 = 25,3.

Вычисляем k1 = 1 и k2 = 13.

Находим наблюдаемое значение критерия Фишера.

Fнабл = MSR / MSE = 38.41.

Значимость этого значения: α = 3,23Е-05, т. е. процент ошибки равен ≈0% < 5%.

Следовательно, модель V = 370,76U +3,53. считается адекватной с гарантией более 95%.

Т. к. линейная модель адекватна, то и соответствующая нелинейная модель то же адекватна. Находим параметры исходной нелинейной модели a и b. Вид нелинейной функции:

Y = 370,76/x +3,53.

Найдем прогноз на основании линейной регрессии. Выберем произвольную точку из области прогноза.

X [xmin, xmax ];

Хпр = 17,02, соответственно Uпр = 1/17,02 = 0,06

Рассчитываем прогнозируемые значения по модели для всех точек выборки и для точки прогноза.

V(х=17,02) = 370,76U +3,53. = 25,32,

У(х=17,02) = 370,76/x +3,53 = 25,32.

Т. к. y(x) = V(U), то полуширина доверительного интервала и доверительный интервал будет равен как для y так и для V.

Найдем полуширину доверительного интервала в каждой точке и в точке прогноза.

,

Прогнозируемый доверительный интервал для любой точки х:

, где δ для точки прогноза – δ (х=17,02) = 11,27 т. е. доверительный интервал для хпр составляет от 8,50 до 12,87 с гарантией 95%.

Совокупность доверительных интервалов для всех х из области прогнозов образует доверительную область.

Т. е. при удельном весе лугов и пастбищ 17,02% уровень убыточности продукции животноводства составит от 14,05% до 36,59%.

Найдем эластичность. Для линейной модели эластичность Ех вычисляется по формуле:

Коэффициент эластичности показывает, что при изменении удельного веса лугов и пастбищ на 1% уровень убыточности продукции животноводства изменяется на 0,86%.

Эконометрический анализ

Прежде, чем строить модель, проверим факторы на коллинеарность. По исходным данным строим корреляционную матрицу. Коэффициент корреляции между х1 и х2 равен:

Rх1х2 =-0,79 < 0,95, следовательно х1 и х2 неколлинеарны.

Определим связаны ли х1 , х2 и у между собой. Для определения тесноты линейной связи найдем коэффициент корреляции.

R = 0,92

Попытаемся описать связь между х1 , х2 и у зависимостью

У = b0 + b1 ∙х1 + b2 ∙х2

Параметры b0 , b1 и b2 находим по методу наименьших квадратов.

B0 = -19.995, b1 = 0.72, b2 = -0.6

Проверим значимость коэффициентов bi. Значимость может быть проверена с помощью критерия Стьюдента.

Для коэффициента b0 :

= -0,87

Значимость t наблюдаемого: α·tнабл = 0,40, т. е. 40% > 5%,

Значит, коэффициент b0 статистически не значим.

Для коэффициента b1 :

= 3,04

Значимость t наблюдаемого: α·tнабл = 0,01, т. е. 1% < 5%,

Значит, коэффициент b1 статистически значим.

Для коэффициента b2 :

= -2,11

Значимость t наблюдаемого: α·tнабл = 0,06, т. е. 6% > 5%,

Значит, коэффициент b2 статистически не значим.

Получим модель зависимости уровня убыточности продукции животноводства от удельного веса пашни в с/х угодьях и и удельного веса лугов и пастбищ.

У = -19,995 + 0,72∙х1 – 0,6∙х2

После того, как была построена модель, проверяем ее на адекватность.

Разброс данных, объясняемый регрессией:

SSP = 1090,3

Остатки необъясняемые – разброс:

SSЕ = 211,17

Общий разброс данных:

SSY = 1301,5

Для анализа общего качества модели найдем коэффициент детерминации.

R2 = SSR/ SSY = 0.84

Разброс данных объясняется: линейной моделью на 84% и на 16% случайными ошибками ((1 – R2 )·100%).

Качество модели хорошее.

Проверим с помощью критерия Фишера. Для проверки найдем величины: MSR = SSR / R1 = 545,17 и MSЕ = SSЕ / R2 = 17,6.

Вычисляем k1 = 2 и k2 = 12.

Находим наблюдаемое значение критерия Фишера.

Fнабл = MSR / MSE = 30.98.

Значимость этого значения: α = 1,82E-05, т. е. процент ошибки равен ≈0% < 5%.

Следовательно, модель

У = -19,995 + 0,72∙х1 – 0,6 ∙х2 – считается адекватной с гарантией более 95%.

Найдем прогноз на основании линейной регрессии. Выберем произвольную точку из области прогноза.

X1,2 [xmin, xmax ]; хпр = (80,98; 17,02)

Рассчитываем прогнозируемые значения по модели для всех точек выборки и для точки прогноза.

У(80,98;17,02) = у = -19,995 + 0,72∙80,98 – 0,6 ∙17,02=28,17

Найдем коэффициенты частичной эластичности Ех1 , Ех2 .

Для линейной модели эластичность Ех вычисляется по формуле:

Коэффициент эластичности показывает, что при увеличении удельного веса пашни в с/х угодьях на 1% и удельного веса лугов и пастбищ на 80,98% уровень убыточности продукции животноводства увеличится на 2,064%

Коэффициент эластичности показывает, что при увеличении производительности труда на 1% и удельного веса пашни в с/х угодьях на 17,02% уровень убыточности продукции животноводства уменьшится на 0,354%.


Зараз ви читаєте: Эконометрический анализ основных числовых характеристик