По 30 заводам, выпускающим продукцию A, изучается зависимость потребления электроэнергии y (тыс. кВт/ч) от производства продукции – x1 (тыс. ед.) и уровня механизации – x2 (%):
Признак
Среднее значение
Среднее квадратическое отклонение
Парный коэффициент корреляции
y
1000
27
ryx1=0,77
x1
420
45
ryx2=0,43
x2
41,5
18
rx1x2=0,38
Задание
Постройте уравнение множественной регрессии в стандартизованном и натуральном масштабе.
Определите показатели частной и множественной корреляции.
Найдите частные коэффициенты эластичности и сравните их с
b-коэффициентами.
Рассчитайте общий и частные критерии Фишера и сделайте выводы.
Частные коэффициенты корреляции.
Коэффициент частной корреляции отличается от простого коэффициента линейной парной корреляции тем, что он измеряет парную корреляцию соответствующих признаков (y и xi) при условии, что влияние на них остальных факторов (xj) устранено.
На основании частных коэффициентов можно сделать вывод об обоснованности включения переменных в регрессионную модель. Если значение коэффициента мало или он незначим, то это означает, что связь между данным фактором и результативной переменной либо очень слаба, либо вовсе отсутствует, поэтому фактор можно исключить из модели.
Теснота связи сильная
Теснота связи низкая.
Теснота связи низкая. Межфакторная связь слабая. Модель регрессии в стандартном масштабе.
Искомое уравнение в стандартизованном масштабе: ty=β1tx1+β2tx2
Расчет β-коэффициентов можно выполнить и по формулам:
Стандартизированная форма уравнения регрессии имеет вид:
y0 = 0.709x1 + 0.161x2
Найденные из данной системы β–коэффициенты позволяют определить значения коэффициентов в регрессии в естественном масштабе по формулам:
a = 1000-0.425 • 420-0.241 • 41.5 = 811.341
Y = 811.341 + 0.425x1 + 0.241x2 Частные коэффициенты эластичности.
С целью расширения возможностей содержательного анализа модели регрессии используются частные коэффициенты эластичности, которые определяются по формуле:
Частный коэффициент эластичности показывает, насколько процентов в среднем изменяется признак-результат у с увеличением признака-фактора хj на 1% от своего среднего уровня при фиксированном положении других факторов модели.
Частный коэффициент эластичности |E1| < 1. Следовательно, его влияние на результативный признак Y незначительно.
Частный коэффициент эластичности |E2| < 1. Следовательно, его влияние на результативный признак Y незначительно.
Расчёт коэффициента корреляции выполним, используя известные значения линейных коэффициентов парной корреляции и β-коэффициентов.
Коэффициент детерминации
R2 = 0.615 Проверка общего качества уравнения множественной регрессии.
Оценка значимости уравнения множественной регрессии осуществляется путем проверки гипотезы о равенстве нулю коэффициент детерминации рассчитанного по данным генеральной совокупности: R2 или b1 = b2 =... = bm = 0 (гипотеза о незначимости уравнения регрессии, рассчитанного по данным генеральной совокупности).
Для ее проверки используют F-критерий Фишера.
При этом вычисляют фактическое (наблюдаемое) значение F-критерия, через коэффициент детерминации R2, рассчитанный по данным конкретного наблюдения.
По таблицам распределения Фишера-Снедоккора находят критическое значение F-критерия (Fкр). Для этого задаются уровнем значимости α (обычно его берут равным 0,05) и двумя числами степеней свободы k1=m и k2=n-m-1.
2) F-статистика. Критерий Фишера.
R2 = 0.61
Чем ближе этот коэффициент к единице, тем больше уравнение регрессии объясняет поведение Y.
Более объективной оценкой является скорректированный коэффициент детерминации:
Добавление в модель новых объясняющих переменных осуществляется до тех пор, пока растет скорректированный коэффициент детерминации.
Проверим гипотезу об общей значимости - гипотезу об одновременном равенстве нулю всех коэффициентов регрессии при объясняющих переменных:
H0: R2 = 0; β1 = β2 = ... = βm = 0.
H1: R2 ≠ 0.
Проверка этой гипотезы осуществляется с помощью F-статистики распределения Фишера (правосторонняя проверка).
Если F < Fkp = Fα ; n-m-1, то нет оснований для отклонения гипотезы H0.
Табличное значение при степенях свободы k1 = 2 и k2 = n-m-1 = 30 - 2 - 1 = 27, Fkp(2;27) = 3.37
Поскольку фактическое значение F > Fkp, то коэффициент детерминации статистически значим и уравнение регрессии статистически надежно Оценка значимости дополнительного включения фактора (частный F-критерий).
Необходимость такой оценки связана с тем, что не каждый фактор, вошедший в модель, может существенно увеличить долю объясненной вариации результативного признака. Это может быть связано с последовательностью вводимых факторов (т. к. существует корреляция между самими факторами).
Мерой оценки значимости улучшения качества модели, после включения в нее фактора хj, служит частный F-критерий – Fxj:
где m – число оцениваемых параметров.
В числителе - прирост доли вариации у за счет дополнительно включенного в модель фактора хj.
Если наблюдаемое значение Fxj больше Fkp, то дополнительное введение фактора xj в модель статистически оправдано.
Оценим с помощью частного F-критерия:
1) целесообразность включения в модель регрессии факторов х1 после введения хj (Fx1).
Определим наблюдаемое значение частного F-критерия:
R2(x2,xn) = r2(x2) = 0.432 = 0.185
Fkp(k1=1;k2=27) = 4.23
Сравним наблюдаемое значение частного F-критерия с критическим:
Fx1>4.23, следовательно, фактор х1 целесообразно включать в модель после введения факторов хj.
2) целесообразность включения в модель регрессии факторов х2 после введения хj (Fx2).
Определим наблюдаемое значение частного F-критерия: