birmaga.ru
добавить свой файл

1

2. Линейная множественная регрессия



Краткая теоретическая справка по теме


Для оценки параметров уравнения линейной множественной регрессии



(2.1)

применяют метод наименьших квадратов – строится система нормальных уравнений, решение которой позволяет получить оценки параметров регрессии:



(2.2)

Другой вид уравнения множественной регрессии – уравнение регрессии в стандартизированном масштабе:

,

(2.3)

где , – стандартизированные переменные;

– стандартизированные коэффициенты регрессии.

К уравнению множественной регрессии в стандартизированном масштабе применим МНК, что приводит к решению системы уравнений:



(2.4)

Для двухфакторной модели линейной регрессии расчет β-коэффициентов можно выполнить по формулам (следуют из решения системы (2.4)):


,

(2.5)

Связь коэффициентов множественной регрессии со стандартизированными коэффициентами описывается соотношением:

, .

(2.6)

При этом: .

Тесноту совместного влияния факторов на результат оценивает коэффициент множественной корреляции, который можно определить по формуле:

,

(2.7)

где – стандартизированные коэффициенты регрессии,

– парные коэффициенты корреляции между переменными y и .

Качество построенной модели в целом оценивает коэффициент (индекс) детерминации. Коэффициент множественной детерминации рассчитывается как квадрат индекса множественной корреляции:


.

(2.8)

Частные коэффициенты корреляции характеризуют тесноту связи между результатом и соответствующим фактором при устранении влияния (при закреплении их влияния на постоянном уровне) других факторов, включенных в уравнение регрессии. Для двухфакторной модели их можно определить по формулам:

; ;

.

(2.9)

При построении уравнения множественной регрессии может возникнуть проблема мультиколлениарности факторов (тесная линейная зависимость более двух факторов). Считается, что две переменные явно коллинеарны, если .

Статистическая значимость уравнения множественной регрессии в целом оценивается с помощью общего F-критерия Фишера:

,

(2.10)

где m – число факторов в линейном уравнении регрессии;

n – число наблюдений.

Вывод о статистической значимости уравнения множественной регрессии в целом и коэффициента множественной детерминации можно сделать, если наблюдаемое значение критерия больше табличного, найденного для заданного уровня значимости (например,  = 0,05) и степенях свободы , .


Частный F-критерий оценивает статистическую значимость присутствия каждого из факторов в уравнении множественной регрессии. Для двухфакторной модели оценивает целесообразность включения в уравнение фактора после того, как в него был включен фактор ; оценивает целесообразность включения в уравнение фактора после того, как в него был включен фактор :

, ,

(2.11)

где m – число факторов в линейном уравнении регрессии;

n – число наблюдений.

Фактическое значение частного F-критерия сравнивается с табличным при 5%-ном или 1%-ном уровне значимости и числе степеней свободы: , . Если фактическое значение превышает табличное, то дополнительное включение соответствующего фактора в модель статистически оправдано, в противном случае фактор в модель включать нецелесообразно.