Коэффициент множественной корреляции

редактировать

В статистике, то коэффициент множественной корреляции является мерой того, насколько хорошо данная переменная может быть предсказана с использованием линейной функции набора других переменных. Это корреляция между значениями переменной и наилучшими прогнозами, которую можно вычислить линейно на основе прогнозных переменных.

Коэффициент множественной корреляции принимает значения от 0 до 1. Более высокие значения указывают на более высокую предсказуемость зависимой переменной от независимых переменных, при этом значение 1 указывает на то, что прогнозы в точности верны, а значение 0 указывает на отсутствие линейной комбинации независимые переменные являются лучшим предиктором, чем фиксированное среднее значение зависимой переменной.

Коэффициент множественной корреляции известен как квадратный корень из коэффициента детерминации, но при определенных предположениях, что точка пересечения включена и что используются наилучшие возможные линейные предикторы, тогда как коэффициент детерминации определяется для более общих случаев, включая те из них, которые относятся к нелинейному предсказанию, и те, в которых предсказанные значения не были получены с помощью процедуры подгонки модели.

СОДЕРЖАНИЕ

1 Определение
2 Расчет
3 свойства
4 ссылки
5 Дальнейшее чтение

Определение

Коэффициент множественной корреляции, обозначенный R, представляет собой скаляр, который определяется как коэффициент корреляции Пирсона между прогнозируемыми и фактическими значениями зависимой переменной в модели линейной регрессии, которая включает точку пересечения.

Вычисление

Квадрат коэффициента множественной корреляции может быть вычислена с использованием вектора из корреляций между переменными предикторов (независимых переменных) и целевой переменной (зависимой переменной) и корреляционной матрицы корреляций между предикторов. Это дается ${\ displaystyle \ mathbf {c} = {(r_ {x_ {1} y}, r_ {x_ {2} y}, \ dots, r_ {x_ {N} y})} ^ {\ top}}$ $\ mathbf {c} = {(r_ {x_ {1} y}, r_ {x_ {2} y}, \ dots, r_ {x_ {N} y})} ^ {\ top}$ ${\ displaystyle r_ {x_ {n} y}}$ $г_ {х_ {п} у}$ ${\ displaystyle x_ {n}}$ $x_ {n}$ ${\ displaystyle y}$ $у$ ${\ displaystyle R_ {xx}}$ $R _ {{xx}}$

{\ Displaystyle R ^ {2} = \ mathbf {c} ^ {\ top} R_ {xx} ^ {- 1} \, \ mathbf {c},}

R ^ {2} = \ mathbf {c} ^ {\ top} R_ {xx} ^ {- 1} \, \ mathbf {c},

где является транспонированной из, и является обратной матрицы ${\ displaystyle \ mathbf {c} ^ {\ top}}$ $\ mathbf {c} ^ {\ top}$ ${\ displaystyle \ mathbf {c}}$ $\ mathbf {c}$ ${\ displaystyle R_ {xx} ^ {- 1}}$ $R _ {{xx}} ^ {{- 1}}$

{\ displaystyle R_ {xx} = \ left ({\ begin {array} {cccc} r_ {x_ {1} x_ {1}} amp; r_ {x_ {1} x_ {2}} amp; \ dots amp; r_ {x_ {1}) } x_ {N}} \\ r_ {x_ {2} x_ {1}} amp; \ ddots amp;amp; \ vdots \\\ vdots amp;amp; \ ddots amp; \\ r_ {x_ {N} x_ {1}} amp; \ dots amp;amp; r_ {x_ {N} x_ {N}} \ end {array}} \ right).}

R_ {xx} = \ left ({\ begin {array} {cccc} r_ {x_ {1} x_ {1}} amp; r_ {x_ {1} x_ {2}} amp; \ dots amp; r_ {x_ {1} x_ { N}} \\ r_ {x_ {2} x_ {1}} amp; \ ddots amp;amp; \ vdots \\\ vdots amp;amp; \ ddots amp; \\ r_ {x_ {N} x_ {1}} amp; \ dots amp;amp; r_ {x_ { N} x_ {N}} \ end {array}} \ right).

Если все переменные-предикторы не коррелированы, матрица является единичной матрицей и просто равна сумме квадратов корреляций с зависимой переменной. Если переменные-предикторы коррелированы между собой, это учитывается обратной корреляционной матрицей. ${\ displaystyle R_ {xx}}$ $R _ {{xx}}$ ${\ displaystyle R ^ {2}}$ $R ^ {2}$ ${\ Displaystyle \ mathbf {c} ^ {\ top} \, \ mathbf {c}}$ $\ mathbf {c} ^ {\ top} \, \ mathbf {c}$ ${\ displaystyle R_ {xx}}$ $R _ {{xx}}$

Квадрат коэффициента множественной корреляции также можно вычислить как долю дисперсии зависимой переменной, которая объясняется независимыми переменными, которая, в свою очередь, равна 1 минус необъяснимая доля. Необъяснимая доля может быть вычислена как сумма квадратов остатков, то есть сумма квадратов ошибок прогнозирования, деленная на сумму квадратов отклонений значений зависимой переменной от ее ожидаемого значения.

Характеристики

С более чем две переменные быть связаны друг с другом, значение коэффициента множественной корреляции зависит от выбора зависимой переменной: регрессии на и будет вообще иметь различный чем будет регресс на и. Например, предположим, что в конкретной выборке переменная не коррелирована с обоими и, в то время как и линейно связаны друг с другом. Тогда регрессия on и даст нулевое значение, а регрессия on и даст строго положительный результат. Это следует из того, что корреляция с его лучшим предсказателем, основанным на и во всех случаях, по крайней мере, такая же большая, как корреляция с его лучшим предсказателем, основанным только на одном, и в этом случае без предоставления объяснительной силы она будет точно такой же большой. ${\ displaystyle y}$ $у$ ${\ displaystyle x}$ $Икс$ ${\ displaystyle z}$ $z$ ${\ displaystyle R}$ $р$ ${\ displaystyle z}$ $z$ ${\ displaystyle x}$ $Икс$ ${\ displaystyle y}$ $у$ ${\ displaystyle z}$ $z$ ${\ displaystyle x}$ $Икс$ ${\ displaystyle y}$ $у$ ${\ displaystyle x}$ $Икс$ ${\ displaystyle y}$ $у$ ${\ displaystyle z}$ $z$ ${\ displaystyle y}$ $у$ ${\ displaystyle x}$ $Икс$ ${\ displaystyle R}$ $р$ ${\ displaystyle y}$ $у$ ${\ displaystyle x}$ $Икс$ ${\ displaystyle z}$ $z$ ${\ displaystyle R}$ $р$ ${\ displaystyle y}$ $у$ ${\ displaystyle x}$ $Икс$ ${\ displaystyle z}$ $z$ ${\ displaystyle y}$ $у$ ${\ displaystyle x}$ $Икс$ ${\ displaystyle z}$ $z$

Рекомендации

дальнейшее чтение

Эллисон, Пол Д. (1998). Множественная регрессия: учебник. Лондон: Sage Publications. ISBN 9780761985334
Коэн, Джейкоб и др. (2002). Прикладная множественная регрессия: корреляционный анализ для поведенческих наук. ISBN 0805822232
Корона, Уильям Х. (1998). Статистические модели для социальных и поведенческих наук: множественная регрессия и модели с ограниченно зависимыми переменными. ISBN 0275953165
Эдвардс, Аллен Луи (1985). Множественная регрессия, дисперсионный и ковариационный анализ. ISBN 0716710811
Кит, Тимоти (2006). Множественная регрессия и не только. Бостон: образование Пирсона.
Фред Н. Керлингер, Элазар Дж. Педхазур (1973). Множественная регрессия в поведенческих исследованиях. Нью-Йорк: Холт Райнхарт Уинстон. ISBN 9780030862113
Стэнтон, Джеффри М. (2001). «Гальтон, Пирсон и горох: краткая история линейной регрессии для инструкторов по статистике», Journal of Statistics Education, 9 (3).