В статистике, то коэффициент множественной корреляции является мерой того, насколько хорошо данная переменная может быть предсказана с использованием линейной функции набора других переменных. Это корреляция между значениями переменной и наилучшими прогнозами, которую можно вычислить линейно на основе прогнозных переменных.
Коэффициент множественной корреляции принимает значения от 0 до 1. Более высокие значения указывают на более высокую предсказуемость зависимой переменной от независимых переменных, при этом значение 1 указывает на то, что прогнозы в точности верны, а значение 0 указывает на отсутствие линейной комбинации независимые переменные являются лучшим предиктором, чем фиксированное среднее значение зависимой переменной.
Коэффициент множественной корреляции известен как квадратный корень из коэффициента детерминации, но при определенных предположениях, что точка пересечения включена и что используются наилучшие возможные линейные предикторы, тогда как коэффициент детерминации определяется для более общих случаев, включая те из них, которые относятся к нелинейному предсказанию, и те, в которых предсказанные значения не были получены с помощью процедуры подгонки модели.
Коэффициент множественной корреляции, обозначенный R, представляет собой скаляр, который определяется как коэффициент корреляции Пирсона между прогнозируемыми и фактическими значениями зависимой переменной в модели линейной регрессии, которая включает точку пересечения.
Квадрат коэффициента множественной корреляции может быть вычислена с использованием вектора из корреляций между переменными предикторов (независимых переменных) и целевой переменной (зависимой переменной) и корреляционной матрицы корреляций между предикторов. Это дается
где является транспонированной из, и является обратной матрицы
Если все переменные-предикторы не коррелированы, матрица является единичной матрицей и просто равна сумме квадратов корреляций с зависимой переменной. Если переменные-предикторы коррелированы между собой, это учитывается обратной корреляционной матрицей.
Квадрат коэффициента множественной корреляции также можно вычислить как долю дисперсии зависимой переменной, которая объясняется независимыми переменными, которая, в свою очередь, равна 1 минус необъяснимая доля. Необъяснимая доля может быть вычислена как сумма квадратов остатков, то есть сумма квадратов ошибок прогнозирования, деленная на сумму квадратов отклонений значений зависимой переменной от ее ожидаемого значения.
С более чем две переменные быть связаны друг с другом, значение коэффициента множественной корреляции зависит от выбора зависимой переменной: регрессии на и будет вообще иметь различный чем будет регресс на и. Например, предположим, что в конкретной выборке переменная не коррелирована с обоими и, в то время как и линейно связаны друг с другом. Тогда регрессия on и даст нулевое значение, а регрессия on и даст строго положительный результат. Это следует из того, что корреляция с его лучшим предсказателем, основанным на и во всех случаях, по крайней мере, такая же большая, как корреляция с его лучшим предсказателем, основанным только на одном, и в этом случае без предоставления объяснительной силы она будет точно такой же большой.