В статистике, то остаточная сумма квадратов ( RSS), также известные как сумма квадратов остатков ( SSR) или сумму квадратов оценки ошибок ( SSE), является суммой из квадратов из остатков (отклонения предсказывали от реальных эмпирических значений данных). Это мера расхождения между данными и моделью оценки, такой как линейная регрессия. Небольшой RSS указывает на точное соответствие модели данным. Он используется как критерий оптимальности при выборе параметров и выбора модели.
В общем, общая сумма квадратов = объясненная сумма квадратов + остаточная сумма квадратов. Для доказательства этого в многомерном обычном случае наименьших квадратов (OLS) см. Разделение в общей модели OLS.
СОДЕРЖАНИЕ
- 1 Одна объясняющая переменная
- 2 Матричное выражение для остаточной суммы квадратов OLS
- 3 Связь с корреляцией продукта и момента Пирсона
- 4 См. Также
- 5 ссылки
Одна объясняющая переменная
В модели с единственной независимой переменной RSS задается следующим образом:
где y i - это i- е значение переменной, которую нужно спрогнозировать, x i - это i- е значение объясняющей переменной, и - это предсказанное значение y i (также называемое). В стандартной линейной простой модели регрессии, где и являются коэффициентами, у и х являются regressand и регрессор, соответственно, а ε является вектор ошибок. Сумма квадратов остатков - это сумма квадратов ; это
где - оценочное значение постоянного члена, а - оценочное значение коэффициента наклона.
Матричное выражение для остаточной суммы квадратов OLS
Общая регрессионная модель с n наблюдениями и k объяснителями, первый из которых представляет собой постоянный единичный вектор, коэффициент которого является пересечением регрессии, имеет вид
где y - вектор наблюдений зависимой переменной размера n × 1, каждый столбец матрицы X размера n × k - вектор наблюдений на одном из k объяснителей, - вектор истинных коэффициентов k × 1, а e - размер n × 1 вектор истинных основных ошибок. В обычный метод наименьших квадратов Оценщик IS
Остаточный вектор = ; поэтому остаточная сумма квадратов равна:
- ,
(эквивалентно квадрату нормы остатков). В полном объеме:
- ,
где H - матрица шляпы или матрица проекции в линейной регрессии.
Связь с корреляцией продукта и момента Пирсона
Линия регрессии методом наименьших квадратов определяется выражением
- ,
где и, где и
Следовательно,
где
Соотношение произведение-момент Пирсона определяется следующим образом:
Смотрите также
Рекомендации
- Draper, NR; Смит, Х. (1998). Прикладной регрессионный анализ (3-е изд.). Джон Вили. ISBN 0-471-17082-8.