В статистике, скрытые переменные (от латинского : причастие настоящего латео («лежать скрыто»), в отличие от наблюдаемые переменные ): переменные, которые не наблюдаются напрямую, а скорее выведены (с помощью математической модели ) из других наблюдаемых переменных (непосредственно измеряемых). Математические модели, которые призваны объяснить наблюдаемые переменные в терминах скрытых переменных называются моделями скрытых переменных. La переменные модели палатки используются во многих дисциплинах, включая психологию, демографию, экономику, инженерию, медицину, физика, машинное обучение / искусственный интеллект, биоинформатика, хемометрика, обработка естественного языка, эконометрика, менеджмент и социальные науки.
Скрытые переменные могут соответствовать аспектам физической реальности. В принципе, их можно измерить, но не по практическим причинам. В этой ситуации обычно используется термин «скрытые переменные» (отражающий тот факт, что переменные значимы, но не наблюдаемы). Другие скрытые переменные соответствуют абстрактным понятиям, таким как категории, поведенческие или психические состояния или структуры данных. В этих ситуациях могут использоваться термины «гипотетические переменные» или «гипотетические конструкции».
Использование скрытых переменных может служить для уменьшения размерности данных. Многие наблюдаемые переменные могут быть агрегированы в модели, чтобы представить основную концепцию, что упрощает понимание данных. В этом смысле они выполняют функцию, аналогичную функции научных теорий. В то же время скрытые переменные связывают наблюдаемые («субсимвольные ») данные в реальном мире с символьными данными в моделируемом мире.
Скрытые переменные, созданные с помощью методов факторного анализа, обычно представляют собой «общие» дисперсия, или степень, в которой переменные «движутся» вместе. Переменные, не имеющие корреляции, не могут привести к латентному построению на основе общей факторной модели.
Примеры скрытых переменных из области экономики включают качество жизни, деловую уверенность, моральный дух, счастье и консерватизм: это все переменные, которые нельзя измерить напрямую. Но связывая эти скрытые переменные с другими наблюдаемыми переменными, значения скрытых переменных могут быть выведены из измерений наблюдаемых переменных. Качество жизни - это скрытая переменная, которую нельзя измерить напрямую, поэтому наблюдаемые переменные используются для определения качества жизни. Наблюдаемые переменные для измерения качества жизни включают богатство, занятость, окружающую среду, физическое и психическое здоровье, образование, отдых и досуг, а также социальную принадлежность.
Методология скрытых переменных используется во многих отраслях медицины. Класс проблем, которые естественным образом поддаются подходам с латентными переменными, - это лонгитюдные исследования, в которых шкала времени (например, возраст участника или время, прошедшее с начала исследования) не синхронизирована с изучаемым признаком. Для таких исследований ненаблюдаемая временная шкала, синхронизированная с изучаемым признаком, может быть смоделирована как преобразование наблюдаемой временной шкалы с использованием скрытых переменных. Примеры этого включают моделирование прогрессирования заболевания и моделирование роста (см. Вставку).
Существует ряд различных классов моделей и методологий, которые используют скрытые переменные и позволяют делать выводы при наличии скрытых переменных. Модели включают:
Методы анализа и вывода включают:
Байесовская статистика часто используется для вывода скрытых переменных.