Условное распределение вероятностей

редактировать

В теории вероятностей и статистике, учитывая два совместно распределенных случайные величины $X {\ displaystyle X}$ $X$ и $Y {\ displaystyle Y}$ $Y$ , условное распределение вероятностей Y для данного X - это распределение вероятностей для $Y {\ displaystyle Y}$ $Y$ , когда $X {\ displaystyle X}$ $X$ известен быть определенной ценностью; в некоторых случаях условные вероятности могут быть выражены как функции, содержащие в качестве параметра неуказанное значение $x {\ displaystyle x}$ $x$ из $X {\ displaystyle X}$ $X$ . Когда оба $X {\ displaystyle X}$ $X$ и $Y {\ displaystyle Y}$ $Y$ являются категориальными переменными, таблица условной вероятности обычно используется для обозначения условной вероятности. Условное распределение контрастирует с предельным распределением случайной величины, которое является ее распределением без ссылки на значение другой переменной.

Если условное распределение $Y {\ displaystyle Y}$ $Y$ с учетом $X {\ displaystyle X}$ $X$ является непрерывным распределением, то его функция плотности вероятности известна как функция условной плотности . Свойства условного распределения, такие как моменты, часто упоминаются соответствующими именами, такими как условное среднее и условная дисперсия.

В более общем смысле можно относятся к условному распределению подмножества набора из более чем двух переменных; это условное распределение зависит от значений всех оставшихся переменных, и если в подмножество включено более одной переменной, то это условное распределение является условным совместным распределением включенных переменных.

Содержание

1 Условные дискретные распределения
- 1.1 Пример
2 Условные непрерывные распределения
- 2.1 Пример
3 Отношение к независимости
4 Свойства
5 Теоретико-мерная формулировка
6 Связь с условным ожиданием
7 См. Также
8 Примечания
9 Ссылки

Условные дискретные распределения

Для дискретных случайных величин функция массы условной вероятности of $Y {\ displaystyle Y}$ $Y$ с учетом $X = x {\ displaystyle X = x}$ $X = x$ может быть записано в соответствии с его определением как:

$p Y | Икс (Y ∣ Икс) ≜ п (Y = Y ∣ X = x) = P ({X = x} ∩ {Y = y}) P (X = x) {\ displaystyle p_ {Y | X} (y \ середина x) \ треугольник q P (Y = y \ mid X = x) = {\ frac {P (\ {X = x \} \ cap \ {Y = y \})} {P (X = x)}} }$ ${\ Displaystyle p_ {Y | X} (y \ mid x) \ треугольник P (Y = y \ mid X = x) = {\ frac {P (\ {X = x \} \ cap \ {Y = y \ })} {P (X = x)}}}$

Из-за наличия в знаменателе $P (X = x) {\ displaystyle P (X = x)}$ $P (X = x)$ , это определено только для ненулевого (следовательно, строго положительного) $Р (Х = х). {\ displaystyle P (X = x).}$ $P (X = x).$

Связь с распределением вероятностей $X {\ displaystyle X}$ $X$ при $Y {\ displaystyle Y}$ $Y$ равно:

P (Y = y ∣ X = x) P (X = x) = P ({X = x} ∩ {Y = y}) = P (X = x ∣ Y = y) P (Y = y). {\ Displaystyle P (Y = Y \ середина X = x) P (X = x) = P (\ {X = x \} \ cap \ {Y = y \}) = P (X = x \ mid Y = y) P (Y = y).}

{\ displaystyle P (Y = y \ mid X = x) P (X = x) = P (\ {X = x \} \ cap \ {Y = y \}) = P (X = x \ mid Y = y) P (Y = y).}

Пример

Рассмотрим бросок честного кубика и пусть $X = 1 {\ displaystyle X = 1}$ ${\ displaystyle X = 1}$ , если число четное (например, 2, 4 или 6), и $X = 0 {\ displaystyle X = 0}$ ${\ displaystyle X = 0}$ в противном случае. Кроме того, пусть $Y = 1 {\ displaystyle Y = 1}$ $Y=1$ , если число простое (например, 2, 3 или 5) и $Y = 0 {\ displaystyle Y = 0}$ $Y = 0$ иначе.

	1	2	3	4	5	6
X	0	1	0	1	0	1
Y	0	1	1	0	1	0

Тогда безусловная вероятность того, что $X = 1 {\ displaystyle X = 1}$ ${\ displaystyle X = 1}$ равна 3/6 = 1/2 (поскольку есть шесть возможных бросков кубика, три из которых даже), тогда как вероятность того, что $X = 1 {\ displaystyle X = 1}$ ${\ displaystyle X = 1}$ условно на $Y = 1 {\ displaystyle Y = 1}$ $Y=1$ , равна 1 / 3 (поскольку есть три возможных броска простых чисел - 2, 3 и 5, из которых одно четное).

Условные непрерывные распределения

Аналогично для непрерывных случайных величин, условная функция плотности вероятности для $Y {\ displaystyle Y}$ $Y$ с учетом появления значения $x {\ displaystyle x}$ $x$ из $X {\ displaystyle X}$ $X$ может быть записано как

$f Y ∣ Икс (Y ∣ Икс) знак равно е Икс, Y (Икс, Y) е Икс (Икс) {\ Displaystyle F_ {Y \ mid X} (y \ mid x) = {\ frac {f_ {X, Y} ( x, y)} {f_ {X} (x)}}}$ ${ \ Displaystyle f_ {Y \ mid X} (y \ mid x) = {\ frac {f_ {X, Y} (x, y)} {f_ {X} (x)}}}$

где $f X, Y (x, y) {\ displaystyle f_ {X, Y} (x, y)}$ $f _ {{X, Y}} (x, y)$ дает плотность соединения из $X {\ displaystyle X}$ $X$ и $Y {\ displaystyle Y}$ $Y$ , а $f X (x) {\ displaystyle f_ {X} (x)}$ $f_{X}(x)$ дает предельную плотность для $X {\ displaystyle X}$ $X$ . Также в этом случае необходимо, чтобы $f X (x)>0 {\ displaystyle f_ {X} (x)>0}$ $f_{X}(x)>0$ .

Связь с распределением вероятностей $X {\ displaystyle X}$ $X$ задано $Y {\ displaystyle Y}$ $Y$ определяется как:

f Y ∣ X (y ∣ x) f X (x) = f X, Y (Икс, Y) знак равно е Икс | Y (Икс ∣ Y) е Y (Y). {\ Displaystyle F_ {Y \ mid X} (y \ mid x) f_ {X} (x) = f_ {X, Y } (x, y) = f_ {X | Y} (x \ mid y) f_ {Y} (y).}

{\ displaystyle f_ {Y \ mid X} (y \ mid x) f_ {X} (x) = f_ {X, Y} (x, y) = f_ {X | Y} (x \ mid y) f_ {Y} (y). }

Концепция условного распределения непрерывной случайной величины не так интуитивно понятна, как может показаться : Парадокс Бореля показывает, что условные функции плотности вероятности не обязательно должны быть инвариантными относительно преобразований координат.

Пример

Двумерная нормаль плотность суставов

На графике показано двумерная нормальная плотность суставов для случайных величин $X {\ displaystyle X}$ $X$ и $Y {\ displaystyle Y}$ $Y$ . Чтобы увидеть распределение $Y {\ displaystyle Y}$ $Y$ при условии $X = 70 {\ displaystyle X = 70}$ ${\ displaystyle X = 70}$ , сначала можно визуализировать строку $X = 70 {\ displaystyle X = 70}$ ${\ displaystyle X = 70}$ в $X, Y {\ displaystyle X, Y}$ $X,Y$ плоскости, а затем визуализируйте плоскость, содержащую эту линию и перпендикуляр на плоскость $X, Y {\ displaystyle X, Y}$ $X,Y$ . Пересечение этой плоскости с нормальной плотностью сустава, после масштабирования для получения единицы площади под пересечением, является соответствующей условной плотностью $Y {\ displaystyle Y}$ $Y$ .

$Y ∣ X = 70 ∼ N (μ 1 + σ 1 σ 2 ρ (70 - μ 2), (1 - ρ 2) σ 1 2). {\ Displaystyle Y \ mid X = 70 \ \ sim \ {\ mathcal {N}} \ left (\ mu _ {1} + {\ frac {\ sigma _ {1}} {\ sigma _ {2}}} \ rho (70- \ mu _ {2}), \, (1- \ rho ^ {2}) \ sigma _ {1} ^ {2} \ right).}$ ${\ displaystyle Y \ mid X = 70 \ \ sim \ {\ mathcal {N}} \ left (\ mu _ {1} + {\ frac {\ sigma _ {1}} {\ sigma _ {2}}} \ rho (70- \ mu _ { 2}), \, (1- \ rho ^ {2}) \ sigma _ {1} ^ {2} \ right).}$

Отношение к независимости

Случайные переменные $X {\ displaystyle X}$ $X$ , $Y {\ displaystyle Y}$ $Y$ независимы тогда и только тогда, когда условное распределение $Y {\ displaystyle Y}$ $Y$ при заданном $X {\ displaystyle X}$ $X$ для всех возможных реализаций $X {\ displaystyle X}$ $X$ равно безусловное распределение $Y {\ displaystyle Y}$ $Y$ . Для дискретных случайных величин это означает $P (Y = y | X = x) = P (Y = y) {\ displaystyle P (Y = y | X = x) = P (Y = y)}$ ${ \ Displaystyle P (Y = Y | X = x) = P (Y = y)}$ для всех возможных $y {\ displaystyle y}$ $y$ и $x {\ displaystyle x}$ $x$ с $P (X = x)>0 { \ displaystyle P (X = x)>0}$ $P(X=x)>0$ . Для непрерывных случайных величин $X {\ displaystyle X}$ $X$ и $Y {\ displaystyle Y}$ $Y$ , имея функция совместной плотности, это означает, что $f Y (y | X = x) = f Y (y) {\ displaystyle f_ {Y} (y | X = x) = f_ {Y} (y)}$ ${\ displaystyle f_ {Y} (y | X = x) = f_ {Y} (y)}$ для всех возможных $y {\ displaystyle y}$ $y$ и $x {\ displaystyle x}$ $x$ с $f X (x)>0 {\ displaystyle f_ {X} (x)>0}$ $f_{X}(x)>0$ .

Свойства

Рассматриваются как функция $y {\ displaystyle y}$ $y$ для данного $x {\ displaystyle x}$ $x$ , $P (Y = y | X = x) {\ displaystyle P (Y = y | X = x)}$ ${\ Displaystyle P (Y = Y | X = x)}$ - функция массы вероятности и, следовательно, сумма по всем $y {\ displaystyle y}$ $y$ (или интеграл, если это условная плотность вероятности) равен 1. Рассматривается как функция от $x {\ displaystyle x}$ $x$ для данного $y {\ displaystyle y}$ $y$ , это функция правдоподобия, поэтому сумма по всем $x {\ displaystyle x}$ $x$ не обязательно должна быть 1.

Дополнительно, маргинальное значение совместного распределения может быть выражено как математическое ожидание соответствующего условного распределения. Например, $p X (x) = E Y [p X | Y (X | Y)] {\ displaystyle p_ {X} (x) = E_ {Y} [p_ {X | Y} (X \ | \ Y)]}$ ${\ displaystyle p_ {X} (x) = E_ {Y} [p_ {X | Y} (X \ | \ Y)]}$ .

Теоретико-мерная формулировка

Пусть $(Ω, F, P) {\ displaystyle (\ Omega, {\ mathcal {F}}, P)}$ $(\ Omega, {\ mathcal {F}}, P)$ будет вероятностным пространством, $G ⊆ F {\ displaystyle {\ mathcal {G}} \ substeq {\ mathcal {F}}}$ ${\ mathcal {G}} \ substeq {\ mathcal {F}}$ a $σ {\ displaystyle \ sigma}$ $\ sigma$ -поле в $F {\ displaystyle {\ mathcal {F}} }$ ${\ mathcal {F}}$ и $X: Ω → R {\ displaystyle X: \ Omega \ to \ mathbb {R}}$ $X: \ Omega \ to \ mathbb {R}$ случайная величина с действительным знаком (измеримая относительно Борель $σ {\ displaystyle \ sigma}$ $\ sigma$ -field $R 1 {\ displaystyle {\ mathcal {R}} ^ {1}}$ ${\ mathcal {R}} ^ {1}$ на $R {\ displaystyle \ mathbb {R}}$ $\ mathbb {R}$ ). Учитывая $A ∈ F {\ displaystyle A \ in {\ mathcal {F}}}$ $A \ in {\ mathcal {F}}$ , теорема Радона-Никодима подразумевает, что существует $G {\ displaystyle {\ mathcal {G}}}$ ${\ mathcal {G}}$ -измеримая интегрируемая случайная величина $P (A ∣ G): Ω → R {\ displaystyle P (A \ mid {\ mathcal {G}}): \ Omega \ to \ mathbb {R}}$ ${\ displaystyle P (A \ mid {\ mathcal {G}}): \ Omega \ to \ mathbb {R}}$ такой, что $∫ GP (A ∣ G) (ω) d P (ω) = P (A ∩ G) {\ displaystyle \ int _ { G} P (A \ mid {\ mathcal {G}}) (\ omega) dP (\ omega) = P (A \ cap G)}$ ${\ displaystyle \ int _ {G} P ( A \ mid {\ mathcal {G}}) (\ omega) dP (\ omega) = P (A \ cap G)}$ для каждого $G ∈ G {\ displaystyle G \ in {\ mathcal {G}}}$ ${\ Displaystyle G \ in {\ mathcal {G}}}$ , и такая случайная величина определяется однозначно с точностью до множеств с нулевой вероятностью. Кроме того, тогда можно показать, что существует функция $μ: R 1 × Ω → R {\ displaystyle \ mu: {\ mathcal {R}} ^ {1} \ times \ Omega \ to \ mathbb {R }}$ $\ mu: {\ mathcal {R}} ^ {1} \ times \ Omega \ to \ mathbb {R}$ такая, что

$μ (⋅, ω) {\ displaystyle \ mu (\ cdot, \ omega)}$ $\ mu (\ cdot, \ omega)$ является мерой вероятности на $R 1 {\ displaystyle {\ mathcal {R}} ^ {1}}$ ${\ mathcal {R}} ^ {1}$ для каждого $ω ∈ Ω {\ displaystyle \ omega \ in \ Omega}$ $\ omega \ in \ Omega$ (т. е. обычный ) и $μ (H, ⋅) = P (X - 1 (H) ∣ G) {\ displaystyle \ mu (H, \ cdot) = P (X ^ {-1} (H) \ mid {\ mathcal {G}})}$ ${\ displaystyle \ mu (H, \ cdot) = P (X ^ {- 1} (H) \ mid {\ mathcal {G}})}$ (почти наверняка) для каждого $H ∈ R 1 {\ displaystyle H \ in {\ mathcal {R}} ^ {1}}$ $H \ in {\ mathcal {R}} ^ {1}$ .

Для любого $ω ∈ Ω {\ displaystyle \ omega \ in \ Omega}$ $\ omega \ in \ Omega$ функция $μ (⋅, ω): R 1 → R { \ displaystyle \ mu (\ cdot, \ omega): {\ mathcal {R}} ^ {1} \ to \ mathbb {R}}$ $\ mu (\ cdot, \ omega) : {\ mathcal {R}} ^ {1} \ to \ mathbb {R}$ называется условной вероятностью распределение из $X {\ displaystyle X}$ $X$ с учетом $G {\ displaystyle {\ mathcal {G}}}$ ${\ mathcal {G}}$ . В этом случае $E [X ∣ G] = ∫ - ∞ ∞ x μ (dx, ⋅) {\ displaystyle E [X \ mid {\ mathcal {G}}] = \ int _ {- \ infty} ^ {\ infty} x \, \ mu (dx, \ cdot)}$ ${\ displaystyle E [X \ mid {\ mathcal {G}}] = \ int _ {- \ infty} ^ {\ infty} x \, \ mu ( dx, \ cdot)}$ почти наверняка.

Отношение к условному ожиданию

Для любого события $A ∈ A ⊇ B {\ displaystyle A \ in {\ mathcal {A}} \ supseteq {\ mathcal {B}}}$ $A \ in {\ mathcal {A}} \ supseteq {\ mathcal {B}}$ , определите индикаторную функцию :

1 A (ω) = {1, если ω ∈ A, 0, если ω ∉ A, {\ displaystyle \ mathbf {1} _ {A} (\ omega) = {\ begin {case} 1 \; {\ text {if}} \ omega \ in A, \\ 0 \; {\ text {if}} \ omega \ notin A, \ end {case} }}

\ mathbf {1} _ {A} (\ omega) = {\ begin {cases} 1 \; {\ text {if}} \ omega \ in A, \\ 0 \; {\ text {if}} \ omega \ notin A, \ end {case}}

- случайная величина. Обратите внимание, что математическое ожидание этой случайной величины равно вероятности самого A:

E ⁡ (1 A) = P ⁡ (A). {\ displaystyle \ operatorname {E} (\ mathbf {1} _ {A}) = \ operatorname {P} (A). \;}

\ operatorname {E} (\ mathbf {1} _ {A}) = \ operatorname {P} (A). \;

Тогда условная вероятность при $B {\ displaystyle \ scriptstyle {\ mathcal {B}}}$ $\ scriptstyle {\ mathcal {B}}$ - это функция $P ⁡ (⋅ ∣ B): A × Ω → [0, 1] {\ displaystyle \ scriptstyle \ operatorname { P} (\ cdot \ mid {\ mathcal {B}}): {\ mathcal {A}} \ times \ Omega \ to [0,1]}$ ${\ displaystyle \ scriptstyle \ operatorname {P} (\ cdot \ mid {\ mathcal {B}}): {\ mathcal {A}} \ times \ Omega \ to [ 0,1]}$ такой, что $P ⁡ (A ∣ B) {\ displaystyle \ scriptstyle \ operatorname {P} (A \ mid {\ mathcal {B}})}$ ${\ displaystyle \ scriptstyle \ имя оператора {P} (A \ mid {\ mathcal {B}})}$ - условное ожидание индикаторной функции для $A {\ displaystyle A}$ $A$ :

P ⁡ (A ∣ B) = E ⁡ (1 A ∣ B) {\ displaystyle \ operatorname {P} (A \ mid {\ mathcal {B}}) = \ operatorname {E } (\ mathbf {1} _ {A} \ mid {\ mathcal {B}}) \;}

{\ displaystyle \ operatorname {P} (A \ mid {\ mathcal {B}}) = \ operatorname {E} (\ mathbf {1} _ {A} \ mid {\ mathcal {B}}) \;}

Другими словами, $P ⁡ (A ∣ B) {\ displaystyle \ scriptstyle \ operatorname {P } (A \ mid {\ mathcal {B}})}$ ${\ displaystyle \ scriptstyle \ имя оператора {P} (A \ mid {\ mathcal {B}})}$ - это $B {\ displaystyle \ scriptstyle {\ mathcal {B}}}$ $\ scriptstyle {\ mathcal {B}}$ -измеримая функция, удовлетворяющая

∫ BP ⁡ (A ∣ B) (ω) d P ⁡ (ω) = P ⁡ (A ∩ B) fo r все A ∈ A, B ∈ B. {\ displaystyle \ int _ {B} \ operatorname {P} (A \ mid {\ mathcal {B}}) (\ omega) \, \ mathrm {d} \ operatorname {P} (\ omega) = \ operatorname { P} (A \ cap B) \ qquad {\ text {для всех}} \ quad A \ in {\ mathcal {A}}, B \ in {\ mathcal {B}}.}

{\ displaystyle \ int _ {B} \ op eratorname {P} (A \ mid {\ mathcal {B}}) (\ omega) \, \ mathrm {d} \ operatorname {P} (\ omega) = \ operatorname {P} (A \ cap B) \ qquad {\ text {для всех}} \ quad A \ in {\ mathcal {A}}, B \ in {\ mathcal {B}}.}

Условная вероятность - это регулярный, если $P ⁡ (⋅ ∣ B) (ω) {\ displaystyle \ scriptstyle \ operatorname {P} (\ cdot \ mid {\ mathcal {B}}) (\ omega)}$ ${\ displaystyle \ scriptstyle \ operatorname {P} (\ cdot \ mid {\ mathcal {B}}) (\ omega)}$ также является вероятностной мерой для всех ω ∈ Ω. Ожидание случайной величины относительно обычной условной вероятности равно ее условному ожиданию.

Для тривиальной сигма-алгебры $B = {∅, Ω} {\ displaystyle {\ mathcal {B}} = \ {\ emptyset, \ Omega \}}$ ${\ mathcal {B}} = \ {\ emptyset, \ Omega \}$ условная вероятность равна постоянная функция, $P (A ∣ {∅, Ω}) ≡ P ⁡ (A). {\ Displaystyle \ OperatorName {P} \! \ left (A \ mid \ {\ emptyset, \ Omega \} \ right) \ Equiv \ OperatorName {P} (A).}$ ${\ displaystyle \ operatorname {P} \! \ Left (A \ mid \ {\ emptyset, \ Omega \} \ right) \ Equiv \ OperatorName {P} (A).}$
Для $A ∈ B {\ displaystyle A \ in {\ mathcal {B}}}$ $A \ in {\ mathcal {B}}$ , как указано выше, $P ⁡ (A ∣ B) = 1 A. {\ displaystyle \ operatorname {P} (A \ mid {\ mathcal {B}}) = 1_ {A}.}$ ${\ displaystyle \ operatorname {P} (A \ mid {\ mathcal {B}}) = 1_ {A}.}$

См. также

Примечания

Ссылки

Биллингсли, Патрик (1995). Вероятность и мера (3-е изд.). Нью-Йорк: John Wiley and Sons.