Таблица условной вероятности

редактировать

В статистике, таблица условной вероятности (CPT) определена для набора дискретных и взаимно зависимых случайных величин для отображения условных вероятностей единственная переменная по отношению к другим (т.е. вероятность каждого возможного значения одной переменной, если мы знаем значения, принимаемые другими переменными). Например, предположим, что есть три случайные величины $x 1, x 2, x 3 {\ displaystyle x_ {1}, x_ {2}, x_ {3}}$ $x_ {1}, x_ {2}, x_ {3}$ , где каждая имеет $K {\ displaystyle K}$ $K$ состояний. Затем таблица условной вероятности $x 1 {\ displaystyle x_ {1}}$ $x_ {1}$ предоставляет значения условной вероятности $P (x 1 = ak ∣ x 2, x 3) {\ displaystyle P (x_ {1} = a_ {k} \ mid x_ {2}, x_ {3})}$ ${\ displaystyle P (x_ {1} = a_ {k} \ mid x_ {2}, x_ {3})}$ - где вертикальная черта $| {\ displaystyle |}$ $|$ означает «с учетом значений» - для каждого из K возможных значений $ak {\ displaystyle a_ {k}}$ $a_ { k}$ переменной $x 1 {\ displaystyle x_ {1}}$ $x_ {1}$ и для каждой возможной комбинации значений $x 2, x 3. {\ displaystyle x_ {2}, \, x_ {3}.}$ ${\ displaystyle x_ {2}, \, x_ {3}.}$ В этой таблице $K 3 {\ displaystyle K ^ {3}}$ ${\ displaystyle K ^ {3}}$ ячеек. Как правило, для $M {\ displaystyle M}$ $M$ переменных $x 1, x 2,…, x M {\ displaystyle x_ {1}, x_ {2}, \ ldots, x_ {M}}$ $x_ {1}, x_ {2}, \ ldots, x_ {M}$ с состояниями $K i {\ displaystyle K_ {i}}$ $K_ {i}$ для каждой переменной $xi, {\ displaystyle x_ {i},}$ ${\ displaystyle x_ {i},}$ CPT для любого из них имеет количество ячеек, равное произведению $K 1 K 2 ⋯ KM. {\ displaystyle K_ {1} K_ {2} \ cdots K_ {M}.}$ ${\ displaystyle K_ {1} K_ {2} \ cdots K_ {M}.}$

Таблица условной вероятности может быть преобразована в форму матрицы. В качестве примера только с двумя переменными значения $P (x 1 = ak ∣ x 2 = bj) = T kj, {\ displaystyle P (x_ {1} = a_ {k} \ mid x_ {2}) = b_ {j}) = T_ {kj},}$ ${\ displaystyle P (x_ {1} = a_ {k } \ mid x_ {2} = b_ {j}) = T_ {kj},}$ с k и j в диапазоне значений K, создать матрицу K × K. Эта матрица является стохастической матрицей , поскольку сумма столбцов равна 1; то есть $∑ К T К J = 1 {\ Displaystyle \ sum _ {k} T_ {kj} = 1}$ ${\ displaystyle \ sum _ {k} T_ {kj} = 1}$ для всех j. Например, предположим, что две двоичные переменные x и y имеют совместное распределение вероятностей, указанное в этой таблице:

	x=0	x = 1	P (y)
y = 0	4/9	1/9	5/9
y = 1	2/9	2/9	4/9
P (x)	6/9	3/9	1

Каждая из четырех центральных ячеек показывает вероятность конкретной комбинации значений x и y. Сумма первого столбца - это вероятность того, что x = 0 и y равно любому из возможных значений, то есть сумма столбца 6/9 - это предельная вероятность того, что x = 0. Если мы хотим найти вероятность того, что y = 0 при x = 0, мы вычисляем долю вероятностей в столбце x = 0, которые имеют значение y = 0, что составляет 4/9 ÷ 6/9 = 4 / 6. Точно так же в том же столбце мы находим, что вероятность того, что y = 1 при x = 0, составляет 2/9 ÷ 6/9 = 2/6. Таким же образом мы можем найти условные вероятности для y, равного 0 или 1, при условии, что x = 1. Объединение этих частей информации дает нам эту таблицу условных вероятностей для y:

	x=0	x = 1
P (y = 0 при x)	4/6	1/3
P (y = 1 при x)	2/6	2/3
Sum	1	1

С более чем одним условием переменной, в таблице по-прежнему будет одна строка для каждого потенциального значения переменной, условные вероятности которой должны быть указаны, и будет один столбец для каждой возможной комбинации значений условных переменных.

Более того, количество столбцов в таблице может быть существенно увеличено, чтобы отображать вероятности интересующей переменной при определенных значениях только некоторых, а не всех других переменных.

Ссылки