Таблица условной вероятности

редактировать

В статистике, таблица условной вероятности (CPT) определена для набора дискретных и взаимно зависимых случайных величин для отображения условных вероятностей единственная переменная по отношению к другим (т.е. вероятность каждого возможного значения одной переменной, если мы знаем значения, принимаемые другими переменными). Например, предположим, что есть три случайные величины x 1, x 2, x 3 {\ displaystyle x_ {1}, x_ {2}, x_ {3}}x_ {1}, x_ {2}, x_ {3} , где каждая имеет K {\ displaystyle K}K состояний. Затем таблица условной вероятности x 1 {\ displaystyle x_ {1}}x_ {1} предоставляет значения условной вероятности P (x 1 = ak ∣ x 2, x 3) {\ displaystyle P (x_ {1} = a_ {k} \ mid x_ {2}, x_ {3})}{\ displaystyle P (x_ {1} = a_ {k} \ mid x_ {2}, x_ {3})} - где вертикальная черта | {\ displaystyle |}| означает «с учетом значений» - для каждого из K возможных значений ak {\ displaystyle a_ {k}}a_ { k} переменной x 1 {\ displaystyle x_ {1}}x_ {1} и для каждой возможной комбинации значений x 2, x 3. {\ displaystyle x_ {2}, \, x_ {3}.}{\ displaystyle x_ {2}, \, x_ {3}.} В этой таблице K 3 {\ displaystyle K ^ {3}}{\ displaystyle K ^ {3}} ячеек. Как правило, для M {\ displaystyle M}M переменных x 1, x 2,…, x M {\ displaystyle x_ {1}, x_ {2}, \ ldots, x_ {M}}x_ {1}, x_ {2}, \ ldots, x_ {M} с состояниями K i {\ displaystyle K_ {i}}K_ {i} для каждой переменной xi, {\ displaystyle x_ {i},}{\ displaystyle x_ {i},} CPT для любого из них имеет количество ячеек, равное произведению K 1 K 2 ⋯ KM. {\ displaystyle K_ {1} K_ {2} \ cdots K_ {M}.}{\ displaystyle K_ {1} K_ {2} \ cdots K_ {M}.}

Таблица условной вероятности может быть преобразована в форму матрицы. В качестве примера только с двумя переменными значения P (x 1 = ak ∣ x 2 = bj) = T kj, {\ displaystyle P (x_ {1} = a_ {k} \ mid x_ {2}) = b_ {j}) = T_ {kj},}{\ displaystyle P (x_ {1} = a_ {k } \ mid x_ {2} = b_ {j}) = T_ {kj},} с k и j в диапазоне значений K, создать матрицу K × K. Эта матрица является стохастической матрицей , поскольку сумма столбцов равна 1; то есть ∑ К T К J = 1 {\ Displaystyle \ sum _ {k} T_ {kj} = 1}{\ displaystyle \ sum _ {k} T_ {kj} = 1} для всех j. Например, предположим, что две двоичные переменные x и y имеют совместное распределение вероятностей, указанное в этой таблице:

x=0x = 1P (y)
y = 04/91/95/9
y = 12/92/94/9
P (x)6/93/91

Каждая из четырех центральных ячеек показывает вероятность конкретной комбинации значений x и y. Сумма первого столбца - это вероятность того, что x = 0 и y равно любому из возможных значений, то есть сумма столбца 6/9 - это предельная вероятность того, что x = 0. Если мы хотим найти вероятность того, что y = 0 при x = 0, мы вычисляем долю вероятностей в столбце x = 0, которые имеют значение y = 0, что составляет 4/9 ÷ 6/9 = 4 / 6. Точно так же в том же столбце мы находим, что вероятность того, что y = 1 при x = 0, составляет 2/9 ÷ 6/9 = 2/6. Таким же образом мы можем найти условные вероятности для y, равного 0 или 1, при условии, что x = 1. Объединение этих частей информации дает нам эту таблицу условных вероятностей для y:

x=0x = 1
P (y = 0 при x)4/61/3
P (y = 1 при x)2/62/3
Sum11

С более чем одним условием переменной, в таблице по-прежнему будет одна строка для каждого потенциального значения переменной, условные вероятности которой должны быть указаны, и будет один столбец для каждой возможной комбинации значений условных переменных.

Более того, количество столбцов в таблице может быть существенно увеличено, чтобы отображать вероятности интересующей переменной при определенных значениях только некоторых, а не всех других переменных.

Ссылки
Последняя правка сделана 2021-05-15 09:04:02
Содержание доступно по лицензии CC BY-SA 3.0 (если не указано иное).
Обратная связь: support@alphapedia.ru
Соглашение
О проекте