Распределение вероятностей с дискретной переменной
График функции вероятности и масс. Все значения этой функции должны быть неотрицательными и в сумме составлять 1.
В вероятность и статистика, функция массы вероятности (PMF ) - это функция, которая дает вероятность того, что дискретная случайная величина в точности равна некоторому значению. Иногда ее также называют дискретной функцией плотности. Функция массы вероятностей часто является основным средством определения дискретного распределения вероятностей, и такие функции существуют либо для скалярных, либо для многомерных случайных величин, область которых дискретный.
Функция массы вероятности отличается от функции плотности вероятности (PDF) тем, что последняя связана с непрерывными, а не дискретными случайными величинами. PDF должен быть интегрирован в интервале, чтобы получить вероятность.
Значение случайной величины, имеющей наибольшую вероятностную массу, называется режимом.
Содержание
- 1 Формальное определение
- 2 Теоретическая формулировка меры
- 3 Примеры
- 3.1 Конечное
- 3.2 Бесконечное
- 4 Многомерный случай
- 5 Ссылки
- 6 Дополнительная литература
Формальное определение
Вероятностная массовая функция - это распределение вероятностей дискретной случайной величины, обеспечивающее возможные значения и связанные с ними вероятности. Это функция определяется как
для
Вероятности связанные с каждым возможным значением, должны быть положительными и в сумме равны 1. Для всех остальных значений вероятности должны быть равны 0.
- ∑ p X (xi) = 1 {\ displaystyle \ sum p_ {X} (x_ {i }) = 1}
- p (xi)>0 {\ displaystyle p (x_ {i})>0}
- p (x) = 0 {\ displaystyle p (x) = 0}для всех остальных x
Представление о вероятности как о массе помогает избежать ошибок, поскольку сохраняется физическая масса, как и полная вероятность для всех гипотетических результатов x {\ displaystyle x}.
Теоретическая формулировка меры
Вероятностная массовая функция дискретной случайной величины X {\ displaystyle X}может рассматриваться как частный случай двух более общих теоретико-мерных построений: распределение n из X {\ displaystyle X}и функция плотности вероятности из X {\ displaystyle X}в отношении счетная мера . Ниже мы уточним это.
Предположим, что (A, A, P) {\ displaystyle (A, {\ mathcal {A}}, P)}является вероятностным пространством и что (B, B) {\ displaystyle (B, {\ mathcal {B}})}является измеримым пространством, лежащая в основе σ-алгебра дискретна, так, в частности, содержит одноэлементные наборы B {\ displaystyle B}. В этой настройке случайная величина X: A → B {\ displaystyle X \ двоеточие A \ to B}является дискретной, если ее изображение является счетным. мера продвижения вперед X ∗ (P) {\ displaystyle X _ {*} (P)}- называется распределением X {\ displaystyle X} <58.>в данном контексте - это мера вероятности на B {\ displaystyle B}, ограничение которой одноэлементными наборами индуцирует функцию массы вероятности f X: B → R {\ displaystyle f_ {X} \ двоеточие B \ to \ mathbb {R}}, поскольку f X (b) = P (X - 1 (b)) = [X ∗ (P)] ({ б}) {\ displaystyle f_ {X} (b) = P (X ^ {- 1} (b)) = [X _ {*} (P)] (\ {b \})}для каждого b ∈ B {\ displaystyle b \ in B}.
Теперь предположим, что (B, B, μ) {\ displaystyle (B, {\ mathcal {B}}, \ mu)}- это измерительное пространство, оснащенное счетной мерой μ. Функция плотности вероятности f {\ displaystyle f}of X {\ displaystyle X}относительно счетной меры, если она существует, является Производная Радона – Никодима прямой меры X {\ displaystyle X}(относительно счетной меры), поэтому f = d X ∗ P / d μ {\ displaystyle f = dX _ {*} P / d \ mu}и f {\ displaystyle f}- это функция из B {\ displaystyle B}к неотрицательным действительным числам. Как следствие, для любого b ∈ B {\ displaystyle b \ in B}мы имеем
- P (X = b) = P (X - 1 ({b})): Знак равно ∫ Икс - 1 ({b}) d P = {\ Displaystyle P (X = b) = P (X ^ {- 1} (\ {b \})): = \ int _ {X ^ {- 1 } (\ {b \})} dP =}∫ {b} fd μ = f (b), {\ displaystyle \ int _ {\ {b \}} fd \ mu = f (b),}
демонстрируя, что f {\ displaystyle f}на самом деле является функцией массы вероятности.
.
Когда существует естественный порядок среди потенциальных результатов x {\ displaystyle x}, может быть удобно присвоить им числовые значения (или кортежи из n в случае дискретного многомерная случайная величина ), а также учитывать значения не в изображении из X {\ displaystyle X}. То есть f X {\ displaystyle f_ {X}}может быть определено для всех вещественных чисел и f X (x) = 0 {\ displaystyle f_ {X} (x) = 0}для всех x ∉ X (S) {\ displaystyle x \ notin X (S)}, как показано на рисунке.
Изображение X {\ displaystyle X}имеет счетное подмножество, на котором функция массы вероятности f X (x) {\ displaystyle f_ {X} (x)}равно единице. Следовательно, функция массы вероятности равна нулю для всех, кроме счетного числа значений x {\ displaystyle x}.
Разрыв функций массы вероятности связан с тем, что кумулятивная функция распределения дискретной случайной величины также является разрывным. Если X {\ displaystyle X}- дискретная случайная величина, то P (X = x) = 1 {\ displaystyle P (X = x) = 1}означает, что случайное событие (X = x) {\ displaystyle (X = x)}обязательно (это верно в 100% случаев); напротив, P (X = x) = 0 {\ displaystyle P (X = x) = 0}означает, что случайное событие (X = x) {\ displaystyle ( X = x)}всегда невозможно. Это утверждение неверно для непрерывной случайной величины X {\ displaystyle X}, для которой P (X = x) = 0 {\ displaystyle P (X = x) = 0}для любого возможного x {\ displaystyle x}: фактически, по определению, непрерывная случайная величина может иметь бесконечное число набор возможных значений, и, таким образом, вероятность того, что он имеет одно конкретное значение x, равна 1 ∞ = 0 {\ displaystyle {\ frac {1} {\ infty}} = 0}. Дискретность - это процесс преобразования непрерывной случайной величины в дискретную.
Примеры
Конечное
Имеются три основных связанных распределения: распределение Бернулли, Биномиальное распределение и геометрическое распределение.
- распределение Бернулли, Ber (p), используется для моделирования эксперимента только с двумя возможными исходами. Два результата часто кодируются как 1 и 0.
- p X (x) = {p, если x равен 1 1 - p, если x равен 0 {\ displaystyle p_ {X} (x) = {\ begin { case} p, {\ text {if}} x {\ text {равно 1}} \\ 1-p, {\ text {if}} x {\ text {равно 0}} \ end {cases}} }
- Пример распределения Бернулли - подбрасывание монеты. Предположим, что S {\ displaystyle S}- это пространство выборки всех результатов одного подбрасывания справедливой монеты, а X {\ displaystyle X}- случайная переменная, определенная на S {\ displaystyle S}, присваивая 0 категории «решки» и 1 категории «головы». Поскольку монета честная, функция вероятности и массы равна
- p X (x) = {1 2, x ∈ {0, 1}, 0, x ∉ {0, 1}. {\ displaystyle p_ {X} (x) = {\ begin {case} {\ frac {1} {2}}, x \ in \ {0,1 \}, \\ 0, x \ notin \ {0, 1 \}. \ End {cases}}}
- Биномиальное распределение, Bin (n, p), моделирует количество успехов, когда кто-то набирает n раз с заменой. Каждый розыгрыш или эксперимент независимы, с двумя возможными исходами. Соответствующая функция вероятностных масс: (nk) pk (1 - p) n - k {\ displaystyle {\ binom {n} {k}} p ^ {k} (1-p) ^ {nk}}. Функция массы вероятности честного кубика. Все числа на кубике имеют равные шансы оказаться сверху, когда кубик перестанет катиться.
- Примером биномиального распределения является вероятность получить ровно одну 6, когда кто-то бросает справедливый кубик три раз.
.
- Геометрическое распределение описывает количество попыток, необходимое для достижения одного успеха, обозначается как Geo (p). Его функция вероятностной массы равна p X (k) = (1 - p) k - 1 p {\ displaystyle p_ {X} (k) = (1-p) ^ {k-1} p}.
- Например, подбрасывание монеты до появления первой головы.
Другими распределениями, которые можно моделировать с использованием функции вероятности и масс, являются Категориальное распределение (также известное как обобщенное распределение Бернулли) и полиномиальное распределение.
- Если дискретное распределение имеет два или может появиться больше категорий, одна из которых может иметь место, независимо от того, имеют ли эти категории естественный порядок, когда есть только одно испытание (розыгрыш), это категориальное распределение.
- Пример многомерного дискретного распределения и его функции массы вероятности обеспечивается полиномиальным распределением . Здесь несколько случайных величин - это количество успехов в каждой из категорий после заданного количества испытаний, и каждая ненулевая вероятностная масса дает вероятность определенной комбинации количества успехов в различных категориях.
Бесконечное
- Следующее экспоненциально убывающее распределение является примером распределения с бесконечным числом возможных результатов - всеми положительными целыми числами:
- Pr (X = i) = 1 2 i для i = 1, 2, 3,…. {\ displaystyle {\ text {Pr}} (X = i) = {\ frac {1} {2 ^ {i}}} \ quad {\ text {for}} \ quad i = 1,2,3, \ точек.}
- Несмотря на бесконечное количество возможных исходов, общая вероятностная масса равна 1/2 + 1/4 + 1/8 +... = 1, что удовлетворяет требованию единичной полной вероятности для распределения вероятностей.
Многомерный случай
Две или несколько дискретных случайных величин имеют совместную функцию масс вероятности, которая дает вероятность каждой возможной комбинации реализаций для случайных величин.
Ссылки
Дополнительная литература
- Johnson, N.L.; Kotz, S.; Кемп, А. (1993). Одномерные дискретные распределения (2-е изд.). Вайли. п. 36. ISBN 0-471-54897-9.