Переменная, представляющая случайное явление
В вероятности и статистике, случайная величина, случайная величина, случайная переменная или стохастическая переменная неформально описывается как переменная, значения которой зависят от результатов случайное явление. Формальная математическая обработка случайных величин - тема теории вероятностей. В этом контексте под случайной величиной понимается измеримая функция, определенная в вероятностном пространстве, которая отображает пространство выборки на действительные числа.
Этот график показывает, как случайная величина является функцией от всех возможных результатов до реальных значений. Он также показывает, как случайная величина используется для определения функций вероятности и массы.
Возможные значения случайной величины могут представлять возможные результаты еще не проведенного эксперимента или возможные результаты прошлого эксперимента, который уже существовал. значение является неопределенным (например, из-за неточных измерений или квантовой неопределенности ). Они также могут концептуально представлять либо результаты «объективно» случайного процесса (такого как бросание кубика), либо «субъективную» случайность, являющуюся результатом неполного знания величины. Значение вероятностей, приписываемых потенциальным значениям случайной величины, не является частью самой теории вероятностей, а вместо этого связано с философскими аргументами по интерпретации вероятности. Математика работает одинаково, независимо от конкретной интерпретации.
В качестве функции случайная величина должна быть измеримой, что позволяет назначать вероятности наборам ее потенциальных значений. Часто результаты зависят от некоторых физических переменных, которые нельзя предсказать. Например, при подбрасывании справедливой монеты конечный результат орла или решки зависит от неопределенных физических условий, поэтому наблюдаемый результат является неопределенным. Монета могла зацепиться за трещину в полу, но такая возможность исключается из рассмотрения.
область случайной величины называется пространством выборки. Он интерпретируется как набор возможных исходов случайного явления. Например, в случае подбрасывания монеты рассматриваются только два возможных исхода, а именно орел или решка.
Случайная величина имеет распределение вероятностей, которое определяет вероятность борелевских подмножеств ее диапазона. Случайные переменные могут быть дискретными, то есть принимать любое из указанного конечного или счетного списка значений (имеющего счетный диапазон), наделенного функцией вероятностной массы что характерно для распределения вероятностей случайной величины; или непрерывный, принимающий любое числовое значение в интервале или совокупности интервалов (имеющих неисчислимый диапазон) с помощью функции плотности вероятности, которая является характеристикой распределения вероятностей случайной величины; или их смесь.
Две случайные величины с одинаковым распределением вероятностей могут отличаться по своей связи или независимости от других случайных величин. Реализации случайной величины, то есть результаты случайного выбора значений в соответствии с функцией распределения вероятностей переменной, называются случайными переменными.
Содержание
- 1 Определение
- 1.1 Стандартный случай
- 1.2 Расширения
- 2 Функции распределения
- 3 Примеры
- 3.1 Дискретная случайная величина
- 3.1.1 Бросок монеты
- 3.1.2 Бросок кости
- 3.2 Непрерывная случайная величина
- 3.3 Смешанный тип
- 4 Теоретико-мерное определение
- 4.1 Случайные величины с действительным знаком
- 5 Моменты
- 6 Функции случайных величин
- 6.1 Пример 1
- 6.2 Пример 2
- 6.3 Пример 3
- 6.4 Пример 4
- 7 Некоторые свойства
- 8 Эквивалентность случайных величин
- 8.1 Равенство в распределении
- 8.2 Почти гарантированное равенство
- 8.3 Равенство
- 9 Сходимость
- 10 См. Также
- 11 Ссылки
- 11.1 Встроенные ссылки
- 11.2 Литература
- 12 Внешние ссылки
Определение
A случайная величина - это измеримая функция из набора возможных результатов до измеримого пространства . Техническое аксиоматическое определение требует, чтобы было пространством выборки тройки вероятностей (см. Определение из теории меры). Случайная величина часто обозначается заглавными римскими буквами, например , , , .
Вероятность того, что примет значение в измеримом наборе записывается как
Стандартный случай
Во многих случаях имеет вещественное значение, т. Е. . В некоторых контекстах термин случайный элемент (см. расширения) используется для обозначения случайной величины не этой формы.
Когда изображение (или диапазон) является счетным, случайная величина называется дискретная случайная величина, и ее распределение является дискретным распределением вероятностей, то есть может быть описано с помощью функции массы вероятности, которая присваивает вероятность каждому значению в изображении . Если изображение бесконечно бесконечно (обычно это интервал ), то называется непрерывной случайной величиной . В частном случае, когда это абсолютно непрерывный, его распределение может быть описано с помощью функции плотности вероятности, которая присваивает вероятности интервалам; в частности, каждая отдельная точка обязательно должна иметь нулевую вероятность для абсолютно непрерывной случайной величины. Не все непрерывные случайные величины абсолютно непрерывны, распределение смеси является одним из таких контрпримеров; такие случайные величины не могут быть описаны плотностью вероятности или функцией массы вероятности.
Любая случайная величина может быть описана ее кумулятивной функцией распределения, которая описывает вероятность того, что случайная величина будет меньше или равна определенному значению.
Расширения
Термин «случайная величина» в статистике традиционно ограничивается случаем вещественных значений (). В этом случае структура действительных чисел позволяет определять такие величины, как ожидаемое значение и дисперсия случайной величины, ее кумулятивная функция распределения, и моменты его распределения.
Однако приведенное выше определение действительно для любого измеримого пространства значений. Таким образом, можно рассматривать случайные элементы других наборов , например случайные логические значения, категориальные значения, сложными числа, векторы, матрицы, последовательности, деревья, наборы, фигур, коллекторы и функции. Затем можно конкретно указать случайную переменную типа type или -значная случайная величина.
Эта более общая концепция случайного элемента особенно полезна в таких дисциплинах, как теория графов, машинное обучение, естественный язык. обработка и другие области в дискретной математике и информатике, где часто интересуют моделирование случайных вариаций нечисловых структур данных. В некоторых случаях, тем не менее, удобно представлять каждый элемент , используя одно или несколько действительных чисел. В этом случае случайный элемент может дополнительно быть представлен как вектор вещественных случайных величин (все они определены в одном и том же базовом вероятностном пространстве , что позволяет различным случайным величинам коварировать ). Например:
- Случайное слово может быть представлено как случайное целое число, которое служит индексом в словаре возможных слов. В качестве альтернативы его можно представить как случайный индикаторный вектор, длина которого равна размеру словаря, где единственными значениями положительной вероятности являются , , , а позиция 1 указывает слово.
- Случайное предложение заданной длины может быть представлен как вектор из случайных слов.
- A случайный граф на заданном вершины могут быть представлены как матрица случайных величин , значения которой задают матрицу смежности случайного графа.
- A случайная функция может быть представлена как набор случайных величин , задавая значения функции при различных s указывает в области определения функции. - обычные случайные величины с действительным знаком при условии, что функция является действительной. Например, случайный процесс является случайной функцией времени, случайный вектор - случайной функцией некоторого набора индексов, например и random field представляет собой случайную функцию для любого набора (обычно времени, пространства или дискретного набора).
Функции распределения
Если случайная величина определена в вероятностном пространстве задано, мы можем задать такие вопросы, как "Насколько вероятно, что значение равно 2? ". Это то же самое, что вероятность события , которое часто записывается как или для краткости.
Запись всех этих вероятностей выходных диапазонов действительной случайной величины дает распределение вероятностей для . Распределение вероятностей "забывает" о конкретном вероятностном пространстве, используемом для определения , и записывает только вероятности различных значений . Такое распределение вероятностей всегда можно уловить с помощью его кумулятивной функции распределения
, а также иногда с использованием функции плотности вероятности, . В терминах теории меры мы используем случайную величину , чтобы «продвинуть» меру на до меры на . Базовое вероятностное пространство - это техническое устройство, используемое для гарантии существования случайных величин, иногда для их построения, и для определения таких понятий, как корреляция и зависимость. или независимость на основе совместного распределения двух или более случайных величин в одном вероятностном пространстве. На практике часто пространство полностью удаляется и просто ставится мера на , который присваивает меру 1 всей действительной прямой, т. е. работает с распределениями вероятностей вместо случайных величин. См. Статью о функциях квантилей для более полной разработки.
Примеры
Дискретная случайная величина
В эксперименте человек может быть выбран случайным образом, и одной случайной величиной может быть рост человека. Математически случайная величина интерпретируется как функция, которая сопоставляет человека с ростом человека. Со случайной величиной связано распределение вероятностей, которое позволяет вычислить вероятность того, что высота находится в любом подмножестве возможных значений, таких как вероятность того, что высота составляет от 180 до 190 см, или вероятность того, что высота либо меньше более 150 или более 200 см.
Другой случайной величиной может быть количество детей человека; это дискретная случайная величина с неотрицательными целыми числами. Он позволяет вычислять вероятности для отдельных целочисленных значений - функции массы вероятности (PMF) - или для наборов значений, включая бесконечные наборы. Например, интересующим событием может быть «четное количество детей». Как для конечных, так и для бесконечных наборов событий их вероятности могут быть найдены путем сложения PMF элементов; то есть вероятность четного числа детей равна бесконечной сумме .
В таких примерах, как эти, пространство выборки часто подавляется, так как это математически сложно описать, а возможные значения случайных величин затем рассматриваются как пространство выборки. Но когда две случайные величины измеряются в одном и том же пространстве выборки результатов, например, рост и количество детей, вычисляемых для одних и тех же случайных людей, легче отслеживать их взаимосвязь, если признается, что приходят и рост, и количество детей. от одного и того же случайного человека, например, чтобы можно было задать вопросы о том, коррелированы ли такие случайные величины или нет.
Если - счетные наборы действительных чисел, и , затем - дискретная функция распределения. Здесь для
Подбрасывание монеты
Возможные результаты для одного подбрасывание монеты можно описать пробелом Ω = { орла, решка} {\ displaystyle \ Omega = \ {{\ text {head}}, {\ text {tails}} \}}. Мы можем ввести случайную величину с действительным знаком Y {\ displaystyle Y}, которая моделирует выплату в 1 доллар за успешную ставку на решку следующим образом:
- Y (ω) = {1, если ω = орла, 0, если ω = решка. {\ displaystyle Y (\ omega) = {\ begin {case} 1, {\ text {if}} \ omega = {\ text {head}}, \\ [6pt] 0, {\ text {if} } \ omega = {\ text {tails}}. \ end {cases}}}
Если монета является честной монетой, Y имеет функцию массы вероятности е Y {\ displaystyle f_ {Y}}определяется выражением:
- f Y (y) = {1 2, если y = 1, 1 2, если y = 0, {\ displaystyle f_ {Y} (y) = {\ begin {cases} {\ tfrac {1} {2}}, {\ text {if}} y = 1, \\ [6pt] {\ tfrac {1} {2} }, {\ text {if}} y = 0, \ end {cases}}}
Бросок кубиков
Если пробел представляет собой набор возможных чисел, брошенных на двух кубиках, и интересующая случайная величина представляет собой сумму S чисел на двух игральных костях, тогда S представляет собой дискретную случайную величину, распределение которой описывается функцией массы вероятности , построенной здесь как высота столбцов изображения.
Случайная величина может также может использоваться для описания процесса бросания игральных костей и возможных результатов. Наиболее очевидное представление для случая двух игральных костей - взять набор пар чисел n 1 и n 2 из {1, 2, 3, 4, 5, 6} (представляющие числа на двух кубиках) как пробел. Общее количество выпавших чисел (сумма чисел в каждой паре) тогда является случайной величиной X, заданной функцией, которая преобразует пару в сумму:
- X ((n 1, n 2)) = n 1 + n 2 {\ displaystyle X ((n_ {1}, n_ {2})) = n_ {1} + n_ {2}}
и (если кости справедливые ) имеет вероятностную массу функция ƒ X определяется как:
- f X (S) = min (S - 1, 13 - S) 36, для S ∈ {2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12} {\ displaystyle f_ {X} (S) = {\ frac {\ min (S-1,13-S)} {36}}, {\ text {for}} S \ in \ {2,3,4,5,6,7,8,9,10,11,12 \}}
Непрерывная случайная величина
Формально непрерывная случайная величина - это случайная величина, чья кумулятивная функция распределения везде непрерывна. Нет «пробелов », которые соответствовали бы числам, которые имеют конечную вероятность появления. Вместо этого непрерывные случайные величины почти никогда не принимают точно заданное значение c (формально ∀ c ∈ R: Pr (X = c) = 0 {\ textstyle \ forall c \ in \ mathbb {R }: \; \ Pr (X = c) = 0}), но существует положительная вероятность того, что его значение будет лежать в определенных интервалах, которые могут быть сколь угодно малыми. Непрерывные случайные величины обычно допускают функции плотности вероятности (PDF), которые характеризуют их CDF и меры вероятности ; такие распределения также называются абсолютно непрерывными ; но некоторые непрерывные распределения являются сингулярным или сочетанием абсолютно непрерывной части и особой части.
Примером непрерывной случайной величины может служить счетчик, который может выбирать горизонтальное направление. Тогда значения, принимаемые случайной величиной, являются направлениями. Мы могли бы представить эти направления в виде севера, запада, востока, юга, юго-востока и т. Д. Однако обычно удобнее сопоставить пространство выборки со случайной величиной, которая принимает значения, которые являются действительными числами. Это можно сделать, например, сопоставив направление с пеленгом в градусах по часовой стрелке от севера. Затем случайная переменная принимает значения, которые являются действительными числами из интервала [0, 360), причем все части диапазона «равновероятны». В этом случае X = угол поворота. Любое действительное число имеет нулевую вероятность быть выбранным, но положительная вероятность может быть присвоена любому диапазону значений. Например, вероятность выбора числа в [0, 180] составляет ⁄ 2. Вместо того чтобы говорить о функции массы вероятности, мы говорим, что плотность вероятности X равна 1/360. Вероятность подмножества [0, 360) может быть вычислена путем умножения меры набора на 1/360. В общем, вероятность набора для данной непрерывной случайной величины может быть вычислена путем интегрирования плотности по данному набору.
Более формально, для любого интервала I = [a, b] = {x ∈ R: a ≤ x ≤ b} {\ textstyle I = [a, b] = \ {x \ in \ mathbb {R}: a \ leq x \ leq b \}}, случайная величина XI ∼ U (I) = U [a, b] {\ displaystyle X_ {I} \ sim \ operatorname {U} (I) = \ operatorname {U} [a, b]}называется «непрерывной однородной случайной величиной» (CURV), если вероятность того, что он принимает значение в подынтервале , зависит только от длины подынтервала. Это означает, что вероятность того, что XI {\ displaystyle X_ {I}}попадет в любой подинтервал [c, d] ⊆ [a, b] {\ displaystyle [c, d] \ substeq [a, b]}пропорционально длине подынтервала, то есть, если a ≤ c ≤ d ≤ b, у него
Pr (XI ∈ [c, d]) = d - cb - a Pr (XI ∈ I) = d - cb - a {\ displaystyle \ Pr \ left (X_ {I} \ in [c, d] \ right) = {\ frac {dc} {ba}} \ Pr \ left (X_ {I} \ in I \ right) = {\ frac {dc} {ba}}}где последнее равенство является результатом аксиома унитарности вероятности. Дается функция плотности вероятности кривой X ∼ U [a, b] {\ displaystyle X \ sim \ operatorname {U} [a, b]}индикаторной функцией своего интервала поддержки, нормированного на длину интервала:
f X (x) = {1 b - a, a ≤ x ≤ b 0, в противном случае. {\ displaystyle f_ {X} (x) = {\ begin {case} \ displaystyle {1 \ over ba}, a \ leq x \ leq b \\ 0, {\ text {else}}. \ end {case }}}Особый интерес представляет равномерное распределение на
единичном интервале [0, 1] {\ displaystyle [0,1]}. Образцы любого желаемого
распределения вероятностей D {\ displaystyle \ operatorname {D}}могут быть созданы путем вычисления
функции квантиля для
D {\ displaystyle \ operatorname {D}}на
случайно сгенерированном числе, равномерно распределенном на единичном интервале. При этом используются свойства
кумулятивных функций распределения, которые являются объединяющей структурой для всех случайных величин.
Смешанный тип
A смешанная случайная величина - это случайная величина, кумулятивная функция распределения которой не является ни кусочно-постоянной (дискретная случайная величина), ни везде -непрерывный. Его можно реализовать как сумму дискретной случайной величины и непрерывной случайной величины; в этом случае CDF будет средневзвешенным значением CDF компонентных переменных.
Пример случайной переменной смешанного типа будет основан на эксперименте, в котором подбрасывается монета и вертушка вращается только в том случае, если в результате подбрасывания монеты выпали решки. Если результат - решка, X = -1; в противном случае X = значение счетчика, как в предыдущем примере. Существует вероятность ⁄ 2 того, что эта случайная величина будет иметь значение -1. Другие диапазоны значений будут иметь половину вероятностей последнего примера.
В большинстве случаев каждое распределение вероятностей на действительной прямой представляет собой смесь дискретной части, единственной части и абсолютно непрерывной части; см. теорему Лебега о разложении § Уточнение. Дискретная часть сосредоточена на счетном множестве, но это множество может быть плотным (как множество всех рациональных чисел).
Теоретико-мерное определение
Наиболее формальное, аксиоматическое определение случайной величины связано с теорией меры. Непрерывные случайные переменные определяются с помощью наборов чисел, а также функций, которые отображают такие наборы на вероятности. Из-за различных трудностей (например, парадокса Банаха – Тарского ), которые возникают, если такие множества недостаточно ограничены, необходимо ввести так называемую сигма-алгебру для ограничения возможных множеств. по которым могут быть определены вероятности. Обычно используется такая особая сигма-алгебра, борелевская σ-алгебра, которая позволяет определять вероятности для любых наборов, которые могут быть получены либо непосредственно из непрерывных интервалов чисел, либо с помощью конечного или счетно бесконечное число объединений и / или пересечений таких интервалов.
Теоретико-мерное определение выглядит следующим образом.
Пусть (Ω, F, P) {\ displaystyle (\ Omega, {\ mathcal {F}}, P)}будет вероятностным пространством и (E, E) {\ displaystyle (E, {\ mathcal {E}})}a измеримое пространство. Тогда (E, E) {\ displaystyle (E, {\ mathcal {E}})}-значная случайная величина является измеримой функцией X: Ω → E {\ displaystyle X \ двоеточие \ Omega \ to E}, что означает, что для каждого подмножества B ∈ E {\ displaystyle B \ in {\ mathcal {E}}}, его прообраз X - 1 (B) ∈ F {\ displaystyle X ^ {- 1} (B) \ in {\ mathcal {F}}}где X - 1 (B) = {ω: X (ω) ∈ B} {\ displaystyle X ^ {- 1} (B) = \ {\ omega: X (\ omega) \ in B \}}. Это определение позволяет нам измерить любое подмножество B ∈ E {\ displaystyle B \ in {\ mathcal {E}}}в целевом пространстве, глядя на его прообраз, который по предположению измерим.
В более интуитивных терминах член Ω {\ displaystyle \ Omega}является возможным результатом, членом F {\ displaystyle {\ mathcal {F }}}- измеримое подмножество возможных результатов, функция P {\ displaystyle P}дает вероятность каждого такого измеримого подмножества, E {\ displaystyle E}представляет набор значений, которые может принимать случайная величина (например, набор действительных чисел), и член E {\ displaystyle {\ mathcal {E}}}- это «хорошо управляемое» (измеримое) подмножество E {\ displaystyle E}(тех, для которых может быть определена вероятность). Тогда случайная величина представляет собой функцию от любого результата к количеству, так что результаты, ведущие к любому полезному подмножеству величин для случайной величины, имеют четко определенную вероятность.
Когда E {\ displaystyle E}является топологическим пространством, тогда наиболее распространенным выбором является σ-алгебра E {\ displaystyle {\ mathcal {E}}}- это борелевская σ-алгебра B (E) {\ displaystyle {\ mathcal {B}} ( E)}, которая представляет собой σ-алгебру, сгенерированную совокупностью всех открытых множеств в E {\ displaystyle E}. В таком случае случайная величина со значением (E, E) {\ displaystyle (E, {\ mathcal {E}})}называется E {\ displaystyle E}-значная случайная величина . Более того, когда пробел E {\ displaystyle E}является действительной линией R {\ displaystyle \ mathbb {R}}, тогда такой вещественный случайная величина называется просто случайной величиной .
случайными величинами с действительными значениями
В этом случае пространство наблюдения - это набор действительных чисел. Напомним, (Ω, F, P) {\ displaystyle (\ Omega, {\ mathcal {F}}, P)}- это вероятностное пространство. Для реального пространства наблюдения функция X: Ω → R {\ displaystyle X \ двоеточие \ Omega \ rightarrow \ mathbb {R}}является случайной величиной с действительным знаком, если
- { ω: X (ω) ≤ r} ∈ F ∀ r ∈ R. {\ displaystyle \ {\ omega: X (\ omega) \ leq r \} \ in {\ mathcal {F}} \ qquad \ forall r \ in \ mathbb {R}.}
Это определение является частным случаем из вышеперечисленного, поскольку набор {(- ∞, r]: r ∈ R} {\ displaystyle \ {(- \ infty, r]: r \ in \ mathbb {R} \}}порождает борелевскую σ-алгебру на множестве действительных чисел, и достаточно проверить измеримость на любом порождающем множестве. Здесь мы можем доказать измеримость на этом порождающем множестве, используя тот факт, что {ω: X (ω) ≤ г} знак равно Икс - 1 ((- ∞, r]) {\ displaystyle \ {\ omega: X (\ omega) \ leq r \} = X ^ {- 1} ((- \ infty, r])}.
Моменты
Распределение вероятностей случайной величины часто характеризуется небольшим количеством параметров, которые также имеют практическую интерпретацию.Например, часто достаточно знать, каково ее «среднее значение». Это зафиксировано математической концепцией ожидаемого значения случайной величины, обозначаемой E [X] {\ displaystyle \ operatorname {E} [X]}, и также называется первый момент. В общем, E [f (X)] {\ displaystyle \ operatorname {E} [f (X)]}не равно f (E [X]) {\ displaystyle f (\ operatorname {E} [X])}. Как только "среднее значение" известно, можно спросить, насколько далеко от этого среднего значения обычно находятся значения X {\ displaystyle X}, вопрос, на который отвечает дисперсия и стандартное отклонение случайной величины. E [X] {\ displaystyle \ operatorname {E} [X]}можно интуитивно рассматривать как среднее значение, полученное из бесконечной совокупности, члены которой являются частными оценками X {\ displaystyle X}.
Математически это известно как (обобщенная) проблема моментов : для данного класса случайных величин X {\ displaystyle X}найдите коллекцию {fi} {\ displaystyle \ {f_ {i} \}}таких функций, что ожидаемые значения E [fi (X)] {\ displaystyle \ operatorname {E} [f_ {i} (X)]}полностью охарактеризовать распределение случайной величины X {\ displaystyle X}.
Моменты могут только быть определенным для действительных функций от случайных величин (или комплексных значений и т. д.). Если случайная величина сама имеет действительное значение, то могут быть взяты моменты самой переменной, которые эквивалентны моментам тождественной функции f (X) = X {\ displaystyle f (X) = X}случайной величины. Однако даже для случайных величин с ненастоящими значениями могут быть взяты моменты действительных функций этих переменных. Например, для категориальной случайной величины X, которая может принимать номинальные значения «красный», «синий» или «зеленый», функция с действительным знаком [X = зеленый] {\ displaystyle [X = {\ text {green}}]}можно построить; здесь используется скобка Айверсона, и он имеет значение 1, если X {\ displaystyle X}имеет значение «зеленый», в противном случае - 0. Затем можно определить ожидаемое значение и другие моменты этой функции.
Функции случайных величин
Новая случайная величина Y может быть определена с помощью применения действительной измеримой по Борелю функции g: R → R {\ displaystyle g \ двоеточие \ mathbb {R} \ rightarrow \ mathbb {R}}к результатам вещественной случайной величины X {\ displaystyle X }. То есть Y = g (X) {\ displaystyle Y = g (X)}. кумулятивная функция распределения для Y {\ displaystyle Y}тогда равна
- F Y (y) = P (g (X) ≤ y). {\ displaystyle F_ {Y} (y) = \ operatorname {P} (g (X) \ leq y).}
Если функция g {\ displaystyle g}обратима ( т.е. существует h = g - 1 {\ displaystyle h = g ^ {- 1}}, где h {\ displaystyle h}равно g {\ displaystyle g}'s обратная функция ) и либо увеличивается, либо уменьшается, тогда предыдущее отношение может быть расширено для получения
- FY ( y) = P (g (X) ≤ y) = {P (X ≤ h (y)) = FX (h (y)), если h = g - 1 возрастает, P (X ≥ h (y)) = 1 - FX (h (y)), если h = g - 1 убывает. {\ displaystyle F_ {Y} (y) = \ operatorname {P} (g (X) \ leq y) = {\ begin {cases} \ operatorname {P} (X \ leq h (y)) = F_ {X } (h (y)), {\ text {if}} h = g ^ {- 1} {\ text {возрастание}}, \\\\\ имя оператора {P} (X \ geq h (y)) = 1-F_ {X} (h (y)), {\ text {if}} h = g ^ {- 1} {\ text {уменьшение}}. \ End {cases}}}
С помощью те же гипотезы обратимости g {\ displaystyle g}, предполагая также дифференцируемость, связь между функциями плотности вероятности может быть найдена путем дифференцирования обоих стороны приведенного выше выражения по отношению к y {\ displaystyle y}, чтобы получить
- f Y (y) = f X (h (y)) | d h (y) d y |. {\ displaystyle f_ {Y} (y) = f_ {X} {\ bigl (} h (y) {\ bigr)} \ left | {\ frac {dh (y)} {dy}} \ right |.}
Если нет обратимости g {\ displaystyle g}, но каждый y {\ displaystyle y}допускает не более чем счетное количество корней ( то есть конечное или счетное бесконечное число xi {\ displaystyle x_ {i}}таких, что y = g (xi) {\ displaystyle y = g (x_ {i })}), то предыдущая связь между функциями плотности вероятности может быть обобщена с помощью
- f Y (y) = ∑, если X (gi - 1 (y)) | d g i - 1 (y) d y | {\ displaystyle f_ {Y} (y) = \ sum _ {i} f_ {X} (g_ {i} ^ {- 1} (y)) \ left | {\ frac {dg_ {i} ^ {- 1 } (y)} {dy}} \ right |}
где xi = gi - 1 (y) {\ displaystyle x_ {i} = g_ {i} ^ {- 1} (y)}, согласно теореме об обратной функции. Формулы для плотностей не требуют увеличения g {\ displaystyle g}.
В теории измерения, аксиоматический подход к вероятности, если случайная величина X {\ displaystyle X}на Ω {\ displaystyle \ Omega}и измеримая функция по Борелю g: R → R {\ displaystyle g \ двоеточие \ mathbb {R} \ rightarrow \ mathbb {R}}, тогда Y = g (X) {\ displaystyle Y = g (X)}также является случайной величиной на Ω {\ displaystyle \ Omega}, поскольку композиция измеримых функций также измерима. (Однако это не обязательно верно, если g {\ displaystyle g}измеримо по Лебегу.) Та же процедура, которая позволила выйти из вероятностного пространства (Ω, P) {\ displaystyle (\ Omega, P)}до (R, d FX) {\ displaystyle (\ mathbb {R}, dF_ {X})}можно использовать для получения распределения Y {\ displaystyle Y}.
Пример 1
Пусть X {\ displaystyle X}будет действительным -значная, непрерывная случайная величина и пусть Y = X 2 {\ displaystyle Y = X ^ {2}}.
- FY (y) = P (X 2 ≤ y). {\ displaystyle F_ {Y} (y) = \ operatorname {P} (X ^ {2} \ leq y).}
Если y < 0 {\displaystyle y<0}, то P (X 2 ≤ y) = 0 { \ displaystyle P (X ^ {2} \ leq y) = 0}, поэтому
- FY (y) = 0, если y < 0. {\displaystyle F_{Y}(y)=0\qquad {\hbox{if}}\quad y<0.}
If y ≥ 0 {\ displaystyle y \ geq 0}, тогда
- P (X 2 ≤ y) = P (| X | ≤ y) = P (- y ≤ X ≤ y), {\ displaystyle \ operatorname { P} (X ^ {2} \ leq y) = \ operatorname {P} (| X | \ leq {\ sqrt {y}}) = \ operatorname {P} (- {\ sqrt {y}} \ leq X \ leq {\ sqrt {y}}),}
поэтому
- FY (y) = FX (y) - FX (- y), если y ≥ 0. {\ displaystyle F_ {Y} (y) = F_ {X} ({\ sqrt {y}}) - F_ {X} (- {\ sqrt {y}}) \ qquad {\ hbox {if}} \ quad y \ geq 0.}
Пример 2
Предположим, X {\ displaystyle X}- случайная величина с кумулятивным распределением
- FX (x) = P (X ≤ x) = 1 (1 + e - х) θ {\ displaystyle F_ {X} (x) = P (X \ leq x) = {\ frac {1} {(1 + e ^ {- x}) ^ {\ theta}}}}
где θ>0 {\ displaystyle \ theta>0}- фиксированный параметр. Рассмотрим случайную величину Y = l o g (1 + e - X). {\ displaystyle Y = \ mathrm {log} (1 + e ^ {- X}).}Тогда
- FY (y) = P (Y ≤ y) = P (log (1 + e - X) ≤ y) = P (X ≥ - log (ey - 1)). {\ displaystyle F_ {Y} (y) = P (Y \ leq y) = P (\ mathrm {log} (1 + e ^ {- X}) \ leq y) = P (X \ geq - \ mathrm {log} ( e ^ {y} -1)). \,}
Последнее выражение может быть вычислено в терминах кумулятивного распределения X, {\ displaystyle X,}итак
- FY (y) = 1 - FX (- log (ey - 1)) = 1 - 1 (1 + e log (ey - 1)) θ = 1 - 1 (1 + ey - 1) θ = 1 - е - у θ. {\ displaystyle {\ begin {align} F_ {Y} (y) = 1-F_ {X} (- \ log (e ^ {y} -1)) \\ [5pt] = 1 - {\ frac {1} {(1 + e ^ {\ log (e ^ {y} -1)}) ^ {\ theta}}} \\ [5pt] = 1 - {\ frac {1} {(1 + e ^ {y} -1) ^ {\ theta}}} \\ [5pt] = 1-e ^ {- y \ theta}. \ end {align}}}
что является кумулятивным распределением функция (CDF) экспоненциального распределения.
Пример 3
Предположим, что X {\ displaystyle X}- случайная величина с стандартное нормальное распределение, плотность которого равна
- f X (x) = 1 2 π e - x 2/2. {\ displaystyle f_ {X} (x) = {\ frac {1} {\ sqrt {2 \ pi}}} e ^ {- x ^ {2} / 2}.}
Рассмотрим случайную величину Y = Х 2. {\ displaystyle Y = X ^ {2}.}Мы можем найти плотность, используя приведенную выше формулу для замены переменных:
- f Y (y) = ∑ if X (gi - 1 ( у)) | d g i - 1 (y) d y |. {\ displaystyle f_ {Y} (y) = \ sum _ {i} f_ {X} (g_ {i} ^ {- 1} (y)) \ left | {\ frac {dg_ {i} ^ {- 1 } (y)} {dy}} \ right |.}
В этом случае изменение не монотонно, потому что каждое значение Y {\ displaystyle Y}имеет два соответствующих значения X {\ displaystyle X}(одно положительное и отрицательное). Однако из-за симметрии обе половины будут преобразовываться одинаково, т.е.
- f Y (y) = 2 f X (g - 1 (y)) | d g - 1 (y) d y |. {\ displaystyle f_ {Y} (y) = 2f_ {X} (g ^ {- 1} (y)) \ left | {\ frac {dg ^ {- 1} (y)} {dy}} \ right |.}
Обратное преобразование:
- x = g - 1 (y) = y {\ displaystyle x = g ^ {- 1} (y) = {\ sqrt {y}}}
и его производная равна
- dg - 1 (y) dy = 1 2 y. {\ displaystyle {\ frac {dg ^ {- 1} (y)} {dy}} = {\ frac {1} {2 {\ sqrt {y}}}}.}
Тогда
- f Y (y) знак равно 2 1 2 π e - y / 2 1 2 y = 1 2 π ye - y / 2. {\ displaystyle f_ {Y} (y) = 2 {\ frac {1} {\ sqrt {2 \ pi}}} e ^ {- y / 2} {\ frac {1} {2 {\ sqrt {y} }}} = {\ frac {1} {\ sqrt {2 \ pi y}}} e ^ {- y / 2}.}
Это распределение хи-квадрат с одним степень свободы.
Пример 4
Предположим, X {\ displaystyle X}- случайная величина с нормальным распределением, плотность которой равна
- f X (x) = 1 2 π σ 2 e - (x - μ) 2 / (2 σ 2). {\ displaystyle f_ {X} (x) = {\ frac {1} {\ sqrt {2 \ pi \ sigma ^ {2}}}} e ^ {- (x- \ mu) ^ {2} / (2 \ sigma ^ {2})}.}
Рассмотрим случайную величину Y = X 2. {\ displaystyle Y = X ^ {2}.}Мы можем найти плотность, используя приведенную выше формулу для замены переменных:
- f Y (y) = ∑ if X (gi - 1 ( у)) | d g i - 1 (y) d y |. {\ displaystyle f_ {Y} (y) = \ sum _ {i} f_ {X} (g_ {i} ^ {- 1} (y)) \ left | {\ frac {dg_ {i} ^ {- 1 } (y)} {dy}} \ right |.}
В этом случае изменение не монотонное, потому что каждое значение Y {\ displaystyle Y}имеет два соответствующих значения X {\ displaystyle X}(одно положительное и отрицательное). В отличие от предыдущего примера, в этом случае, однако, нет симметрии, и мы должны вычислить два различных члена:
- f Y (y) = f X (g 1 - 1 (y)) | d g 1 - 1 (y) d y | + f X (g 2 - 1 (y)) | d g 2 - 1 (y) d y |. {\ displaystyle f_ {Y} (y) = f_ {X} (g_ {1} ^ {- 1} (y)) \ left | {\ frac {dg_ {1} ^ {- 1} (y)} { dy}} \ right | + f_ {X} (g_ {2} ^ {- 1} (y)) \ left | {\ frac {dg_ {2} ^ {- 1} (y)} {dy}} \ right |.}
Обратное преобразование:
- x = g 1, 2 - 1 (y) = ± y {\ displaystyle x = g_ {1,2} ^ {- 1} (y) = \ pm {\ sqrt {y}}}
и его производная
- dg 1, 2 - 1 (y) dy = ± 1 2 y. {\ displaystyle {\ frac {dg_ {1,2} ^ {- 1} (y)} {dy}} = \ pm {\ frac {1} {2 {\ sqrt {y}}}}.}
Тогда
- f Y (y) = 1 2 π σ 2 1 2 y (e - (y - μ) 2 / (2 σ 2) + e - (- y - μ) 2 / (2 σ 2)). {\ displaystyle f_ {Y} (y) = {\ frac {1} {\ sqrt {2 \ pi \ sigma ^ {2}}}} {\ frac {1} {2 {\ sqrt {y}}}} (e ^ {- ({\ sqrt {y}} - \ mu) ^ {2} / (2 \ sigma ^ {2})} + e ^ {- (- {\ sqrt {y}} - \ mu) ^ {2} / (2 \ sigma ^ {2})}).}
Это нецентральное распределение хи-квадрат с одной степенью свободы.
Некоторые свойства
- Вероятностное распределение суммы двух независимых случайных величин представляет собой свертку каждого из их распределений.
- Распределения вероятностей не являются векторным пространством - они не замыкаются под линейными комбинациями, поскольку они не сохраняют неотрицательность или полный интеграл 1 - но они закрываются под выпуклой комбинацией, таким образом образуя выпуклое подмножество пространства функций (или мер).
Эквивалентность случайных величин
Существует несколько различных смыслов, в которых случайные величины могут считаться эквивалентными. Две случайные величины могут быть равными, почти наверняка или равными по распределению.
В порядке возрастания силы точное определение этих понятий эквивалентности дается ниже.
Равенство в распределении
Если пространство выборки является подмножеством вещественной линии, случайные величины X и Y равны в распределении (обозначается X = d Y {\ displaystyle X { \ stackrel {d} {=}} Y}), если они имеют одинаковые функции распределения:
- P (X ≤ x) = P (Y ≤ x) для всех x. {\ displaystyle \ operatorname {P} (X \ leq x) = \ operatorname {P} (Y \ leq x) \ quad {\ text {для всех}} x.}
Чтобы быть равными в распределении, случайные величины нет необходимости определять в одном и том же вероятностном пространстве. Две случайные величины, имеющие равные производящие функции момента, имеют одинаковое распределение. Это обеспечивает, например, полезный метод проверки равенства некоторых функций независимых, одинаково распределенных (IID) случайных величин. Однако функция создания момента существует только для распределений, которые имеют определенное преобразование Лапласа.
Почти наверняка равенство
Две случайные величины X и Y равны почти наверняка (обозначено X = as Y {\ displaystyle X \; {\ stackrel {\ text {as}} {=}} \; Y}) тогда и только тогда, когда вероятность того, что они различны, равна ноль :
- P (X ≠ Y) = 0. {\ displaystyle \ operatorname {P} (X \ neq Y) = 0.}
Для всех практических целей теории вероятностей это понятие эквивалентности так же сильно, как фактическое равенство. Ему соответствует следующее расстояние:
- d ∞ (X, Y) = ess sup ω | X (ω) - Y (ω) |, {\ displaystyle d _ {\ infty} (X, Y) = \ operatorname {ess} \ sup _ {\ omega} | X (\ omega) -Y (\ omega) |,}
где "ess sup" представляет существенную верхнюю грань в смысле теории меры.
Равенство
Наконец, две случайные величины X и Y равны, если они равны как функции на их измеримом пространстве :
- X (ω) = Y (ω) для всех ω. {\ displaystyle X (\ omega) = Y (\ omega) \ qquad {\ hbox {for all}} \ omega.}
Это понятие обычно наименее полезно в теории вероятностей, поскольку на практике и в теории лежащее в основе пространство измерений в эксперименте редко описывается явным образом или даже может быть охарактеризовано.
Сходимость
Важной темой математической статистики является получение результатов сходимости для определенных последовательностей случайных величин; например, закон больших чисел и центральная предельная теорема.
. Существуют различные смыслы, в которых последовательность X n {\ displaystyle X_ {n}}случайных величин может сходиться к случайной величине X {\ displaystyle X}. Они объясняются в статье о сходимости случайных величин.
См. Также
- Математический портал
Ссылки
Встроенные цитаты
Литература
Внешние ссылки