В теория информации, предельная плотность дискретных точек является корректировкой формулы Клода Шеннона для дифференциальной энтропии.
. Она была сформулирована Эдвином Томпсон Джейнс для устранения недостатков в первоначальном определении дифференциальной энтропии.
Первоначально Шеннон записал следующую формулу для энтропии непрерывного распределения, известной как дифференциальная энтропия :
Однако, в отличие от формулы Шеннона для дискретной энтропии, это не результат какого-либо вывода (Шеннон просто заменил символ суммирования в дискретной версии на интеграл), и оказалось, что отсутствуют многие свойства, которые делают дискретную энтропию полезной мерой неопределенности. В частности, он не инвариантен при замене переменных и даже может стать отрицательным. Кроме того, это даже неверно по размерам. Поскольку будет безразмерным, должен иметь единицы измерения of , что означает, что аргумент логарифма не является безразмерным, как требуется.
Джейнс (1963, 1968) утверждал, что формулу для непрерывной энтропии следует выводить, взяв предел все более плотных дискретных распределений. Предположим, что у нас есть набор дискретных точек , например что в пределе их плотность приближается к функции называется «инвариантная мера».
Джейнс вывел из этого следующую формулу для непрерывной энтропии, которую, как он утверждал, следует принимать как правильную формулу:
Обычно, когда это написано, термин опускается, так как обычно это не будет конечным. Таким образом, фактическое общее определение:
Если неясно, следует ли опускать термин , можно написать
Обратите внимание, что в формуле Джейнса - плотность вероятности. Понятно, что для любого плавника ite , что представляет собой просто равномерную плотность по квантованию непрерывного пространства который используется в сумме Римана. В пределе - это непрерывная предельная плотность точек при квантовании, используемая для представления непрерывной переменной .
Предположим, у кого-то есть числовой формат, который принимает возможных значений, распределенных согласно . Тогда (если достаточно велико, чтобы непрерывное приближение действительный) - дискретная энтропия переменной в этой кодировке. Это равно среднему числу битов, необходимых для передачи этой информации, и составляет не более . Следовательно, можно рассматривать как количество информации, полученной, зная, что переменная следует распределению и не распределяется равномерно по возможным квантованным значениям, как это было бы в случае, если бы оно следовало . на самом деле (отрицательное) расхождение Кульбака – Лейблера от to , который рассматривается как информация, полученная в результате изучения того, что переменная, ранее считавшаяся распределенной как , фактически распределяется как .
Формула непрерывной энтропии Джейнса имеет свойство быть инвариантной при замене переменных при условии, что и трансфо таким же образом. (Отсюда и название «инвариантная мера» для m.) Это решает многие трудности, возникающие при применении формулы Шеннона для непрерывной энтропии. Сам Джейнс отказался от термина , поскольку он не имел отношения к его работе (максимальное распределение энтропии), и несколько неловко иметь бесконечный срок в расчете. К сожалению, с этим ничего не поделать, если квантование выполняется произвольно точно, как это было бы в случае непрерывного предела. Обратите внимание, что , как определено здесь (без term) всегда будет неположительным, потому что расхождение KL всегда будет неотрицательным.
Если это так, что постоянно в некотором интервале размера и по существу равно нулю за пределами этого интервала, тогда предельная плотность дискретных точек (LDDP) тесно связана с дифференциальная энтропия