МатБюро Статьи по теории вероятностей Распределение Пуассона

Закон редких событий

Как Пуассон искал справедливость с помощью формул

В истории науки есть удивительные примеры, когда абстрактная математика помогает понять суть глубоко человеческих проблем, такик как справедливость и ответственность. Один из таких примеров связан с именем Симеона Дени Пуассона, французского физика и математика, который в 1837 году сформулировал вероятностный закон, названный впоследствии его именем — распределение Пуассона.

Этот закон стал незаменимым инструментом в самых разных областях: от оценки риска и надёжности до биологии, физики и телекоммуникаций. А началось всё… с размышлений о судебных приговорах.

Суд, ошибки и математика: Франция начала 19 века

Симеон Дени Пуассон (1781–1840) был одним из выдающихся учёных своего времени. Ученик Лапласа, коллега Фурье и Лежандра, он внёс вклад в математический анализ, физику, астрономию. Но одной из его самых неожиданных и в то же время влиятельных работ стала книга:

«Recherches sur la probabilité des jugements en matière criminelle et en matière civile»
("Исследования вероятности судебных приговоров в уголовных и гражданских делах", 1837).

В этой работе Пуассон попытался ответить на, казалось бы, нематематический вопрос: Какова вероятность того, что суд выносит ошибочный приговор, если присяжные (как и все люди) изредка могут ошибаться?

Судебная система того времени включала коллегиальные решения (например, суд присяжных заседателей), и Пуассон рассматривал вероятности голосования за или против обвиняемого. Он рассмотрел малую вероятность индивидуальной ошибки каждого судьи или присяжного, а затем исследовал вероятность совокупной ошибки в решении суда. В книге Пуассон исследовал воздействие изменений в уголовном законодательстве на долю осуждений и на ошибки при осуждениях и оправданиях.


Полный текст книги в переводе О.Б. Шейнина (2013).


Путь к формуле: как родилось распределение Пуассона

Математический аппарат, использованный Пуассоном, опирался на уже существующие на тот момент представления о биномиальном распределении. Оно описывает число успехов в серии независимых испытаний с двумя исходами (как в данном случае: голос может быть дан "за" или "против").

Пуассон задался вопросом: что будет, если число "испытаний" велико (много судебных процессов), но вероятность ошибки присяжного в каждом отдельном случае мала?

Он пришёл к выводу, что в предельном случае биномиальное распределение превращается в новый вид распределения, описывающий вероятность наступления редких событий (в т.ч. судебных ошибок).

Это новое распределение он не называл своим именем — термин "распределение Пуассона" закрепился в литературе позднее. Однако именно его работа заложила основу вероятностного моделирования редких и независимых событий.

Основная формула распределения Пуассона

Пусть:

  • \( p \) — вероятность ошибки (или наступления другого редкого события) в одном испытании;
  • \( n \) — количество независимых испытаний;
  • параметр \( \lambda = n \cdot p \) — среднее (ожидаемое) число ошибок (событий).

Если \( n \to \infty \) и \( p \to 0 \), так что \( \lambda \) остается постоянным (и обычно находится в интервале от 1 до 10), то биномиальное распределение:

$$P(k) = C_n^k \cdot p^k \cdot (1 - p)^{n - k}$$

переходит в распределение Пуассона:

$$P(k; \lambda) = \frac{\lambda^k e^{-\lambda}}{k!}$$

Это распределение описывает вероятность того, что в фиксированном интервале произойдёт ровно \( k \) событий, если события редки и происходят независимо друг от друга.

Пуассон применил эту модель к анализу судебных решений: если в год рассматривается большое число дел, и в каждом вероятность ошибки мала, то общее число ошибочных приговоров подчиняется данному закону.

Где применяется распределение Пуассона сегодня?

С момента своего появления распределение Пуассона стало универсальным инструментом в науке и технике. Его применяют там, где речь идёт о количестве редких событий за фиксированный интервал.

Вот несколько примеров:

  • Телекоммуникации: число входящих звонков за минуту
  • Физика: число распадов радиоактивных ядер за секунду
  • Биология: число случайных мутаций в ДНК;
  • Криминология: число краж/преступлений в районе за сутки
  • Логистика: поток заказов в течение рабочего дня на складе
  • Типография: число опечаток на одной странице текста
  • География: число землетрясений в регионе за год с заданной магнитудой;

Это распределение лежит в основе теории массового обслуживания, надежности, страхования, биостатистики и анализа данных в IT.

Сегодня имя Пуассона носят не только распределение, но и уравнение Пуассона в физике, формула Пуассона в теории потенциала, ядро Пуассона в комплексном анализе. Но именно распределение, возникшее из размышлений о суде, стало его самым узнаваемым научным наследием.

Характеристики и график распределения Пуассона

Рассмотрим некоторый поток событий, в котором события наступают независимо друг от друга и с некоторой фиксированной средней интенсивностью $\lambda$ (событий в единицу времени). Тогда случайная величина $X$, равная числу событий $k$, произошедших за фиксированное время, имеет распределение Пуассона. Вероятности вычисляются по следующей формуле:

$$ P(X=k)=P(k; \lambda)=\frac{\lambda^k}{k!}\cdot e^{-\lambda}, \quad k=0,1,2,... $$

Математическое ожидание: $$\mathbb{E}(X) = \lambda$$

Дисперсия: $$D(X) = \lambda$$

Мода: $$Mo= \lfloor \lambda \rfloor \quad \text{или} \quad Mo= \lfloor \lambda \rfloor - 1 $$

Коэффициент эксцесса: $$Ex(X) = \lambda^{-1}$$

график распределения Пуассона при разных параметрах лямбда

График распределения ведет себя по-разному, в зависимости от параметра: при малых \( \lambda \) оно сильно асимметрично (см. синий график, \( \lambda=1 \)), при возрастающих значения \( \lambda \) приближается к нормальному (см. зеленый график, при \( \lambda=10 \) уже имеет характерный вид "колокола").