Статистическая обработка результатов учебно-исследовательской деятельности учащихся - Учебное пособие (Мельникова Ю.Б.)

2.7 повторение испытаний. формула бернулли

При решении вероятностных задач часто приходится сталкиваться с ситуациями, в которых одно и то же испытание (опыт) повторяется многократно.

Например, стрелок, не сходя с места, каждый раз тщательно прицеливаясь, производит несколько выстрелов по мишени или несколько человек заполняют по одной карточке «Спортлото». В результате каждого такого испытания может наступить или не наступить некоторое событие А. В результате одного выстрела (испытания) мишень может быть поражена (событие А) или нет (событие Ậ). В результате заполнения одной карточки «Спортлото» (испытания) можно отгадать все шесть номеров (событие А) или не отгадать все номера (событие Ậ). Можно предположить, что в приведенных ситуациях вероятность появления события А в каждом испытании одна и та же (для каждой ситуации своя). Модель каждой из этих ситуаций выглядит следующим образом. Проводится n испытаний, в каждом из которых событие А может произойти или не произойти, причем вероятность события в каждом отдельном испытании постоянна, т. е. не меняется от испытания к испыта­нию. Вопрос о том, как находятся вероятность события в отдельном испытании, уже был рассмотрен. Поэтому представ­ляет особый интерес появление любого определенного числа раз события А в n испытаниях, точнее, вероятность появления этого числа. Рассмотрению задач, в которых требуется определять вероятность m появлений события А в результате n испытаний, и посвящена настоящая глава. Подобные задачи решаются сравнительно легко, если испытания являются независимыми.

Определение. Несколько испытаний называются неза­висимыми относительно события А. если вероятность события А в каждом из них не зависит от исходов других испытаний.

Примером независимых испытаний может служить несколь­ко подбрасываний монеты. Несколько последовательных вы­ниманий из урны одинаковых на ощупь, но разных по цвету шаров, также являются независимыми испытаниями, например, относительно появления белого шара, если шары каждый раз возвращаются назад и тщательно перемешиваются.

Возникает вопрос: как связаны независимость испытаний и независимость, событий, которые могут произойти в резуль­тате этих испытаний? Пусть проводятся n независимых ис­пытаний, в которых событие А может наступить или не наступить. Это означает, что в результате каждого испытания может произойти событие А, причем его вероятность не изменяется от того, какие события произойдут в остальных испытаниях. Не исключена возможность, что во всех этих испытаниях произойдет событие А. Обозначим через Аi ,i=1, 2, 3,..., n, событие А, если оно произойдет в i-м испытании.

Из определений независимости испытаний и независимости событий в совокупности следует, что события А1, А2, А3, ..., Аn независимы в совокупности. Однако совсем не обязатель­но, чтобы во всех испытаниях произошло событие А.

Пусть для определенности в пяти независимых испытаниях два раза произошло событие А, причем наступило оно во 2-м и 5-м испытаниях. Это означает, что в пяти испытаниях наступили события Ậ1 ;А2 ;Ậ3 ;Ậ4 ;А5 . А так как при замене этого числа событий из группы независимых в совокупности событий на противоположные им события независимость событий сохраняется, то представленная группа событий также независима в совокупности.

Практически событие А может появиться в n независимых испытаниях любое число раз в разных последовательностях или комбинациях, чередуясь с противоположным событием Ậ. Такая группа событий независима в совокупности. Таким образом, из независимости n испытаний относительно события А следует независимость в совокупности группы n событий, представляющей собой произвольную комбинацию событий А и Ậ , одно из которых обязательно произойдет в каждом из рассматриваемых испытаний.

По теореме умножения вероятностей для независимых событий, вероятность совместного наступления таких событий равна произведению их вероятностей, т. е. выполняется, на­пример, равенство

Р(А1Ậ2Ậ3Ậ4…Ận)=Р(А1)Р(Ậ2) Р(Ậ3) Р(Ậ4)… Р(Ận).

Выработаем теперь общий метод решения подобных задач, позволяющий с минимальными вычислительными затратами получить требуемый результат. Поставим задачу в общем виде. Пусть в результате испытания возможны два исхода: либо появится событие А, либо противоположное ему событие Ậ. Проведем п испытаний Бернулли. Напомним, это означает. что все п испытаний независимы; вероятность появления события А в каждом отдельно взятом, или единичном ис­пытании постоянна и от испытания к испытанию не изменяется (т. е. испытания проводятся в одинаковых условиях). Обозна­чим вероятность Р(А) появления события А в единичном испытании буквой р, т. е. Р(А)=р, а вероятность Р(Ậ)— буквой q, т.е. Р(Ậ)=1-Р(А)=1-р=q.

Найдем вероятность Рn(m) наступления события А ровно т раз (ненаступления n - m раз) в этих n испытаниях. Отметим, что здесь не требуется появление m раз события А в определен­ной последовательности.

Вероятность Рn(m)  пропорциональна произведению pmqn-m причем коэффициент пропорциональности равен Сmn, т. е.

Рn(m)= Сmn pmqn-m

Полученную формулу можно доказать используя метод тематической индукции: Однако в качестве доказательства ведем следующие рассуждения.

Пусть проведено n независимых испытаний, в каждом из которых событие А может наступить и не наступить. Если в результате испытаний событие А произошло m раз (неважно, в каком порядке), то это означает, что совместно наступили m событий А и n-m событий Ậ, вероятности которых в каждом отдельном опыте равны p и q соответственно. Так как все n событий независимы, то, по теореме умножения, вероятность появления m раз события А в определенной последовательности равна  pmqn-m.

Однако событие А может появиться т раз в п опытах в совершенно другой последовательности и число таких последовательностей равно числу сочетаний из n по т, т. е. Сmn  (это число совпадает с числом способов, которыми можно выбрать т мест из имеющихся n, не учитывая их порядка). Все Сmn вариантов появления события А т раз представляют собой несовместные события, вероятность каждого из которых равна pmqn-m. А так как наступление одного (любого) из этих событий означает наступление события, состоящего в том, что в n независимых испытаниях событие А появится т раз, то, по теореме сложения вероятностей для несовместных событий, искомая верятность Рn(m) равна сумме вероятностей всех указанных несовместных событий, т. е. Произведению Сmn pmqn-m      . Таким образом,

Рn(m)= Сmn pmqn-m= n!/(m!(n-m)!) * pmqn-m     (*)

Полученную формулу называют формулой Бернулли. Проиллюстрируем применение формулы (*).

Задача . Монету бросают 8 раз. Какова вероятность, что 4 раза выпадет «герб»?

Как правило, на вопрос задачи отвечают, что эта вероятность равна 1/2. Однако это ошибочный ответ. Действительно, здесь n=8, m=4, p=q=1/2. По формуле (*) получаем

Р8(4)= С48 (1/2)4(1/2)4=70/256<1/3.

 

2.8 Асимптотические формулы

При решении задач особых трудностей при вычислении искомых вероятностей не возникало, так как число испытаний n было велико. Однако, если число испытаний достаточно велико, то использование формулы (*) нецелесообразно в силу необходимости выполнения громоздких вычислений. Пусть, например, требуется вычислить Р320(285 ) (при p =0,89). В данном случае формула (*) принимает вид

Р320(285)=  320!/(285!35!) * (0,89)285(0,11)35

Получить по указанной формуле более или менее точный результат практически невозможно. Рассмотрим специальные методы, с помощью которых можно получить достаточно точные ответы в задачах, связанных с повторением испытаний, не прибегая к сложным вычислениям.

Локальная теорема Муавра – Лапласа. Если вероятность наступления события А в каждом из n  независимых испытаниях  равна p и отлична от  нуля и единицы, а число испытанийдостаточно  велико,  то вероятность Рn(m) того, что в n испытани  х событие А  наступит m  раз, приближенно  равна

 ( чем больше n, тем точнее) значению функции y= 1/√npq * f(u), где  f(u)= 1/√2π *e-u²/2 ,  u= (m-np)/√npq

Рn(m)≈ 1/√npq*f(u= (m-np)/√npq)

Если вероятность события р (или q)  в отдельном испытании близка к нулю (такие события называют редкими), то даже при большом числе испытаний n , но при небольшой величине произведения np (меньше 10)  вероятности Рn(m)  недостаточно близки к их истинным значениям. В таких случаях применяют  другую формулу – формулу Пуассона.

Теорема. Если вероятность р наступления события А  в каждом испытании постоянна, но близка к нулю, чило независимых испытаний n  достаточно велико, а произведение np=λ, то вероятность Рn(m)  того,  что  в n независимых испытаниях событие А  наступит m  раз, приближенно равна  λm e-λ/m! , т.е.                      Рn(m) ≈ λm e-λ/m!

Данная формула называется формулой Пуассона.