"Основы статистики с элементами теории вероятностей для экономистов. Рук-во для решения задач" - читать интересную книгу автора (Ниворожкина Л.П., Морозова 3.А.)

Учебники «Феникса»

 


Учебники «Феникса»

П. П. Ниворожкина, 3. А. Морозова,
 П. А. Герасимова., П. В. Житников

ОСНОВЫ СТАТИСТИКИ С ЭЛЕМЕНТАМИ ТЕОРИИ ВЕРОЯТНОСТЕЙ ДЛЯ ЭКОНОМИСТОВ

Руководство для решения задач

Рекомендовано

Министерством общего

и профессионального образования

Российской Федерации

в качестве учебного пособия

для студентов

высших учебных заведений,

обучающихся по экономическим

специальностям и направлениям

Ростов-на-Дону «Феникс» 1999

 

УДК 311(075.8)
 ББК 606я73
 Н60


 

Рецензенты:

Заслуженный деятель науки РФ, доктор экономических наук, профессор В. С. Князевский

Кафедра высшей математики Московского государствен­ного института стали и сплавов

Учебно-методический совет по специальности «Статисти­ка» УМО при Московском государственном университете экономики, статистики и информатики

Ниворожкина Л. П., Морозова 3. А.,
 Герасимова И. А., Житников И. В.

   Основы статистики с элементами теории вероят­ностей для экономистов: Руководство для решения задач. — Ростов н/Д: Феникс, 1999. — 320 с. — (Учебники «Феникса»).

ISBN 5-222-00560-7

В пособии кратко и просто изложены основные понятия статисти­ки и теории вероятностей, даны методические указания по решению типовых задач. В конце каждой главы приведены 20 вариантов задач, условия которых приближены к практическим ситуациям в области маркетинга, аудита, финансов и др.

Предназначено для студентов и аспирантов экономических вузов, преподавателей колледжей, вузов, а также для практических работ­ников, желающих научиться использовать современные статистичес­кие методы и их практические приложения при планировании своей деятельности.

 

 

ISBN 5-222-00560-7

©Ниворожкина Л. И., Морозова 3. А.,
 Герасимова И. А., Житников И. В., 1999
 ©Оформление. Издательство «Фе­никс», 1999


ПРЕДИСЛОВИЕ

 

Рыночная экономика существенно повышает тре­бования к качеству подготовки конкурентоспособных выпускников экономических вузов. Для этого необходимо владеть современным инструментари­ем математико-статистического анализа данных. Предлагаемое учебное пособие знакомит читателя с рядом важнейших разделов статистики и теории вероятностей, формирует основы статистического мышления. В пособии переработан и переосмыслен ряд методических подходов, используемых при чте­нии курсов по прикладной статистике и элементар­ной теории вероятностей на экономических факуль­тетах в США и Европе.

В процессе экономического образования математико-статистические дисциплины традиционно считаются наиболее сложными для студентов. Предла­гаемое пособие ставит своей целью помочь тем, кто осваивает эти курсы, особенно в системе заочного образования, понять прикладной, практический смысл проблем, решаемых с помощью статистики, а также помочь самостоятельно выполнить домашние задания по представленным темам.

Каждая глава начинается с краткого изложения основных теоретических понятий и формул. Авто­ры стремились подать этот материал так, чтобы, избегая громоздких математических доказательств, на доступном уровне донести до читателя сложные понятия современной статистики.

Для всех основных типов задач, которые можно решить на базе изложенного теоретического материала, приведены методики их решения, которые не только дают «рецепты» для получения ответов, но, прежде всего, помогают читателю освоить основы ста­тистического вывода при решении различных задач из области практической деятельности. Если чита­тель поймет, для чего необходимо использовать тот или иной статистический метод, ему легче будет ос­воить и его формальный вычислительный алгоритм, увидеть, что полученный результат — не просто чис­ло, а сконцентрированное выражение того, что ис­ходные данные несут в себе об изучаемом явлении.

Для того чтобы процесс обучения носил актив­ный характер, тексты задач максимально прибли­жены к реальным ситуациям в различных облас­тях экономики, таких, как бухгалтерский учет и аудит, финансы, маркетинг и т. д. Решение их по­может понять универсальность статистического ана­лиза как инструмента решения проблем, связанных с риском и неопределенностью.

В книге приведены основные таблицы математи­ческой статистики, необходимые для решения за­дач (приложения 1-6), а также список рекомендуе­мой литературы.

 

 

 

1. ЭЛЕМЕНТЫ КОМБИНАТОРИКИ

Этот материал не относится непосредственно к теории вероятностей и математической статистике, однако необходим в дальнейшем при расчетах ве­роятностей.

Комбинаторика происходит от латинского слова «combinatio» — соединение.

Группы, составленные из каких-либо предме­тов (безразлично каких, например, букв, цветных шаров, кубиков, чисел и т. п.), называются соеди­нениями (комбинациями).

Предметы, из которых состоят соединения, называются элементами.

Различают три типа соединений: размещения, перестановки и сочетания.

1.1. Размещения

Размещениями из п элементов по т в каждом называются такие соединения, из которых каждое содержит т элементов, взятых из числа дан­ных n элементов, и которые отличаются друг от друга либо самими элементами (хотя бы одним), либо лишь порядком их расположения.

Число размещений из п элементов по т в каж­дом обычно обозначается символом Аnm и вычисля­ется по следующей формуле*:


* Выводы формул для числа размещений, а в последующем изложении — для числа сочетаний, опускаются. Их можно найти в курсе элементарной алгебры.

 

1.2. Понятие факториала

Произведение п натуральных чисел от 1 до n обо­значается сокращенно п!, т. е. 1·2·3·...·(n -1)·n= n! (читается: п факториал). Например:

5!=1·2·3·4·5=120.

 

Считается, что 0! = 1.

Используя понятие факториала, формулу (1.1) можно представить так:


где 0 т  n.

Очевидно, что Аn1= п (при m = 1) и Аn0=n (при m= 0).

Пример 1. Правление коммерческого банка вы­бирает из 10 кандидатов 3 человек на различные должности (все 10 кандидатов имеют равные шан­сы). Сколько всевозможных групп по 3 человека можно составить из 10 кандидатов?

Решение. В условии задачи речь идет о расчете числа комбинаций из 10 элементов по 3. Так как

группы по 3 человека могут отличаться и составом претендентов, и заполняемыми ими вакансиями, т. е. порядком, то для ответа необходимо рассчитать число размещений из 10 элементов по 3:

N=А310=10·9·8=720

 

Ответ. Можно составить 720 групп по 3 человека из 10.

1.3. Размещения с повторениями

Размещение с повторениями из n элементов по m(mn) элементов может содержать любой элемент сколько угодно раз от 1 до m включительно, или не содержать его совсем, т. е. каждое размещение с повторениями из n элементов по m элементов мо­жет состоять не только из различных элементов, но из m каких угодно и как угодно повторяющихся элементов.

Соединения, отличающиеся друг от друга хотя бы порядком расположения элементов, считаются различными размещениями.

Число размещений с повторениями из n элемен­тов по m элементов будем обозначать символом Аnm(c повт.) . Можно доказать, что оно равно nm:

 

Аnm(c повт.) =nm               (1.3)

Пример 2. Изменим условие примера 1. Правле­ние коммерческого банка выбирает из 10 кандидатов 3 человек на 3 различные должности. Предпо­ложим, что один и тот же отобранный из 10 претендентов кандидат может занять не только одну, но и 2, и даже все 3 различные вакантные должности. Сколько в данном  случае возможно комбинаций замещения 3 вакантных должностей?

Решение. Как и в предыдущей задаче, комби­нации замещения вакантных должностей могут отличаться и составом претендентов и заполняе­мыми ими вакансиями, т.е. порядком. Следовательно, и в этом случае для ответа на вопрос зада­чи необходимо рассчитать число размещений. Од­нако теперь вакантные должности могут замещать­ся одним и тем же претендентом, а значит, здесь речь идет о расчете числа размещений с повторе­ниями.

По условию задачи п = 10, т = 3. Следователь­но, Аnm=103=1000.

Ответ. Можно составить 1000 комбинаций.

1.4. Сочетания

Сочетаниями из п элементов по m в каждом называются такие соединения, из которых каж­дое содержит т элементов, взятых из числа дан­ных п элементов, и которые отличаются друг от друга по крайней мере одним элементом.

Число сочетаний из п элементов по m в каждом обозначается символом Cnm и вычисляется так:


или


Пример 3. Правление коммерческого банка вы­бирает из 10 кандидатов 3 человек на одинаковые должности (все 10 кандидатов имеют равные шан­сы). Сколько всевозможных групп по 3 человека можно составить из 10 кандидатов?

Решение. Состав различных групп должен отли­чаться по крайней мере хотя бы одним кандидатом и порядок выбора кандидата не имеет значения, сле­довательно, этот вид соединений представляет собой сочетания. По условию задачи п = 10, т = 3. Подставив данные в формулу (1.5), получаем


 

Ответ. Можно составить 120 групп из 3 человек по 10.


Замечание. Надо уметь различать сочетания от раз­мещений. Например: если в группе 25 студентов и 10 человек из них, выйдя из аудитории на перерыв, стоят вместе и беседуют, то порядок, в котором они стоят, несуществен. Число всех возможных групп из 25 человек по 10 в данном случае — сочетания. Если же студенты отправились на перерыве в буфет или в кассу за стипендией, то тогда существенно, в каком, порядке они стали, т. е. кто из них первый, второй и т. д. В этой ситуации при подсчете возможных групп из 25 человек по 10 необходимо состав­лять размещения.

1.5. Сочетания с повторениями

Сочетание с повторениями из n элементов по m (n Î m) элементов может содержать любой элемент сколько угодно раз от 1 до m включительно или не содержать его совсем, т. е. каждое сочетание из n элементов по m элементов может состоять не толь­ко из m различных элементов, но из m каких угод­но и как угодно повторяющихся элементов.

Следует отметить, что если, например, два со­единения по m элементов отличаются друг от друга только порядком расположения элементов, то они не считаются различными сочетаниями.

Число сочетаний с повторениями из n элементов по m будем обозначать символом (Cnm)c повт и вычислять по формуле


Замечание, т может быть и больше n.

Пример 4. Сколькими способами можно выбрать 6 пирожных в кондитерской, где есть 4 разных сорта пирожных?

Решение.


Ответ. Существует 84 различных способа выбора пирожных.

1.6. Перестановки

Перестановками из п элементов называются та­кие соединения, из которых каждое содержит все п элементов и которые отличаются друг от друга лишь порядком расположения элементов.

Число перестановок из п элементов обозначается символом Pn, это то же самое, что число размещений из п элементов по n в каждом, поэтому


Пример 5. Менеджер ежедневно просматривает 6 изданий экономического содержания. Если порядок просмотра изданий случаен, то сколько суще­ствует способов его осуществления?

Решение. Способы просмотра изданий различа­ются только порядком, так как число, а значит, и состав изданий при каждом способе неизменны. Сле­довательно, при решении этой задачи необходимо рассчитать число перестановок.

По условию задачи п = 6. Следовательно,

 

Рn  = 6! =1·2·3·4·5·6 = 720.

Ответ. Можно просмотреть издания 720 способами.

1.7. Перестановки с повторениями

Число перестановок с повторениями выражает­ся формулой


Пример 6. Сколькими способами можно разде­лить т + п + s предметов на 3 группы, чтобы в одной группе было т предметов, в другой n пред­метов, в третьей — s предметов?

Решение.


Задачи к теме 1

1. Во многих странах водительское удостовере­ние (автомобильные права) имеет шифр, состоящий из 3 букв и 3 цифр. Чему равно общее число воз­можных номеров водительских удостоверений, счи­тая, что число букв русского алфавита, используе­мых для составления шифра, — 26, а буквы занима­ют первые 3 позиции шифра? Если шифр состоит только из 6 цифр, то чему в этом случае равно об­щее число всех возможных номеров удостоверений, если: а) цифры в шифре не повторяются; б) повто­ряются?

2. Сколько существует способов составления в случайном порядке списка из 7 кандидатов для выбора на руководящую должность? Какова вероят­ность того, что кандидаты будут расставлены в спис­ке по возрасту (от меньшего к большему)?*

3. Руководство фирмы выделило отделу рекла­мы средства для помещения в печати объявлений о предлагаемых фирмой товарах и услугах. По рас­четам отдела рекламы выделенных средств хватит для того, чтобы поместить объявления только в 15 из 25 городских газет. Сколько существует спосо­бов случайного отбора газет для помещения объяв­лений? Какова вероятность того, что в число отобранных попадут 15 газет, имеющих наибольший ти­раж?*

4. Менеджер рассматривает кандидатуры 8 чело­век, подавших заявления о приеме на работу. Сколько существует способов приглашения кандидатов на собеседование в случайном порядке? Какова ве­роятность того, что они случайно будут приглаше­ны на собеседование в зависимости от времени их прихода в офис?*

5. На железнодорожной станции имеется 5 путей. Сколькими способами можно расставить на них 3 состава? Какова вероятность того, что составы слу­чайно будут расставлены на путях в порядке возрастания их номеров?*

6. Покупая карточку лотереи «Спортлото», иг­рок должен зачеркнуть 6 из 49 возможных чисел от 1 до 49. Если при розыгрыше тиража лотереи он угадает все 6 чисел, то имеет шанс выиграть значительную сумму денег. Сколько возможных комби­наций можно составить из 49 по 6, если порядок чисел безразличен? Чему равна вероятность угадать все 6 номеров?*

7. Четыре человека случайно отбираются из 10 согласившихся участвовать в интервью для выяснения их отношения к продукции фирмы по производ­ству продуктов питания. Эти 4 человека прикреп­ляются к 4 интервьюерам. Сколько существует раз­личных способов составления таких групп? Если выбор случаен, чему равна вероятность прикрепле­ния определенного человека к интервьюеру?*

8. Сколькими способами можно рассадить 5 гос­тей за круглым столом? Какова вероятность того, что гости случайно окажутся рассаженными по ро­сту?*

9. Девять запечатанных пакетов с предложения­ми цены на аренду участков для бурения нефтяных скважин поступили утром в специальное агентство утренней почтой. Сколько существует различных способов очередности вскрытия конвертов с пред­ложениями цены? Какова вероятность того, что конверты случайно окажутся вскрытыми в зависимос­ти от величины предлагаемой за аренду участков цены?*

10. Фирма нуждается в организации 4 новых складов. Ее сотрудники подобрали 8 подходящих одинаково удобных помещений. Сколько существу­ет способов отбора 4 помещений из 8 в случайном порядке? Какова вероятность того, что в число ото­бранных попадут 4 помещения, расположенные в многоэтажных зданиях?*

11. Для разгрузки поступивших товаров менедже­ру требуется выделить 6 из 20 имеющихся рабочих. Сколькими способами можно это сделать, осуще­ствляя отбор в случайном порядке? Какова вероят­ность того, что в число отобранных войдут самые высокие рабочие?*

12. Руководство фирмы может обратиться в 6 туристических агентств с просьбой об организации для своих сотрудников 3 различных туристичес­ких поездок. Сколько существует способов распре­деления 3 заявок между 6 агентствами, если каждое агентство может получить не более одной заявки? Какова вероятность того, что заявки получат агент­ства с наибольшим оборотом, причем, чем крупнее агентство, тем крупнее заявку оно получает?*

13. Для доступа в компьютерную сеть оператору необходимо набрать пароль из 4 цифр. Оператор забыл или не знает необходимого кода. Сколько все­возможных комбинаций он может составить для набора пароля: а) если цифры в коде не повторяют­ся; б) если повторяются? С какой вероятностью мож­но открыть замок с первой попытки?*

14. Сколько существует способов составления списка 20 деловых звонков случайным образом? Какова вероятность того, что список окажется со­ставленным в алфавитном порядке?*

15. На рынке представлено 8 различных пакетов программ для бухгалтерии с приблизительно равными возможностями. Для апробации в своих фи­лиалах фирма решила отобрать 3 из них. Сколько существует способов отбора 3 программ из 8, если отбор осуществлен в случайном порядке? Какова вероятность того, что среди отобранных случайно окажутся 3 программы, занимающие наименьший объем памяти?*

16. Выделены крупные суммы на выполнение 4 крупных правительственных программ, сулящих исполнителям высокую прибыль. Сколько существует способов случайного распределения этих 4 программ между 6 возможными исполнителями? Какова ве­роятность того, что средства на выполнение про­грамм при таком распределении получат 4 испол­нителя, имеющие наибольшую прибыль, причем ве­личина выделяемых средств зависит от величины прибыли исполнителей?*

17. Брокерская фирма предлагает акции различных компаний. Акции 10 из них продаются по наименьшей  среди имеющихся акций цене и обладают одинако­вой доходностью. Клиент собирается приобрести ак­ции 3 таких компаний — по 1 от каждой компании. Сколько существует способов выбора 3 таких ак­ций из 10, если выбор осуществляется в случайном порядке? Какова вероятность того, что в число слу­чайно отобранных попадут акции, рост цен на ко­торые будет наибольшим в следующем году?*

18. Фирмы Fl, F2, F3, F4, F5 предлагают свои условия по выполнению 3 различных контрактов Cl, C2 и СЗ. Любая фирма может получить только один контракт. Контракты различны, т. е. если фирма Fl получит контракт Cl, то это не то же самое, если она получит контракт C2. Сколько спо­собов получения контрактов имеют фирмы? Если предположить равновозможность заключения кон­трактов, чему равна вероятность того, что фирма F3 получит контракт?*

19. По сведениям геологоразведки 1 из 15 участ­ков земли по всей вероятности содержит нефть. Однако компания имеет средства для бурения только 8 скважин. Сколько способов отбора 8 различных скважин у компании? Какова вероятность того, что случайно отобранные для бурения участки окажутся, например, самыми северными?*

20. На 9 вакантных мест по определенной специ­альности претендуют 15 безработных, состоящих на учете в службе занятости. Сколько возможно ком­бинаций выбора 9 из 15 безработных?

* Для вычисления вероятностей здесь и далее ознакомьтесь с материалом гл. 2.

 

2. ЭЛЕМЕНТЫ ТЕОРИИ ВЕРОЯТНОСТЕЙ

2.1. Определение вероятности и свойства, вытекающие из ее определения, классификация событий, диаграммы Венна

Под вероятностью в широком смысле понимают количественную меру неопределенности или число, которое выражает степень уверенности в наступле­нии того или иного случайного события. Напри­мер, нас может интересовать вероятность того, что объем продаж некоторого продукта не упадет, если цены вырастут, или вероятность того, что строи­тельство нового дома завершится в срок.

Случайным называется событие, которое может произойти или не произойти в результате некото­рого испытания. В дальнейшем для простоты мы будем опускать термин «случайный».

Испытание (опыт, эксперимент) — это процесс, включающий определенные условия и приводящий к одному из нескольких возможных исходов. Исхо­дом опыта может быть результат наблюдения или измерения (табл. 2.1).

Единичный, отдельный исход испытания назы­вается элементарным событием.

Случайное событие может состоять из несколь­ких элементарных событий, подразделяющихся на достоверные, невозможные, совместные, несовместные, единственно возможные, равновозможные, противоположные.

Таблица 2.1

Испытание

Исход испытания

Подбрасывание монеты

Контроль качества деталей

Продажа квартиры

Результат футбольного матча

Цифра, герб

Годная, бракованная

Продана, не продана
Победа, проигрыш, ничья

 

Событие, которое обязательно произойдет в ре­зультате испытания, называется достоверным. На­пример, если в урне содержатся только белые шары, то извлечение из нее белого шара есть событие дос­товерное; другой пример, если мы подбросим вверх камень, то он обязательно упадет на землю в силу действия закона притяжения, т. е. результат этого опыта заведомо известен. Достоверные события ус­ловимся обозначать символом W.

Событие, которое не может произойти в резуль­тате данного опыта (испытания), называется не­возможным. Извлечение черного шара из урны с белыми шарами есть событие невозможное; выпадение выигрыша на все номера облигаций в каком-либо тираже выигрышного займа также невозможное событие. Невозможное событие обозначим ø.

Достоверные и невозможные события, вообще го­воря, не являются случайными.

Несколько событий называются совместными, если в результате эксперимента наступление од­ного из них не исключает появления других. Например, при бросании 3 монет выпадение цифры

на одной не исключает появления цифр на других монетах.

В магазин вошел покупатель. События «В мага­зин вошел покупатель старше 60 лет» и «В магазин вошла женщина» — совместные, так как в магазин может войти женщина старше 60 лет.

Несколько событий называются несовместны­ми в данном опыте, если появление одного из них исключает появление других. Например, выигрыш, ничейный исход и проигрыш при игре в шахматы (одной партии) — 3 несовместных события.

События называются единственно возможными, если в результате испытания хотя бы одно из них обязательно произойдет (или 1, или 2, или... или все события из рассматриваемой совокупности со­бытий произойдут; одно точно произойдет). Напри­мер, некая фирма рекламирует свой товар по радио и в газете. Обязательно произойдет одно и только одно из следующих событий: «Потребитель услы­шал о товаре по радио», «Потребитель прочитал о товаре в газете», «Потребитель получил информа­цию о товаре по радио и из газеты», «Потребитель не слышал о товаре по радио и не читал газеты». Эти 4 события единственно возможные.

Несколько событий называются равновозможными, если в результате испытания ни одно из них не имеет объективно большую возможность появления, чем другие. При бросании игральной

кости появление каждой из ее граней — события равновозможные.

Два единственно возможных и несовместных со­бытия называются противоположными. Купля и продажа определенного вида товара есть события противоположные.

Совокупность всех единственно возможных и не­совместных событий называется полной группой событий.

Различные события и действия с ними удобно рассматривать с помощью так называемых диаграмм Венна (по имени английского математика-логика Джона Венна).

Изобразим полную группу событий в виде квад­рата, тогда круг внутри квадрата будет обозначать некоторое событие, скажем. А, а точка - элемен­тарное событие - Е (рис. 2.1).


Рис. 2.1 демонстрирует два противоположных со­бытия А и не А, которые дополняют друг друга до полной группы событий. Противоположное событие обозначается Ā.

Пересечение А и В (обозначается как А Ç В) есть набор, содержащий все элементы, которые являются членами и А и В (рис. 2.2).

 


Рис. 2.2

Объединение А и В (обозначается A È В) есть набор, содержащий все элементы, которые являются членами или А, или В, или А и В вместе.

Полную группу можно определить так:


тогда {А1, А2, ..., Аn} — полная группа событий.

Вероятностью появления события А называют отношение числа исходов, благоприятствующих наступлению этого события, к общему числу всех единственно возможных и несовместных элемен­тарных исходов.

Обозначим число благоприятствующих событию А исходов через М, а число всех исходов — N:

P(A)=M/N,             (2.1)

где М — целое неотрицательное число, 0 £ М £  N.

Другой тип объективной вероятности определя­ется исходя из относительной частоты (частости) появления события. Например: если некоторая фирма в течение времени провела опрос 1 000 покупателей нового сорта напитка и 20 из них оценили его как вкусный, то мы можем оценить вероятность того, что потребителям понравится новый напиток как 20/1 000 = 0,02. В этом примере 20 — это час­тота наступления события, а 20/1 000 = 0,02 — это относительная частота.

Относительной частотой события называется от­ношение числа испытаний т, при которых собы­тие появилось, к общему числу проведенных ис­пытаний п.

 

W(A) == т/п            (2.2)

где т — целое неотрицательное число, 0 £ т£  п.

Статистической вероятностью события А назы­вается относительная частота (частость) этого со­бытия, вычисленная по результатам большого числа испытаний. Будем обозначать ее Р*(А). Сле­довательно,


При очень большом числе испытаний статисти­ческая вероятность приближенно равна классичес­кой вероятности, т. е.


Для определения вероятности выпадения 1 или 2 при подбрасывании кости нам необходимо только знать «модель игры», в данном случае — кость с 6 гранями. Мы можем определить наши шансы теоретически, без подбрасывания кости, это априорная (доопытная) вероятность. Во втором примере мы мо­жем определить вероятность только по результатам опыта, это — апостериорная (послеопытная) веро­ятность. То есть классическая вероятность — апри­орная, а статистическая — апостериорная.

Какой бы вид вероятности ни был выбран, для их вычисления и анализа используется один и тот же набор математических правил.

Свойства вероятности, вытекающие из классического определения.

1. Вероятность достоверного события равна 1, т. е. P(W) =1.

Действительно, если событие А = W, то М = N, значит,

Р(W) = N/N = 1.

2. Если событие невозможное, то его вероятность равна 0, т. е.

Р(Æ)= 0.

Если А = Æ, то оно не осуществится ни при од­ном испытании, т. е.

М = 0 и Р(Æ) = 0/N = 0.

3. Вероятность случайного события есть поло­жительное число, заключенное между 0 и 1.

В самом деле, так как 0£ M £ N, 0£ M/N £ 1, т. е. 0 £ Р(А) £ 1.

4. Сумма вероятностей противоположных собы­тий равна 1, т. е. Р(А) + Р(А) = 1. В самом деле,

Р(А) = (N - M)/N = 1 - M/N = 1 - P(A), следовательно,

Р(А)+Р(А)=1.             (2.3)

Например, если вероятность извлечения туза из колоды, состоящей из 52 карт, равна 4/52, то вероятность извлечения карты, не являющейся тузом, равна

1 - 4/52 = 48/52

Пример 1. Магазин в целях рекламы нового товара проводит лотерею, в которой 1 главный приз, 5 вторых, 100 — третьих и 1 000 — чет­вертых. В конце рекламного дня выяснилось, что лотерейные билеты получили 10 000 покупателей. По правилам розыгрыша после извлечения выигрышного билета он возвращается в урну, и поку­патель не может получить более одного выигрыша. Чему равна вероятность того, что покупатель, который приобрел рекламируемый товар: а) вы­играет 1-й приз; б) выиграет хотя бы 1 приз; в) не выиграет ни одного приза?

Решение, а) Определим событие А: «Покупатель выиграл 1-й приз». Согласно условию задачи, в лотерее участвовало 10 000 покупателей, отсюда общее число испытаний N = 10 000, а число исходов, благо­приятствующих событию А, М = 1. Все исходы явля­ются равновозможными, единственно возможными и несовместными элементарными событиями. Следо­вательно, по формуле классической вероятности:

б) определим событие В: «Покупатель выиграл хотя бы 1 приз». Для этого события число благоприятствующих исходов

М = 1 + 5 +100 + 1 000 = 1 106. P(B) = M/N = 1106/10 000 = 0,1106;

в) событие «Покупатель не выиграет ни одного при­за» — противоположное событию В: «Покупатель вы­играет хотя бы один приз», поэтому обозначим его как  . По формуле (2.3) найдем

Р(В) =1- Р(В) = 1 - 0,1106 = 0,8894 .

Ответ. Вероятность того, что покупатель выигра­ет 1-й приз равна 0,0001, один приз — 0,1106, не выиграет ни одного приза — 0,8894.

Пример 2. Структура занятых в региональном отделении крупного банка имеет следующий вид (табл. 2.2):

Таблица 2.2

Структура

Женщины

Мужчины

Администрация

25

15

Операционисты

35

25

 

Если один из служащих выбран случайным об­разом, то какова вероятность, что он: а) мужчина-администратор; б) женщина-операционист; в) муж­чина; г) операционист?

Решение.

а) В банке работают 100 человек, N = 100.

Из них 15 - мужчины-администраторы, М = 15. следовательно,

Р(мужчина-администратор) = 15/100 = 0,15.

б) 35 служащих в банке - женщины-операцио­нисты, следовательно,

P(женщина-операционист) == 35/100 = 0,35.

в) 40 служащих в банке - мужчины, следова­тельно,

Р(мужчина) = 40/100 = 0,40.

г) Из общего числа служащих в банке 60 - операционисты, следовательно,

P(операционист) = 60/100= 0,60.

 

2.2. Правила сложения и умножения вероятностей. Зависимые и независимые события

Вероятность суммы двух событий равна сумме вероятностей этих событий без вероятности их со­вместного наступления

Р(А + В) = Р(А) + Р(В) - Р(АВ),       

или                                                                     (2.4)

Р(А È В) - Р(А) + Р(В) - Р(А Ç В).

Для несовместных событий их совместное на­ступление есть невозможное событие, а вероятность его равна нулю, следовательно, вероятность сум­мы двух несовместных событий равна сумме вероятностей этих событий.


или                                                                  (2.5)

Р(А È В) = Р(А) + Р(В).

Правило сложения вероятностей справедливо и для конечного числа п попарно несовместных событий


В случае нескольких совместных событий необ­ходимо по аналогии с рассуждениями о пересечении двух совместных событий исключить повтор­ный учет областей пересечения событий. Рассмот­рим три совместных события (рис. 2.3).


Рис. 2.3

Для случая трех совместных событий можно записать

Р(А + В + С) = Р(А) + Р(В) + Р(С) - Р(АВ)-  Р(АС) - Р(ВС) + Р(АВС).

Сумма вероятностей событий А1, А2, А3 , ..., Аn, образующих полную группу, равна 1

Р(А1) + Р(А2) + Р(А3) + ... + Р(Аn) = 1.

или

 


Пример 3. Компания производит 40 000 холо­дильников в год, которые реализуются в различ­ных регионах России. Из них 10 000 экспортиру­ются в страны СНГ, 8 000 продаются в регионах Европейской части России, 7 000 продаются в стра­ны дальнего зарубежья, 6 000 в Западной Сибири, 5000 в Восточной Сибири, 4 000 в Дальневосточ­ном районе. Чему равна вероятность того, что определенный холодильник будет: а) произведен на эк­спорт; б) продан в России?

Решение. Обозначим события:

А - «Холодильник будет продан в странах СНГ»;

В - «Холодильник будет продан в Европейской части России»;

С - «Холодильник будет продан в страны даль­него зарубежья»;

D - «Холодильник будет продан в Западной Си­бири»;

Е — «Холодильник будет продан в Восточной Сибири»;

F «Холодильник будет продан в Дальневосточ­ном районе».

Соответственно, вероятность того, что холодиль­ник будет продан в странах СНГ:

Р(А) = 10000/40000 =0,25;

вероятность того, что холодильник будет продан в Европейской части России:

Р(В) = 8 000/40 000 = 0,20;

вероятность того, что холодильник будет продан в страны дальнего зарубежья:

Р(С) = 7 000/40 000 = 0,175;

вероятность того, что холодильник будет продан в Западной Сибири;

Р(D) = 6 000/40 000 = 0,15;

вероятность того, что холодильник будет продан в Восточной Сибири:

 

Р(Е) = 5 000/40 000 = 0,125;

вероятность того, что холодильник будет продан на Дальнем Востоке:

P(F) = 4 000/40 000 =0,10. События А, В, С, D, Е, F несовместные.

1) Событие, состоящее в том, что холодильник произведен на экспорт, означает, что холодильник будет продан или в страны СНГ, или в страны даль­него зарубежья. Отсюда по формуле (2.5) находим его вероятность:

Р(холодильник произведен на экспорт) = Р(А + В) = Р(А) + Р(В) = 0,25 + 0,175 = 0,425.

2) Событие, состоящее в том, что холодильник будет продан в России, означает, что холодильник будет продан или в Европейской части России, или в Западной Сибири, или в Восточной Сибири, или на Дальнем Востоке. Отсюда по формуле (2.6) нахо­дим его вероятность:

Р(холодильник будет продан в России)  = Р(А +D+E+ F) = Р(В) + P(D) + Р(Е) + P(F) = 0,20 + 0,15 + +0,125 + 0,10 = 0,575.

Этот же результат можно было получить рассуж­дая по-другому. События «Холодильник произве­ден на экспорт» и «Холодильник будет продан в России» — два взаимно противоположных события, отсюда по формуле (2.3):

Р(холодильник будет продан в России) = 1 - Р(холодильник произведен на экспорт)  = 1 - 0,425 = =0,575.

 

Пример 4. Опыт состоит в случайном извлече­нии карты из колоды в 52 карты. Чему равна вероятность того, что это будет или туз, или карта масти треф?

Решение. Определим события: А — «Извлече­ние туза», В — «Извлечение карты трефовой мас­ти». Вероятность извлечения туза из колоды карт Р(А) = 4/52; вероятность извлечения карты трефо­вой масти — Р(В) = 13/52; вероятность их пересече­ния — извлечение трефового туза - Р(АВ) = 1/52 (рис. 2.4).


События А и В — совместные, поскольку в коло­де есть трефовый туз.

Согласно условию задачи, нас интересует веро­ятность суммы совместных событий А и. В. По формуле (2.4) получим

     Р(А + В) = Р(А) + Р(В) - Р(АВ) = 4/52 + 13/52 - 1/52 = 16/52 = 1/2.

Пример 5. В урне 2 белых и 3 черных шара. Чему равна вероятность появления белого шара: а) при 1-м извлечении из урны; б) при 2-м извлечении из урны?

Решение. Здесь возможны 2 случая.

1-й случай. Схема возвращенного шара, т. е. шар после 1-го извлечения возвращается в урну.

Пусть событие А — «Появление белого шара при 1-м извлечении», так как N = 5, а М = 2, то Р(А) = 2/5.

Пусть событие В — «Появление белого шара при 2-м извлечении», так как шар после 1-го извлечения возвратился в урну, то N=5,а М=2 и Р(В) = 2/5.

Таким образом, вероятность каждого из событий не зависит от того, произошло или не произошло другое событие. События А и В в этом случае явля­ются независимыми.

Итак, события А и В называются независимы­ми, если вероятность каждого из них не зависит от того, произошло или нет другое событие.

Вероятности независимых событий называют­ся безусловными.

2-й случай. Схема невозвращенного шара, т. е. шар после 1-го извлечения в урну не возвращается.

Вероятность появления белого шара при 1-м извлечении Р(А) = 2/5. Белый шар в урну не возвращается, следовательно, в урне остались 1 бе­лый и 3 черных шара. Чему равна вероятность события В при условии, что событие А произошло? N = 4, М = 1.

Искомую вероятность обозначают Р(В/А) или Р(В)A или РA(В). Итак, Р(В/А) = 1/4 называют ус­ловной вероятностью, а события А, В — зависимыми. В предыдущем примере с картами Р(А) = 4/52;
Р(А/В) =
4/16.

Например, тот факт, что человек работает науч­ным сотрудником, не является независимым от наличия у него высшего образования; событие, состо­ящее в том, что станок может выйти из строя, не является независимым от срока его эксплуатации; событие, состоящее в том, что цена акций компа­нии пошла вверх, не является независимым от того с прибылью или с убытком сработала компания в прошлом периоде; и т. д.

Таким образом, события А и В называются за­висимыми, если вероятность каждого из них зависит от того произошло или нет другое событие. Вероятность события В, вычисленная в предполо­жении, что другое событие А уже осуществилось, называется условной вероятностью.

Вероятность произведения двух независимых со­бытий А и В равна произведению их вероятностей

Р(А В) = Р(А)Р(В),       

или                     (2.8)

Р(А Ç В) = Р(А)Р(В).

События А1, А2, ..., Аn (п > 2) называются неза­висимыми в совокупности, если вероятность каждого из них не зависит от того, произошли или нет любые события из числа остальных.

Распространим теоремы умножения на случаи п независимых и зависимых в совокупности событий.

 

 Вероятность совместного появления нескольких событий, независимых в совокупности, равна про­изведению вероятностей этих событий

Р(А1·А2·А3·...·Аn) = Р(А1)·Р(А2)·Р(А3)·...·Р(Аn).   (2.9)

 

Вероятность произведения двух зависимых со­бытий А и В равна произведению вероятности од­ного из них на условную вероятность другого


Вероятность события В при условии появления события А


Вероятность совместного наступления конечного числа n зависимых событий равна произведению вероятности одного из них на условные вероятно­сти всех остальных, причем условная вероятность каждого последующего события вычисляется в предположении, что все предыдущие уже наступили


Если события А1 , А2 ,..., Аn зависимые в со­вокупности, то вероятность наступления хотя бы одного из них равна


Вероятность появления хотя бы одного собы­тия из п независимых в совокупности равна разности между 1 и произведением вероятностей со­бытий, противоположных данным,


Пример 6. Консультационная фирма претендует на 2 заказа от 2 крупных корпораций. Эксперты фирмы считают, что вероятность получения кон­сультационной работы в корпорации А равна 0,45. Эксперты также полагают, что если фирма получит заказ у корпорации А, то вероятность того, что и корпорация В обратится к ним, равна 0,9. Какова вероятность того, что консультационная фирма получит оба заказа?

Решение. Обозначим события:

А — «Получение консультационной работы в кор­порации А»;

В — «Получение консультационной работы в кор­порации В».

События А и В — зависимые, так как событие В зависит от того, произойдет или нет событие А.

По условию мы имеем Р(А) = 0,45, а также зна­ем, что Р(В/А) = 0,9.

Необходимо найти вероятность того, что оба со­бытия (и событие А, и событие В) произойдут, т.е. Р(АВ). Для этого используем правило умножения вероятностей (2.10).

Отсюда получим

Р(АВ) = Р(А)Р( B/А) = 0,45 · 0,9 = 0,405.

Пример 7. В большой рекламной фирме 21% ра­ботников получают высокую заработную плату. Из­вестно также, что 40% работников фирмы — жен­щины, а 6,4% работников — женщины, получающие высокую заработную плату. Можем ли мы ут­верждать, что на фирме существует дискримина­ция женщин в оплате труда?

Решение. Сформулируем условие этой задачи в терминах теории вероятностей. Для ее решения не­обходимо ответить на вопрос: «Чему равняется ве­роятность того, что случайно выбранный работник будет женщиной, имеющей высокую заработную плату?» и сравнить ее с вероятностью того, что наудачу выбранный работник любого пола имеет вы­сокую зарплату.

Обозначим события:

А — «Случайно выбранный работник имеет вы­сокую зарплату»;

В — «Случайно выбранный работник — женщина». События А и В — зависимые. По условию

Р(АВ) = 0,064; Р(В) = 0,40; Р(А) = 0,21.

Нас интересует вероятность того, что наудачу выб­ранный работник имеет высокую зарплату при условии, что это женщина, т. е. — условная вероят­ность события А.

Тогда, используя теорему умножения вероятностей, получим

Р(А/В) = Р(АВ)/Р(В) = 0,064/0,40 = 0,16.

Поскольку Р(А/В) = 0,16 меньше, чем Р(А) = 0,21, то мы можем заключить, что женщины, работающие в рекламной фирме, имеют меньше шансов получить высокую заработную плату по сравнению с мужчинами.

Пример 8. Студент пришел на экзамен, изучив только 20 из 25 вопросов программы. Экзаменатор задал студенту 3 вопроса. Вычислить вероятность того, что студент ответит: а) на все 3 вопроса; б) хотя бы на 1 вопрос.

Решение. Обозначим события:

А — «Студент знает все 3 вопроса»;

А1 — «Студент знает 1-й вопрос»;

А2 «Студент знает 2-й вопрос»;

А3 — «Студент знает 3-й вопрос».

По условию

Р(А1) = 20/25; Р(А21) = 19/24; Р(А3,/А2A1) = 18/23.

1) Искомое событие А состоит в совместном на­ступлении событий А1, А2, А3.

События А1, А2, A3 — зависимые.

Для решения задачи используем правило умно­жения вероятностей конечного числа п зависимых событий (2.10):

Р(А) = (20/25)(19/24)(18/23) = 57/115 = 0,496.

Вероятность того, что студент ответит на все 3 вопроса, равна 0,496.

2) Обозначим событие:

В — «Студент ответит хотя бы на один вопрос». Событие В состоит в том, что произойдет или со­бытие А1, а события А2 и А3 — не произойдут, или произойдет событие А2, а события А1 и A3 — не произойдут, или произойдет событие А3 , а события А1 и А2 — не произойдут, или произойдут события А1 и А2 ,а событие A3 — не произойдет, или произойдут события А1 и А3, а событие А2 — не произойдет, или произойдут события А2 и А3 , а событие А1 — не про­изойдет, или произойдут все три ,события А1, А2, А3.

Для решения этой задачи можно было бы исполь­зовать правила сложения и умножения вероятностей. Однако здесь проще применить правило для вероятности наступления хотя бы одного из n зависимых событий (2.13).

Учитывая, что


получим

Р(В) = 1 - (5/25)(4/24)(3/23) = 229/230 = 0,9957.

Вероятность того, что студент ответит хотя бы на один вопрос, равна 0,9957.

Пример 9. Вероятность того, что потребитель уви­дит рекламу определенного продукта по телевиде­нию, равна 0,04. Вероятность того, что потребитель увидит рекламу того же продукта на рекламном стенде, равна 0,06. Предполагается, что оба собы­тия — независимы. Чему равна вероятность того, что потребитель увидит: а) обе рекламы; б) хотя бы одну рекламу?

Решение. Обозначим события:

А — «Потребитель увидит рекламу по телевиде­нию»;

    В — «Потребитель увидит рекламу на стенде»;

С — «Потребитель увидит хотя бы одну рекламу». Это значит, что потребитель увидит рекламу по

телевидению, или на стенде, или по телевидению и на стенде. По условию

Р(А) = 0,04; Р(В) = 0,06.

 

        События А и. В — совместные и независимые.

а) Поскольку вероятность искомого события есть вероятность совместного наступления независимых событий А и В (потребитель увидит рекламу и по телевидению и на стенде), т. е. их пересечения, для решения задачи используем правило умножения вероятностей для независимых событий.

Отсюда

Р(АВ) = Р(А) · Р(В) = 0,04 · 0,06 = 0,0024.

Вероятность того, что потребитель увидит обе рек­ламы, равна 0,0024.

б) Так как событие С состоит в совместном на­ступлении событий А и В, искомая вероятность может быть найдена с помощью правила сложения вероятностей.

Р(С) = Р(А + В) = Р(А) + Р(В) - Р(АВ) = = 0,04 + 0,06 - 0,0024 = 0,0976.

Вместе с тем, при решении этой задачи может быть использовано правило о вероятности наступ­ления хотя бы одного из п независимых событий.

Учитывая, что



Вычисление вероятностей событий такого типа характеризует эффективность рекламы, поскольку эта вероятность может означать долю (процент) на­селения, охватываемого ею, и отсюда следует оцен­ка рекламных усилий.

Задачи к теме 2

1. Анализ работы кредитного отдела банка выя­вил, что 12% фирм, бравших кредит в банке, обанкротились и не вернут кредиты по крайней мере в течение 5 лет. Также известно, что обанкротились 20% кредитовавшихся в банке фирм. Если один из клиентов банка обанкротился, то чему равна веро­ятность того, что он окажется не в состоянии вер­нуть долг банку?

2. Модельер, разрабатывающий новую коллек­цию одежды к весеннему сезону, создает модели в зеленой, черной и красной цветовой гамме. Вероят­ность того, что зеленый цвет будет в моде весной, модельер оценивает в 0,3, что черный — в 0,2, а вероятность того, что будет моден красный цвет — в 0,15. Предполагая, что цвета выбираются незави­симо друг от друга, оцените вероятность того, что цветовое решение коллекции будет удачным хотя бы по одному из выбранных цветов.

3. Вероятность того, что потребитель увидит рек­ламу определенного продукта по каждому из 3 центральных телевизионных каналов, равна 0,05. Пред­полагается, что эти события — независимы в сово­купности. Чему равна вероятность того, что потреби­тель увидит рекламу: а) по всем 3 каналам; б) хотя бы по 1 из этих каналов?

4. Торговый агент предлагает клиентам иллюс­трированную книгу. Из предыдущего опыта ему известно, что в среднем 1 из 65 клиентов, кото­рым он предлагает книгу, покупает ее. В течение некоторого промежутка времени он предложил кни­гу 20 клиентам. Чему равна вероятность того, что он продаст им хотя бы 1 книгу? Прокомментируйте предположения, которые вы использовали при решении задачи.

5. В налоговом управлении работает 120 сотруд­ников, занимающих различные должности.

Все

сотрудники

Руководители

Рядовые сотрудники

Итого

Мужчины

29

67

96

Женщины

4

20

24

Итого

33

87

120

 

На профсоюзном собрании женщины заявили о дискриминации при выдвижении на руководящие должности. Правы ли они?

6. В фирме 550 работников, 380 из них имеют высшее образование, а 412 — среднее специальное образование, у 357 высшее и среднее специальное образование. Чему равна вероятность того, что случайно выбранный работник имеет или среднее специ­альное, или высшее образование, или и то и другое?

7. Финансовый аналитик предполагает, что если норма (ставка) процента упадет за определенный период, то вероятность того, что рынок акций бу­дет расти в это же время, равна 0,80. Аналитик также считает, что норма процента может упасть за этот же период с вероятностью 0,40. Используя полученную информацию, определите вероятность того, что рынок акций будет расти, а норма процента падать в течение обсуждаемого периода.

8. Вероятность для компании, занимающейся строительством терминалов для аэропортов, полу­чить контракт в стране А равна 0,4, вероятность выиграть его в стране В равна 0,3. Вероятность того, что контракты будут заключены и в стране А, и в стране В, равна 0,12. Чему равна вероятность того, что компания получит контракт хотя бы в одной стране?

9. Город имеет 3 независимых резервных источ­ника электроэнергии для использования в случае аварийного отключения постоянного источника электроэнергии. Вероятность того, что любой из 3 резервных источников будет доступен при отклю­чении постоянного источника, составляет 0,8. Ка­кова вероятность того, что не произойдет аварий­ное отключение электроэнергии, если выйдет из строя постоянный источник?

10. Покупатель может приобрести акции 2 ком­паний А и В. Надежность 1-й оценивается экспер­тами на уровне 90%, а 2-й — 80%. Чему равна вероятность того, что: а) обе компании в течение года не станут банкротами; б) наступит хотя бы одно банк­ротство?

11. Стандарт заполнения счетов, установленный фирмой, предполагает, что не более 5% счетов будут заполняться с ошибками. Время от времени компа­ния проводит случайную выборку счетов для про­верки правильности их заполнения. Исходя из того, что допустимый уровень ошибок — 5% и 10 счетов отобраны в случайном порядке, чему равна вероят­ность того, что среди них нет ошибок?

12. На сахарном заводе один из цехов произво­дит рафинад. Контроль качества обнаружил, что 1 из 100 кусочков сахара разбит. Если вы случайным образом извлекаете 2 кусочка сахара, чему равна вероятность того, что, по крайней мере, 1 из них будет разбит? Предполагаем независимость событий, это предположение справедливо вследствие случай­ности отбора.

13. Эксперты торговой компании полагают, что покупатели, обладающие пластиковой карточкой этой компании, дающей право на скидку, с 90%-й вероятностью обратятся за покупкой определенного ассортимента товаров в ее магазины. Если это прои­зойдет, обладатель пластиковой карточки приобретет необходимый ему товар в магазинах этой компании с вероятностью 0,8. Какова вероятность того, что об­ладатель пластиковой карточки торговой компании приобретет необходимый ему товар в ее магазинах?

14. Аудиторская фирма размещает рекламу в жур­нале «Коммерсант». По оценкам фирмы 60% людей, читающих журнал, являются потенциальными клиентами фирмы. Выборочный опрос читателей журнала показал также, что 85% людей, которые читают журнал, помнят о рекламе фирмы, помещенной в конце журнала. Оцените, чему равен процент людей, которые являются потенциальными клиен­тами фирмы и могут вспомнить ее рекламу?

15. В городе 3 коммерческих банка, оценка на­дежности которых — 0,95, 0,90 и 0,85 соответственно. В связи с определением хозяйственных перс­пектив развития города администрацию интересу­ют ответы на следующие вопросы: а) какова веро­ятность того, что в течение года обанкротятся все 3 банка; б) что обанкротится хотя бы 1 банк?

16. О двух акциях А и В известно, что они выпу­щены одной и той же отраслью. Вероятность того, что акция А поднимется завтра в цене, равна 0,2. Вероятность того, что обе акции А и В поднимутся завтра в цене, равна 0,12. Предположим, что вы знаете, что акция А поднимется в цене завтра. Чему равна вероятность того, что и акция В завтра под­нимется в цене?

17. Инвестор предполагает, что в следующем пе­риоде вероятность роста цены акций компании N будет составлять 0,7, а компании М — 0,4. Вероят­ность того, что цены поднимутся на те и другие акции, равна 0,28. Вычислите вероятность их рос­та или компании N, или компании М, или обеих компаний вместе.

18. Крупная торговая компания занимается оп­товой продажей материалов для строительства и ремонта жилья и, имея список покупателей в 3 ре­гионах, основанный на ее собственной системе ко­дов, рассылает им по почте каталог товаров. Ме­неджер компании полагает, что вероятность того, что компания не получит откликов на разосланные предложения ни из одного региона, равна 0,25. Чему в этом случае равна вероятность того, что компа­ния получит ответ хотя бы из одного региона?

19. Секрет увеличения доли определенного това­ра на рынке состоит в привлечении новых потребителей и их сохранении. Сохранение потребителей то­вара («brand loyalty» — приверженность потребите­ля к данной марке или разновидности товара) — одна из наиболее ответственных областей рыночных ис­следований. Производители нового сорта духов зна­ют, что вероятность того, что потребители сразу примут новый продукт и создание «brand loyalty» потребует, по крайней мере, 6 месяцев, равна 0,02. Производитель также знает, что вероятность того, что случайно отобранный потребитель примет но­вый сорт, равна 0,05. Предположим, потребитель только что приобрел новый сорт духов (изменил марку товара). Чему равна вероятность того, что он сохранит свои предпочтения в течение 6 месяцев?

20. Вероятность того, что покупатель, собираю­щийся приобрести компьютер и пакет прикладных программ, приобретет только компьютер, равна 0,15, только пакет программ — 0,1. Вероятность того, что будет куплен и компьютер, и пакет программ, равна 0,05. Чему равна вероятность того, что будет куплен или компьютер, или пакет программ, или компьютер и пакет программ вместе?

 

3. ФОРМУЛЫ ПОЛНОЙ ВЕРОЯТНОСТИ И БАЙЕСА

Часто мы начинаем анализ вероятностей, имея предварительные, априорные значения вероятнос­тей интересующих нас событий. Затем из источни­ков информации, таких как выборка, отчет, опыт и т. д., мы получаем дополнительную информацию об интересующем нас событии. Имея эту новую информацию, мы можем уточнить, пересчитать зна­чения априорных вероятностей. Новые значения вероятностей для тех же интересующих нас собы­тий будут уже апостериорными (послеопытными) вероятностями. Теорема Байеса дает нам правило для вычисления таких вероятностей.

Последовательность процесса переоценки вероят­ностей можно схематично изобразить так:


Пусть событие А может осуществиться лишь вме­сте с одним из событий Н1, Н2, H3, ..., Hn, образующих полную группу. Пусть известны вероятности Р(Н1), Р(Н2), ..., Р(Нi), ..., Р(Нn). Так как события Нi образуют полную группу, то


а также известны и условные вероятности события А:


Так как заранее неизвестно, с каким из событий Нi произойдет событие А, то события Нi, называют гипотезами.

Необходимо определить вероятность события А и переоценить вероятности событий Нi с учетом полной информации о событии А.

Вероятность события А определяется как


Эта вероятность называется полной вероятностью. Если событие А может наступить только вмес­те с одним из событий Н123, ..., Нn, образую­щих полную группу несовместных событий и на­зываемых гипотезами, то вероятность события А равна сумме произведений вероятностей каждого из событий Н1, Н2, ..., Нn на соответствующую ус­ловную вероятность события А.              

Условные вероятности гипотез вычисляются по формуле


или


Это — формулы Байеса (по имени английского математика Т.Байеса, опубликовавшего их в 1764 г.), выражение в знаменателе — формула полной вероятности.

Пример 1. Предприятие, производящее компью­теры, получает одинаковые ЧИПы от 2 поставщиков. 1-й поставляет 65% ЧИПов, 2-й — 35%. Изве­стно, что качество поставляемых ЧИПов разное. На основании предыдущих данных о рейтингах каче­ства составлена табл. 3.1.

Таблица 3.1

Поставщик

 

% качественной продукции

 

% брака

 

1-й поставщик
2-й поставщик

 

98
95

 

2
5

 

 

Предприятие осуществляет гарантийный ремонт компьютеров. Имея данные о числе компьютеров, поступающих на гарантийный ремонт в связи с не­исправностью ЧИПов, переоцените вероятности того, что возвращенный для ремонта компьютер укомп­лектован ЧИПом: а) от 1-го поставщика; б) от 2-го поставщика.

Решение задач с использованием формул пол­ной вероятности и Байеса удобнее оформлять в виде табл. 3.2.

Таблица 3.2

Гипотезы

Нi

Вероятности

априорные Р(Нi)

условные Р(А/Нi)

совместные Р(Нi  Ç А)

апостериорные Р(Нi/А)

1

2

3

4

5

 

Шаг 1. В колонке 1 перечисляем события, кото­рые задают априорную информацию в контексте решаемой проблемы: Соб. Н1 ЧИП от 1-го постав­щика; Соб. Н2 — ЧИП от 2-го поставщика. Это — гипотезы и они образуют полную группу независи­мых и несовместных событий.

В колонке 2 записываем вероятности этих событий:

Р(Н1) = 0,65, Р(Н2) = 0,35.

В колонке 3 определим условные вероятности со­бытия А — «ЧИП бракованный» для каждой из

гипотез.

Шаг 2. В колонке 4 находим вероятности для со­бытий «ЧИП от 1-го поставщика и он бракованный» и «ЧИП от 2-го поставщика и он бракованный». Они определяются по правилу умножения вероятностей путем перемножения значений колонок 2 и 3. По­скольку сформулированные события являются ре­зультатом пересечения двух событий А и Нi, то их вероятности называют совместными:

Р(Нi Ç А) = Р(Нi)Р(А/Нi).

Шаг 3. Суммируем вероятности в колонке 4 для того, чтобы найти вероятность события А. В нашем примере 0,0130 — вероятность поставки некачествен­ного ЧИПа от 1-го поставщика, 0,0175 — вероятность поставки некачественного ЧИПа от 2-го постав­щика. Поскольку, как мы уже сказали выше, ЧИПы поступают только от 2 поставщиков, то сумма вероятностей 0,0130 и 0,0175 показывает, что 0,0305 есть вероятность бракованного ЧИПа в общей поставке, определяемая с помощью формулы (3.1)


Шаг 4. В колонке 5 вычисляем апостериорные вероятности, используя формулу (3.2):


Заметим, что совместные вероятности находятся в строках колонки 4, а вероятность события А как сумма колонки 4 (табл. 3.3).

Таблица 3.3

Гипотезы

Нi

 

Вероятности

априорные
Р(Нi)

 

Условные
 Р(А/Нi)

 

Совместные
Р(Нi Ç А)

 

апостериорные Р(Нi/А)

 

1

 

2

 

3

 

4

 

5

 

ЧИП от 1-го постав­щика

 

0,65

 

0,02

 

0,0130

 

0,426

 

ЧИП от 2-го постав­щика

0,35

0,05

0,0175

0,574

å

 

å=1

 

 

 

P(A)=0,0305

 

å=l

 

 

Пример 2. Экономист полагает, что вероятность роста стоимости акций некоторой компании в следующем году будет равна 0,75, если экономика стра­ны будет на подъеме; и эта же вероятность будет равна 0,30, если экономика страны не будет успеш­но развиваться. По его мнению, вероятность экономического подъема в новом году равна 0,80. Ис­пользуя предположения экономиста, оцените вероятность того, что акции компании поднимутся в цене в следующем году.

Решение. Определим события:

А — «Акции компании поднимутся в цене в бу­дущем году».

Событие А может произойти только вместе с од­ной из гипотез:

Н1 — «Экономика страны будет на подъеме»;

Н2 «Экономика страны не будет успешно развиваться».

По условию известны вероятности гипотез:

Р(Н1) = 0,80; Р(Н2) = 0,20 и условные вероятности события А:

Р(А/Н1)= 0,75; Р(А/Н2)= 0,30.

Гипотезы образуют полную группу, сумма их вероятностей равна 1. Рассмотрим событие А — это или Н1А, или Н2А. События Н1А и Н2А — несовместные попарно, так как события Н1 и Н2

несовместны.

События Н1 и А, Н2 и А — зависимые. Вышеизложенное позволяет применить для оп­ределения искомой вероятности события А форму­лу полной вероятности

 

Р(А) = Р(Н1)Р(А/Н1) + Р(Н2)Р(А/Н2) = == 0,80 · 0,75 + 0,20 · 0,30 = 0,66.

Решение оформим в виде табл. 3.4.

Таблица 3.4

Гипотезы Нi

Р(Нi)

Р(А/Нi)

Р(Нi)Р(А/Нi)

Н1 «подъем экономики»

0,80

0,75

0,60

Н2 «спад экономики»

0,20

0,30

0,06

å

1,00

 

0,66

 

Вероятность того, что акции компании поднимут­ся в цене в следующем году, составляет 0,66. Ответ. 0,66.

Пример 3. Экономист полагает, что в течение периода активного экономического роста американ­ский доллар будет расти в цене с вероятностью 0,70, в период умеренного экономического роста он по­дорожает с вероятностью 0,40 и при низких темпах экономического роста доллар подорожает с вероят­ностью 0,20. В течение любого периода времени ве­роятность активного экономического роста — 0,30;

умеренного экономического роста — 0,50 и низко­го роста — 0,20. Предположим, что доллар дорожа­ет в течение текущего периода. Чему равна вероят­ность того, что анализируемый период совпал с пери­одом активного экономического роста?

Решение. Определим события:

А — «Доллар дорожает». Оно может произойти только вместе с одной из гипотез:

Н1 — «Активный экономический рост»;

Н2 «Умеренный экономический рост»;

Н3 «Низкий экономический рост». По условию известны доопытные (априорные) ве­роятности гипотез и условные вероятности события А:

 

Р(Н1) = 0,30, Р(Н2) = 0,50, Р(Н3) = 0,20, Р(А/Н1) = 0,70, Р(А/Н2) = 0,40, Р(А/Н3) = 0,20.

Гипотезы образуют полную группу, сумма их ве­роятностей равна 1. Событие А — это или Н1А, или Н2А, или Н3А. События Н1А, Н2А. и Н3А. — не­совместные попарно, так как события Н1, Н2 и Н3 — несовместны. События Н1 и А, Н2 и А, Н3 и А — зависимые.

Требуется найти уточненную (послеопытную, апостериорную) вероятность первой гипотезы, т. е. необходимо найти вероятность активного экономи­ческого роста, при условии, что доллар дорожает (событие А уже произошло), т. е. Р(Н1/А).

Используя формулу Байеса (3.2) и подставляя заданные значения вероятностей, имеем


Мы можем получить тот же результат с помо­щью табл. 3.5.

Вероятность активного экономического роста, при условии, что доллар дорожает, составляет 0,467.

 

Таблица 3.5


Для более наглядного восприятия решения на­шей задачи мы можем также построить дерево ре­шений:


Пример 4. В каждой из двух урн содержится 6 чер­ных и 4 белых шара. Из 1-й урны во 2-ю наудачу переложен один шар.

а) Найти вероятность того, что шар, извлечен­ный из 2-й урны после перекладывания, окажется черным.

б) Предположим, что шар, извлеченный из 2-й урны после перекладывания, оказался черным. Какова тогда вероятность того, что из 1-й урны во 2-ю был переложен белый шар?

Решение. Определим события:

А — «Шар, извлеченный из 2-й урны, черный». Оно может произойти только вместе с одной из ги­потез:

Н1 — «Из 1-й урны во 2-ю урну переложили чер­ный шар» и Н2 — «Из 1-й урны во 2-ю переложили

белый шар».

Используя классическое определение вероятнос­ти, найдем вероятности гипотез

Р(Н1) = 6/10; Р(Н2) = 4/10

и условные вероятности события А.

После перекладывания во 2-й урне окажется 11 шаров. Если из 1-й урны во 2-ю переложили чер­ный шар, то во 2-й урне окажется 7 черных и 4 бе­лых шаров, тогда

Р(А/Н1) = 7/11.

Если из 1-й урны во 2-ю переложили белый шар, то во 2-й урне окажется 6 черных и 5 белых шаров, тогда

Р(А/Н2) = 6/11.

Гипотезы образуют полную группу, сумма их веро­ятностей равна 1. Рассмотрим событие А — это или Н1А, или Н2А. События Н1А и Н2А — несовместные попарно, так как события Н1 и Н2 несовместны. События Н1 и А, Н2 и А — зависимые.

1. Вышеизложенное позволяет применить для определения вероятности события А и ответа на 1-й вопрос формулу полной вероятности (3.1)

Р(А) = Р(Н1) Р(А/Н1) + Р(Н2) Р(А/Н2)= = 6/10 · 7/11 + 4/10 · 6/11 = 0,6.

Это же решение можно оформить в виде табл. 3.6.

Таблица 3.6

Гипотезы Нi

Р(Нi)

Р(А/Нi)

Р(Нi)Р(А/Нi)

Н1 «из 1-й урны во 2-ю переложили черный шар»

6/10

7/11

42/110

Н2— «из 1-й урны во 2-ю переложили белый шар»

4/10

6/11

24/110

å

1,00

0,6

 

 

Вероятность того, что шар, извлеченный из 2-й урны после перекладывания, окажется черным, составляет 0,6.

2. Во 2-й части задачи предполагается, что собы­тие А уже произошло, т. е. шар, извлеченный из 2-й урны, оказался черным. Требуется найти уточненную (послеопытную, апостериорную) вероятность 2-й гипотезы, т. е. необходимо определить вероятность того, что из 1-й урны во 2-ю был переложен белый шар при условии, что шар, извлеченный из 2-й урны после перекладывания, оказался черным:

Р(Н2/А).

Для определения искомой вероятности восполь­зуемся формулой Байеса (3.2)


Мы можем получить тот же результат с помо­щью табл. 3.7.

Таблица 3.7


Вероятность того, что из 1-й урны во 2-ю был переложен белый шар при условии, что шар, извлеченный из 2-й урны после перекладывания, ока­зался черным, составляет 0,3636.

Ответ. а) 0,6; б) 0,3636.

Задачи к теме 3

1. Директор компании имеет 2 списка с фамили­ями претендентов на работу. В 1-м списке — фамилии 6 женщин и 3 мужчин. Во 2-м списке оказа­лись 4 женщины и 7 мужчин. Фамилия одного из претендентов случайно переносится из 1-го списка во 2-й. Затем фамилия одного из претендентов случайно выбирается из 2-го списка. Если предполо­жить, что эта фамилия принадлежит мужчине, чему равна вероятность того, что из 1-го списка была пе­ренесена фамилия женщины?

2. Агент по недвижимости пытается продать уча­сток земли под застройку. Он полагает, что участок будет продан в течение ближайших 6 месяцев с ве­роятностью 0,9, если экономическая ситуация в регионе не будет ухудшаться. Если же экономичес­кая ситуация будет ухудшаться, то вероятность продать участок составит 0,5. Экономист, консуль­тирующий агента, полагает, что с вероятностью, равной 0,7, экономическая ситуация в регионе в течение следующих 6 месяцев будет ухудшаться. Чему равна вероятность того, что участок будет продан в течение ближайших 6 месяцев?

3. Судоходная компания организует средиземно­морские круизы в течение летнего времени и проводит несколько круизов в сезон. Поскольку в этом виде бизнеса очень высокая конкуренция, то важ­но, чтобы все каюты зафрахтованного под круизы корабля были полностью заняты туристами, тогда компания получит прибыль. Эксперт по туризму, нанятый компанией, предсказывает, что вероятность того, что корабль будет полон в течение сезона, бу­дет равна 0,92, если доллар не подорожает по отно­шению к рублю, и с вероятностью — 0,75, если дол­лар подорожает. По оценкам экономистов, вероят­ность того, что в течение сезона доллар подорожает по отношению к рублю, равна 0,23. Чему равна ве­роятность того, что билеты на все круизы будут проданы?

4. В корпорации обсуждается маркетинг нового продукта, выпускаемого на рынок. Исполнительный директор корпорации желал бы, чтобы новый товар превосходил по своим характеристикам соответству­ющие товары конкурирующих фирм. Основываясь на предварительных оценках экспертов, он опреде­ляет вероятность того, что новый товар более высо­кого качества по сравнению с аналогичными в 0,5, такого же качества — в 0,3, хуже по качеству — в 0,2. Опрос рынка показал, что новый товар конку­рентоспособен. Из предыдущего опыта проведения опросов следует, что если товар действительно кон­курентоспособный, то предсказание такого же выво­да имеет вероятность, равную 0,7. Если товар такой же, как и аналогичные, то вероятность того, что оп­рос укажет на его превосходство, равна 0,4. И если товар более низкого качества, то вероятность того, что опрос укажет на его конкурентоспособность, рав­на 0,2. С учетом результата опроса оцените вероят­ность того, что товар действительно более высокого качества и, следовательно, обладает более высокой конкурентоспособностью, чем аналогичные.

5. Сотрудники отдела маркетинга полагают, что в ближайшее время ожидается рост спроса на продукцию фирмы. Вероятность этого они оценивают  в 80%. Консультационная фирма, занимающаяся

прогнозом рыночной ситуации, подтвердила пред­положение о росте спроса. Положительные прогно­зы консультационной фирмы сбываются с вероят­ностью 95%, а отрицательные — с вероятностью 99%. Какова вероятность того, что рост спроса дей­ствительно произойдет?

6. Исследователь рынка заинтересован в прове­дении интервью с супружескими парами для выяснения их предпочтений к некоторым видам това­ров. Он приходит по выбранному адресу, попадает в трехквартирный дом и по надписям на почтовых ящиках выясняет, что в 1-й квартире живут 2 мужчин, во 2-й — супружеская пара, в 3-й — 2 женщи­ны. Когда исследователь поднимается по лестнице, то выясняется, что на дверях квартир нет никаких указателей. Исследователь звонит в случайно выб­ранную дверь и на его звонок выходит женщина. Предположим, что если бы он позвонил в дверь квартиры, где живут 2 мужчин, то к двери мог по­дойти только мужчина; если бы он позвонил в дверь квартиры, где живут только женщины, то к двери подошла бы только женщина; если бы он позвонил в дверь супружеской пары, то мужчина или жен­щина имели бы равные шансы подойти к двери. Имея эту информацию, оцените вероятность того, что исследователь выбрал нужную ему дверь.

7. Среди студентов института — 30% первокурс­ники, 35% студентов учатся на 2-м курсе, на 3-м и 4-м курсе их 20% и 15% соответственно. По дан­ным деканатов известно, что на первом курсе 20% студентов сдали сессию только на отличные оцен­ки, на 2-м — 30%, на 3-м — 35%, на 4-м — 40% отличников. Наудачу вызванный студент оказался отличником. Чему равна вероятность того, что он (или она) — третьекурсник?

8. Отдел менеджмента одного из супермаркетов разрабатывает новую кредитную политику с целью снижения числа тех покупателей, которые, полу­чая кредит, не выполняют своих платежных обязательств. Менеджер по кредитам предлагает в буду­щем отказывать в кредитной поддержке тем поку­пателям, которые на 2 недели и более задерживают очередной взнос, тем более что примерно 90% та­ких покупателей задерживают платежи, по край­ней мере, на 2 месяца.

Дополнительные исследования показали, что 2% всех покупателей товаров в кредит не только задерживают очередной взнос, но и вообще не выполня­ют своих обязательств, а 45% тех, кто уже имеют 2-месячную задолженность по кредиту, уплатил оче­редной взнос в данный момент. Учитывая все это, найти вероятность того, что покупатель, имеющий 2-месячную задолженность, в действительности не выполнит своих платежных обязательств по креди­ту. Проанализировав полученные вероятности, кри­тически оцените новую кредитную политику, раз­работанную отделом менеджмента.

9. Из числа авиалиний некоторого аэропорта 60% — местные, 30% — по СНГ и 10% — международные. Среди пассажиров местных авиалиний 50% путешествуют по делам, связанным с бизнесом, на линиях СНГ таких пассажиров 60%, на междуна­родных — 90%. Из прибывших в аэропорт пасса­жиров случайно выбирается 1. Чему равна вероят­ность того, что он: а) бизнесмен; б) прибыл из стран СНГ по делам бизнеса; в) прилетел местным рейсом по делам бизнеса; г) прибывший международным рейсом бизнесмен?

10. Нефтеразведочная экспедиция проводит ис­следования для определения вероятности наличия нефти на месте предполагаемого бурения скважи­ны. Исходя из результатов предыдущих исследова­ний, нефтеразведчики считают, что вероятность наличия нефти на проверяемом участке равна 0,4. На завершающем этапе разведки проводится сейс­мический тест, который имеет определенную сте­пень надежности: если на проверяемом участке есть нефть, то тест укажет на ее наличие в 85% случаев; если нефти нет, то в 10% случаев тест может оши­бочно указать на это. Сейсмический тест указал на присутствие нефти. Чему равна вероятность того, что запасы нефти на данном участке существуют реально?

11. Экспортно-импортная фирма собирается зак­лючить контракт на поставку сельскохозяйствен­ного оборудования в одну из развивающихся стран. Если основной конкурент фирмы не станет одновременно претендовать на заключение контракта, то вероятность получения контракта оценивается в 0,45; в противном случае — в 0,25. По оценкам экспертов компании вероятность того, что конку­рент выдвинет свои предложения по заключению контракта, равна 0,40. Чему равна вероятность заключения контракта?

12. Транснациональная компания обсуждает воз­можности инвестиций в некоторое государство с неустойчивой политической ситуацией. Менедже­ры компании считают, что успех предполагаемых инвестиций зависит, в частности, и от политичес­кого климата в стране, в которую предполагается вливание инвестиционных средств. Менеджеры оце­нивают вероятность успеха (в терминах годового дохода от субсидий в течение 1-го года работы) в 0,55, если преобладающая политическая ситуация будет благоприятной; в 0,30, если политическая си­туация будет нейтральной; в 0,10, если политичес­кая ситуация в течение года будет неблагоприят­ной. Менеджеры компании также полагают, что вероятности благоприятной, нейтральной и небла­гоприятной политических ситуаций соответствен­но равны: 0,60, 0,20 и 0,20. Чему равна вероят­ность успеха инвестиций?

13. Экономист-аналитик условно подразделяет экономическую ситуацию в стране на «хорошую», «посредственную» и «плохую» и оценивает их ве­роятности для данного момента времени в 0,15; 0,70 и 0,15 соответственно. Некоторый индекс экономи­ческого состояния возрастает с вероятностью 0,60, когда ситуация «хорошая»; с вероятностью 0,30, когда ситуация «посредственная», и с вероятнос­тью 0,10, когда ситуация «плохая». Пусть в насто­ящий момент индекс экономического состояния воз­рос. Чему равна вероятность того, что экономика страны на подъеме?

14. При слиянии акционерного капитала 2 фирм аналитики фирмы, получающей контрольный па­кет акций, полагают, что сделка принесет успех с вероятностью, равной 0,65, если председатель сове­та директоров поглощаемой фирмы выйдет в отстав­ку; если он откажется, то вероятность успеха будет равна 0,30. Предполагается, что вероятность ухода в отставку председателя составляет 0,70. Чему рав­на вероятность успеха сделки?

15. На химическом заводе установлена система аварийной сигнализации. Когда возникает аварий­ная ситуация, звуковой сигнал срабатывает с веро­ятностью 0,950. Звуковой сигнал может сработать случайно и без аварийной ситуации с вероятностью 0,02. Реальная вероятность аварийной ситуации равна 0,004. Предположим, что звуковой сигнал сработал. Чему равна вероятность реальной аварий­ной ситуации?

16. Вероятность того, что клиент банка не вер­нет заем в период экономического роста, равна 0,04, а в период экономического кризиса — 0,13. Пред­положим, что вероятность того, что начнется пери­од экономического роста, равна 0,65. Чему равна вероятность того, что случайно выбранный клиент банка не вернет полученный кредит?

17. Перед тем, как начать маркетинг нового това­ра по всей стране, компании-производители часто проверяют спрос на него по отзывам случайно выб­ранных потенциальных покупателей. Методы про­ведения выборочных процедур уже проверены и имеют определенную степень надежности. Для опре­деленного товара известно, что вероятность его воз­можного успеха на рынке составит 0,75, если товар действительно удачный, и 0,15, если он неудачен. Из прошлого опыта известно, что новый товар мо­жет иметь успех на рынке с вероятностью 0,60. Если новый товар прошел выборочную проверку, и ее ре­зультаты указали на возможный его успех, то чему равна вероятность того, что это действительно так?


18. 2 автомата производят одинаковые детали, которые поступают на общий конвейер. Производительность 1-го автомата вдвое больше производи­тельности 2-го. 1-й автомат производит в среднем 60% деталей отличного качества, а 2-й — 84% де­талей отличного качества. Наудачу взятая с кон­вейера деталь оказалась отличного качества. Найти вероятность того, что эта деталь изготовлена: а) 1-м автоматом; б) 2-м автоматом.

19. Исследованиями психологов установлено, что мужчины и женщины по-разному реагируют на некоторые жизненные обстоятельства. Результаты исследований показали, что 70% женщин позитив­но реагируют на изучаемый круг ситуаций, в то время как 40% мужчин реагируют на них негатив­но. 15 женщин и 5 мужчин заполнили анкету, в которой отразили свое отношение к предлагаемым ситуациям. Случайно извлеченная анкета содержит негативную реакцию. Чему равна вероятность того, что ее заполнял мужчина?

20. Вероятность того, что новый товар будет пользоваться спросом на рынке, если конкурент не выпустит в продажу аналогичный продукт, равна 0,67. Вероятность того, что товар будет пользовать­ся спросом при наличии на рынке конкурирующе­го товара, равна 0,42. Вероятность того, что конкурирующая фирма выпустит аналогичный товар на рынок в течение интересующего нас периода, рав­на 0,35. Чему равна вероятность того, что товар будет иметь успех?

 

4. ДИСКРЕТНЫЕ СЛУЧАЙНЫЕ ВЕЛИЧИНЫ

4.1. Определение дискретной случайной величины

Величина, которая в результате испытания мо­жет принять то или иное значение, заранее неизвестно, какое именно, считается случайной.

Дискретной случайной величиной называется такая переменная величина, которая может при­нимать конечную или бесконечную совокупность значений, причем принятие ею каждого из значе­ний есть случайное событие с определенной веро­ятностью.

Соотношение, устанавливающее связь между от­дельными возможными значениями случайной ве­личины и соответствующими им вероятностями, называется законом распределения дискретной случайной величины. Если обозначить возмож­ные числовые значения случайной величины Х че­рез x1, x2, ..., xn..., а через pi = Р(Х = хi) вероят­ность появления значения xi, то дискретная слу­чайная величина полностью определяется табл. 4.1.

Таблица 4.1

xi

 

x1

 

x2

 

...

 

xn

 

pi

 

p1

 

p2

 

...

 

pn

 

 

Здесь значения x1, x2, ..., xn записываются, как правило, в порядке возрастания. Таблица называет­ся законом (рядом) распределения дискретной слу­чайной величины X. Поскольку в его верхней строч­ке записаны все значения случайной величины X, то нижняя обладает следующим свойством:


Ряд распределения можно изобразить графически (рис. 4.1).


Рис. 4.1

Если на рис. 4.1 по оси абсцисс отложить значе­ния случайной величины, по оси ординат — вероятности значений, полученные точки соединить от­резками прямой, то получим многоугольник рас­пределения вероятностей (полигон распределения).

Дискретная случайная величина может быть за­дана функцией распределения.

Функцией распределения случайной величины Х называется функция F(x), выражающая вероят­ность того, что Х примет значение, меньшее чем х:


Здесь для каждого значения х суммируются ве­роятности тех значений xi, которые лежат левее точ­ки х.

Функция F(x) есть неубывающая функция. Для дискретных случайных величин функция распределения F(x) есть разрывная ступенчатая функция, непрерывная слева (рис. 4.2).


Вероятность попадания случайной величины Х в промежуток от  a до b (включая a) выражается формулой

Р(a £ Х < b) = F(b) - F(a).        (4.3)

Одной из важных числовых характеристик слу­чайной величины Х является математическое ожидание

М(Х) = x1p1, + x2p2 +...+ x3p3.      (4.4)

В случае бесконечного множества значений xi в правой части (4.4) находится ряд, и мы будем рассматривать только те значения Х, для которых он абсолютно сходится.

М(Х) представляет собой среднее ожидаемое зна­чение случайной величины. Оно обладает следующими свойствами:

1) М(С) = С, где С = const;

2) М(СХ) = СМ(Х);                   

3) М(Х + Y) = М(Х) + М(Y), для любых Х и Y;

4) М(ХУ) = М(Х)М(У), если Х и Y  независимы.

(4.5)

Для оценки степени рассеяния значений случай­ной величины около ее среднего значения М(Х) = а вводятся понятия дисперсии D(X) и среднего квадратического (стандартного) отклонения s(х). Дисперсией называется математическое ожидание квадрата разности (Ха),


где а = М(Х); s (х) определяется как квадратный корень из дисперсии, т. е.


Для вычисления дисперсии пользуются форму­лой

D(X) = М(Х2) - М2(Х).        (4.6)

Свойства дисперсии и среднего квадратического отклонения:

1) D(C) = 0, где С = const;

 


если Х и У независимы.

Размерность величин М(Х) и s(Х) совпадает с размерностью самой случайной величины X, а размерность D(X) равна квадрату размерности случай­ной величины X.

 

4.2. Математические операции над случайными величинами

Пусть случайная величина Х принимает значе­ния хi с вероятностями Р(Х = xi) =pi(i= 1, 2, ..., п), а случайная величина Y — значения уj с вероятно­стями Р(Y = у) =pj(j = 1, 2, ..., m). Произведение КХ случайной величины Х на постоянную величи­ну K — это новая случайная величина, которая с теми же вероятностями, что и случайная величина X, принимает значения, равные произведениям на К значений случайной величины X. Следователь­но, закон ее распределения имеет вид табл. 4.2.

Таблица 4.2

kxi

 

kx1

 

kx2

 

...

 

kxn

 

pi

 

p1

 

p2

 

...

 

pn

 

 

Квадрат случайной величины (X 2) — это новая случайная величина, которая с теми же вероятностями, что и случайная величина X, принимает зна­чения, равные квадратам ее значений.

Сумма случайных величин Х и Y — это новая случайная величина, принимающая все значения вида xi + уj, (i = 1, 2, .... п; j = 1, 2, ..., т) с вероят­ностями рij, выражающими вероятность того, что случайная величина Х примет значение xi ,a Yзначение yj, т. е.

рij = Р(Х = xi; У = уj) = Р(Х = xiX=xi(Y = уi). (4.8) Если случайные величины Х и Y независимы, то


Аналогично определяются разность и произведе­ние случайных величин Х и Y. .

Разность случайных величин Х и Y — это новая случайная величина, которая принимает все значе­ния вида хi – уj, а произведение — все значения вида хiуj с вероятностями, определяемыми по формуле (4.8), а если случайные величины Х и Y неза­висимы, то по (4.9).

 

4.3. Распределения Бернулли и Пуассона

Рассмотрим последовательность п идентичных повторных испытаний, удовлетворяющих следующим условиям:

1) каждое испытание имеет 2 исхода, называе­мые успех и неуспех; это — взаимно несовместные и противоположные события;

2) вероятность успеха — р — остается постоян­ной от испытания к испытанию. Вероятность неуспеха — q;

3) все п испытаний — независимы. Это значит, что вероятность наступления события в любом из п повторных испытаний не зависит от результатов других испытаний.

Вероятность того, что в п независимых повтор­ных испытаниях, в каждом из которых вероятность появления события равна р(0 < р < 1), событие наступит ровно т раз (в любой последовательно­сти), равна


где q = 1— р.

Выражение (4.10) называется формулой Бернулли.

Вероятности того, что событие наступит: а) ме­нее т раз; б) более т раз; в) не менее т раз; г) не более т раз — находятся по формулам:


Биномиальным называют закон распределения дискретной случайной величины Х — числа появлений события в n независимых испытаниях, в каждом из которых вероятность наступления события равна р; вероятности возможных значений Х = О, 1, 2, ..., т, ..., п вычисляются по формуле Бернулли (табл.4.3).

Таблица 4.3


Так как правая часть формулы (4.10) представля­ет общий член биномиального разложения (q + р)n, то этот закон распределения называют биномиаль­ным. Для случайной величины X, распределенной по биномиальному закону, имеем

М(Х) = np;    (4.11)

D(X) = npq.  (4.12)

Если число испытаний велико, а вероятность появления события р в каждом испытании очень мала, то вместо формулы (4.10) пользуются при­ближенной формулой


где т — число появлений события в п независи­мых испытаниях; l = пр ( среднее число появлений события в п испытаниях).

Выражение (4.13) называется формулой Пуассо­на. Придавая т целые неотрицательные значения т = 0, 1, 2, ..., п, можно записать ряд распределе­ния вероятностей, вычисленных по формуле (4.13), который называется законом распределения Пуас­сона (табл. 4.4).

Таблица 4.4


Распределение Пуассона (приложение 3) часто ис­пользуется, когда мы имеем дело с числом событий, появляющихся в промежутке времени или про­странства, например: число машин, прибывших на автомойку в течение часа; число дефектов на новом отрезке шоссе длиной в 10 км; число мест утечки воды на 100 км водопровода; число остановок стан­ков в неделю; число дорожных происшествий.

Если распределение Пуассона применяется вме­сто биномиального, то п должно иметь порядок не менее нескольких десятков, лучше нескольких со­тен, а пр < 10.

Математическое ожидание и дисперсия случай­ной величины, распределенной по закону Пуассо­на, совпадают и равны параметру l, который опре­деляет этот закон, т. е.

М(Х) = D(X) = l.         (4.14)

4.4. Гипергеометрическое распределение

Пусть имеется множество N элементов, из кото­рых М элементов обладают некоторым признаком А. Извлекается случайным образом без возвраще­ния п элементов. Требуется найти вероятность того, что из них т элементов обладают признаком А. Искомая вероятность (зависящая от N, М, п, т) определяется по формуле


Полученный с помощью формулы (4.15) ряд рас­пределения называется гипергеометрическим законом распределения (табл. 4.5).

Таблица 4.5


Математическое ожидание и дисперсия случай­ной величины т, распределенной по гипергеометрическому закону, определяются формулами:


Пример 1. Известно, что в определенном городе 20% горожан предпочитают добираться на работу личным автотранспортом. Случайно выбраны 4 че­ловека.

1) Составьте ряд распределения числа людей в выборке, предпочитающих добираться на работу личным автотранспортом, и постройте его график.

2) Найдите числовые характеристики этого рас­пределения.

3) Напишите функцию распределения числа лю­дей в выборке, предпочитающих добираться на работу личным автотранспортом, и постройте ее гра­фик.

4) Чему равна вероятность того, что среди 4 слу­чайно отобранных человек: а) не будет ни одного человека, предпочитающего добираться на работу лич­ным автотранспортом; б) окажется хотя бы 1 чело­век, предпочитающий добираться на работу личным автотранспортом; в) будет не больше 2, предпочи­тающих добираться на работу личным автотранс­портом?

Решение. В качестве случайной величины в дан­ной задаче выступает число людей в выборке, предпо­читающих добираться на работу личным автотранс­портом. Обозначим ее через X. Перечислим все возмо­жные значения случайной величины X: 0, 1, 2, 3, 4.

Вероятность того, что каждый из отобранных людей предпочитает добираться на работу личным автотранспортом, постоянна и равна 0,2 (р = 0,2). Вероятность противоположного события, т. е. того, что каждый из отобранных людей предпочитает добираться на работу не личным автотранспортом, а как-то иначе, также постоянна и составляет 0,8 (q= 1 - p= 10,2=0,8).

Все 4 испытания — независимы, т. е. вероятность того, что каждый из отобранных людей предпочитает добираться на работу личным автотранспор­том, не зависит от того, каким способом предпочи­тает добираться на работу любой другой человек из числа случайно отобранных.

Очевидно, что случайная величина Х подчиня­ется биномиальному закону распределения вероятностей с параметрами n=4 и р = 0,2.

Итак, по условию задачи:

n = 4; р = 0,2; q = 0,8; X = т.

1) Чтобы построить ряд распределения, необхо­димо вычислить вероятности того, что случайная величина примет каждое из своих возможных зна­чений, и записать полученные результаты в таблицу.

Расчет искомых вероятностей осуществляется по формуле Бернулли


 

Поставим в эту формулу данные задачи.

 



Получим ряд распределения числа людей в вы­борке, предпочитающих добираться на работу лич­ным автотранспортом (табл. 4.6).

Таблица 4.6

X

 

0

 

1

 

2

 

3

 

4

 

P

 

0,4096

 

0,4096

 

0,1536

 

0,0256

 

0,0016

 

 

Так как все возможные значения случайной ве­личины образуют полную группу событий, то сум­ма их вероятностей должна быть равна 1.

Проверка: 0,4096 + 0,4096 + 0,1536 + 0,0256 + + 0,0016 = 1.

Вместо ряда распределения дискретная случай­ная величина может быть задана графически многоугольником (полигоном) распределения (рис. 4.3).


Рис. 4.3

2) Найдем основные числовые характеристики распределения данной случайной величины: математическое ожидание, дисперсию и среднее квадратическое (стандартное) отклонение.

Математическое ожидание любой дискретной случайной величины может быть рассчитано по формуле (4.4)


Но, ввиду того, что в данном случае речь идет о математическом ожидании частоты, для его расче­та можно воспользоваться более простой формулой (4.11)

М(Х = т) = = 4 · 0,2 = 0,8 (чел.).

Рассчитаем дисперсию числа человек, предпочи­тающих добираться на работу личным автотранспортом, среди 4 отобранных. Дисперсия любой дискретной случайной величины может быть рассчи­тана по формуле


В данном случае речь идет о дисперсии частоты, а ее можно найти по формуле (4.12)

D(X = т) = npq = 4 · 0,2 · 0,8 = 0,64 (чел.2).

Рассчитаем среднее квадратическое отклонение числа людей в выборке, предпочитающих добираться на работу личным автотранспортом. Среднее квад­ратическое отклонение рассчитывается по формуле


3) Дискретную случайную величину можно за­дать функцией распределения


где для каждого значения х суммируются вероятно­сти тех значений хi, которые лежат левее точки х.

Зададим функцию распределения дискретной случайной величины применительно к условию дан­ной задачи


Для построения графика функции распределения вероятностей дискретной случайной величины необходимо рассчитать кумулятивные (накопленные) вероятности, соответствующие значениям случай­ной величины. Алгоритм их расчета вытекает из смысла функции распределения

F(Xi) = Р(Х1) + Р(Х2) + ... + Р(Хi-2) + Р(Хi-1).

Эта формула справедлива для всех F(Xi), кроме F(X0). Так как функция распределения определяет вероятность того, что случайная величина примет значение, меньшее заданного, понятно, что вероятность того, что случайная величина примет значе­ние, не более минимального, равна 0, т. е. F(X0) = 0.

Рассчитаем значения F(x)


Эти данные можно представить и в виде табл. 4.7.

Таблица 4.7

Х

х £ 0

0 < х £1

1 < x £2

2< x £3

3 < x £ 4

х > 4

F(x)

0

0,4096

0,8192

0,9728

0,9984

1

 

График функции распределения вероятностей дискретной случайной величины имеет ступенчатый вид. Скачки равны вероятностям, с которыми случайная величина принимает возможные значе­ния (рис. 4.4).


4) Определим вероятность того, что среди 4 слу­чайно отобранных человек:

а) Не будет ни одного человека, предпочитающе­го добираться на работу личным автотранспортом.

Р(Х = 0) = 0,4096.

Вероятность того, что среди четырех случайно отобранных человек не будет ни одного, предпочи­тающего добираться на работу личным автотранс­портом, составляет 0,4096.

б) Будет хотя бы 1 человек, предпочитающий до­бираться на работу личным автотранспортом.

«Хотя бы 1» — «как минимум 1» — «1 или боль­ше». Другими словами, «хотя бы 1» — это «или 1, или 2, или 3, или 4».

Исходя из этого, для определения вероятности того, что среди 4 случайно отобранных человек бу­дет хотя бы 1, предпочитающий добираться на ра­боту личным автотранспортом, можно использовать теорему сложения вероятностей несовместных со­бытий:

Р(Х  ³ 1) = Р(Х = 1) + Р(Х = 2) + Р(Х = 3) + Р(Х = 4);

Р(Х  ³ 1) = 0,4096 + 0,1536 + 0,0256 + 0,0016 = 0,5904.

С другой стороны, все возможные значения слу­чайной величины образуют полную группу собы­тий, а сумма их вероятностей равна 1. По отноше­нию к событию (X ³ 1) до полной группы событий не хватает события (X = 0), которое является про­тивоположным событию (X £ 1). Поэтому искомую вероятность того, среди 4 случайно отобранных че­ловек будет хотя бы 1 человек, предпочитающий добираться на работу личным автотранспортом, про­ще найти следующим образом:

Р(Х  ³ 1) + Р(Х < 1) = 1, откуда Р(Х  ³ 1)=1 - Р(Х = 0) = 1 - 0,4096 = 0,5904.

Вероятность того, что среди 4 случайно отобран­ных человек будет хотя бы 1 человек, предпочитающий добираться на работу личным автотранспор­том, составляет 0,5904.

в) Будет не больше 2, предпочитающих добирать­ся на работу личным автотранспортом.

«Не больше 2» — «2 или меньше», т. е. «или 0, или 1, или 2».

Используем теорему сложения вероятностей не­совместных событий

Р(Х £ 2) = Р(Х = 0) + Р(Х = 1) + Р(Х = 2);

Р(Х £ 2) = 0,4096 + 0,4096 + 0,1536 = 0,9728.

Вероятность того, что среди 4 случайно отобран­ных человек будет не больше 2, предпочитающих добираться на работу личным автотранспортом, со­ставляет 0,9728.

Пример 2. Среднее число инкассаторов, прибы­вающих утром на автомобиле в банк в 15-минут­ный интервал, равно 2. Прибытие инкассаторов происходит случайно и независимо друг от друга.

1) Составьте ряд распределения числа инкасса­торов, прибывающих утром на автомобиле в банк в течение 15 мин.

2) Найдите числовые характеристики этого рас­пределения.

3) Напишите функцию распределения числа ин­кассаторов, прибывающих утром на автомобиле в банк в течение 15 мин, и постройте ее график.

4) Определите, чему равна вероятность того, что в течение 15 мин в банк прибудут на автомобиле хотя бы 2 инкассатора.

5) Определите вероятность того, что в течение 15 мин число прибывших инкассаторов окажется меньше 3.

Решение. Пусть случайная величина Х — число инкассаторов, прибывающих утром на автомобиле в банк в течение 15 мин. Перечислим все возмож­ные значения случайной величины X: 0, 1, 2, 3, 4, 5, ..., п.

Это — дискретная случайная величина, так как ее возможные значения отличаются друг от друга не менее чем на 1, и множество ее возможных зна­чений является счетным.

По условию, прибытие инкассаторов происходит случайно и независимо друг от друга. Следовательно, мы имеем дело с независимыми испытаниями.

Если мы предположим, что вероятность прибы­тия инкассаторов на автомобиле одинакова в лю­бые 2 периода времени равной длины и что прибы­тие или неприбытие автомобиля в любой период времени не зависит от прибытия или неприбытия в любой другой период времени, то последовательность прибытия инкассаторов в банк может быть описана распределением Пуассона.

Итак, случайная величина Х — число инкасса­торов, прибывающих утром на автомобиле в тече­ние 15 мин, подчиняется распределению Пуассона. По условию задачи: l = пр = 2; Х = т.

1) Составим ряд распределения.

Вычислим вероятности того, что случайная ве­личина примет каждое из своих возможных значе­ний, и запишем полученные результаты в таблицу.

Так как данная случайная величина Х подчинена распределению Пуассона, расчет искомых вероятно­стей осуществляется по формуле Пуассона (4.13).

Найдем по этой формуле вероятность того, что в течение 15 мин утром на автомобиле прибудет 0 ин­кассаторов;


Однако расчет вероятностей распределения Пу­ассона легче осуществлять, пользуясь специальными таблицами вероятностей распределения Пуассо­на. В этих таблицах содержатся значения вероят­ностей при заданных m и  l (приложение 6). По условию l = 2, а т изменяется от 0 до n. Воспользовавшись таблицей распределения Пу­ассона (приложение 3), получим:

Р(Х = 0) = 0,1353; Р(Х = 1) = 0,2707;

Р(Х = 2) = 0,2707; Р(Х = 3) = 0,1804;

Р(Х = 4) = 0,0902; Р(Х = 5) == 0,0361;

Р(Х = 6) = 0,0120; Р(Х = 7) = 0,0034;

Р(Х = 8) = 0,0009; Р(Х = 9) = 0,0002.

Данных для l=2 и m ³ 10в таблице нет, что указывает на то, что эти вероятности составляют менее 0,0001, т. е.

Р(Х = 10) » 0.

Понятно, что Р(Х =11) еще меньше отличается от 0.

Занесем полученные результаты в табл. 4.8.

Таблица 4.8

Р

 

Р(Х)

 

0

 

0,1353

 

1

 

0,2707

 

2

 

0,2707

 

3

 

0,1804

 

4

 

0,0902

 

5

 

0,0361

 

6

 

0,0120

 

7

 

0,0034

 

8

 

0,0009

 

9

 

0,0002

 

10

 

0,0000

 

 

Так как все возможные значения случайной ве­личины образуют полную группу событий, сумма их вероятностей должна быть равна 1.

Проверим:

-0,1353 + 0,2707 + 0,2707 + 0,1804 + 0,0902 + 0,0361 + + 0,0120 + 0,0034 + 0.0009 + 0,0002 = 0,9999 »1.

График полученного ряда распределения дискретной случайной величины Х - полигон распределения вероятностей (рис. 4.5).


Рис. 4.5

2) Найдем основные числовые характеристики полученного распределения случайной величины X.

Можно рассчитать математическое ожидание, дисперсию и среднее квадратическое отклонение по общим для любой дискретной случайной величины формулам.

Математическое ожидание случайной величины, подчиняющейся распределению Пуассона, может быть рассчитано и по формуле

М(Х = т) = пр = l, М(Х = т) = l = 2 (инкассатора).

Для выполнения дисперсии случайной величи­ны, подчиняющейся распределению Пуассона, мож­но применить формулу

D(X = т) = l.

Итак, дисперсия числа инкассаторов, прибыва­ющих утром на автомобиле в течение 15 мин,

D(X = т) = l = 2 (инкассатора2).

Среднее квадратическое отклонение числа инкас­саторов, прибывающих утром на автомобиле в течение 15 мин,


3) Зададим теперь дискретную случайную вели­чину в виде функции распределения


График функции вероятностей дискретной слу­чайной величины — полигон распределения вероятностей (рис. 4.6).

Рассчитаем значения F(x):




Эти данные можно представить и в виде табл. 4.9.

Таблица 4.9

Х

 

Р(Х)

 

х £ 0

 

0

 

0<х£1

 

0,1353

 

1<х£2

 

0,4060

 

2<х£3

 

0,6767

 

3<х£4

 

0,8571

 

4.<х£5

 

0,9473

 

5<x£6

 

0,9834

 

6<х£7

 

0,9954

 

7 <x£8

 

0,9988

 

8<х£9

 

0,9997

 

х>9

 

1

 

 

4) Определим вероятность того, что в течение 15 мин в банк прибудут хотя бы 2 инкассатора.

«Хотя бы 2» — «как минимум 2» — «2 или боль­ше». Другими словами, «хотя бы 2» — это «или 2, или 3, или 4, или ...».

Исходя из этого, для определения вероятности того, что в течение 15 мин в банк прибудут хотя бы 2 инкассатора, можно использовать теорему сложе­ния вероятностей несовместных событий:

Р(Х ³ 2) = Р(Х=2) + Р(Х=3) + Р(Х=4) + ... + Р(Х=n).

С другой стороны, все возможные значения слу­чайной величины образуют полную группу собы­тий, а сумма их вероятностей равна 1. По отноше­нию к событию (X ³ 2) до полной группы событий не хватает события (X < 2), т. е. (х £ 1), которое является противоположным событию (X ³ 2). Поэто­му искомую вероятность того, что в течение 15 мин в банк прибудут на автомобиле хотя бы 2 инкасса­тора, проще найти следующим образом:

Р(Х ³ 2) = 1 - Р(Х £ 1) = 1 - (Р(Х = 0) + Р(Х = 1)) = = 1 - (0,1353 + 0,2707) = 1 - 0,406 = 0,594.

Вероятность того, что в течение 15 мин в банк прибудут на автомобиле хотя бы 2 инкассатора, составляет 0,594.

5) Определим вероятность того, что в течение 15 мин число прибывших инкассаторов окажется меньше 3.

«Меньше 3» — это «или 0, или 1, или 2». Из теоремы сложения вероятностей несовмест­ных событий следует:

Р(Х < 3) = Р(Х = 0) + Р(Х = 1) + Р(Х = 2);


Р(Х < 3) = 0,1353 + 0,2707 + 0,2707 – 0,6767.

Вероятность того, что в течение 15 мин в банк прибудут меньше 3 инкассаторов, составляет 0,6767.

Пример 3. Из 20 лотерейных билетов выигрыш­ными являются 4. Наудачу извлекаются 4 билета.

1) Составьте ряд распределения числа выигрыш­ных билетов среди отобранных.

2) Найдите числовые характеристики этого рас­пределения.

3) Напишите функцию распределения числа вы­игрышных билетов среди отобранных и постройте

ее график.

4) Определите вероятность того, что среди ото­бранных 4 билетов окажется: а) не меньше 3 выигрышных билетов; б) не больше 1-го выигрышного билета.

Решение. В качестве случайной величины в дан­ной задаче выступает число выигрышных билетов среди отобранных. Обозначим ее через X.

Перечислим все возможные значения случайной величины X: 0, 1, 2, 3, 4.

Это — дискретная случайная величина, так как ее возможные значения отличаются друг от друга не менее, чем на 1, и множество ее возможных зна­чений является счетным.

 Очевидно, что отбор лотерейных билетов — бес­повторный. Следовательно, испытания — зависимые.

Вышеперечисленные признаки указывают на то, что рассматриваемая случайная величина — чис­ло выигрышных билетов среди отобранных — под­чиняется гипергеометрическому закону распреде­ления.

Изобразим ситуацию на схеме (рис. 4.7).


Случайная величина, интересующая нас, Х = т — число выигрышных билетов в выборке объемом в п билетов. Число всех возможных случаев отбора п билетов из общего числа N билетов равно числу сочетаний из N по п (СnN ), а число случаев отбора т выигрышных билетов из общего числа М выигрышных билетов (и значит, (n-m) проигрышных из общего числа (N — М) проигрышных) равно произведению СmM · Сn-mN-M (отбор каждого из т вы­игрышных билетов может сочетаться с отбором любого из (n-m) проигрышных). Событие, вероятность которого мы хотим определить, состоит в том, что в выборке из n лотерейных билетов окажется ров­но m выигрышных. По формуле для расчета вероятности события в классической модели веро­ятность получения в выборке m выигрышных би­летов (т. е. вероятность того, что случайная вели­чина Х примет значение m) равна


где СnN общее число всех единственно возмож­ных, равновозможных и несовместных исходов;

СnM · Сn-mN-M число исходов, благоприятствующих наступлению интересующего нас события;

m £ n, если n £ M и m £ M, если М < п.

Если по этой формуле вычислить вероятности для всех возможных значений m и поместить их в таблицу, то получим ряд распределения.

1) Составим ряд распределения.

Вычислим вероятности того, что случайная величина примет каждое из своих возможных значений, и запишем полученные результаты в таблицу.

По условию задачи N = 20; М = 4; n = 4; m = 0, 1, 2, 3, 4.


Занесем полученные результаты в табл. 4.10.

Таблица 4.10

Х

 

0

 

1

 

2

 

3

 

4

 

Р(Х)

 

0,37564

 

0,46233

 

0,14861

 

0,01321

 

0,00021

 

 

Произведем проверку. Так как все возможные значения случайной величины образуют полную группу событий, сумма их вероятностей должна быть равна 1.

Проверка:

0,37564 + 0,46233 + 0,14861 + 0,01321 + 0,00021 = 1.

График полученного распределения вероятностей дискретной случайной величины — полигон распределения вероятностей (рис. 4.8).


Рис. 4.8

2) Найдем основные числовые характеристики распределения данной случайной величины.

Можно рассчитать математическое ожидание, дисперсию и среднее квадратическое отклонение по


общим для любой дискретной случайной величины формулам.

Но математическое ожидание случайной величи­ны, подчиняющейся гипергеометрическому распределению, может быть рассчитано по более простой формуле


Рассчитаем математическое ожидание числа вы­игрышных билетов среди отобранных:


Дисперсию случайной величины, подчиняющей­ся распределению, также можно рассчитать по бо­лее простой формуле


Вычислим дисперсию числа выигрышных биле­тов среди отобранных:


Рассчитаем среднее квадратическое отклонение числа выигрышных билетов среди отобранных:


3) Зададим дискретную случайную величину в виде функции распределения


Рассчитаем значения F(x):


Эти данные можно представить в виде графика функции распределения (рис. 4.9) и табл. 4.11.


 

Таблица 4.11

Х

 

х £ 0

 

0 <х £ 1

 

1 £ 2

 

2 £ 3

 

3 £4

 

х > 4

 

F(x)

 

0

 

0,37564

 

0,83797

 

0,98658

 

0,99979

 

1

 

4) Определим вероятность того, что среди 4 ото­бранных билетов окажется:

а) не меньше 3 выигрышных.

«Не меньше 3» — «как минимум 3» — «3 или больше». Другими словами, «не меньше 3» — это «или 3, или 4».

Исходя из этого, для определения вероятности то­го, что среди отобранных 4 билетов окажется не мень­ше 3 выигрышных билетов, можно применить тео­рему сложения вероятностей несовместных событий:

Р(Х ³ 3) = Р(Х = 3) + Р(Х = 4) == 0,01321 + 0,00021 = 0,01342.

Вероятность того, что среди отобранных окажет­ся не меньше 3 выигрышных билетов, составляет 0,01342.     .

б) не больше 1 выигрышного билета. «Не боль­ше 1» — это «1 или меньше», «или 0, или 1».

Следовательно, для определения вероятности того, что среди отобранных окажется не больше одного выигрышного билета, также применяем теорему сло­жения вероятностей для несовместных событий

Р(Х  £ 1) = Р(Х = 0) + Р(Х = 1) = 0,37564 + 0,46233 = 0,83797.

 

Задачи к теме 4

1. В городе 10 коммерческих банков. У каждого риск банкротства в течение года составляет 10%. Составьте ряд распределения числа банков, кото­рые могут обанкротиться в течение следующего года; постройте его график. Найдите числовые ха­рактеристики этого распределения. Запишите в общем виде функцию распределения вероятностей и постройте ее график. Чему равна вероятность того, что в течение года обанкротятся не больше одного банка?

2. В лотерее на 100 билетов разыгрываются две вещи, стоимости которых 210 и 60 у. е. Составьте ряд распределения суммы выигрыша для лица, имеющего: а) один билет; б) два билета. Стоимость билета — 3 у. е. Найдите числовые характеристи­ки этих распределений. Запишите в общем виде функции распределений вероятностей и постройте их графики.

3. Нефтеразведывательная компания получила финансирование для проведения 6 нефтеразработок. Вероятность успешной нефтеразведки 0,05. Пред­положим, что нефтеразведку осуществляют независимые друг от друга разведывательные партии. Со­ставьте ряд распределения числа успешных нефтеразведок. Найдите числовые характеристики этого распределения. Запишите в общем виде функцию распределения вероятностей и постройте ее график. Чему равна вероятность того, что как минимум 2 нефтеразведки принесут успех?

 4. Под руководством бригадира производствен­ного участка работают 3 мужчин и 4 женщины. Бригадиру необходимо выбрать двух рабочих для специальной работы. Не желая оказывать кому-либо предпочтения, он решил выбрать двух рабочих слу­чайно. Составьте ряд распределения числа женщин в выборке. Найдите числовые характеристики это­го распределения. Запишите в общем виде функ­цию распределения вероятностей и постройте ее график. Какова вероятность того, что будет выбра­но не более одной женщины?

5. Некоторый ресторан славится хорошей кух­ней. Управляющий ресторана хвастает, что в суб­ботний вечер в течение получаса подходит до 9 групп посетителей. Составьте ряд распределения возмож­ного числа групп посетителей ресторана в течение получаса; постройте его график. Найдите число­вые характеристики этого распределения. Запиши­те в общем виде функцию распределения вероят­ностей и постройте ее график. Чему равна вероят­ность того, что 3 или более групп посетителей при­будут в ресторан в течение 10-минутного проме­жутка времени?

6. Хорошим считается руководитель, принима­ющий не менее 70% правильных решений. Тако­му управляющему банком предстоит принять ре­шения по 4 важным вопросам банковской полити­ки. Считая вероятность принятия правильного ре­шения постоянной, составьте ряд распределения возможного числа правильных решений управля­ющего; постройте его график. Найдите числовые характеристики этого распределения. Запишите в общем виде функцию распределения вероятностей и постройте ее график. Чему равна вероятность того, что управляющий примет менее 3 правиль­ных решений?

7. В банк поступило 30 авизо. Подозревают, что среди них 5 фальшивых. Тщательной проверке подвергается 15 случайно выбранных авизо. Составьте ряд распределения числа фальшивых авизо, кото­рые могут быть выявлены в ходе проверки; пост­ройте его график. Найдите числовые характеристики этого распределения. Запишите в общем виде функцию распределения вероятностей и постройте ее график. Чему равна вероятность того, что в ходе проверки обнаружится менее 2 фальшивок?

8. В течение семестра преподаватели проводят консультации по вопросам, которые остались неясными для студентов. Преподаватель, проводящий консультации по статистике, заметил, что в сред­нем 8 студентов посещают его за час консультаци­онного времени, хотя точное число студентов, посе­щающих консультацию в определенный день, в на­значенный час, — случайная величина. Составьте ряд распределения числа студентов, посещающих консультации преподавателя по статистике в тече­ние часа. Найдите числовые характеристики этого распределения. Запишите в общем виде функцию распределения вероятностей и постройте ее график. Чему равна вероятность того, что 3 студента придут на консультацию в течение определенного по­лучаса?

9. В ходе аудиторской проверки строительной компании аудитор случайным образом отбирает 5

счетов. При условии, что 3% счетов содержат ошиб­ки, составьте ряд распределения правильных сче­тов. Найдите числовые характеристики этого рас­пределения. Запишите в общем виде функцию распределения вероятностей и постройте ее график. Чему равна вероятность того, что хотя бы 1 счет будет с ошибкой?

10. Записи страховой компании показали, что 30% держателей страховых полисов старше 50 лет потребовали возмещения страховых сумм. Для про­верки в случайном порядке было отобрано 15 человек старше 50 лет, имеющих полисы. Составьте ряд распределения числа предъявленных претензий. Найдите числовые характеристики этого распреде­ления. Запишите в общем виде функцию распределе­ния вероятностей и постройте ее график. Чему рав­на вероятность того, что, по крайней мере, 10 чело­век потребуют возмещения страховых сумм?

11. Экзаменационный тест содержит 15 вопро­сов, каждый из которых имеет 5 возможных отве­тов и только 1 из них верный. Предположим, что студент, который сдает экзамен, знает ответы не на все вопросы. Составьте ряд распределения числа пра­вильных ответов студента на вопросы теста и постройте его график. Найдите числовые характерис­тики этого распределения. Запишите функцию рас­пределения вероятностей и постройте ее график. Чему равна вероятность того, что студент правильно ответит, по крайней мере, на 10 вопросов?

12. Для того чтобы проверить точность своих финансовых счетов, компания регулярно пользуется услугами аудиторов для проверки бухгалтерских проводок счетов. Предположим, что служащие компании при обработке входящих счетов допускают примерно 5% ошибок. Предположим, аудитор слу­чайно отбирает 3 входящих документа. Составьте ряд распределения числа ошибок, выявленных ауди­тором. Найдите числовые характеристики этого распределения. Запишите функцию распределения вероятностей и постройте ее график. Определите ве­роятность того, что аудитор обнаружит более чем 1 ошибку.

13. В городе 10 машиностроительных предприя­тий, из которых 6 — рентабельных и 4 — убыточ­ных. Программой приватизации намечено прива­тизировать 5 предприятий. При условии проведе­ния приватизации в случайном порядке составьте ряд распределения рентабельных предприятий, по­павших в число приватизируемых; постройте его график. Найдите числовые характеристики этого распределения. Запишите функцию распределения вероятностей и постройте ее график. Чему равна вероятность того, что будет приватизировано не менее 4 рентабельных предприятий?

14. В международном аэропорту время прибы­тия самолетов различных рейсов высвечивается на электронном табло. Появление информации о раз­личных рейсах происходит случайно и независи­мо друг от друга. В среднем в аэропорт прибывает 10 рейсов в час. Составьте ряд распределения чис­ла сообщений о прибытии самолетов в течение часа. Найдите числовые характеристики этого распределения. Запишите функцию распределения вероятностей и постройте ее график. Чему равна веро­ятность того, что в течение часа прибудут не менее 3 самолетов? Чему равна вероятность того, что в течение четверти часа не прибудет ни один само­лет?

15. Телевизионный канал рекламирует новый вид детского питания. Вероятность того, что телезритель увидит эту рекламу, оценивается в 0,2. В случайном порядке выбраны 10 телезрителей. Составьте ряд распределения числа лиц, видевших рекламу. Найдите числовые характеристики этого распределения. Запишите функцию распределения вероятностей и постройте ее график. Чему равна вероятность того, что, по крайней мере, 2 телезри­теля этого канала видели рекламу нового детского питания?

16. В часы пик для общественного транспорта города происходит в среднем 2 дорожных происшествия в час. Утренний пик длится 1,5 ч, а ве­черний — 2ч. Составьте ряды распределения чис­ла дорожных происшествий в утренние и вечер­ние часы пик и постройте их графики. Найдите числовые характеристики этих распределений. Запишите функции распределений вероятностей и постройте их графики. Чему равна вероятность того, что в определенный день во время и утренне­го, и вечернего пика не произойдет ни одного до­рожного происшествия?

17. В магазине имеется 15 автомобилей опреде­ленной марки. Среди них — 7 черного цвета, 6 — серого и 2 — белого. Представители фирмы обратились в магазин с предложением о продаже им 3 автомобилей этой марки, безразлично какого цве­та. Составьте ряд распределения числа проданных автомобилей черного цвета при условии, что автомобили отбирались случайно, и постройте его гра­фик. Найдите числовые характеристики этого рас­пределения. Напишите функцию распределения вероятностей и постройте ее график. Какова вероят­ность того, что среди проданных фирме автомоби­лей окажется, по крайней мере, 2 автомобиля чер­ного цвета?

18. На предприятии 1000 единиц оборудования определенного вида. Вероятность отказа единицы оборудования в течение часа составляет 0,001. Со­ставьте ряд распределения числа отказов оборудо­вания в течение часа. Найдите числовые характе­ристики этого распределения. Запишите в общем виде функцию распределения вероятностей и пост­ройте ее график. Чему равна вероятность того, что в течение часа откажут как минимум 2 единицы обо­рудования?

19. Торговый агент в среднем контактирует с 8 по­тенциальными покупателями в день. Из опыта ему известно, что вероятность того, что потенциальный покупатель совершит покупку, равна 0,1. Составь­те ряд распределения ежедневного числа продаж для агента и постройте его график. Найдите числовые характеристики этого распределения. Запиши­те в общем виде функцию распределения вероятно­стей и постройте ее график. Чему равна вероятность того, что у агента будут хотя бы 2 продажи в тече­ние дня?

 

20. Прибытие посетителей в банк подчиняется одному из теоретических законов распределения. Предполагая, что в среднем в банк каждые 3 мину­ты входит 1 посетитель, составьте ряд распределе­ния возможного числа посетителей банка в течение 15 мин. Найдите числовые характеристики этого распределения. Запишите в общем виде функцию распределения вероятностей и постройте ее график. Определите вероятность того, что, по крайней мере, 3 посетителя войдут в банк в течение 1 минуты?

 

5. НЕПРЕРЫВНЫЕ СЛУЧАЙНЫЕ ВЕЛИЧИНЫ

5.1. Функция распределения и плотность распределения непрерывной случайной величины

Нам уже известно, что такое функция распреде­ления дискретной случайной величины. Эта форма задания закона распределения случайной величи­ны является универсальной и используется для непрерывных случайных величин.

Случайная величина Х называется непрерыв­ной, если ее функция распределения непрерывна и имеет производную.

Рассмотрим свойства функ­ции распределения.

1. Вероятность попадания случайной величины в промежуток от a до b равна приращению функ­ции распределения на концах этого промежутка

P(a<X<b)=F(b)-F(a),        (5.1)

так как вероятность любого отдельного значения случайной величины равна нулю, если функция распределения непрерывна при этом значении

Р(Х = х1) = 0, когда F(x) непрерывна в точке х = х1.

 

2. Функция распределения удовлетворяет условиям

F(-¥)= 0, F(+¥) = 1.          (5.2)

Плотностью распределения (дифференциальной функцией) непрерывной случайной величины на­зывается функция

f(x) = F'(x).                 (5.3)

Плотность распределения любой случайной ве­личины неотрицательна f(x) ≥ 0.

Несобственный интеграл от дифференциальной функции в пределах от -¥ до +¥ равен 1:


График функции у = f(x) называется кривой распределения или графиком плотности распределения. Кривая у = f(x) располагается над осью абсцисс.

Вероятность попадания случайной величины в промежуток от a доb может быть вычислена по формуле

 


Подынтегральное выражение f(x)dx называет­ся элементом вероятности. Оно выражает вероятность попадания случайной точки в промежуток между точками х и х + Dх, где Dх — бесконечно

малая величина.

Функция распределения F(x), выражаемая через плотность f(x), имеет вид


Математическое ожидание непрерывной случай­ной величины Х вычисляется по формуле


5.2. Нормальное распределение

Если плотность распределения (дифференциаль­ная функция) случайной переменной определяется

как


то говорят, что Х имеет нормальное распределение с параметрами а и s2. Вероятностный смысл параметров

а = М(Х), а s2 = D(X),

где    Х ~ N(а; s2).

Если задать параметры нормального распределе­ния, взяв а=0 и s=1,то получим так называемое нормированное (стандартное) нормальное распреде­ление. Плотность нормированного нормального распределения описывается функцией


Значения этой функции табулированы (приложение 1).

Для расчета вероятности попадания нормально распределенной случайной величины Х в промежу­ток от a до b используется формула


где   - интеграл Лапласа.

Формула (5.10) иногда в литературе называется интегральной теоремой Лапласа.

Функция Ф0(х) обладает свойствами:

 


Функция Ф0(х) табулирована. В частности для симметричного относительно а промежутка (а - Δ;

а + D) имеем


Формула (5.11) применима и к частоте т, по­скольку ее закон распределения при достаточно большом числе испытаний практически совпадает с нормальным. Применительно к случайной вели­чине т с учетом ее числовых характеристик

М(т) = пр и s2(m) = npq      (5.12)

формула (5.11) примет вид


Формула (5.11) может быть применена и к отно­сительной частоте т/п с числовыми характеристиками


С вероятностью, очень близкой к единице (рав­ной 2Ф0(3) = 0,9973), нормально распределенная случайная величина Х удовлетворяет неравенству

а- Зs<Х< а + Зs.        (5.16)

В этом состоит правило 3 сигм: если случайная величина распределена по нормальному закону, то ее отклонение от математического ожидания прак­тически не превышает ±3s.

Локальная теорема Муавра — Лапласа. При р¹0 и p¹1 и достаточно большом п биномиальное распределение близко к нормальному закону (при­чем их математические ожидания и дисперсии совпадают), т. е. имеет место равенство:


тогда


для достаточно больших п.

Здесь j(х) (приложение 1) — плотность веро­ятностей стандартной нормальной случайной вели­чины


Пример 1. На рынок поступила крупная партия говядины. Предполагается, что вес туш — случай­ная величина, подчиняющаяся нормальному за­кону распределения с математическим ожидани­ем а = 950 кг и средним квадратическим отклоне­нием σ = 150 кг.

1) Определите вероятность того, что вес случай­но отобранной туши: а) окажется больше 1 250 кг;

б) окажется меньше 850 кг; в) будет находиться между 800 и 1 300 кг; г) отклонится от математи­ческого ожидания меньше, чем на 50 кг; д) откло­нится от математического ожидания больше, чем на 50 кг.

2) Найдите границы, в которых отклонение веса случайно отобранной туши от своего математического ожидания не превысит утроенного среднего квадратического отклонения (проиллюстрируйте правило 3 сигм).

3) С вероятностью 0,899 определите границы, в которых будет находиться вес случайно отобранной туши. Какова при этом условии максимальная ве­личина отклонения веса случайно отобранной туши от своего математического ожидания?

Решение. 1а) Вероятность того, что вес случайно отобранной туши окажется больше 1 250 кг, можно понимать как вероятность того, что вес случайно отобранной туши окажется в интервале от 1 250 кг до +¥..

Формула расчета вероятности попадания в задан­ный интервал нормально распределенной случай­ной величины Х имеет вид


где Ф0(z) — функция Лапласа


Функция Ф0(z) является нечетной функцией, т. е.

Ф0(-z) = 0(z).

Найдем вероятность того, что вес случайно ото­бранной туши окажется больше 1 250 кг. По усло­вию a = 1 250, b = +¥, а = 950, s = 150.

Используем формулу расчета вероятности попа­дания в заданный интервал нормально распределенной случайной величины Х


Найдем по таблице функции Лапласа (приложение 2) значения Ф0(z)

Значения Ф0(+¥) в таблице нет. Однако извест­но, что Ф0(z)→ 0,5 при z +¥. Уже при z=5           Ф0 (z =5) = 0,49999997 » 0,5. Очевидно, что Ф0(+¥)— величина, бесконечно близкая к 0,5 , Ф0(-¥.) — величина, бесконечно близкая к -0,5.

По таблице функции Лапласа Ф0(2) = 0,47725.

Отсюда

Р(Х > 1 250) = 0,5 - 0,47725 = 0,02275.

Итак, вероятность того, что вес случайно отобран­ной туши окажется больше 1 250 кг, составляет

0,02275.

Проиллюстрируем решение задачи графически (рис. 5.1).


Итак, нам задана нормально распределенная слу­чайная величина Х с математическим ожиданием а = 950 кг и средним квадратическим отклонением s= 150 кг, т. е. Х ~ N (950; 1502). Мы хотим найти вероятность того, что Х больше 1 250, т. е. определить Р(Х > 1 250). Преобразуем X в Z, и тогда иско­мая вероятность определится по таблице стандарт­ного нормального распределения (приложение 2)


Точка z=0 соответствует математическому ожи­данию, т. е. а = 950 кг.

1б) Вероятность того, что вес случайно отобранной туши окажется меньше 850 кг — это то же самое, что и вероятность того, что вес случайно отобранной туши окажется в интервале от -¥ до 850 кг. По условию α = -¥, b = 850, а = 950, s= 150.

Для расчета искомой вероятности используем формулу расчета вероятности попадания в задан­ный интервал нормально распределенной случай­ной величины Х


Согласно свойству функции Лапласа,


Найдем по таблице функции Лапласа (приложе­ние 2) значения Ф0(z).

 

Ф0(+¥) » 0,5; Ф0(0,67) = 0,24857.

 

Отсюда

Р(Х < 850) = 0,5 - 0,24857 = 0,25143.

Вероятность того, что вес случайно отобранной туши окажется меньше 850 кг составляет 0,25143.

Проиллюстрируем решение задачи графически (рис. 5.2).


По условию данной задачи точка на оси абсцисс (z = -0,67) соответствует х = 850, т.е. весу, равно­му 850 кг. Заштрихованная на рис. 5.2 площадь представляет вероятность того, что вес наудачу выб­ранной туши окажется меньше 850 кг, т. е. в ин­тервале от -¥ до 850 кг.

1в) Найдем вероятность того, что вес случайно отобранной туши окажется в интервале от 800 до 1 300 кг.

По условию a = 800, b=1 300, а = 950, s = 150. Для расчета искомой вероятности используем формулу расчета вероятности попадания в задан­ный интервал нормально распределенной случай­ной величины Х


Согласно свойству функции Лапласа,

0(-1) = Ф0(1).

Найдем по таблице функции Лапласа (приложение 2) значения Ф0(z)

Ф0(2,33) = 0,49010; Ф0(1) = 0,34134.

Отсюда

Р(800 < Х < 1 300) = 0,49010 + 0,34134 = 0,83144.

Вероятность того, что вес случайно отобранной туши окажется в интервале от 800 до 1300 кг, составляет 0,83144.

Проиллюстрируем решение задачи графически (рис. 5.3).

По условию данной задачи точка на оси абсцисс (z = -1) соответствует х = 800, т. е. весу, равному 800 кг, а точка (z = 2,33) — х = 1300, т. е. весу, равному 1 300 кг. Заштрихованная на рис. 5.3 пло­щадь представляет собой вероятность того, что вес наудачу выбранной туши окажется в интервале от 800 до 1 300 кг.


На рис. 5.3 видно, что искомую вероятность того, что вес наудачу выбранной туши окажется в интер­вале от 800 до 1 300 кг, можно было найти другим способом. Для этого необходимо было найти вероят­ность того, что вес наудачу выбранной туши окажет­ся меньше 800 кг, а также больше 1 300 кг. Полу­ченные вероятности сложить и вычесть из 1.

Итак, вероятность того, что вес наудачу выбран­ной туши окажется меньше 800 кг, — это вероятность того, что вес случайно отобранной туши ока­жется в интервале от —¥ до 850 кг.


Вероятность того, что вес случайно отобранной туши окажется больше 1 300 кг — это вероятность того, что вес случайно отобранной туши окажется в интервале от 1 300 кг до +¥.


Отсюда искомая вероятность того, что вес науда­чу выбранной туши окажется в интервале от 800 до 1300 кг:

Р(800 < Х < 1 300) = 1 - (Р(Х < 800) + Р(Х > 1 300)) =  1 - (0,15866 + 0,0099) = 1 - 0,16856 = 0,83144.

1г) Найдем вероятность того, что вес случайно отобранной туши отклонится от математического ожидания меньше, чем на 50 кг, т. е.

Р(|Х - 950| < 50) = ?

Что значит |Х - 950| < 50 ?

Это неравенство можно заменить двойным нера­венством

-50 < Х - 950 < 50,

или

950 - 50 < X < 950 + 50, 900 < X < 1 000.

Следовательно,

Р(|Х - 950| < 50) = Р(900 < X < 1 000).

А это вероятность попадания в заданный интервал нормально распределенной случайной величины X. Отсюда


Согласно свойству функции Лапласа,

0(-0,33) = Ф0(0,33).

Найдем по таблице функции Лапласа (приложение 2) значения Ф0(z)

Ф0(0,33) = 0,1293.

Следовательно,

Р(|Х - 950| < 50) = Р(900 < Х < 1 000) =  2·0,1293 = 0,2586.

Вероятность того, что вес случайно отобранной туши отклонится от математического ожидания меньше, чем на 50 кг, составляет 0,2586.

Эту задачу легче решить, используя формулу расчета вероятности заданного отклонения нормаль­но распределенной случайной величины Х от свое­го математического ожидания


где Δ — величина отклонения случайной величины Х от математического ожидания.

По условию D = 50; а = 950, s= 150. Используя эту формулу, сразу получим

Р(|Х — 950| < 50) = 2Ф0(50/150) = 2Ф0(0,33) = 2 · 0,1293 = 0,2586.

Проиллюстрируем решение задачи графически (рис. 5.4).


По условию данной задачи точка на оси абсцисс (z = -0,33) соответствует х = 900, т. е. весу, равно­му 900 кг, а точка (z = 0,33) соответствует х = 1000, т. е. весу, равному 1 000 кг. Заштрихованная на рис. 5.4 площадь представляет собой вероятность того, что вес наудачу выбранной туши окажется в интервале от 900 до 1 000 кг, т. е. отклонится от математического ожидания меньше, чем на 50 кг.

1д) Найдем вероятность того, что вес случайно отобранной туши отклонится от математического ожидания больше, чем на 50 кг, т. е.

Р(|Х - 950| > 50) = ?

Это вероятность события, противоположного по отношению к событию, — вес случайно отобранной туши отклонится от математического ожидания меньше, чем на 50 кг,


Следовательно,


Вероятность того, что вес случайно отобранной туши отклонится от математического ожидания больше, чем на 50 кг, составляет 0,7414.

Можно использовать другой алгоритм решения.  Вероятность того, что вес случайно отобранной туши отклонится от математического ожидания больше, чем на 50 кг, — это вероятность того, что вес случайно отобранной туши будет или меньше (950 - 50 = 900) кг, или больше (950 + 50 = 1 000) кг.

По теореме сложения вероятностей несовместных событий имеем

 


Отсюда


2) Найдем границы, в которых отклонение веса случайно отобранной туши от своего математического ожидания не превысит утроенного среднего квадратического отклонения.

В этом задании студентам предлагается проил­люстрировать правило 3 сигм, которое можно сформулировать следующим образом:

Если случайная величина распределена по нор­мальному закону, то ее отклонение от математического ожидания практически не превышает ±3s.

Р(|Х - а| < 3s) = 2Ф0(3) = 0,9973.

Вероятность того, что отклонение нормально рас­пределенной случайной величины Х от своего математического ожидания будет меньше 3s или, дру­гими словами, вероятность того, что нормально рас­пределенная случайная величина Х попадет в ин­тервал (а - 3s; а + 3s), равна 0,9973.

Следовательно, вероятность того, что отклонение случайной величины от своего математического ожи­дания по абсолютной величине превысит утроенное среднее квадратическое отклонение, очень мала и равна 0,0027. Другими словами, лишь в 27 случа­ях из 10 000 случайная величина Х в результате испытания может оказаться вне интервала (а - 3s;а + 3s). Такие события считаются практически невозможными.

Формулу, описывающую правило 3 сигм, неслож­но получить из формулы вероятности заданного отклонения нормально распределенной случайной ве­личины Х от своего математического ожидания:


Если взять D = 3s, то получим D/s = 3.

Отсюда

Р(|Х - а|< 3s) = 2Ф0(3) = 0,9973.

По условию задачи а = 950; s = 150.

Правило 3 сигм можно представить так:

Р(а - 3s < Х < а + 3s) = 2Ф0(3) = 0,9973.

Интересующие нас границы — это границы интервала (а - 3s; а + 3s), т. е.


Учитывая, что вес отобранной туши — нормаль­но распределенная случайная величина, можно быть практически уверенным, что вес случайно отобран­ной туши не выйдет за пределы от 500 до 1 400 кг.

3) Определим границы, в которых с вероятностью 0,899 будет находиться вес случайно отобранной туши.  Формулу вероятности заданного отклонения нормально распределенной случайной величины Х от своего математического ожидания можно представить следующим образом:


или


где g — вероятность того, что отклонение нормаль­но распределенной случайной величины Х от своего математического ожидания не превысит задан­ной величины Δ.

По условию задачи а = 950; s = 150. Используя последнюю формулу, получим:


Из соотношения 2Ф0(D/150) = 0,899 найдем Δ :


По таблице функции Лапласа (приложение 2) най­дем, при каком z = D/150 функция Ф0(2) = 0,4495.

z = 1,64, т.е. Ф0(1,64) = 0,4495.

Отсюда

D/150 = 1,64, D = 1,64 · 150 = 246.

С вероятностью 0,899 можно ожидать, что откло­нение веса случайно отобранной туши от своего математического ожидания не превысит 246 кг.

Найдем границы интересующего нас интервала:

а-D<Х<а+D,

950 - 246 < X < 950 + 246,

704 < X < 1196.

С вероятностью 0,899 можно ожидать, что вес случайно отобранной туши будет находиться в пределах от 704 до 1 196 кг.

Ответ. 1. а) 0,02275, б) 0,25143, в) 0,83144, г) 0,2586, д) 0,7414; 2. (500, 1 400);

3. 246 (704, 1196).


Пример 2. Изменим условие предыдущей задачи.

На рынок поступила крупная партия говядины. Предполагается, что вес туш — случайная величина, подчиняющаяся нормальному закону распределе­ния с неизвестным математическим ожиданием и средним квадратическим отклонением s= 150 кг. Известно, что 37,07% туш имеют вес более 1 000 кг. Определите ожидаемый вес случайно отобранной туши.

Решение. По условию задачи s= 150; а = 1 000; β = +¥; Р(Х > 1 000) = 0,3707.

Ожидаемый вес случайно отобранной туши — это среднеожидаемый вес (математическое ожидание), т. е. а = ?

Используем формулу (5.10) расчета вероятности попадания в заданный интервал нормально распределенной случайной величины Х


По таблице функции Лапласа (приложение 2) найдем, при каком z = (100 - а)/150 функция Ф0(z) = 0,1293.

z = 0,33, т.е. Ф0(0,33) = 0,1293.

Отсюда


1 000 - а = 0,33 · 150 = 50,

а = 1 000 - 50 = 950.

Ответ. Среднеожидаемый вес случайно отобран­ной туши составляет 950 кг.

Пример 3. Вновь изменим условие задачи.

На рынок поступила крупная партия говядины. Предполагается, что вес туш — случайная величи­на, подчиняющаяся нормальному закону распреде­ления с математическим ожиданием а = 950 кг и неизвестным средним квадратическим отклонением. Известно, что 15,87% туш имеют вес менее 800 кг. Определите среднее квадратическое (стандартное) отклонение веса туш.

Решение. По условию задачи: а = 950; a = ; b= 800; Р(Х < 800) = 0,1587; s = ?

Используем формулу (5.10) расчета вероятности попадания в заданный интервал нормально распределенной случайной величины Х


 


 

 По таблице функции Лапласа (приложение 2) най­дем, при каком z = 150/ σ функция Ф0(z) = 0,3413.

z = 1, т. е. Ф0(1) = 0.3413.

Отсюда


 

Ответ. Среднее квадратическое отклонение веса туш составляет 150 кг.

Пример 4. Еще раз изменим условие задачи. На рынок поступила крупная партия говядины.  Предполагается, что вес туш — случайная величи­на, подчиняющаяся нормальному закону распределения с неизвестными математическим ожиданием и средним квадратическим отклонением. Известно, что 15,87% туш имеют вес менее 800 кг и 37,07% туш — более 1 000 кг. Определите средний ожидае­мый вес и среднее квадратическое (стандартное) отклонение веса туш.

 

Решение. По условию задачи α = -¥; b = 800; Р(Х < 800) = 0,1587; Р(Х > 1000) = 0,3707; а = ?; s= ?

Используем формулу (5.10) расчета вероятности попадания в заданный интервал нормально распределенной случайной величины Х


 


По таблице функции Лапласа (приложение 2) най­дем, при каком z = (а - 800)/s функция Ф0(z) =  =0,3413.

z=1,т. e. Ф0(1) = 0,3413.

Отсюда


С другой стороны,


По таблице функции Лапласа (приложение 2) най­дем, при каком


 

Отсюда


Решим систему линейных уравнений:


Среднеожидаемый вес случайно отобранной туши составляет 950 кг. Среднее квадратическое отклонение веса туш — 150 кг.

Ответ. а = 950; s= 150.

Пример 5. В очередной раз изменим условие задачи. На рынок поступила крупная партия говядины. Предполагается, что вес туш — случайная величина, подчиняющаяся нормальному закону распределения, с математическим ожиданием а = 950 кг и неизвестным средним квадратическим отклонени­ем. Каким должно быть среднее квадратическое (стандартное) отклонение, чтобы с вероятностью 0,81648 можно было утверждать, что абсолютное отклонение веса случайно отобранной туши от ма­тематического ожидания не превысит 200 кг?

Решение. По условию задачи а = 950; Δ = 200; Р(|Х - 950| < 200) = 0,81648; σ =?

Используем формулу (5.11) расчета вероятности заданного отклонения нормально распределенной случайной величины Х от своего математического ожидания.

Тогда получим


По таблице функции Лапласа (приложение 2) най­дем, при каком z = 200/s функция Ф0(z) = 0,40824.

z = 1,33, т. е. Ф0(1.33) = 0,40824.

Отсюда


s=200/1,33=150.

Чтобы с вероятностью 0,81648 можно было ут­верждать, что абсолютное отклонение веса случай­но отобранной туши от математического ожидания не превысит 200 кг, среднее квадратическое отклонение веса туш должно составлять 150 кг.

Ответ. 150.

 

Пример 6. Фирма собирается приобрести партию из 100 000 единиц некоторого товара. Из прошлого опыта известно, что 1 % товаров данного типа име­ют дефекты. Какова вероятность того, что в данной партии окажется от 950 до 1 050 дефектных еди­ниц товара?

Решение. В качестве случайной величины в дан­ной задаче выступает число дефектных единиц товара в общей партии из 100 000 единиц. Обозначим ее через X.

Перечислим все возможные значения случайной величины X: 0, 1, 2, ..., 99 999, 100 000.

Это — дискретная случайная величина, так как ее возможные значения отличаются друг от друга не менее чем на 1, и множество ее возможных зна­чений является счетным.

По условию вероятность того, что единица това­ра окажется дефектной, — постоянна и составляет 0,01 (р = 0,01). Вероятность противоположного со­бытия, т. е. того, что единица товара не имеет дефекта, также постоянна и составляет 0,99:

q= 1 -p= 1 -0,01 =0,99.

Все 100 000 испытаний — независимы, т. е. веро­ятность того, что каждая единица товара окажется дефектной, не зависит от того, окажется дефектной или нет любая другая единица товара.

Значения случайной величины Х — это, в об­щем виде, число появлений интересующего нас со­бытия в 100 000 независимых испытаниях. Поэто­му можно сделать вывод о том, что случайная ве­личина Х — число дефектных единиц товара в об­щей партии из 100 000 единиц — подчиняется би­номиальному закону распределения вероятностей с параметрами п = 100 000 и р = 0,01.

Итак, по условию задачи n = 100 000; р = 0,01; q = 0,99; X = т.

Необходимо найти вероятность того, что число дефектных единиц товара окажется в пределах от    т1 = 950 до т2 =1 050, т. е. вероятность того, что случайная величина Х = т попадет в интервал от 950 до 1050:

Р(т1 < т < т2) = ?

Так как мы имеем дело со случайной величиной, подчиняющейся биномиальному распределению, вероятность появления события т раз в п незави­симых испытаниях необходимо вычислять по фор­муле Бернулли (4.10).

В данном случае для определения искомой вероят­ности нам необходимо с помощью формулы Бернулли найти P100000, 950       Р100000, 951 , РР100000, 952   ...,  РР100000,1049

РР100000,1050 ,а затем сложить их, используя теорему сложения вероятностей несовместных событий.

Очевидно, что такой способ определения иско­мой вероятности связан с громоздкими вычислени­ями. Так,


Можно значительно облегчить расчеты, если ап­проксимировать биномиальное распределение нор­мальным, т. е. выразить функции биномиального распределения через функции нормального.

Когда п — число испытаний в биномиальном эксперименте — возрастает, дискретное биномиаль­ное распределение стремится к непрерывному нор­мальному распределению. Это означает, что для больших п мы можем аппроксимировать биноми­альные вероятности вероятностями, полученными для нормально распределенной случайной величины, имеющей такое же математическое ожидание и такое же среднее квадратическое отклонение.

Подставим параметры биномиального распреде­ления (5.15) в формулу (5.10) и получим формулу для приближенного расчета вероятности появления события от т1 до т2 раз в п независимых испыта­ниях Р(т1 < т < т2):


где Ф0(z) — функция Лапласа


Формулу для вычисления вероятности появле­ния события от т1 до т2 раз в п независимых испытаниях Рn(m1 < т < т2) называют интегральной теоремой Лапласа.

Использование локальной и интегральной теорем Лапласа дает приближенные значения искомых вероятностей. Погрешность будет невелика при ус­ловии, что npq > 9.

Для решения данной задачи воспользуемся ин­тегральной теоремой Лапласа:


 


По таблице функции Лапласа (приложение 2) найдем Ф0(1,59).

Ф0(1,59) = 0,44408.

P100000 (950< т < 1 050) » 2 · 0,44408 = 0,88816.

Вероятность того, что в партии из 100 000 еди­ниц окажется от 950 до 1 050 дефектных единиц товара, составляет 0,88816.

Данную конкретную задачу можно было решить еще более просто.

Математическое ожидание числа дефектных еди­ниц товара равно 1 000 единиц:

М(т) = пр= 100 000 · 0,01 = 1 000.

Абсолютное отклонение нижней и верхней гра­ниц интервала 1, т2) от математического ожида­ния М(т) = пр составляет 50 единиц:

|m1 - пр| = |950 - 100 000 · 0,0l| = 50;

|m2 - np| = 1 050 - 100 000 · 0,0l| = 50.

Следовательно, искомую вероятность можно рас­сматривать как вероятность заданного отклонения частоты от своего математического ожидания:

Р(|т – пр| < Δ).

Подставив параметры биномиального распреде­ления в формулу расчета вероятности заданного отклонения нормально распределенной случайной величины от своего математического ожидания, получим формулу для приближенного расчета ве­роятности заданного отклонения частоты от своего математического ожидания:


При использовании этой формулы для решения задачи сразу получим


Ответ. 0,88816.

Пример 7. Подлежат исследованию 400 проб руды. Вероятность промышленного содержания металла в каждой пробе для всех проб одинакова и равна 0,8. Найти вероятность того, что доля проб с промышленным содержанием металла отклонится от вероятности промышленного содержания метал­ла в каждой пробе не более, чем на 0,05.

Решение. В отличие от предыдущей задачи, в данном случае речь идет о расчете вероятности заданного отклонения частости (относительной час­тоты) появления события от вероятности его появления в отдельном независимом испытании, т. е.


При возрастании числа независимых испытаний распределение частости стремится к нормальному распределению точно так же, как и распределение частоты. Это означает, что при больших п мы мо­жем аппроксимировать распределение частости нор­мальным распределением случайной величины, имеющей такое же математическое ожидание и та­кое же среднее квадратическое отклонение.

Подставив параметры распределения частости в формулу расчета вероятности заданного отклонения нормально распределенной случайной величины от своего математического ожидания, получим формулу для приближенного расчета вероятности задан­ного отклонения частости от своего математическо­го ожидания (вероятности).

Параметры распределения частости:


Используя эти формулы, получим


Применим данную формулу для решения задачи.

По условию: n = 400; р = 0,8; q = 1 - 0,8 = 0,2;



Вероятность того, что доля проб с промышлен­ным содержанием металла отклонится от вероятности промышленного содержания металла в каждой пробе не более, чем на 0,05, составляет 0,98758.

Ответ. 0,98758.

Задачи к теме 5

1. Дневная добыча угля в некоторой шахте рас­пределена по нормальному закону с математиче­ским ожиданием 785 т и стандартным отклонени­ем 60 т. Найдите вероятность того, что в опреде­ленный день будут добыты, по крайней мере, 800 т угля. Определите долю рабочих дней, в которые бу­дет добыто от 750 до 850 т угля. Найдите вероят­ность того, что в данный день добыча угля окажет­ся ниже 665 т.

2. Кандидат на выборах считает, что 20% изби­рателей в определенной области поддерживают его избирательную платформу. Если 64 избирателя слу­чайно отобраны из числа избирателей данной области, найдите вероятность того, что отобранная доля избирателей, поддерживающих кандидата, не бу­дет отличаться по абсолютной величине от истин­ной доли более, чем на 0,07.

3. Авиакомпания знает, что в среднем 5% лю­дей, делающих предварительный заказ на опреде­ленный рейс, не будет его использовать. Если авиа­компания продала 160 билетов на самолет, в кото­ром лишь 155 мест, чему равна вероятность того, что место будет доступно для любого пассажира, имеющего заказ и планирующего улететь?

4. Вес тропического грейпфрута, выращенного в Краснодарском крае, — нормально распределен­ная случайная величина с неизвестным математи­ческим ожиданием и дисперсией, равной 0,04. Агрономы знают, что 65% фруктов весят меньше, чем 0,5 кг. Найдите ожидаемый вес случайно выб­ранного грейпфрута.

5. Один из методов, позволяющих добиться ус­пешных экономических прогнозов, состоит в применении согласованных подходов к решению конк­ретной проблемы. Обычно прогнозом занимается большое число аналитиков. Средний результат та­ких индивидуальных прогнозов представляет собой общий согласованный прогноз. Пусть этот прогноз относительно величины банковской процентной ставки в текущем году подчиняется нормальному закону со средним значением а = 9% и стандарт­ным отклонением α= 2,6%. Из группы аналитиков случайным образом отбирается один человек. Най­дите вероятность того, что согласно прогнозу этого аналитика уровень процентной ставки: а) превысит 11%; б) окажется менее 14%; в) будет в пределах от 12 до 15%.

6. Предположим, что в течение года цена на ак­ции некоторой компании есть случайная величина, распределенная по нормальному закону с матема­тическим ожиданием, равным 48 у. е., и стандарт­ным отклонением, равным 6. Определите вероят­ность того, что в случайно выбранный день обсужда­емого периода цена за акцию была: а) более 60 у. е.; б) ниже 60 за акцию; в) выше 40 за акцию; г) между 40 и 50 у. е. за акцию.

7. Для поступления в некоторый университет необходимо успешно сдать вступительные экзаме­ны. В среднем их выдерживают лишь 25% абиту­риентов. Предположим, что в приемную комиссию поступило 1 889 заявлений. Чему равна вероятность того, что хотя бы 500 поступающих сдадут все экзамены (наберут проходной балл)?

8. Средний срок службы коробки передач до ка­питального ремонта у автомобиля определенной марки составляет 56 мес. со стандартным отклоне­нием σ = 16 мес. Привлекая покупателей, производитель хочет дать гарантию на этот узел, обещая сделать бесплатно любое число ремонтов коробки передач нового автомобиля в случае ее поломки до определенного срока. Пусть срок службы коробки передач подчиняется нормальному закону. На сколь­ко месяцев в таком случае производитель должен дать гарантию для этой детали, чтобы число бес­платных ремонтов не превышало 2,275% продан­ных автомобилей?

9. При производстве безалкогольных напитков специальный аппарат разливает определенное чис­ло унций (1 унция == 28,3 г) напитка в стандартную емкость. Число разлитых унций подчиняется нормальному закону с математическим ожиданием, зависящим от настройки аппарата. Количество унций напитка, разлитых отдельным аппаратом, имеет стандартное отклонение s = 0,4 унции. Пусть емкости объемом в 8 унций наполняются кока-колой. Сколько унций напитка должен в среднем разливать аппарат, чтобы не более 5% емкостей оказа­лось переполненными?

10. Фирма, занимающаяся продажей товаров по каталогу, ежемесячно получает по почте заказы. Число этих заказов есть нормально распределен­ная случайная величина со средним квадратическим отклонением s = 560 и неизвестным математическим ожиданием. В 90% случаев число ежемесячных заказов превышает 12 439. Найдите ожидаемое среднее число заказов, получаемых фирмой за месяц.

11. Еженедельный выпуск продукции на заводе приблизительно распределен по нормальному закону со средним значением, равным 134 786 ед. продук­ции в неделю, и стандартным отклонением —     13000 ед. Найдите вероятность того, что еженедель­ный выпуск продукции: а) превысит 150000 ед.; б) окажется ниже 100 000 ед. в данную неделю; в) предположим, что возникли трудовые споры, и недельный выпуск продукции стал ниже 80 000 ед. Менеджеры обвиняют профсоюз в беспрецедентном падении выпуска продукции, а профсоюз утверждает, что выпуск продукции находится в пределах принятого уровня (±3s). Можно ли доверять проф­союзу?

12. Почтовое отделение быстро оценивает объем переводов в рублях, взвешивая почту, полученную утром каждого текущего рабочего дня. Установле­но, что если вес почтовых отправлений составляет N кг, то объем переводов в рублях есть случайная величина, распределенная по нормальному закону со средним значением 160N и стандартным откло­нением 20N кг. Найдите вероятность того, что в день, когда вес почтовых отправлений составит 150 кг, объем переводов в рублях будет находиться в пределах: а) от 21 000 до 27 000 руб.; б) более 28 500 руб.; в) менее 22 000 руб.

 

13. Менеджер ресторана по опыту знает, что 70% людей, сделавших заказ на вечер, придут в ресторан поужинать. В один из вечеров менеджер ре­шил принять 20 заказов, хотя в ресторане было лишь 15 свободных столиков. Чему равна вероят­ность того, что более 15 посетителей придут на заказанные места?

14. Процент протеина в пакете с сухим кормом для собак — нормально распределенная случайная величина с математическим ожиданием 11,2% и стандартным отклонением 0,6%. Производителям корма необходимо, чтобы в 99% продаваемого кор­ма доля протеина составляла не меньше х1 %, но не более х2%. Найдите х1 и х2.

15. Вес товаров, помещаемых в контейнер опре­деленного размера, — нормально распределенная случайная величина. Известно, что 65% контейне­ров имеют чистый вес больше чем 4,9 т и 25% — имеют вес меньше чем 4,2 т. Найдите ожидаемый средний вес и среднее квадратическое отклонение чистого веса контейнера.

16. Отклонение стрелки компаса из-за влияния магнитного поля в определенной области Заполя­рья есть случайная величина Х ~ (0; 12). Чему рав­на вероятность того, что абсолютная величина от­клонения в определенный момент времени будет больше чем 2,4?

17. Компания А покупает у компании В детали к контрольным приборам. Каждая деталь имеет точ­но установленное значение размера. Деталь, размер которой отличается от установленного размера бо­лее чем на ±0,25 мм, считается дефектной. Компа­ния А требует от компании В, чтобы доля брака не превышала 1% деталей. Если компания В выпол­няет требование компании А, то каким должно быть допустимое максимальное стандартное отклонение размеров деталей? Учесть, что размер деталей есть случайная величина, распределенная по нормаль­ному закону.

18. Компьютерная система содержит 45 одина­ковых микроэлементов. Вероятность того, что лю­бой микроэлемент будет работать в заданное время, равна 0,80. Для выполнения некоторой опера­ции требуется, чтобы по крайней мере 30 микро­элементов было в рабочем состоянии. Чему равна вероятность того, что операция будет выполнена успешно?

19. Технический отдел компании, производящей автопокрышки, планирует выпустить несколько экспериментальных партий покрышек и проверить степень их износа на тестирующем оборудовании. С этой целью предполагается увеличивать количе­ство каучука в покрышках каждой последующей партии до тех пор, пока срок службы покрышек окажется приемлемым. Эксперимент показал, что стандартное отклонение срока службы покрышек фактически остается постоянным от партии к партии и составляет 2 500 миль ( s = 2 500). Если компания хочет, чтобы 80% выпускаемых автопок­рышек имели срок службы не менее 25 000 миль, то какой наименьший средний срок службы авто­покрышек должен быть заложен в расчетах технического отдела? Считать срок службы автопокрышек нормально распределенным.

20. Менеджер торгово-посреднической фирмы получает жалобы от некоторых клиентов на то, что служащие фирмы затрачивают слишком много вре­мени на выполнение их заказов. Собрав и проанализировав соответствующую информацию, он вы­яснил, что среднее время выполнения заказа состав­ляет 6,6 дн., однако для выполнения 20% заказов потребовалось 15 дн. и более. Учитывая, что время выполнения заказа есть случайная величина, рас­пределенная по нормальному закону, определите фактическое стандартное отклонение времени об­служивания клиентов.

 

6. ВАРИАЦИОННЫЕ РЯДЫ И ИХ ХАРАКТЕРИСТИКИ

 

6.1. Понятие вариационного ряда. Виды вариационных рядов

 

Прежде чем приступить к рассмотрению вариационных рядов дадим определение другим поняти­ям, используемым в статистике. Так, совокупность предметов или явлений, объединенных каким-либо общим признаком или свойством качественного или количественного характера, называется объек­том наблюдения.

Всякий объект статистического наблюдения состо­ит из отдельных элементов — единиц наблюдения.

Результаты статистического наблюдения пред­ставляют собой числовую информацию — данные. Статистические данные — это сведения о том, какие значения принял интересующий исследова­теля признак в статистической совокупности. При­знаки бывают количественными и качественными.

Количественным называется признак, значения которого выражаются числами.

Качественным называется признак, характери­зующийся некоторым свойством или состоянием элементов совокупности.

Статистическая совокупность называется гене­ральной, если исследованию подлежат все элемен­ты совокупности (сплошное наблюдение).

Часть элементов генеральной совокупности, под­лежащая исследованию, называется выборочной совокупностью (выборкой). Она извлекается из ге­неральной совокупности случайно, так чтобы каж­дый из п элементов выборки имел равные шансы быть отобранным.

Значения признака, которые при переходе от од­ного элемента совокупности к другому изменяют­ся (варьируют), называются вариантами и обычно обозначаются малыми латинскими буквами х, у,z.

Порядковый номер варианта (значения призна­ка) называется рангом: х1 1-й вариант (1-е значе­ние признака), х2 2-й вариант (2-е значение при­знака), хi i-й вариант (i-e значение признака).

Ряд значений признака (вариантов), располо­женных в порядке возрастания или убывания с соответствующими им весами, называется вариа­ционным рядом (рядом распределения).

В качестве весов выступают частоты или частости.

Частота (т) показывает, сколько раз встреча­ется тот или иной вариант (значение признака) в статистической совокупности.

Частость или относительная частота (ωi) по­казывает, какая часть единиц совокупности имеет тот или иной вариант. Частость рассчитывается как отношение частоты того или иного варианта к сумме всех частот ряда


Сумма всех частостей равна 1


Вариационные ряды бывают дискретными и ин­тервальными.

Дискретные вариационные ряды строят обычно в том случае, .если значения изучаемого признака могут отличаться друг от друга не менее чем на некоторую конечную величину. В дискретных вариационных рядах задаются точечные значения признака. Общий вид дискретного вариационного ряда показан в табл. 6.1, где i = 1, 2, ..., k.

Таблица 6.1

Значения признака (xi)

x1

x2

 

xk

Частоты i)

т1

m2

 

mk

 

Интервальные вариационные ряды строят обыч­но в том случае, если значения изучаемого при­знака могут отличаться друг от друга на сколь угод­но малую величину. Значения признака в них за­даются в виде интервалов. Общий вид интерваль­ного вариационного ряда показан в табл. 6.2, где i= 1, 2, ..., l.

Таблица 6.2

Значения признака (xi)

а1-а2

a2-a3

...

ai-1-ai

Частоты i)

m1

т2

...

ml

 

В интервальных вариационных рядах в каждом интервале выделяют верхнюю и нижнюю границы. Разность между верхней и нижней границами интервала называется интервальной разностью или длиной (величиной) интервала.

Величина 1-го интервала k1 определяется по фор­муле k1 = a2 - а1; 2-го — k2= а3-  a2 последнего:

k1=ai-ai-1

В общем виде интервальную разность ki пред­ставим как

 

ki=xi(max)-xi(min)                         (6.3)

Если интервал имеет обе границы, то его назы­вают закрытым.

Первый и последний интервалы могут быть от­крытыми, т. е. иметь только одну границу. Напри­мер, 1-й интервал может быть задан как «до 100», 2-й — «100-110», .... предпоследний — «190-200», последний — «200 и более». Очевидно, что 1-й ин­тервал не имеет нижней границы, а последний — верхней, оба они — открытые.

Часто открытые интервалы приходится условно закрывать. Обычно для этого величину 1-го интервала принимают равной величине 2-го, а величину последнего — величине предпоследнего. В нашем примере величина 2-го интервала равна 110 - 100 = 10, следовательно, нижняя граница 1-го условно соста­вит 100 - 10 = 90; величина предпоследнего равна 200 - 190 = 10, значит, верхняя граница последне­го условно составит 200 + 10 = 210.

Кроме этого в интервальном вариационном ряде могут встречаться интервалы разной длины. Если ин­тервалы в вариационном ряде имеют одинаковую длину (интервальную разность), их называют равно­великими, в противном случае — неравновеликими.

При построении интервального вариационного ряда часто встает проблема выбора величины интервалов (интервальной разности). Для определения оптимальной величины интервалов (в том случае,если строится ряд с равными интервалами) приме­няют формулу Стэрджесса


где п — число единиц совокупности; хmax  и xmin наибольшее и наименьшее значения вариантов ряда.

Для характеристики вариационного ряда наря­ду с частотами и частостями используются накопленные частоты и частости. Накопленные частоты (частости) показывают, сколько единиц совокупно­сти (какая их часть) не превышают заданного зна­чения (варианта) х.

Их можно рассчитать по данным дискретного ряда, пользуясь формулой

vi = тi + тi-1 +...+ т1.          (6.5)

Для интервального вариационного ряда — это сумма частот (частостей) всех интервалов, не превышающих данный.

Дискретный вариационный ряд графически мож­но представить с помощью полигона распределения частот или частостей (рис.6.1).


Интервальные вариационные ряды графически можно представить с помощью гистограммы, т. е, столбчатой диаграммы (рис. 6.2).


При ее построении по оси абсцисс откладыва­ются значения изучаемого признака (границы интервалов). В том случае, если интервалы одинако­вой величины, по оси ординат можно откладывать частоты или частости. Если же интервалы имеют разную величину, по оси ординат необходимо откладывать значения абсолютной или относитель­ной плотности распределения. Абсолютная плотность — отношение частости интервала к его ве­личине:


где f(a)i абсолютная плотность i-го интервала;

mi — его частота;

ki величина (интервальная разность).

Абсолютная плотность показывает, сколько еди­ниц совокупности приходится на единицу интервала.

Относительная плотность — отношение частости интервала к его величине:


где f(0). — относительная плотность i-го интервала;

wi его частость.

Относительная плотность показывает, какая часть единиц совокупности приходится на единицу ин­тервала.

И дискретные, и интервальные вариационные ряды графически можно представить в виде кумуляты и огивы. При построении первой по данным дискретного ряда по оси абсцисс откладываются значения признака (варианты), а по оси ординат — накопленные частоты или частости. На пересече­нии значений признака (вариантов) и соответству­ющих им накопленных частот (частостей) строят­ся точки, которые в свою очередь соединяются от­резками или кривой. Получающаяся таким обра­зом ломаная (кривая) называется кумулятой (ку­мулятивной кривой). Абсциссами ее точек явля­ются верхние границы интервалов. Ординаты об­разуют накопленные частоты (частости) соответ­ствующих интервалов. Часто добавляют еще одну точку, абсциссой которой является нижняя гра­ница первого интервала, а ордината равна нулю. Соединяя точки отрезками или кривой, получаем кумуляту.

Огива строится аналогично кумуляте с той лишь разницей, что на оси абсцисс наносятся точки, соответствующие накопленным частотам (частостям), а по оси ординат — значения признака (варианты).

 

6.2. Числовые характеристики вариационного ряда

Одной из основных числовых характеристик ряда распределения (вариационного ряда) является сред­няя арифметическая.

Существует две формулы расчета средней ариф­метической: простая и взвешенная. Простую среднюю арифметическую обычно используют, когда данные наблюдения не сведены в вариационный ряд либо все частоты равны единице или одинаковы


где хii-e значение признака; п — объем ряда (чис­ло наблюдений; число значений признака).

Если частоты отличны друг от друга, расчет про­изводится по формуле средней арифметической взве­шенной


где хii-e значение признака; тi частота i-го значе­ния признака; k число его значений (вариантов).

При расчете средней арифметической в качестве весов могут выступать и частости, тогда формула расчета средней арифметической взвешенной при­мет следующий вид:


где хi — i-e значение признака; ωi частость i-го значения признака; k — число его значений (вари­антов).

Колеблемость изучаемого признака можно оха­рактеризовать с помощью различных показателей вариации. К числу основных показателей вариации относятся: дисперсия, среднее квадратическое отклонение, коэффициент вариации.

Дисперсию можно рассчитать по простой и взвешенной формулам, имеющим вид


Среднее квадратическое отклонение рассчитыва­ется по формуле


Коэффициент вариации определяется формулой


Пример 1. При обследовании 50 членов семей рабочих и служащих установлено следующее количество членов семьи: 5;3;2;1;4;6;3;7;9;1;3;2;5; 6; 8; 2; 5; 2; 3; 6; 8; 3; 4; 4; 5; 6; 5; 4; 7; 5; 6; 4; 8; 7;

4; 5; 7; 8; 6; 5; 7; 5; 6; 6; 7; 3; 4; 6; 5; 4.

1)      Составьте вариационный ряд распределения частот.

2) Постройте полигон распределения частот, кумуляту.

3) Определите средний размер (среднее число членов) семьи.

4) Охарактеризуйте колеблемость размера семьи с помощью показателей вариации (дисперсии, среднего квадратического отклонения, коэффициента вариации).

Объясните полученные результаты, сделайте вы­воды.

Решение. 1) В данной задаче изучаемый признак является дискретно варьирующим, так как размер семей не может отличаться друг от друга менее чем на одного человека. Следовательно, необходимо по­строить дискретный вариационный ряд. Чтобы сде­лать это, необходимо подсчитать, сколько раз встре­чаются те или иные значения признака, и располо­жить их в порядке возрастания или убывания. Зна­чения изучаемого признака — размер семьи — обо­значим xi, частоты — тi.

Произведем упомянутые расчеты и запишем их результаты в табл. 6.3.

Таблица 6.3

хi

 

1

 

2

 

3

 

4

 

5

 

6

 

7

 

8

 

9

 

mi

 

2

 

4

 

6

 

8

 

10

 

9

 

6

 

4

 

1

 

 

2) Дискретный вариационный ряд можно пред­ставить графически, построив полигон распределе­ния частот или частостей (рис. 6.3).

Для того чтобы построить кумуляту, необходимо рассчитать накопленные частоты или частости. Накопленная частота 1-го варианта 1 = 1) равна самой частоте этого варианта, т. е. v1 = 2. Накопленная частота 2-го варианта (х2 = 2) равна сумме частот 1-го и 2-го вариантов, т.е. v2 = 2 + 4 = 6. Далее, аналогично v3 = 12; v4 = 20; v5 = 30; v6 = 39; v7= 45; v8 = 49;  v9 =50.


Построим кумуляту (рис. 6.4).


3) Рассчитаем средний размер (среднее число членов) семьи. Так как частоты отличны друг от друга, расчет средней арифметической произведем по формуле (6.9)


Средний размер семьи — 5,06 чел.

4) Так как частоты неодинаковы, для расчета дисперсии размера семьи используем формулу (6.12)


Дисперсия размера семьи — 3,6964 чел2. Найдем среднее квадратическое отклонение раз­мера семьи по формуле (6.13)


Среднее квадратическое отклонение размера се­мьи — 1,9226 чел.

Найдем коэффициент вариации размера семьи по формуле (6.14)


Коэффициент вариации составляет 38%. Так как коэффициент вариации больше 35%, можно сделать вывод о том, что изучаемая совокупность семей яв­ляется неоднородной, чем и объясняется высокая колеблемость размера семьи в данной совокупности.

Ввиду неоднородности семей, попавших в выбор­ку, использование средней арифметической для характеристики наиболее типичного уровня разме­ра семьи не вполне оправданно — средняя арифметическая нетипична для изучаемой совокупности, в качестве характеристики наиболее типичного уров­ня размера семьи в данной совокупности лучше использовать моду или медиану.

Пример 2. Имеются данные о годовой мощности предприятий цементной промышленности в 1996 г.

Предприятия с годовой мощностью, тыс. т

 

Количество предприятий

 

До 500

 

27

 

500 - 1 000

 

11

 

1 000 - 2 000

 

8

 

2 000 - 3 000

 

8

 

Свыше 3 000

 

2

 

 

1) Постройте гистограмму, кумуляту.

2) Рассчитайте среднюю мощность предприятий.

3) Найдите дисперсию, среднее квадратическое отклонение, коэффициент вариации.

Объясните полученные результаты, сделайте вы­воды.

Решение. 1) Данные о годовой мощности пред­приятий цементной промышленности представле­ны в виде интервального вариационного ряда — значения признака заданы в виде интервалов. При этом первый и последний интервалы — открытые: оба интервала не имеют одной из границ. Наконец, данный интервальный вариационный ряд — с нерав­ными интервалами: интервальные разности (раз­ность между верхней и нижней границами) интер­валов неодинаковы. Условно закроем границы от­крытых интервалов.

Интервальная разность 2-го интервала

1 000 - 500 = 500.

Следовательно, нижняя граница 1-го интервала

500 - 500 = 0.

Интервальная разность предпоследнего интервала

3 000 - 2 000 = 1 000.

Следовательно, верхняя граница последнего ин­тервала

3 000 + 1 000 = 4 000.

В результате, получим следующий вариационный ряд (табл. 6.4):

Таблица 6.4

xi

 

mi

 

0-500

 

27

 

500 - 1 000

 

11

 

1 000 - 2 000

 

8

 

2 000 - 3 000

 

8

 

3 000 - 4 000

 

2

 

 

Учитывая неодинаковую величину интервалов, для построения гистограммы рассчитаем абсолют­ные плотности распределения по формуле (6.6)




Построим гистограмму (рис. 6.5).


Для того чтобы построить кумуляту, необходимо рассчитать накопленные частоты или частости.

Накопленная частота нижней границы 1-го варианта х = 0 равна нулю. Накопленная частота верхней границы 1-го интервала равна его частоте, т. е. 27.

Накопленная частота верхней границы 2-го интервала равна сумме частот 1-го и 2-го интервалов, т.е.27 + 11 = 38.

Далее, аналогично 38 + 8 =46; 46 + 8 = 54; 54 + 2 = 56.

Построим кумуляту (рис. 6.6).


2) Рассчитаем среднюю мощность предприятий цементной промышленности в 1996 г. Так как частоты интервалов разные, используем для расчета средней арифметической формулу (6.9). При расчете числовых характеристик интервального вариа­ционного ряда в качестве значений признака принимаются середины интервалов, найдем их.


Теперь расчет средней арифметической примет вид


Средняя мощность предприятий цементной про­мышленности в 1996 г. составляла 964,29 тыс. т.

Следует отметить, что использование с той или иной целью средней арифметической, рассчитанной по данным интервального ряда с открытыми ин­тервалами, может привести к серьезным ошибкам. Это связано с тем, что открытые интервалы закры­ваются условно, в действительности значения при­знака у объектов, попадающих в открытые интер­валы, могут выходить далеко за их условные гра­ницы.

В связи с этим для оценки наиболее типичного уровня изучаемого признака по данным интерваль­ного ряда с открытыми интервалами лучше исполь­зовать моду или медиану.

3) Оценим колеблемость мощности предприятий цементной промышленности в 1996 г.

Так как частоты неодинаковы, для расчета дис­персии используем формулу (6.12)


Дисперсия мощности предприятий — 862 563,78 (тыс. т)2.

Найдем среднее квадратическое отклонение мощности предприятий по формуле (6.13)


Среднее квадратическое отклонение мощности предприятий — 928,74 тыс. т.


Найдем коэффициент вариации по формуле (6.14)


Коэффициент вариации годовой мощности пред­приятий цементной промышленности составляет 96,31%. Поскольку он больше 35%, можно сделать вывод о том, что изучаемая совокупность предприятий является неоднородной, в ее состав вошли и крупные и мелкие предприятия, что и обусловило высокую колеблемость годовой мощности.

Следовательно, использование средней арифме­тической для характеристики наиболее типичного уровня годовой мощности предприятий цементной промышленности неверно — средняя арифметическая нетипична для изучаемой совокупности. Это еще раз подтверждает необходимость использования моды или медианы для характеристики наиболее типичного уровня годовой мощности данной сово­купности предприятий цементной промышленности.

 

Задачи к теме 6

1. По данным выборочного обследования получе­но следующее распределение семей по среднедушевому доходу

Среднедушевой доход семьи в месяц, у. е.

до 25

25-50

50-75

75-100

100-125

125-150

150 и

выше

Количество обследованных семей

46

236

250

176

102

78

12

 

Постройте гистограмму распределения частот. Найдите cреднедушевой доход семьи в выборке, дисперсию, среднее квадратическое отклонение, коэффи­циент вариации. Объясните полученные результаты.

2. Постройте гистограмму частот, найдите сред­нюю заработную работников одного из цехов промышленного предприятия.

Заработная плата, у. е.

50-75

75-100

125-150

150-175

175-200

200-225

Число работников

12

23

37

19

15

9

 

Рассчитайте среднюю арифметическую, среднее квадратическое отклонение, коэффициент вариации заработной платы.

3. Ниже представлена группировка отраслей и под­отраслей промышленности по темпам роста цен на изготавливаемую продукцию за период с начала года.

Сентябрь 1996 г., % к декабрю 1995 г.

 

92,1-100,0

100,1-108,0

108,1-116,0

116,1-124,0

124,1-132,0

132,1-140,0

Число отраслей и подотраслей, единиц

 

4

15

21

31

19

18

 

Найдите среднюю арифметическую, дисперсию, среднее квадратическое отклонение, коэффициент ва­риации. Постройте гистограмму. Сделайте выводы.

4. По результатам выборочного обследования тор­говых киосков города получены следующие данные о дневной выручке частного бизнеса.

Выручка от продажи товара, тыс. у. е.

 

до 1

 

1-1,2

 

1,2-1,4

 

1,4-1,6