"Основы статистики с элементами теории вероятностей для экономистов. Рук-во для решения задач" - читать интересную книгу автора (Ниворожкина Л.П., Морозова 3.А.)
Учебники «Феникса» П. П. Ниворожкина, 3. А. Морозова, ОСНОВЫ СТАТИСТИКИ С ЭЛЕМЕНТАМИ ТЕОРИИ ВЕРОЯТНОСТЕЙ ДЛЯ ЭКОНОМИСТОВ Руководство для решения задач Рекомендовано Министерством общего и профессионального образования Российской Федерации в качестве учебного пособия для студентов высших учебных заведений, обучающихся по экономическим специальностям и направлениям Ростов-на-Дону «Феникс» 1999 УДК 311(075.8) Рецензенты: Заслуженный деятель науки
РФ, доктор экономических наук, профессор В. С. Князевский Кафедра высшей математики
Московского государственного института стали и сплавов Учебно-методический совет по специальности «Статистика» УМО при
Московском государственном университете экономики, статистики и информатики Ниворожкина Л. П., Морозова
3. А., Основы статистики с элементами теории вероятностей для
экономистов: Руководство для решения задач. — Ростов н/Д: Феникс, 1999. — 320
с. — (Учебники «Феникса»). ISBN 5-222-00560-7 В пособии кратко
и просто изложены основные понятия статистики и теории вероятностей, даны
методические указания по решению типовых задач. В конце каждой главы приведены
20 вариантов задач, условия которых приближены к практическим ситуациям в
области маркетинга, аудита, финансов и др. Предназначено для
студентов и аспирантов экономических вузов, преподавателей колледжей, вузов, а
также для практических работников, желающих научиться использовать современные
статистические методы и их практические приложения при планировании своей
деятельности. ISBN 5-222-00560-7 ©Ниворожкина Л. И., Морозова 3. А., ПРЕДИСЛОВИЕ Рыночная экономика
существенно повышает требования к качеству подготовки конкурентоспособных
выпускников экономических вузов. Для этого необходимо владеть современным
инструментарием математико-статистического анализа данных. Предлагаемое
учебное пособие знакомит читателя с рядом важнейших разделов статистики и
теории вероятностей, формирует основы статистического мышления. В пособии
переработан и переосмыслен ряд методических подходов, используемых при чтении
курсов по прикладной статистике и элементарной теории вероятностей на
экономических факультетах в США и Европе. В процессе экономического
образования математико-статистические дисциплины традиционно считаются наиболее
сложными для студентов. Предлагаемое пособие ставит своей целью помочь тем,
кто осваивает эти курсы, особенно в системе заочного образования, понять
прикладной, практический смысл проблем, решаемых с помощью статистики, а также
помочь самостоятельно выполнить домашние задания по представленным темам. Каждая глава начинается с
краткого изложения основных теоретических понятий и формул. Авторы стремились
подать этот материал так, чтобы, избегая громоздких математических
доказательств, на доступном уровне донести до читателя сложные понятия
современной статистики. Для всех основных типов
задач, которые можно решить на базе изложенного теоретического материала,
приведены методики их решения, которые не только дают «рецепты» для получения
ответов, но, прежде всего, помогают читателю освоить основы статистического
вывода при решении различных задач из области практической деятельности. Если
читатель поймет, для чего необходимо использовать тот или иной статистический
метод, ему легче будет освоить и его формальный вычислительный алгоритм,
увидеть, что полученный результат — не просто число, а сконцентрированное
выражение того, что исходные данные несут в себе об изучаемом явлении. Для того чтобы процесс
обучения носил активный характер, тексты задач максимально приближены к
реальным ситуациям в различных областях экономики, таких, как бухгалтерский
учет и аудит, финансы, маркетинг и т. д. Решение их поможет понять
универсальность статистического анализа как инструмента решения проблем,
связанных с риском и неопределенностью. В книге приведены основные
таблицы математической статистики, необходимые для решения задач (приложения 1-6), а также список
рекомендуемой литературы. 1. ЭЛЕМЕНТЫ КОМБИНАТОРИКИЭтот материал
не относится непосредственно к теории вероятностей и математической статистике,
однако необходим в дальнейшем при расчетах вероятностей. Комбинаторика происходит от
латинского слова «combinatio» — соединение. Группы, составленные из каких-либо предметов (безразлично каких,
например, букв, цветных шаров, кубиков, чисел и т. п.), называются соединениями (комбинациями). Предметы, из которых состоят соединения, называются элементами. Различают три типа
соединений: размещения, перестановки и сочетания. 1.1. РазмещенияРазмещениями из п элементов
по т в каждом называются такие
соединения, из которых каждое содержит т
элементов, взятых из числа данных n элементов, и которые отличаются друг от друга либо самими элементами
(хотя бы одним), либо лишь порядком их расположения. Число размещений из п элементов по т в каждом обычно обозначается символом Аnm и вычисляется по следующей формуле*:
*
Выводы формул для числа размещений, а в последующем изложении — для числа
сочетаний, опускаются. Их можно найти в курсе элементарной алгебры. 1.2. Понятие факториалаПроизведение п натуральных чисел от 1 до n обозначается сокращенно п!, т. е. 1·2·3·...·(n -1)·n= n!
(читается: п факториал).
Например: 5!=1·2·3·4·5=120. Считается, что 0! = 1. Используя понятие факториала, формулу (1.1) можно представить так:
где 0 т n. Очевидно, что Аn1=
п (при m = 1) и Аn0=n (при m= 0). Пример 1. Правление коммерческого банка выбирает из 10 кандидатов
3 человек на различные должности
(все 10 кандидатов имеют равные шансы). Сколько всевозможных групп по 3
человека можно составить из 10 кандидатов? Решение. В условии задачи речь идет о расчете числа комбинаций из 10 элементов
по 3. Так как группы по 3 человека могут
отличаться и составом претендентов, и заполняемыми ими вакансиями, т. е.
порядком, то для ответа необходимо рассчитать число размещений из 10 элементов
по 3: N=А310=10·9·8=720 Ответ. Можно составить 720 групп
по 3 человека из 10. 1.3. Размещения с повторениямиРазмещение с
повторениями из n элементов по m(mn) элементов может содержать любой
элемент сколько угодно раз от 1 до m
включительно, или не содержать его совсем, т. е. каждое размещение с
повторениями из n элементов по m элементов может состоять не только из
различных элементов, но из m каких
угодно и как угодно повторяющихся элементов. Соединения, отличающиеся
друг от друга хотя бы порядком расположения элементов, считаются различными
размещениями. Число
размещений с повторениями из n
элементов по m элементов будем
обозначать символом Аnm(c
повт.) . Можно доказать, что оно равно nm: Аnm(c
повт.) =nm (1.3) Пример 2. Изменим условие примера 1. Правление коммерческого банка выбирает из
10 кандидатов 3 человек на 3 различные должности. Предположим, что один и тот
же отобранный из 10 претендентов кандидат может занять не только одну, но и 2,
и даже все 3 различные вакантные
должности. Сколько в данном случае
возможно комбинаций замещения 3 вакантных должностей? Решение. Как и в предыдущей задаче, комбинации замещения вакантных должностей
могут отличаться и составом претендентов и заполняемыми ими вакансиями, т.е.
порядком. Следовательно, и в этом случае для ответа на вопрос задачи
необходимо рассчитать число размещений. Однако теперь вакантные должности
могут замещаться одним и тем же претендентом, а значит, здесь речь идет о
расчете числа размещений с повторениями. По условию задачи п = 10, т = 3. Следовательно, Аnm=103=1000. Ответ.
Можно составить 1000 комбинаций. 1.4. СочетанияСочетаниями из п
элементов по m в каждом называются такие соединения, из которых каждое содержит т элементов, взятых из числа данных п элементов, и которые отличаются друг
от друга по крайней мере одним элементом. Число сочетаний из п элементов по m в каждом обозначается
символом Cnm и
вычисляется так:
или
Пример 3. Правление коммерческого банка выбирает из 10 кандидатов 3 человек на одинаковые должности (все 10 кандидатов
имеют равные шансы). Сколько всевозможных групп по 3 человека можно составить
из 10 кандидатов? Решение. Состав различных групп должен отличаться по крайней мере хотя бы
одним кандидатом и порядок выбора кандидата не имеет значения, следовательно,
этот вид соединений представляет собой сочетания. По условию задачи п = 10, т = 3. Подставив данные в формулу (1.5), получаем
Ответ.
Можно составить 120 групп из 3 человек по 10.
Замечание. Надо уметь различать сочетания от размещений. Например: если в группе
25 студентов и 10 человек из них, выйдя из аудитории на перерыв, стоят вместе и
беседуют, то порядок, в котором они
стоят, несуществен. Число всех
возможных групп из 25 человек по 10 в данном случае — сочетания. Если же студенты отправились на перерыве в буфет или в
кассу за стипендией, то тогда существенно,
в каком, порядке они стали, т. е. кто из них первый, второй и т. д. В этой
ситуации при подсчете возможных групп из 25 человек по 10 необходимо составлять
размещения. 1.5. Сочетания с повторениямиСочетание с повторениями из n элементов по m (n Î m) элементов может содержать любой элемент сколько угодно раз от 1 до m включительно или не
содержать его совсем, т. е. каждое сочетание из n элементов по m элементов может состоять не только из m различных элементов, но из m каких угодно и как угодно повторяющихся элементов. Следует отметить, что если,
например, два соединения по m
элементов отличаются друг от друга только порядком расположения элементов, то
они не считаются различными сочетаниями. Число сочетаний с
повторениями из n элементов по m будем обозначать символом
(Cnm)c повт и вычислять по формуле
Замечание, т может быть и больше n. Пример 4. Сколькими способами можно выбрать 6 пирожных в кондитерской, где есть
4 разных сорта пирожных? Решение.
Ответ.
Существует 84 различных способа выбора пирожных. 1.6. ПерестановкиПерестановками из п элементов
называются такие соединения, из которых каждое содержит все п элементов и которые отличаются друг от
друга лишь порядком расположения элементов. Число перестановок из п элементов обозначается символом Pn,
это то же самое, что число размещений из п
элементов по n в каждом, поэтому
Пример 5. Менеджер ежедневно просматривает 6 изданий
экономического содержания. Если порядок просмотра изданий случаен, то сколько
существует способов его осуществления? Решение. Способы просмотра изданий различаются только порядком, так как число,
а значит, и состав изданий при каждом способе неизменны. Следовательно, при
решении этой задачи необходимо рассчитать число перестановок. По условию задачи п = 6. Следовательно, Рn = 6! =1·2·3·4·5·6 = 720. Ответ.
Можно просмотреть издания 720 способами. 1.7. Перестановки с повторениямиЧисло перестановок с
повторениями выражается формулой
Пример 6. Сколькими способами можно разделить т + п + s
предметов на 3 группы, чтобы в одной группе было т предметов, в другой n
предметов, в третьей — s предметов? Решение.
Задачи к теме 11. Во многих странах
водительское удостоверение (автомобильные права) имеет шифр, состоящий из 3
букв и 3 цифр. Чему равно общее число возможных номеров водительских
удостоверений, считая, что число букв русского алфавита, используемых для
составления шифра, — 26, а буквы занимают первые 3 позиции шифра? Если шифр
состоит только из 6 цифр, то чему в этом случае равно общее число всех
возможных номеров удостоверений, если: а) цифры в шифре не повторяются; б)
повторяются? 2. Сколько существует способов составления в
случайном порядке списка из 7 кандидатов для выбора на руководящую должность?
Какова вероятность того, что кандидаты будут расставлены в списке по возрасту
(от меньшего к большему)?* 3. Руководство фирмы выделило отделу рекламы
средства для помещения в печати объявлений о предлагаемых фирмой товарах и
услугах. По расчетам отдела рекламы выделенных средств хватит для того, чтобы
поместить объявления только в 15 из 25 городских газет. Сколько существует
способов случайного отбора газет для помещения объявлений? Какова вероятность
того, что в число отобранных попадут 15 газет, имеющих наибольший тираж?* 4. Менеджер рассматривает кандидатуры 8 человек,
подавших заявления о приеме на работу. Сколько существует способов приглашения
кандидатов на собеседование в случайном порядке? Какова вероятность того, что
они случайно будут приглашены на собеседование в зависимости от времени их
прихода в офис?* 5. На железнодорожной
станции имеется 5 путей. Сколькими способами можно расставить на них 3 состава?
Какова вероятность того, что составы случайно будут расставлены на путях в
порядке возрастания их номеров?* 6. Покупая карточку лотереи
«Спортлото», игрок должен зачеркнуть 6 из 49 возможных чисел от 1 до 49. Если
при розыгрыше тиража лотереи он угадает все 6 чисел, то имеет шанс выиграть
значительную сумму денег. Сколько возможных комбинаций можно составить из 49
по 6, если порядок чисел безразличен? Чему равна вероятность угадать все 6
номеров?* 7. Четыре человека случайно
отбираются из 10 согласившихся
участвовать в интервью для выяснения их отношения к продукции фирмы по производству
продуктов питания. Эти 4 человека прикрепляются к 4 интервьюерам. Сколько
существует различных способов составления таких групп? Если выбор случаен,
чему равна вероятность прикрепления определенного человека к интервьюеру?* 8. Сколькими способами можно
рассадить 5 гостей за круглым столом? Какова вероятность того, что гости
случайно окажутся рассаженными по росту?* 9. Девять запечатанных
пакетов с предложениями цены на аренду участков для бурения нефтяных скважин
поступили утром в специальное агентство утренней почтой. Сколько существует
различных способов очередности вскрытия конвертов с предложениями цены? Какова
вероятность того, что конверты случайно окажутся вскрытыми в зависимости от
величины предлагаемой за аренду участков цены?* 10. Фирма
нуждается в организации 4 новых складов. Ее сотрудники подобрали 8 подходящих
одинаково удобных помещений. Сколько существует способов отбора 4 помещений из
8 в случайном порядке? Какова вероятность того, что в число отобранных попадут
4 помещения, расположенные в многоэтажных зданиях?* 11. Для разгрузки поступивших
товаров менеджеру требуется выделить 6 из 20 имеющихся рабочих. Сколькими
способами можно это сделать, осуществляя отбор в случайном порядке? Какова
вероятность того, что в число отобранных войдут самые высокие рабочие?* 12. Руководство фирмы может
обратиться в 6 туристических агентств с просьбой об организации для своих
сотрудников 3 различных туристических поездок. Сколько существует способов
распределения 3 заявок между 6 агентствами, если каждое агентство может
получить не более одной заявки? Какова вероятность того, что заявки получат
агентства с наибольшим оборотом, причем, чем крупнее агентство, тем крупнее
заявку оно получает?* 13. Для доступа в
компьютерную сеть оператору необходимо набрать пароль из 4 цифр. Оператор забыл
или не знает необходимого кода. Сколько всевозможных комбинаций он может
составить для набора пароля: а) если цифры в коде не повторяются; б) если
повторяются? С какой вероятностью можно открыть замок с первой попытки?* 14. Сколько
существует способов составления списка 20 деловых звонков случайным образом?
Какова вероятность того, что список окажется составленным в алфавитном
порядке?* 15. На рынке
представлено 8 различных пакетов программ для бухгалтерии с приблизительно
равными возможностями. Для апробации в своих филиалах фирма решила отобрать 3
из них. Сколько существует способов отбора 3 программ из 8, если отбор
осуществлен в случайном порядке? Какова вероятность того, что среди отобранных
случайно окажутся 3 программы, занимающие наименьший объем памяти?* 16. Выделены
крупные суммы на выполнение 4 крупных правительственных программ, сулящих
исполнителям высокую прибыль. Сколько существует способов случайного
распределения этих 4 программ между 6 возможными исполнителями? Какова вероятность
того, что средства на выполнение программ при таком распределении получат 4
исполнителя, имеющие наибольшую прибыль, причем величина выделяемых средств
зависит от величины прибыли исполнителей?* 17. Брокерская
фирма предлагает акции различных компаний. Акции 10 из них продаются по
наименьшей среди имеющихся акций цене и
обладают одинаковой доходностью. Клиент собирается приобрести акции 3 таких
компаний — по 1 от каждой компании. Сколько существует способов выбора 3 таких
акций из 10, если выбор осуществляется в случайном порядке? Какова вероятность
того, что в число случайно отобранных попадут акции, рост цен на которые
будет наибольшим в следующем году?* 18. Фирмы Fl, F2, F3, F4, F5 предлагают свои условия по
выполнению 3 различных контрактов Cl, C2 и СЗ. Любая фирма может
получить только один контракт. Контракты различны, т. е. если фирма Fl получит
контракт Cl, то это не то же самое, если она получит контракт C2. Сколько способов
получения контрактов имеют фирмы? Если предположить равновозможность заключения
контрактов, чему равна вероятность того, что фирма F3 получит контракт?* 19. По сведениям
геологоразведки 1 из 15 участков земли по всей вероятности содержит нефть.
Однако компания имеет средства для бурения только 8 скважин. Сколько способов
отбора 8 различных скважин у компании? Какова вероятность того, что случайно
отобранные для бурения участки окажутся, например, самыми северными?* 20. На 9 вакантных мест по
определенной специальности претендуют 15 безработных, состоящих на учете в
службе занятости. Сколько возможно комбинаций выбора 9 из 15 безработных? * Для вычисления вероятностей
здесь и далее ознакомьтесь с материалом гл. 2. 2. ЭЛЕМЕНТЫ ТЕОРИИ ВЕРОЯТНОСТЕЙ2.1. Определение вероятности и свойства, вытекающие из ее определения, классификация событий, диаграммы ВеннаПод
вероятностью в широком смысле понимают количественную меру неопределенности или
число, которое выражает степень уверенности в наступлении того или иного случайного события. Например, нас может
интересовать вероятность того, что объем продаж некоторого продукта не упадет,
если цены вырастут, или вероятность того, что строительство нового дома
завершится в срок. Случайным называется событие, которое может произойти или не произойти
в результате некоторого испытания. В дальнейшем для простоты мы будем опускать термин
«случайный». Испытание (опыт, эксперимент) — это процесс, включающий определенные условия и
приводящий к одному из нескольких возможных исходов. Исходом опыта может быть
результат наблюдения или измерения (табл. 2.1). Единичный, отдельный исход испытания называется элементарным событием. Случайное событие может
состоять из нескольких элементарных событий, подразделяющихся на достоверные,
невозможные, совместные, несовместные, единственно возможные, равновозможные, противоположные. Таблица 2.1
Событие, которое обязательно произойдет в результате
испытания, называется достоверным. Например, если в урне содержатся только белые
шары, то извлечение из нее белого шара есть событие достоверное; другой
пример, если мы подбросим вверх камень, то он обязательно упадет на землю в
силу действия закона притяжения, т. е. результат этого опыта заведомо известен.
Достоверные события условимся обозначать символом W. Событие, которое не может произойти в результате данного опыта
(испытания), называется невозможным. Извлечение черного шара из урны с белыми шарами
есть событие невозможное; выпадение выигрыша на все номера облигаций в
каком-либо тираже выигрышного займа также невозможное событие. Невозможное
событие обозначим ø. Достоверные и невозможные
события, вообще говоря, не являются случайными. Несколько событий называются совместными, если в результате
эксперимента наступление одного из них не исключает появления других. Например, при бросании 3
монет выпадение цифры на одной не исключает появления цифр на других монетах. В магазин вошел покупатель.
События «В магазин вошел покупатель старше 60 лет» и «В магазин вошла женщина»
— совместные, так как в магазин может войти женщина старше 60 лет. Несколько событий называются несовместными в данном опыте, если
появление одного из них исключает появление других. Например, выигрыш, ничейный
исход и проигрыш при игре в шахматы (одной партии) — 3 несовместных события. События называются единственно возможными, если в результате испытания
хотя бы одно из них обязательно произойдет (или 1, или 2, или... или все события из
рассматриваемой совокупности событий произойдут; одно точно произойдет). Например,
некая фирма рекламирует свой товар по радио и в газете. Обязательно произойдет
одно и только одно из следующих событий: «Потребитель услышал о товаре по
радио», «Потребитель прочитал о товаре в газете», «Потребитель получил информацию
о товаре по радио и из газеты», «Потребитель не слышал о товаре по радио и не
читал газеты». Эти 4 события единственно возможные. Несколько событий называются равновозможными, если в результате
испытания ни одно из них не имеет объективно большую возможность появления, чем
другие. При бросании игральной кости появление каждой из ее граней — события равновозможные. Два единственно возможных и несовместных события называются
противоположными. Купля и продажа определенного вида товара есть события
противоположные. Совокупность всех единственно возможных и несовместных событий
называется полной группой событий. Различные события и действия
с ними удобно рассматривать с помощью так называемых диаграмм Венна (по имени
английского математика-логика Джона Венна). Изобразим полную группу
событий в виде квадрата, тогда круг внутри квадрата будет обозначать некоторое
событие, скажем. А, а точка - элементарное событие - Е (рис. 2.1).
Рис. 2.1 демонстрирует два противоположных события А и не А, которые
дополняют друг друга до полной группы событий. Противоположное событие
обозначается Ā. Пересечение А и В
(обозначается как А Ç В) есть набор,
содержащий все элементы, которые являются членами и А и В (рис. 2.2).
Рис. 2.2 Объединение А и В (обозначается A È В) есть набор, содержащий все
элементы, которые являются членами или А,
или В, или А и В вместе. Полную группу можно определить так:
тогда {А1, А2,
..., Аn} — полная группа
событий. Вероятностью появления события А
называют отношение числа исходов, благоприятствующих наступлению этого события,
к общему числу всех единственно возможных и несовместных элементарных исходов. Обозначим число
благоприятствующих событию А исходов через М,
а число всех исходов — N: P(A)=M/N, (2.1) где М — целое неотрицательное
число, 0 £ М £ N. Другой тип объективной
вероятности определяется исходя из относительной
частоты (частости) появления события. Например: если некоторая фирма в
течение времени провела опрос 1 000 покупателей нового сорта напитка и 20 из
них оценили его как вкусный, то мы можем оценить вероятность того, что
потребителям понравится новый напиток как 20/1 000 = 0,02. В этом примере 20 —
это частота наступления события, а 20/1 000 = 0,02 — это относительная
частота. Относительной частотой события называется отношение числа испытаний т, при которых событие появилось, к общему числу проведенных испытаний п. W(A)
== т/п (2.2) где т — целое неотрицательное
число, 0 £ т£ п. Статистической вероятностью события А называется относительная частота
(частость) этого события, вычисленная по результатам большого числа испытаний.
Будем обозначать ее Р*(А). Следовательно,
При очень большом числе испытаний статистическая
вероятность приближенно равна классической вероятности, т. е.
Для определения вероятности
выпадения 1 или 2 при подбрасывании кости нам необходимо только знать «модель
игры», в данном случае — кость с 6 гранями. Мы можем определить наши шансы теоретически, без подбрасывания кости,
это априорная (доопытная)
вероятность. Во втором примере мы можем определить вероятность только по результатам опыта, это — апостериорная (послеопытная) вероятность.
То есть классическая вероятность — априорная, а статистическая —
апостериорная. Какой бы вид вероятности ни
был выбран, для их вычисления и анализа используется один и тот же набор
математических правил. Свойства
вероятности, вытекающие из
классического определения. 1.
Вероятность достоверного события равна 1, т. е. P(W) =1. Действительно, если событие А =
W, то М = N, значит, Р(W) = N/N = 1. 2.
Если событие невозможное, то его вероятность равна 0, т. е. Р(Æ)= 0. Если А = Æ, то оно не осуществится ни
при одном испытании, т. е. М = 0 и Р(Æ) = 0/N = 0. 3. Вероятность случайного
события есть положительное число, заключенное между 0 и 1. В самом деле, так как 0£ M £ N, 0£ M/N £ 1, т. е. 0 £ Р(А) £ 1. 4. Сумма вероятностей
противоположных событий равна 1, т. е. Р(А)
+ Р(А) = 1. В самом деле, Р(А) = (N - M)/N = 1 - M/N = 1 - P(A), следовательно, Р(А)+Р(А)=1. (2.3) Например, если вероятность
извлечения туза из колоды, состоящей из 52 карт, равна 4/52, то вероятность
извлечения карты, не являющейся тузом, равна 1 - 4/52 = 48/52 Пример 1. Магазин в целях рекламы нового товара проводит лотерею, в которой 1
главный приз, 5 вторых, 100 — третьих и 1 000 — четвертых. В конце рекламного
дня выяснилось, что лотерейные билеты получили 10 000 покупателей. По правилам
розыгрыша после извлечения выигрышного билета он возвращается в урну, и покупатель
не может получить более одного выигрыша. Чему равна вероятность того, что
покупатель, который приобрел рекламируемый товар: а) выиграет 1-й приз; б)
выиграет хотя бы 1 приз; в) не выиграет ни одного приза? Решение, а) Определим событие А: «Покупатель выиграл 1-й приз». Согласно
условию задачи, в лотерее участвовало 10 000 покупателей, отсюда общее число
испытаний N = 10 000, а число
исходов, благоприятствующих событию А, М
= 1. Все исходы являются равновозможными, единственно возможными и
несовместными элементарными событиями. Следовательно, по формуле классической
вероятности: б) определим событие В: «Покупатель выиграл хотя бы 1 приз».
Для этого события число благоприятствующих исходов М = 1
+ 5 +100 + 1 000 = 1 106. P(B) = M/N = 1106/10 000 = 0,1106; в) событие «Покупатель не
выиграет ни одного приза» — противоположное событию В: «Покупатель выиграет хотя бы один приз», поэтому обозначим его
как . По формуле (2.3) найдем Р(В) =1- Р(В) = 1 - 0,1106 = 0,8894 . Ответ.
Вероятность того, что покупатель выиграет 1-й приз равна 0,0001, один приз —
0,1106, не выиграет ни одного приза — 0,8894. Пример 2. Структура занятых в региональном отделении крупного банка имеет
следующий вид (табл. 2.2): Таблица 2.2
Если один из служащих выбран
случайным образом, то какова вероятность, что он: а) мужчина-администратор; б)
женщина-операционист; в) мужчина; г) операционист? Решение. а)
В банке работают 100 человек, N =
100. Из
них 15 - мужчины-администраторы, М =
15. следовательно, Р(мужчина-администратор) = 15/100 = 0,15. б)
35 служащих в банке - женщины-операционисты, следовательно, P(женщина-операционист) == 35/100 = 0,35. в)
40 служащих в банке - мужчины, следовательно, Р(мужчина) = 40/100 = 0,40. г)
Из общего числа служащих в банке 60 - операционисты, следовательно, P(операционист) = 60/100= 0,60. 2.2. Правила сложения и умножения вероятностей. Зависимые и независимые событияВероятность суммы двух событий равна сумме вероятностей этих событий
без вероятности их совместного наступления Р(А + В) = Р(А) +
Р(В) - Р(АВ), или
(2.4) Р(А È В)
- Р(А) + Р(В) - Р(А Ç В). Для несовместных событий их совместное наступление есть невозможное
событие, а вероятность его равна нулю, следовательно, вероятность суммы двух несовместных событий равна сумме вероятностей
этих событий.
или
(2.5) Р(А È В) = Р(А) + Р(В). Правило сложения
вероятностей справедливо и для конечного числа п попарно несовместных событий
В случае нескольких
совместных событий необходимо по аналогии с рассуждениями о пересечении двух
совместных событий исключить повторный учет областей пересечения событий.
Рассмотрим три совместных события (рис.
2.3).
Рис. 2.3 Для случая
трех совместных событий можно записать Р(А + В + С) =
Р(А) + Р(В) + Р(С) - Р(АВ)- Р(АС) -
Р(ВС) + Р(АВС). Сумма
вероятностей событий А1, А2, А3 , ..., Аn,
образующих полную группу, равна 1 Р(А1) + Р(А2) + Р(А3)
+ ... + Р(Аn) = 1. или
Пример 3. Компания производит 40 000
холодильников в год, которые реализуются в различных регионах России. Из них
10 000 экспортируются в страны СНГ, 8 000 продаются в регионах Европейской
части России, 7 000 продаются в страны дальнего зарубежья, 6 000 в Западной
Сибири, 5000 в Восточной Сибири, 4 000 в Дальневосточном районе. Чему равна
вероятность того, что определенный холодильник будет: а) произведен на экспорт;
б) продан в России? Решение. Обозначим события: А - «Холодильник будет
продан в странах СНГ»; В -
«Холодильник будет продан в Европейской части России»; С - «Холодильник будет
продан в страны дальнего зарубежья»; D -
«Холодильник будет продан в Западной Сибири»; Е — «Холодильник будет продан в
Восточной Сибири»; F —
«Холодильник будет продан в Дальневосточном районе». Соответственно, вероятность того, что холодильник
будет продан в странах СНГ: Р(А) = 10000/40000 =0,25; вероятность того, что холодильник будет продан в Европейской части
России: Р(В) = 8 000/40 000 = 0,20; вероятность того, что холодильник будет продан в страны дальнего
зарубежья: Р(С) = 7 000/40 000 = 0,175; вероятность того, что холодильник будет продан в Западной Сибири; Р(D) = 6 000/40 000 = 0,15; вероятность того, что холодильник будет продан в Восточной Сибири: Р(Е) = 5 000/40 000 = 0,125; вероятность того, что холодильник будет продан на Дальнем Востоке: P(F) = 4 000/40 000 =0,10. События А, В, С, D, Е, F — несовместные. 1) Событие,
состоящее в том, что холодильник произведен на экспорт, означает, что
холодильник будет продан или в
страны СНГ, или в страны дальнего
зарубежья. Отсюда по формуле (2.5) находим его вероятность: Р(холодильник
произведен на экспорт) = Р(А + В) = Р(А) + Р(В) = 0,25 + 0,175 = 0,425. 2) Событие, состоящее в том,
что холодильник будет продан в России, означает, что холодильник будет продан или в Европейской части России, или в Западной Сибири, или в Восточной Сибири, или на Дальнем Востоке. Отсюда по
формуле (2.6) находим его вероятность: Р(холодильник
будет продан в России) = Р(А +D+E+ F) = Р(В) + P(D) + Р(Е) + P(F) = 0,20 + 0,15 + +0,125 + 0,10 = 0,575. Этот же результат можно было
получить рассуждая по-другому. События «Холодильник произведен на экспорт» и
«Холодильник будет продан в России» — два взаимно противоположных события,
отсюда по формуле (2.3): Р(холодильник
будет продан в России) = 1 - Р(холодильник произведен на экспорт) = 1 - 0,425 = =0,575. Пример 4. Опыт состоит в случайном извлечении карты из колоды в 52 карты. Чему
равна вероятность того, что это будет
или туз, или карта масти треф? Решение. Определим события: А —
«Извлечение туза», В — «Извлечение
карты трефовой масти». Вероятность извлечения туза из колоды карт Р(А) = 4/52; вероятность извлечения карты
трефовой масти — Р(В) = 13/52; вероятность их пересечения — извлечение
трефового туза - Р(АВ) = 1/52 (рис.
2.4).
События А и В
— совместные, поскольку в колоде есть трефовый туз. Согласно условию задачи, нас
интересует вероятность суммы совместных событий А и. В. По формуле (2.4) получим Р(А + В) = Р(А) + Р(В) -
Р(АВ) = 4/52 + 13/52 - 1/52 =
16/52 = 1/2. Пример 5. В урне 2 белых и 3 черных шара. Чему равна вероятность появления белого
шара: а) при 1-м извлечении из урны; б) при 2-м извлечении из урны? Решение. Здесь возможны 2 случая. 1-й случай. Схема возвращенного шара, т. е. шар после 1-го извлечения возвращается
в урну. Пусть событие А — «Появление
белого шара при 1-м извлечении», так как N
= 5, а М = 2, то Р(А) = 2/5. Пусть событие В — «Появление белого шара при 2-м
извлечении», так как шар после 1-го извлечения возвратился в урну, то N=5,а М=2 и Р(В) = 2/5. Таким образом, вероятность
каждого из событий не зависит от того, произошло или не произошло другое
событие. События А и В в этом случае являются независимыми. Итак, события А и В называются независимыми, если вероятность каждого
из них не зависит от того, произошло или нет другое событие. Вероятности независимых событий называются безусловными. 2-й случай. Схема невозвращенного шара, т. е. шар после 1-го
извлечения в урну не возвращается. Вероятность появления белого
шара при 1-м извлечении Р(А) = 2/5.
Белый шар в урну не возвращается, следовательно, в урне остались 1 белый и 3
черных шара. Чему равна вероятность события В
при условии, что событие А произошло? N =
4, М = 1. Искомую вероятность
обозначают Р(В/А) или Р(В)A или РA(В). Итак, Р(В/А) = 1/4 называют условной вероятностью, а события А, В — зависимыми. В предыдущем примере
с картами Р(А) = 4/52; Например, тот факт, что
человек работает научным сотрудником, не является независимым от наличия у
него высшего образования; событие, состоящее в том, что станок может выйти из
строя, не является независимым от срока его эксплуатации; событие, состоящее в
том, что цена акций компании пошла вверх, не является независимым от того с
прибылью или с убытком сработала компания в прошлом периоде; и т. д. Таким образом, события А и В называются зависимыми, если вероятность
каждого из них зависит от того произошло или нет другое событие. Вероятность
события В, вычисленная в предположении,
что другое событие А уже
осуществилось, называется условной вероятностью. Вероятность произведения двух независимых событий А и В
равна произведению их вероятностей Р(А В) =
Р(А)Р(В), или (2.8) Р(А Ç В) = Р(А)Р(В). События А1, А2, ..., Аn (п > 2) называются независимыми в совокупности, если
вероятность каждого из них не зависит от того, произошли или нет любые события
из числа остальных. Распространим теоремы
умножения на случаи п независимых и
зависимых в совокупности событий. Вероятность совместного
появления нескольких событий, независимых в совокупности, равна произведению
вероятностей этих событий Р(А1·А2·А3·...·Аn)
= Р(А1)·Р(А2)·Р(А3)·...·Р(Аn). (2.9) Вероятность произведения двух зависимых событий А и В равна произведению вероятности одного из них на условную
вероятность другого
Вероятность события В при
условии появления события А
Вероятность совместного наступления конечного числа n зависимых событий
равна произведению вероятности одного из них на условные вероятности всех
остальных, причем условная вероятность каждого последующего события вычисляется
в предположении, что все предыдущие уже наступили
Если события А1 , А2 ,..., Аn — зависимые в совокупности, то вероятность наступления хотя бы одного
из них равна
Вероятность появления хотя бы одного события из п независимых в совокупности равна разности между 1 и произведением
вероятностей событий, противоположных данным,
Пример 6. Консультационная фирма претендует на 2 заказа от 2 крупных корпораций.
Эксперты фирмы считают, что вероятность получения консультационной работы в
корпорации А равна 0,45. Эксперты также полагают, что если фирма получит заказ
у корпорации А, то вероятность того, что и корпорация В обратится к ним, равна 0,9. Какова вероятность того, что
консультационная фирма получит оба заказа? Решение. Обозначим события: А — «Получение
консультационной работы в корпорации А»; В —
«Получение консультационной работы в корпорации В». События А и В — зависимые,
так как событие В зависит от того,
произойдет или нет событие А. По условию мы имеем Р(А) =
0,45, а также знаем, что Р(В/А) =
0,9. Необходимо найти вероятность
того, что оба события (и событие А, и событие В) произойдут, т.е. Р(АВ).
Для этого используем правило умножения вероятностей (2.10). Отсюда получим Р(АВ) = Р(А)Р(
B/А) = 0,45 · 0,9 = 0,405. Пример
7. В большой рекламной фирме 21% работников получают высокую заработную плату.
Известно также, что 40% работников фирмы — женщины, а 6,4% работников —
женщины, получающие высокую заработную плату. Можем ли мы утверждать, что на
фирме существует дискриминация женщин в оплате труда? Решение. Сформулируем условие этой задачи в терминах теории вероятностей. Для
ее решения необходимо ответить на вопрос: «Чему равняется вероятность того,
что случайно выбранный работник будет женщиной, имеющей высокую заработную
плату?» и сравнить ее с вероятностью того, что наудачу выбранный работник
любого пола имеет высокую зарплату. Обозначим события: А — «Случайно выбранный
работник имеет высокую зарплату»; В — «Случайно выбранный
работник — женщина». События А и В —
зависимые. По условию Р(АВ) = 0,064; Р(В)
= 0,40; Р(А) = 0,21. Нас интересует вероятность
того, что наудачу выбранный работник имеет высокую зарплату при условии, что
это женщина, т. е. — условная вероятность события А. Тогда,
используя теорему умножения вероятностей, получим Р(А/В) = Р(АВ)/Р(В) = 0,064/0,40 = 0,16. Поскольку Р(А/В) = 0,16 меньше, чем Р(А) = 0,21,
то мы можем заключить, что женщины, работающие в рекламной фирме, имеют меньше
шансов получить высокую заработную плату по сравнению с мужчинами. Пример 8. Студент пришел на экзамен, изучив только 20 из 25 вопросов программы.
Экзаменатор задал студенту 3 вопроса. Вычислить вероятность того, что студент
ответит: а) на все 3 вопроса; б) хотя бы на 1 вопрос. Решение. Обозначим события: А — «Студент знает все 3
вопроса»; А1 — «Студент
знает 1-й вопрос»; А2 — «Студент знает 2-й вопрос»; А3 — «Студент
знает 3-й вопрос». По условию Р(А1) = 20/25;
Р(А2/А1) = 19/24; Р(А3,/А2A1) = 18/23. 1) Искомое событие А состоит
в совместном наступлении событий А1, А2, А3. События А1, А2,
A3
— зависимые. Для решения задачи используем
правило умножения вероятностей конечного числа п зависимых событий (2.10): Р(А) = (20/25)(19/24)(18/23) = 57/115 = 0,496. Вероятность того, что
студент ответит на все 3 вопроса, равна 0,496. 2) Обозначим событие: В —
«Студент ответит хотя бы на один вопрос». Событие В состоит в том, что произойдет или событие А1, а
события А2 и А3 — не произойдут, или произойдет событие А2,
а события А1 и A3 — не произойдут, или
произойдет событие А3 , а события А1 и А2 — не
произойдут, или произойдут события А1 и А2 ,а событие A3 — не произойдет, или
произойдут события А1 и А3, а событие А2 — не
произойдет, или произойдут события А2 и А3 , а событие А1
— не произойдет, или произойдут все три ,события А1, А2, А3. Для решения этой задачи
можно было бы использовать правила сложения и умножения вероятностей. Однако
здесь проще применить правило для вероятности наступления хотя бы одного из n зависимых событий (2.13).
получим Р(В) = 1 - (5/25)(4/24)(3/23) = 229/230 = 0,9957. Вероятность того, что студент
ответит хотя бы на один вопрос, равна 0,9957. Пример 9. Вероятность того, что потребитель увидит рекламу определенного
продукта по телевидению, равна 0,04. Вероятность того, что потребитель увидит
рекламу того же продукта на рекламном стенде, равна 0,06. Предполагается, что
оба события — независимы. Чему равна вероятность того, что потребитель увидит:
а) обе рекламы; б) хотя бы одну рекламу? Решение. Обозначим события: А — «Потребитель увидит
рекламу по телевидению»; В — «Потребитель увидит рекламу
на стенде»; С —
«Потребитель увидит хотя бы одну рекламу». Это значит, что потребитель увидит
рекламу по телевидению, или на стенде,
или по телевидению и на стенде. По условию Р(А) = 0,04;
Р(В) = 0,06. События А и. В
— совместные и независимые. а) Поскольку вероятность
искомого события есть вероятность совместного наступления независимых событий А
и В (потребитель увидит рекламу и по телевидению и на стенде), т. е. их
пересечения, для решения задачи используем правило умножения вероятностей для
независимых событий. Отсюда Р(АВ) = Р(А) · Р(В) = 0,04 · 0,06 = 0,0024. Вероятность того, что
потребитель увидит обе рекламы, равна 0,0024. б) Так как
событие С состоит в совместном наступлении
событий А и В, искомая вероятность может быть найдена с помощью правила
сложения вероятностей. Р(С) = Р(А +
В) = Р(А) + Р(В) - Р(АВ) = = 0,04 + 0,06 - 0,0024 = 0,0976. Вместе с тем, при решении
этой задачи может быть использовано правило о вероятности наступления хотя бы
одного из п независимых событий. Учитывая, что
Вычисление вероятностей
событий такого типа характеризует эффективность рекламы, поскольку эта
вероятность может означать долю (процент) населения, охватываемого ею, и
отсюда следует оценка рекламных усилий. Задачи к теме 21. Анализ
работы кредитного отдела банка выявил, что 12% фирм, бравших кредит в банке,
обанкротились и не вернут кредиты по крайней мере в течение 5 лет. Также
известно, что обанкротились 20% кредитовавшихся в банке фирм. Если один из
клиентов банка обанкротился, то чему равна вероятность того, что он окажется
не в состоянии вернуть долг банку? 2. Модельер,
разрабатывающий новую коллекцию одежды к весеннему сезону, создает модели в
зеленой, черной и красной цветовой гамме. Вероятность того, что зеленый цвет
будет в моде весной, модельер оценивает в 0,3, что черный — в 0,2, а
вероятность того, что будет моден красный цвет — в 0,15. Предполагая, что цвета
выбираются независимо друг от друга, оцените вероятность того, что цветовое
решение коллекции будет удачным хотя бы по одному из выбранных цветов. 3. Вероятность того, что
потребитель увидит рекламу определенного продукта по каждому из 3 центральных
телевизионных каналов, равна 0,05. Предполагается, что эти события —
независимы в совокупности. Чему равна вероятность того, что потребитель
увидит рекламу: а) по всем 3 каналам; б) хотя бы по 1 из этих каналов? 4. Торговый агент предлагает
клиентам иллюстрированную книгу. Из предыдущего опыта ему известно, что в
среднем 1 из 65 клиентов, которым он предлагает книгу, покупает ее. В течение
некоторого промежутка времени он предложил книгу 20 клиентам. Чему равна
вероятность того, что он продаст им хотя бы 1 книгу? Прокомментируйте
предположения, которые вы использовали при решении задачи. 5. В налоговом управлении работает 120 сотрудников, занимающих
различные должности.
На профсоюзном собрании
женщины заявили о дискриминации при выдвижении на руководящие должности. Правы
ли они? 6. В фирме 550 работников,
380 из них имеют высшее образование, а 412 — среднее специальное образование, у
357 высшее и среднее специальное образование. Чему равна вероятность того, что
случайно выбранный работник имеет или среднее специальное, или высшее
образование, или и то и другое? 7. Финансовый аналитик предполагает, что если норма
(ставка) процента упадет за определенный период, то вероятность того, что рынок
акций будет расти в это же время, равна 0,80. Аналитик также считает, что
норма процента может упасть за этот же период с вероятностью 0,40. Используя
полученную информацию, определите вероятность того, что рынок акций будет
расти, а норма процента падать в течение обсуждаемого периода. 8. Вероятность для компании,
занимающейся строительством терминалов для аэропортов, получить контракт в
стране А равна 0,4, вероятность выиграть его в стране В равна 0,3. Вероятность того, что контракты будут заключены и в
стране А, и в стране В, равна 0,12.
Чему равна вероятность того, что компания получит контракт хотя бы в одной
стране? 9. Город имеет 3 независимых
резервных источника электроэнергии для использования в случае аварийного
отключения постоянного источника электроэнергии. Вероятность того, что любой из
3 резервных источников будет доступен при отключении постоянного источника,
составляет 0,8. Какова вероятность того, что не произойдет аварийное
отключение электроэнергии, если выйдет из строя постоянный источник? 10. Покупатель может
приобрести акции 2 компаний А и В. Надежность 1-й оценивается экспертами на
уровне 90%, а 2-й — 80%. Чему равна вероятность того, что: а) обе компании в
течение года не станут банкротами; б) наступит хотя бы одно банкротство? 11. Стандарт
заполнения счетов, установленный фирмой, предполагает, что не более 5% счетов
будут заполняться с ошибками. Время от времени компания проводит случайную
выборку счетов для проверки правильности их заполнения. Исходя из того, что
допустимый уровень ошибок — 5% и 10 счетов отобраны в случайном порядке, чему
равна вероятность того, что среди них нет ошибок? 12. На сахарном заводе один
из цехов производит рафинад. Контроль качества обнаружил, что 1 из 100
кусочков сахара разбит. Если вы случайным образом извлекаете 2 кусочка сахара,
чему равна вероятность того, что, по крайней мере, 1 из них будет разбит?
Предполагаем независимость событий, это предположение справедливо вследствие
случайности отбора. 13. Эксперты торговой
компании полагают, что покупатели, обладающие пластиковой карточкой этой
компании, дающей право на скидку, с 90%-й вероятностью обратятся за покупкой
определенного ассортимента товаров в ее магазины. Если это произойдет,
обладатель пластиковой карточки приобретет необходимый ему товар в магазинах
этой компании с вероятностью 0,8. Какова вероятность того, что обладатель
пластиковой карточки торговой компании приобретет необходимый ему товар в ее
магазинах? 14. Аудиторская фирма размещает рекламу в журнале
«Коммерсант». По оценкам фирмы 60% людей, читающих журнал, являются
потенциальными клиентами фирмы. Выборочный опрос читателей журнала показал
также, что 85% людей, которые читают журнал, помнят о рекламе фирмы, помещенной
в конце журнала. Оцените, чему равен процент людей, которые являются
потенциальными клиентами фирмы и могут вспомнить ее рекламу? 15. В городе 3 коммерческих
банка, оценка надежности которых — 0,95, 0,90 и 0,85 соответственно. В связи с
определением хозяйственных перспектив развития города администрацию интересуют
ответы на следующие вопросы: а) какова вероятность того, что в течение года
обанкротятся все 3 банка; б) что обанкротится хотя бы 1 банк? 16. О двух акциях А и В известно, что они выпущены одной и той же отраслью. Вероятность
того, что акция А поднимется завтра в цене, равна 0,2. Вероятность того, что
обе акции А и В поднимутся завтра в цене, равна 0,12. Предположим, что вы
знаете, что акция А поднимется в цене завтра. Чему равна вероятность того, что
и акция В завтра поднимется в цене? 17. Инвестор предполагает, что в следующем периоде
вероятность роста цены акций компании N будет
составлять 0,7, а компании М — 0,4.
Вероятность того, что цены поднимутся на те и другие акции, равна 0,28.
Вычислите вероятность их роста или компании N, или компании М, или обеих компаний вместе. 18. Крупная торговая компания занимается оптовой
продажей материалов для строительства и ремонта жилья и, имея список
покупателей в 3 регионах, основанный на ее собственной системе кодов,
рассылает им по почте каталог товаров. Менеджер компании полагает, что
вероятность того, что компания не получит откликов на разосланные предложения
ни из одного региона, равна 0,25. Чему в этом случае равна вероятность того,
что компания получит ответ хотя бы из одного региона? 19. Секрет увеличения доли
определенного товара на рынке состоит в привлечении новых потребителей и их
сохранении. Сохранение потребителей товара («brand loyalty»
— приверженность потребителя к данной марке или разновидности товара) — одна
из наиболее ответственных областей рыночных исследований. Производители нового
сорта духов знают, что вероятность того, что потребители сразу примут новый
продукт и создание «brand loyalty» потребует, по крайней
мере, 6 месяцев, равна 0,02. Производитель также знает, что вероятность того,
что случайно отобранный потребитель примет новый сорт, равна 0,05.
Предположим, потребитель только что приобрел новый сорт духов (изменил марку
товара). Чему равна вероятность того, что он сохранит свои предпочтения в
течение 6 месяцев? 20. Вероятность того, что покупатель, собирающийся
приобрести компьютер и пакет прикладных программ, приобретет только компьютер,
равна 0,15, только пакет программ — 0,1. Вероятность того, что будет куплен и
компьютер, и пакет программ, равна 0,05. Чему равна вероятность того, что будет
куплен или компьютер, или пакет программ, или компьютер и пакет программ
вместе? 3. ФОРМУЛЫ ПОЛНОЙ ВЕРОЯТНОСТИ И БАЙЕСАЧасто мы
начинаем анализ вероятностей, имея предварительные, априорные значения вероятностей интересующих нас событий. Затем из
источников информации, таких как выборка, отчет, опыт и т. д., мы получаем
дополнительную информацию об интересующем нас событии. Имея эту новую
информацию, мы можем уточнить, пересчитать значения априорных вероятностей.
Новые значения вероятностей для тех же интересующих нас событий будут уже апостериорными (послеопытными)
вероятностями. Теорема Байеса дает нам правило для вычисления таких
вероятностей. Последовательность процесса
переоценки вероятностей можно схематично изобразить так:
Пусть событие А может
осуществиться лишь вместе с одним из событий Н1, Н2, H3, ..., Hn,
образующих полную группу. Пусть известны вероятности Р(Н1), Р(Н2),
..., Р(Нi), ..., Р(Нn). Так как события Нi образуют полную группу, то
а также известны и условные вероятности события А:
Так как заранее неизвестно,
с каким из событий Нi произойдет
событие А, то события Нi,
называют гипотезами. Необходимо определить
вероятность события А и переоценить вероятности событий Нi с учетом полной информации о событии А. Вероятность события А
определяется как
Эта вероятность называется полной
вероятностью. Если событие А
может наступить только вместе с одним из событий Н1,Н2 ,Н3, ..., Нn, образующих полную группу
несовместных событий и называемых гипотезами, то вероятность события А равна
сумме произведений вероятностей каждого из событий Н1, Н2, ..., Нn на соответствующую условную вероятность события А. Условные вероятности гипотез
вычисляются по формуле
или
Это
— формулы Байеса (по имени английского математика Т.Байеса, опубликовавшего их
в 1764 г.), выражение в знаменателе — формула полной вероятности. Пример 1. Предприятие, производящее компьютеры, получает одинаковые ЧИПы от 2
поставщиков. 1-й поставляет 65% ЧИПов, 2-й — 35%. Известно, что качество
поставляемых ЧИПов разное. На основании предыдущих данных о рейтингах качества
составлена табл. 3.1. Таблица 3.1
Предприятие осуществляет
гарантийный ремонт компьютеров. Имея данные о числе компьютеров, поступающих на
гарантийный ремонт в связи с неисправностью ЧИПов, переоцените вероятности
того, что возвращенный для ремонта компьютер укомплектован ЧИПом: а) от 1-го
поставщика; б) от 2-го поставщика. Решение задач с
использованием формул полной вероятности и Байеса удобнее оформлять в виде
табл. 3.2. Таблица 3.2
Шаг 1.
В колонке 1 перечисляем события, которые задают априорную информацию в
контексте решаемой проблемы: Соб. Н1 — ЧИП от 1-го поставщика; Соб. Н2 — ЧИП от 2-го поставщика.
Это — гипотезы и они образуют полную группу независимых и несовместных
событий. В колонке 2 записываем
вероятности этих событий: Р(Н1)
= 0,65, Р(Н2) = 0,35. В колонке 3 определим
условные вероятности события А — «ЧИП бракованный» для каждой из гипотез. Шаг 2.
В колонке 4 находим вероятности для событий «ЧИП от 1-го поставщика и он бракованный» и «ЧИП от 2-го
поставщика и он бракованный». Они определяются по правилу умножения
вероятностей путем перемножения значений колонок 2 и 3. Поскольку
сформулированные события являются результатом пересечения двух событий А и Нi, то их вероятности называют совместными: Р(Нi
Ç А) = Р(Нi)Р(А/Нi). Шаг 3.
Суммируем вероятности в колонке 4 для того, чтобы найти вероятность события А.
В нашем примере 0,0130 — вероятность поставки некачественного ЧИПа от 1-го
поставщика, 0,0175 — вероятность поставки некачественного ЧИПа от 2-го поставщика.
Поскольку, как мы уже сказали выше, ЧИПы поступают только от 2 поставщиков, то
сумма вероятностей 0,0130 и 0,0175 показывает, что 0,0305 есть вероятность
бракованного ЧИПа в общей поставке, определяемая с помощью формулы (3.1)
Шаг 4.
В колонке 5 вычисляем апостериорные вероятности, используя формулу (3.2):
Заметим, что совместные
вероятности находятся в строках колонки 4, а вероятность события А как сумма
колонки 4 (табл. 3.3). Таблица 3.3
Пример 2. Экономист полагает, что вероятность роста стоимости акций некоторой
компании в следующем году будет равна 0,75, если экономика страны будет на
подъеме; и эта же вероятность будет равна 0,30, если экономика страны не будет
успешно развиваться. По его мнению, вероятность экономического подъема в новом
году равна 0,80. Используя предположения экономиста, оцените вероятность того,
что акции компании поднимутся в цене в
следующем году. Решение. Определим события: А — «Акции компании
поднимутся в цене в будущем году». Событие А может произойти
только вместе с одной из гипотез: Н1 — «Экономика страны будет
на подъеме»; Н2 —
«Экономика страны не будет успешно развиваться». По условию известны
вероятности гипотез: Р(Н1) = 0,80; Р(Н2) = 0,20 и условные
вероятности события А: Р(А/Н1)= 0,75; Р(А/Н2)=
0,30. Гипотезы образуют полную
группу, сумма их вероятностей равна 1. Рассмотрим событие А — это или Н1А,
или Н2А. События Н1А и Н2А — несовместные попарно, так как
события Н1 и Н2 — несовместны. События Н1 и А, Н2
и А — зависимые. Вышеизложенное
позволяет применить для определения искомой вероятности события А формулу полной вероятности Р(А) = Р(Н1)Р(А/Н1) + Р(Н2)Р(А/Н2)
= == 0,80 · 0,75 + 0,20 · 0,30 = 0,66. Решение оформим в виде табл. 3.4. Таблица 3.4
Вероятность того, что акции
компании поднимутся в цене в следующем году, составляет 0,66. Ответ. 0,66. Пример 3. Экономист полагает, что в течение периода активного экономического
роста американский доллар будет расти в цене с вероятностью 0,70, в период
умеренного экономического роста он подорожает с вероятностью 0,40 и при низких
темпах экономического роста доллар подорожает с вероятностью 0,20. В течение
любого периода времени вероятность активного экономического роста — 0,30; умеренного экономического
роста — 0,50 и низкого роста — 0,20. Предположим, что доллар дорожает в
течение текущего периода. Чему равна вероятность того, что анализируемый
период совпал с периодом активного экономического роста? Решение. Определим события: А
— «Доллар дорожает». Оно может произойти только вместе с одной из гипотез: Н1 — «Активный экономический
рост»; Н2 —
«Умеренный экономический рост»; Н3 —
«Низкий экономический рост». По условию известны доопытные (априорные) вероятности
гипотез и условные вероятности события А: Р(Н1)
= 0,30, Р(Н2) = 0,50, Р(Н3) = 0,20, Р(А/Н1) = 0,70, Р(А/Н2) = 0,40, Р(А/Н3)
= 0,20. Гипотезы образуют полную группу, сумма их вероятностей
равна 1. Событие А — это или Н1А,
или Н2А, или Н3А. События Н1А,
Н2А. и Н3А. — несовместные попарно, так как
события Н1, Н2 и Н3 — несовместны. События Н1 и А, Н2
и А, Н3 и А — зависимые. Требуется найти уточненную (послеопытную,
апостериорную) вероятность первой гипотезы, т. е. необходимо найти вероятность
активного экономического роста, при условии, что доллар дорожает (событие А
уже произошло), т. е. Р(Н1/А). Используя формулу Байеса (3.2) и подставляя заданные
значения вероятностей, имеем
Мы можем получить тот же результат с помощью табл.
3.5. Вероятность активного экономического роста, при
условии, что доллар дорожает, составляет 0,467. Таблица 3.5
Для более наглядного
восприятия решения нашей задачи мы можем также построить дерево решений:
Пример 4. В каждой из двух урн содержится 6 черных и 4 белых шара. Из 1-й урны
во 2-ю наудачу переложен один шар. а) Найти вероятность того, что шар, извлеченный из 2-й урны после перекладывания, окажется черным. б) Предположим, что шар,
извлеченный из 2-й урны после перекладывания, оказался черным. Какова тогда
вероятность того, что из 1-й урны во 2-ю
был переложен белый шар? Решение. Определим события: А — «Шар, извлеченный из 2-й
урны, черный». Оно может произойти только вместе с одной из гипотез: Н1 — «Из 1-й урны во 2-ю урну
переложили черный шар» и Н2
— «Из 1-й урны во 2-ю переложили белый шар». Используя классическое определение вероятности, найдем вероятности гипотезР(Н1)
= 6/10; Р(Н2) = 4/10 и условные вероятности события А. После перекладывания во 2-й
урне окажется 11 шаров. Если из 1-й урны во 2-ю переложили черный шар, то во
2-й урне окажется 7 черных и 4 белых шаров, тогда Р(А/Н1) =
7/11. Если из 1-й урны во 2-ю
переложили белый шар, то во 2-й урне окажется 6 черных и 5 белых шаров, тогда Р(А/Н2) =
6/11. Гипотезы образуют полную
группу, сумма их вероятностей равна 1. Рассмотрим событие А — это или Н1А, или Н2А. События Н1А и Н2А — несовместные попарно, так как события Н1 и Н2 — несовместны. События Н1 и А, Н2 и А — зависимые. 1. Вышеизложенное позволяет
применить для определения вероятности события А и ответа на 1-й вопрос формулу
полной вероятности (3.1) Р(А) = Р(Н1) Р(А/Н1) + Р(Н2) Р(А/Н2)= = 6/10 · 7/11 + 4/10 · 6/11 = 0,6. Это же решение можно оформить в виде табл.
3.6. Таблица 3.6
Вероятность того, что шар,
извлеченный из 2-й урны после перекладывания, окажется черным, составляет 0,6. 2. Во 2-й части задачи
предполагается, что событие А уже произошло, т. е. шар, извлеченный из 2-й
урны, оказался черным. Требуется найти уточненную (послеопытную, апостериорную)
вероятность 2-й гипотезы, т. е. необходимо определить вероятность того, что из
1-й урны во 2-ю был переложен белый шар при условии, что шар, извлеченный из
2-й урны после перекладывания, оказался черным: Р(Н2/А). Для определения искомой
вероятности воспользуемся формулой Байеса (3.2)
Мы можем получить тот же
результат с помощью табл. 3.7. Таблица 3.7
Вероятность того, что из 1-й
урны во 2-ю был переложен белый шар при условии, что шар, извлеченный из 2-й
урны после перекладывания, оказался черным, составляет 0,3636. Ответ.
а) 0,6; б) 0,3636. Задачи к теме 31. Директор компании имеет 2
списка с фамилиями претендентов на работу. В 1-м списке — фамилии 6 женщин и 3
мужчин. Во 2-м списке оказались 4 женщины и 7 мужчин. Фамилия одного из
претендентов случайно переносится из 1-го списка во 2-й. Затем фамилия одного
из претендентов случайно выбирается из 2-го списка. Если предположить, что эта
фамилия принадлежит мужчине, чему равна вероятность того, что из 1-го списка
была перенесена фамилия женщины? 2. Агент по недвижимости пытается продать участок
земли под застройку. Он полагает, что участок будет продан в течение ближайших
6 месяцев с вероятностью 0,9, если экономическая ситуация в регионе не будет
ухудшаться. Если же экономическая ситуация будет ухудшаться, то вероятность
продать участок составит 0,5. Экономист, консультирующий агента, полагает, что
с вероятностью, равной 0,7, экономическая ситуация в регионе в течение
следующих 6 месяцев будет ухудшаться. Чему равна вероятность того, что участок
будет продан в течение ближайших 6 месяцев? 3. Судоходная компания организует средиземноморские
круизы в течение летнего времени и проводит несколько круизов в сезон.
Поскольку в этом виде бизнеса очень высокая конкуренция, то важно, чтобы все
каюты зафрахтованного под круизы корабля были полностью заняты туристами, тогда
компания получит прибыль. Эксперт по туризму, нанятый компанией, предсказывает,
что вероятность того, что корабль будет полон в течение сезона, будет равна
0,92, если доллар не подорожает по отношению к рублю, и с вероятностью — 0,75,
если доллар подорожает. По оценкам экономистов, вероятность того, что в течение
сезона доллар подорожает по отношению к рублю, равна 0,23. Чему равна вероятность
того, что билеты на все круизы будут проданы? 4. В корпорации обсуждается
маркетинг нового продукта, выпускаемого на рынок. Исполнительный директор
корпорации желал бы, чтобы новый товар превосходил по своим характеристикам
соответствующие товары конкурирующих фирм. Основываясь на предварительных
оценках экспертов, он определяет вероятность того, что новый товар более высокого
качества по сравнению с аналогичными в 0,5, такого же качества — в 0,3, хуже по
качеству — в 0,2. Опрос рынка показал, что новый товар конкурентоспособен. Из
предыдущего опыта проведения опросов следует, что если товар действительно конкурентоспособный,
то предсказание такого же вывода имеет вероятность, равную 0,7. Если товар
такой же, как и аналогичные, то вероятность того, что опрос укажет на его
превосходство, равна 0,4. И если товар более низкого качества, то вероятность
того, что опрос укажет на его конкурентоспособность, равна 0,2. С учетом
результата опроса оцените вероятность того, что товар действительно более
высокого качества и, следовательно, обладает более высокой
конкурентоспособностью, чем аналогичные. 5. Сотрудники отдела
маркетинга полагают, что в ближайшее время ожидается рост спроса на продукцию
фирмы. Вероятность этого они оценивают
в 80%. Консультационная фирма, занимающаяся прогнозом рыночной ситуации, подтвердила предположение о
росте спроса. Положительные прогнозы консультационной фирмы сбываются с вероятностью
95%, а отрицательные — с вероятностью 99%. Какова вероятность того, что рост
спроса действительно произойдет? 6. Исследователь рынка
заинтересован в проведении интервью с супружескими парами для выяснения их
предпочтений к некоторым видам товаров. Он приходит по выбранному адресу,
попадает в трехквартирный дом и по надписям на почтовых ящиках выясняет, что в
1-й квартире живут 2 мужчин, во 2-й — супружеская пара, в 3-й — 2 женщины.
Когда исследователь поднимается по лестнице, то выясняется, что на дверях квартир
нет никаких указателей. Исследователь звонит в случайно выбранную дверь и на
его звонок выходит женщина. Предположим, что если бы он позвонил в дверь
квартиры, где живут 2 мужчин, то к двери мог подойти только мужчина; если бы
он позвонил в дверь квартиры, где живут только женщины, то к двери подошла бы
только женщина; если бы он позвонил в дверь супружеской пары, то мужчина или
женщина имели бы равные шансы подойти к двери. Имея эту информацию, оцените
вероятность того, что исследователь выбрал нужную ему дверь. 7. Среди студентов института
— 30% первокурсники, 35% студентов учатся на 2-м курсе, на 3-м и 4-м курсе их
20% и 15% соответственно. По данным деканатов известно, что на первом курсе
20% студентов сдали сессию только на отличные оценки, на 2-м — 30%, на 3-м —
35%, на 4-м — 40% отличников. Наудачу вызванный студент оказался отличником.
Чему равна вероятность того, что он (или она) — третьекурсник? 8. Отдел
менеджмента одного из супермаркетов разрабатывает новую кредитную политику с
целью снижения числа тех покупателей, которые, получая кредит, не выполняют
своих платежных обязательств. Менеджер по кредитам предлагает в будущем
отказывать в кредитной поддержке тем покупателям, которые на 2 недели и более
задерживают очередной взнос, тем более что примерно 90% таких покупателей
задерживают платежи, по крайней мере, на 2 месяца. Дополнительные исследования
показали, что 2% всех покупателей товаров в кредит не только задерживают
очередной взнос, но и вообще не выполняют своих обязательств, а 45% тех, кто
уже имеют 2-месячную задолженность по кредиту, уплатил очередной взнос в
данный момент. Учитывая все это, найти вероятность того, что покупатель,
имеющий 2-месячную задолженность, в действительности не выполнит своих
платежных обязательств по кредиту. Проанализировав полученные вероятности, критически
оцените новую кредитную политику, разработанную отделом менеджмента. 9. Из числа авиалиний
некоторого аэропорта 60% — местные, 30% — по СНГ и 10% — международные. Среди
пассажиров местных авиалиний 50% путешествуют по делам, связанным с бизнесом,
на линиях СНГ таких пассажиров 60%, на международных — 90%. Из прибывших в
аэропорт пассажиров случайно выбирается 1. Чему равна вероятность того, что
он: а) бизнесмен; б) прибыл из стран СНГ по делам бизнеса; в) прилетел местным
рейсом по делам бизнеса; г) прибывший международным рейсом бизнесмен? 10. Нефтеразведочная
экспедиция проводит исследования для определения вероятности наличия нефти на
месте предполагаемого бурения скважины. Исходя из результатов предыдущих
исследований, нефтеразведчики считают, что вероятность наличия нефти на
проверяемом участке равна 0,4. На завершающем этапе разведки проводится сейсмический
тест, который имеет определенную степень надежности: если на проверяемом участке
есть нефть, то тест укажет на ее наличие в 85% случаев; если нефти нет, то в
10% случаев тест может ошибочно указать на это. Сейсмический тест указал на
присутствие нефти. Чему равна вероятность того, что запасы нефти на данном
участке существуют реально? 11.
Экспортно-импортная фирма собирается заключить контракт на поставку
сельскохозяйственного оборудования в одну из развивающихся стран. Если
основной конкурент фирмы не станет одновременно претендовать на заключение
контракта, то вероятность получения контракта оценивается в 0,45; в противном
случае — в 0,25. По оценкам экспертов компании вероятность того, что конкурент
выдвинет свои предложения по заключению контракта, равна 0,40. Чему равна
вероятность заключения контракта? 12.
Транснациональная компания обсуждает возможности инвестиций в некоторое
государство с неустойчивой политической ситуацией. Менеджеры компании считают,
что успех предполагаемых инвестиций зависит, в частности, и от политического
климата в стране, в которую предполагается вливание инвестиционных средств.
Менеджеры оценивают вероятность успеха (в терминах годового дохода от субсидий
в течение 1-го года работы) в 0,55, если преобладающая политическая ситуация
будет благоприятной; в 0,30, если политическая ситуация будет нейтральной; в
0,10, если политическая ситуация в течение года будет неблагоприятной.
Менеджеры компании также полагают, что вероятности благоприятной, нейтральной и
неблагоприятной политических ситуаций соответственно равны: 0,60, 0,20 и
0,20. Чему равна вероятность успеха инвестиций? 13. Экономист-аналитик
условно подразделяет экономическую ситуацию в стране на «хорошую»,
«посредственную» и «плохую» и оценивает их вероятности для данного момента
времени в 0,15; 0,70 и 0,15 соответственно. Некоторый индекс экономического
состояния возрастает с вероятностью 0,60, когда ситуация «хорошая»; с
вероятностью 0,30, когда ситуация «посредственная», и с вероятностью 0,10,
когда ситуация «плохая». Пусть в настоящий момент индекс экономического
состояния возрос. Чему равна вероятность того, что экономика страны на
подъеме? 14. При слиянии акционерного
капитала 2 фирм аналитики фирмы, получающей контрольный пакет акций, полагают,
что сделка принесет успех с вероятностью, равной 0,65, если председатель совета
директоров поглощаемой фирмы выйдет в отставку; если он откажется, то
вероятность успеха будет равна 0,30. Предполагается, что вероятность ухода в
отставку председателя составляет 0,70. Чему равна вероятность успеха
сделки? 15. На химическом заводе установлена система
аварийной сигнализации. Когда возникает аварийная ситуация, звуковой сигнал
срабатывает с вероятностью 0,950. Звуковой сигнал может сработать случайно и
без аварийной ситуации с вероятностью 0,02. Реальная вероятность аварийной
ситуации равна 0,004. Предположим, что звуковой сигнал сработал. Чему равна
вероятность реальной аварийной ситуации? 16. Вероятность того, что клиент банка не вернет
заем в период экономического роста, равна 0,04, а в период экономического
кризиса — 0,13. Предположим, что вероятность того, что начнется период
экономического роста, равна 0,65. Чему равна вероятность того, что случайно
выбранный клиент банка не вернет полученный кредит? 17. Перед тем, как начать
маркетинг нового товара по всей стране, компании-производители часто проверяют
спрос на него по отзывам случайно выбранных потенциальных покупателей. Методы
проведения выборочных процедур уже проверены и имеют определенную степень
надежности. Для определенного товара известно, что вероятность его возможного
успеха на рынке составит 0,75, если товар действительно удачный, и 0,15, если
он неудачен. Из прошлого опыта известно, что новый товар может иметь успех на
рынке с вероятностью 0,60. Если новый товар прошел выборочную проверку, и ее результаты
указали на возможный его успех, то чему равна вероятность того, что это
действительно так? 18. 2 автомата производят
одинаковые детали, которые поступают на общий конвейер. Производительность 1-го
автомата вдвое больше производительности 2-го. 1-й автомат производит в
среднем 60% деталей отличного качества, а 2-й — 84% деталей отличного
качества. Наудачу взятая с конвейера деталь оказалась отличного качества.
Найти вероятность того, что эта деталь изготовлена: а) 1-м автоматом; б) 2-м
автоматом. 19. Исследованиями
психологов установлено, что мужчины и женщины по-разному реагируют на некоторые
жизненные обстоятельства. Результаты исследований показали, что 70% женщин
позитивно реагируют на изучаемый круг ситуаций, в то время как 40% мужчин
реагируют на них негативно. 15 женщин и 5 мужчин заполнили анкету, в которой
отразили свое отношение к предлагаемым ситуациям. Случайно извлеченная анкета
содержит негативную реакцию. Чему равна вероятность того, что ее заполнял
мужчина? 20. Вероятность того, что
новый товар будет пользоваться спросом на рынке, если конкурент не выпустит в
продажу аналогичный продукт, равна 0,67. Вероятность того, что товар будет
пользоваться спросом при наличии на рынке конкурирующего товара, равна 0,42.
Вероятность того, что конкурирующая фирма выпустит аналогичный товар на рынок в
течение интересующего нас периода, равна 0,35. Чему равна вероятность того,
что товар будет иметь успех? 4. ДИСКРЕТНЫЕ СЛУЧАЙНЫЕ ВЕЛИЧИНЫ4.1. Определение дискретной случайной величиныВеличина,
которая в результате испытания может принять то или иное значение, заранее
неизвестно, какое именно, считается случайной. Дискретной случайной величиной называется такая переменная величина,
которая может принимать конечную или бесконечную совокупность значений, причем
принятие ею каждого из значений есть случайное событие с определенной вероятностью. Соотношение, устанавливающее связь между отдельными возможными
значениями случайной величины и соответствующими им вероятностями, называется
законом распределения дискретной случайной величины. Если обозначить возможные
числовые значения случайной величины Х
через x1, x2, ..., xn...,
а через pi = Р(Х = хi) вероятность появления
значения xi, то дискретная случайная величина
полностью определяется табл. 4.1. Таблица 4.1
Здесь значения x1, x2, ..., xn записываются, как правило,
в порядке возрастания. Таблица называется законом
(рядом) распределения дискретной случайной величины X. Поскольку в его верхней строчке записаны все значения случайной
величины X, то нижняя обладает
следующим свойством:
Ряд распределения можно
изобразить графически (рис. 4.1).
Рис. 4.1 Если на рис.
4.1 по оси абсцисс отложить значения случайной величины, по оси ординат —
вероятности значений, полученные точки соединить отрезками прямой, то получим
многоугольник распределения вероятностей (полигон распределения). Дискретная случайная
величина может быть задана функцией
распределения. Функцией распределения случайной величины Х называется функция F(x), выражающая вероятность
того, что Х примет значение, меньшее
чем х:
Здесь для каждого значения х суммируются вероятности тех значений xi, которые лежат левее точки х. Функция F(x)
есть неубывающая функция. Для дискретных случайных величин функция
распределения F(x)
есть разрывная ступенчатая функция, непрерывная слева (рис. 4.2).
Вероятность попадания
случайной величины Х в промежуток
от a до b (включая a) выражается формулой Р(a £ Х < b) = F(b) - F(a).
(4.3) Одной из важных числовых
характеристик случайной величины Х
является математическое ожидание М(Х) = x1p1, + x2p2 +...+ x3p3. (4.4) В случае бесконечного
множества значений xi в
правой части (4.4) находится ряд, и мы будем рассматривать только те значения Х, для которых он абсолютно сходится. М(Х)
представляет собой среднее ожидаемое значение случайной величины. Оно обладает
следующими свойствами: 1) М(С) = С, где С = const; 2) М(СХ) = СМ(Х); 3) М(Х + Y) = М(Х) + М(Y), для любых Х и Y; 4) М(ХУ) = М(Х)М(У),
если Х и Y
независимы. (4.5) Для оценки степени рассеяния
значений случайной величины около ее среднего значения М(Х) = а вводятся понятия дисперсии D(X) и
среднего квадратического (стандартного) отклонения s(х). Дисперсией называется
математическое ожидание квадрата разности (Х
— а),
где а = М(Х); s (х) определяется как квадратный
корень из дисперсии, т. е.
Для вычисления дисперсии
пользуются формулой D(X) = М(Х2) - М2(Х). (4.6) Свойства дисперсии и среднего квадратического отклонения: 1) D(C) = 0, где С = const;
если Х и У независимы. Размерность величин М(Х) и s(Х) совпадает с размерностью
самой случайной величины X, а
размерность D(X) равна квадрату размерности
случайной величины X. 4.2. Математические операции над случайными величинамиПусть случайная величина Х принимает значения хi с вероятностями Р(Х = xi) =pi(i=
1, 2, ..., п), а случайная величина Y — значения уj с вероятностями Р(Y = у) =pj(j =
1, 2, ..., m). Произведение КХ
случайной величины Х на постоянную
величину K — это новая случайная
величина, которая с теми же вероятностями, что и случайная величина X, принимает значения, равные
произведениям на К значений случайной
величины X. Следовательно, закон ее
распределения имеет вид табл. 4.2. Таблица 4.2
Квадрат случайной величины (X 2)
— это новая случайная величина, которая с теми же вероятностями, что и
случайная величина X, принимает значения,
равные квадратам ее значений. Сумма
случайных величин Х и Y —
это новая случайная величина, принимающая все значения вида xi + уj, (i =
1, 2, .... п; j = 1, 2, ..., т) с вероятностями рij,
выражающими вероятность того, что случайная величина Х примет значение xi
,a Y — значение
yj, т. е. рij = Р(Х = xi; У = уj) = Р(Х = xi)РX=xi(Y = уi). (4.8) Если случайные величины Х и Y независимы, то
Аналогично определяются разность и произведение случайных величин Х и Y. . Разность случайных величин Х и Y —
это новая случайная величина, которая принимает все значения вида хi – уj, а
произведение — все значения вида хiуj с
вероятностями, определяемыми по формуле (4.8), а если случайные величины Х и Y независимы, то по (4.9). 4.3. Распределения Бернулли и ПуассонаРассмотрим
последовательность п идентичных
повторных испытаний, удовлетворяющих следующим условиям: 1) каждое испытание имеет 2
исхода, называемые успех и неуспех; это — взаимно несовместные и
противоположные события; 2) вероятность успеха — р — остается постоянной от испытания к
испытанию. Вероятность неуспеха — q; 3) все п испытаний — независимы. Это значит, что вероятность наступления
события в любом из п повторных
испытаний не зависит от результатов других испытаний. Вероятность того, что в п независимых повторных испытаниях, в
каждом из которых вероятность появления события равна р(0 < р < 1), событие наступит ровно т раз (в любой последовательности), равна
где q = 1— р. Выражение (4.10) называется
формулой Бернулли. Вероятности того, что
событие наступит: а) менее т раз; б)
более т раз; в) не менее т раз; г) не более т раз — находятся по формулам:
Биномиальным называют закон
распределения дискретной случайной величины Х
— числа появлений события в n
независимых испытаниях, в каждом из которых вероятность наступления события
равна р; вероятности возможных
значений Х = О, 1, 2, ..., т, ..., п
вычисляются по формуле Бернулли (табл.4.3). Таблица 4.3
Так как правая
часть формулы (4.10) представляет общий член биномиального разложения (q + р)n, то этот закон
распределения называют биномиальным.
Для случайной величины X, распределенной
по биномиальному закону, имеем М(Х) = np; (4.11) D(X) = npq. (4.12) Если число испытаний велико,
а вероятность появления события р в
каждом испытании очень мала, то вместо формулы (4.10) пользуются приближенной формулой
где т — число появлений события в п
независимых испытаниях; l = пр ( среднее число
появлений события в п испытаниях). Выражение (4.13) называется
формулой Пуассона. Придавая т целые
неотрицательные значения т = 0, 1, 2,
..., п, можно записать ряд распределения
вероятностей, вычисленных по формуле (4.13), который называется законом распределения Пуассона (табл.
4.4). Таблица 4.4
Распределение
Пуассона (приложение 3) часто используется, когда
мы имеем дело с числом событий, появляющихся в промежутке времени или пространства,
например: число машин, прибывших на автомойку в течение часа; число дефектов на
новом отрезке шоссе длиной в 10 км; число мест утечки воды на 100 км
водопровода; число остановок станков в неделю; число дорожных происшествий. Если распределение Пуассона
применяется вместо биномиального, то п
должно иметь порядок не менее нескольких десятков, лучше нескольких сотен, а пр
< 10. Математическое ожидание и
дисперсия случайной величины, распределенной по закону Пуассона, совпадают и
равны параметру l, который определяет этот закон, т. е. М(Х) = D(X) = l.
(4.14) 4.4. Гипергеометрическое распределениеПусть имеется множество N элементов, из которых М элементов обладают некоторым признаком
А. Извлекается случайным образом без возвращения п элементов. Требуется найти вероятность того, что из них т элементов обладают признаком А.
Искомая вероятность (зависящая от N, М, п, т) определяется по формуле
Полученный с помощью формулы
(4.15) ряд распределения называется гипергеометрическим
законом распределения (табл. 4.5). Таблица 4.5
Математическое ожидание и
дисперсия случайной величины т,
распределенной по гипергеометрическому закону, определяются формулами:
Пример 1. Известно, что в определенном городе 20% горожан предпочитают
добираться на работу личным автотранспортом. Случайно выбраны 4 человека. 1) Составьте ряд
распределения числа людей в выборке, предпочитающих добираться на работу личным
автотранспортом, и постройте его график. 2) Найдите числовые
характеристики этого распределения. 3) Напишите функцию
распределения числа людей в выборке, предпочитающих добираться на работу
личным автотранспортом, и постройте ее график. 4) Чему равна вероятность
того, что среди 4 случайно отобранных человек: а) не будет ни одного человека,
предпочитающего добираться на работу личным автотранспортом; б) окажется хотя
бы 1 человек, предпочитающий добираться на работу личным автотранспортом; в)
будет не больше 2, предпочитающих добираться на работу личным автотранспортом? Решение. В качестве случайной величины в данной задаче выступает число людей в
выборке, предпочитающих добираться на работу личным автотранспортом.
Обозначим ее через X. Перечислим все
возможные значения случайной величины X:
0, 1, 2, 3, 4. Вероятность того, что каждый
из отобранных людей предпочитает добираться на работу личным автотранспортом,
постоянна и равна 0,2 (р = 0,2). Вероятность противоположного события, т. е.
того, что каждый из отобранных людей предпочитает добираться на работу не
личным автотранспортом, а как-то иначе, также постоянна и составляет 0,8 (q= 1 - p=
10,2=0,8). Все 4 испытания —
независимы, т. е. вероятность того, что каждый из отобранных людей предпочитает
добираться на работу личным автотранспортом, не зависит от того, каким
способом предпочитает добираться на работу любой другой человек из числа
случайно отобранных. Очевидно, что случайная
величина Х подчиняется биномиальному
закону распределения вероятностей с параметрами n=4 и р = 0,2. Итак, по условию задачи: n = 4; р =
0,2; q = 0,8; X
= т. 1) Чтобы построить ряд
распределения, необходимо вычислить вероятности того, что случайная величина
примет каждое из своих возможных значений, и записать полученные результаты в
таблицу. Расчет искомых вероятностей
осуществляется по формуле Бернулли
Поставим в эту формулу
данные задачи.
Получим ряд распределения
числа людей в выборке, предпочитающих добираться на работу личным
автотранспортом (табл. 4.6). Таблица 4.6
Так как все возможные
значения случайной величины образуют полную группу событий, то сумма их
вероятностей должна быть равна 1. Проверка: 0,4096 + 0,4096 + 0,1536 + 0,0256 + + 0,0016 = 1. Вместо ряда распределения
дискретная случайная величина может быть задана графически многоугольником
(полигоном) распределения (рис. 4.3).
Рис. 4.3 2) Найдем
основные числовые характеристики распределения данной случайной величины:
математическое ожидание, дисперсию и среднее квадратическое (стандартное)
отклонение. Математическое ожидание
любой дискретной случайной величины может быть рассчитано по формуле (4.4)
Но, ввиду того, что в данном
случае речь идет о математическом ожидании частоты, для его расчета можно
воспользоваться более простой формулой (4.11) М(Х = т) = nр = 4
· 0,2 = 0,8 (чел.). Рассчитаем дисперсию числа
человек, предпочитающих добираться на работу личным автотранспортом, среди 4
отобранных. Дисперсия любой дискретной случайной величины может быть рассчитана
по формуле
В данном случае речь идет о
дисперсии частоты, а ее можно найти по формуле (4.12) D(X = т) = npq =
4 · 0,2 · 0,8 = 0,64 (чел.2). Рассчитаем среднее
квадратическое отклонение числа людей в выборке, предпочитающих добираться на
работу личным автотранспортом. Среднее квадратическое отклонение рассчитывается
по формуле
3)
Дискретную случайную величину можно задать функцией распределения
где для каждого значения х суммируются вероятности тех значений хi, которые лежат левее точки х. Зададим функцию
распределения дискретной случайной величины применительно к условию данной
задачи
Для построения графика
функции распределения вероятностей дискретной случайной величины необходимо
рассчитать кумулятивные (накопленные) вероятности, соответствующие значениям
случайной величины. Алгоритм их расчета вытекает из смысла функции
распределения F(Xi) = Р(Х1) + Р(Х2) + ... + Р(Хi-2) +
Р(Хi-1). Эта формула справедлива для
всех F(Xi), кроме F(X0). Так как функция
распределения определяет вероятность того, что случайная величина примет
значение, меньшее заданного, понятно, что вероятность того, что случайная
величина примет значение, не более минимального, равна 0, т. е. F(X0) = 0. Рассчитаем значения F(x)
Эти данные можно представить и в виде табл. 4.7. Таблица 4.7
График функции распределения вероятностей дискретной
случайной величины имеет ступенчатый вид. Скачки равны вероятностям, с которыми
случайная величина принимает возможные значения (рис. 4.4).
4) Определим вероятность
того, что среди 4 случайно отобранных человек: а) Не будет ни одного
человека, предпочитающего добираться на работу личным автотранспортом. Р(Х = 0) = 0,4096. Вероятность того, что среди
четырех случайно отобранных человек не будет ни одного, предпочитающего
добираться на работу личным автотранспортом, составляет 0,4096. б) Будет хотя бы 1 человек,
предпочитающий добираться на работу личным автотранспортом. «Хотя бы 1» —
«как минимум 1» — «1 или больше». Другими
словами, «хотя бы 1» — это «или 1, или 2, или 3, или 4». Исходя из этого, для
определения вероятности того, что среди 4 случайно
отобранных человек будет хотя бы 1, предпочитающий добираться на работу
личным автотранспортом, можно использовать теорему сложения вероятностей
несовместных событий: Р(Х ³ 1) = Р(Х
= 1) + Р(Х = 2) + Р(Х = 3) + Р(Х = 4); Р(Х ³ 1) = 0,4096 + 0,1536 +
0,0256 + 0,0016 = 0,5904. С другой стороны, все
возможные значения случайной величины образуют полную группу событий, а сумма
их вероятностей равна 1. По отношению к событию (X ³ 1) до полной группы событий
не хватает события (X = 0), которое
является противоположным событию (X £ 1). Поэтому искомую
вероятность того, среди 4 случайно отобранных человек будет хотя бы 1 человек,
предпочитающий добираться на работу личным автотранспортом, проще найти
следующим образом: Р(Х ³ 1) + Р(Х
< 1) = 1, откуда Р(Х ³ 1)=1 - Р(Х
= 0) = 1 - 0,4096 = 0,5904. Вероятность того, что среди
4 случайно отобранных человек будет хотя бы 1 человек, предпочитающий
добираться на работу личным автотранспортом, составляет 0,5904. в) Будет не больше 2,
предпочитающих добираться на работу личным автотранспортом. «Не больше 2» — «2 или
меньше», т. е. «или 0, или 1, или 2». Используем теорему сложения
вероятностей несовместных событий Р(Х £ 2) = Р(Х = 0)
+ Р(Х = 1) + Р(Х = 2); Р(Х £ 2) = 0,4096 + 0,4096 +
0,1536 = 0,9728. Вероятность того, что среди
4 случайно отобранных человек будет не больше 2, предпочитающих добираться на
работу личным автотранспортом, составляет 0,9728. Пример 2. Среднее число инкассаторов, прибывающих утром на автомобиле в банк в
15-минутный интервал, равно 2. Прибытие инкассаторов происходит случайно и
независимо друг от друга. 1) Составьте ряд
распределения числа инкассаторов, прибывающих утром на автомобиле в банк в
течение 15 мин. 2) Найдите числовые характеристики этого распределения. 3) Напишите функцию распределения числа инкассаторов,
прибывающих утром на автомобиле в банк в течение 15 мин, и постройте ее график. 4) Определите, чему равна вероятность того, что в
течение 15 мин в банк прибудут на автомобиле хотя бы 2 инкассатора. 5) Определите вероятность
того, что в течение 15 мин число прибывших инкассаторов окажется меньше 3. Решение. Пусть случайная величина Х —
число инкассаторов, прибывающих утром на автомобиле в банк в течение 15 мин.
Перечислим все возможные значения случайной величины X: 0, 1, 2, 3, 4, 5, ..., п. Это — дискретная случайная
величина, так как ее возможные значения отличаются друг от друга не менее чем
на 1, и множество ее возможных значений является счетным. По условию, прибытие
инкассаторов происходит случайно и независимо друг от друга. Следовательно, мы
имеем дело с независимыми испытаниями. Если мы предположим, что
вероятность прибытия инкассаторов на автомобиле одинакова в любые 2 периода
времени равной длины и что прибытие или неприбытие автомобиля в любой период
времени не зависит от прибытия или неприбытия в любой другой период времени, то
последовательность прибытия инкассаторов в банк может быть описана распределением
Пуассона. Итак, случайная величина Х — число инкассаторов, прибывающих
утром на автомобиле в течение 15 мин, подчиняется распределению Пуассона. По
условию задачи: l = пр = 2; Х = т. 1) Составим ряд
распределения. Вычислим вероятности того,
что случайная величина примет каждое из своих возможных значений, и запишем
полученные результаты в таблицу. Так как данная случайная
величина Х подчинена распределению
Пуассона, расчет искомых вероятностей осуществляется по формуле Пуассона
(4.13). Найдем по этой формуле
вероятность того, что в течение 15
мин утром на автомобиле прибудет 0 инкассаторов;
Однако расчет вероятностей
распределения Пуассона легче осуществлять, пользуясь специальными таблицами
вероятностей распределения Пуассона. В этих таблицах содержатся значения
вероятностей при заданных m
и l (приложение
6). По
условию l = 2, а т изменяется от 0 до n. Воспользовавшись таблицей
распределения Пуассона (приложение 3),
получим: Р(Х = 0) =
0,1353; Р(Х = 1) = 0,2707; Р(Х = 2) = 0,2707; Р(Х = 3) = 0,1804; Р(Х = 4) = 0,0902; Р(Х = 5) ==
0,0361; Р(Х = 6) = 0,0120; Р(Х = 7) = 0,0034; Р(Х = 8) = 0,0009; Р(Х = 9) = 0,0002. Данных для l=2 и m ³ 10в таблице нет, что указывает на то, что эти вероятности составляют
менее 0,0001, т. е. Р(Х = 10) » 0. Понятно, что Р(Х =11) еще меньше отличается от 0. Занесем полученные
результаты в табл. 4.8. Таблица 4.8
Так как все возможные
значения случайной величины образуют полную группу событий, сумма их
вероятностей должна быть равна 1. Проверим: -0,1353 + 0,2707 + 0,2707 +
0,1804 + 0,0902 + 0,0361 + + 0,0120 + 0,0034 + 0.0009 + 0,0002 = 0,9999 »1. График полученного ряда
распределения дискретной случайной величины Х
- полигон распределения вероятностей (рис. 4.5).
Рис. 4.5 2) Найдем основные числовые характеристики полученного
распределения случайной величины X. Можно
рассчитать математическое ожидание, дисперсию и среднее квадратическое
отклонение по общим для любой дискретной случайной величины формулам. Математическое ожидание
случайной величины, подчиняющейся распределению Пуассона, может быть рассчитано
и по формуле М(Х = т) = пр = l, М(Х = т) = l = 2 (инкассатора). Для выполнения дисперсии
случайной величины, подчиняющейся распределению Пуассона, можно применить
формулу D(X = т) = l. Итак, дисперсия числа
инкассаторов, прибывающих утром на автомобиле в течение 15 мин, D(X = т)
= l = 2
(инкассатора2). Среднее квадратическое
отклонение числа инкассаторов, прибывающих утром на автомобиле в течение 15
мин,
3) Зададим теперь дискретную
случайную величину в виде функции распределения
График функции вероятностей
дискретной случайной величины — полигон распределения вероятностей (рис. 4.6). Рассчитаем значения F(x):
Эти данные можно представить и в виде табл. 4.9. Таблица 4.9
4) Определим вероятность
того, что в течение 15 мин в банк прибудут хотя бы 2 инкассатора. «Хотя бы 2» — «как минимум
2» — «2 или больше». Другими словами, «хотя бы 2» — это «или 2, или 3, или 4,
или ...». Исходя из этого, для
определения вероятности того, что в течение 15 мин в банк прибудут хотя бы 2
инкассатора, можно использовать теорему сложения вероятностей несовместных
событий: Р(Х ³ 2) = Р(Х=2) + Р(Х=3) + Р(Х=4) + ... + Р(Х=n). С
другой стороны, все возможные значения случайной величины образуют полную
группу событий, а сумма их вероятностей равна 1. По отношению к событию (X ³ 2) до полной группы событий
не хватает события (X < 2), т. е. (х £ 1), которое является
противоположным событию (X ³ 2). Поэтому искомую вероятность того, что в
течение 15 мин в банк прибудут на автомобиле хотя бы 2 инкассатора, проще
найти следующим образом: Р(Х ³ 2) = 1 - Р(Х £ 1) = 1 - (Р(Х = 0) + Р(Х = 1)) = = 1 - (0,1353 + 0,2707) = 1 - 0,406 = 0,594. Вероятность того, что в
течение 15 мин в банк прибудут на автомобиле хотя бы 2 инкассатора, составляет
0,594. 5) Определим вероятность
того, что в течение 15 мин число прибывших инкассаторов окажется меньше 3. «Меньше 3» — это «или 0, или
1, или 2». Из теоремы сложения вероятностей несовместных событий следует: Р(Х < 3) = Р(Х = 0) + Р(Х = 1) + Р(Х =
2); Р(Х < 3) =
0,1353 + 0,2707 + 0,2707 – 0,6767. Вероятность того, что в
течение 15 мин в банк прибудут меньше 3 инкассаторов, составляет 0,6767. Пример 3. Из 20 лотерейных билетов выигрышными являются 4. Наудачу извлекаются
4 билета. 1)
Составьте ряд распределения числа выигрышных билетов среди отобранных. 2)
Найдите числовые характеристики этого распределения. 3)
Напишите функцию распределения числа выигрышных билетов среди отобранных и
постройте ее график. 4) Определите вероятность
того, что среди отобранных 4 билетов окажется: а) не меньше 3 выигрышных
билетов; б) не больше 1-го выигрышного билета. Решение. В качестве случайной величины в данной задаче выступает число
выигрышных билетов среди отобранных. Обозначим ее через X. Перечислим все возможные
значения случайной величины X: 0, 1, 2, 3, 4. Это — дискретная случайная
величина, так как ее возможные значения отличаются друг от друга не менее, чем
на 1, и множество ее возможных значений является счетным. Очевидно, что отбор лотерейных билетов — бесповторный.
Следовательно, испытания — зависимые. Вышеперечисленные признаки
указывают на то, что рассматриваемая случайная величина — число выигрышных
билетов среди отобранных — подчиняется гипергеометрическому закону распределения. Изобразим ситуацию на схеме (рис. 4.7).
Случайная величина,
интересующая нас, Х = т — число
выигрышных билетов в выборке объемом в п
билетов. Число всех возможных случаев отбора п билетов из общего числа N
билетов равно числу сочетаний из N по
п (СnN ), а
число случаев отбора т выигрышных
билетов из общего числа М выигрышных
билетов (и значит, (n-m) проигрышных
из общего числа (N — М)
проигрышных) равно произведению СmM · Сn-mN-M
(отбор каждого из т выигрышных
билетов может сочетаться с отбором любого из (n-m) проигрышных). Событие, вероятность которого мы хотим
определить, состоит в том, что в выборке из n лотерейных билетов окажется ровно m выигрышных. По формуле для расчета вероятности события в классической
модели вероятность получения в выборке m выигрышных билетов (т. е. вероятность того, что случайная величина Х примет значение m) равна
где
СnN — общее
число всех единственно возможных, равновозможных и несовместных исходов; СnM · Сn-mN-M— число исходов, благоприятствующих
наступлению интересующего нас события; m £ n, если n £ M
и m £ M, если М < п. Если по этой формуле
вычислить вероятности для всех возможных значений m и поместить их в таблицу, то получим ряд распределения. 1) Составим ряд распределения. Вычислим вероятности того,
что случайная величина примет каждое из своих возможных значений, и запишем
полученные результаты в таблицу. По условию задачи N = 20; М = 4; n = 4; m = 0, 1, 2, 3, 4.
Занесем полученные
результаты в табл. 4.10. Таблица 4.10
Произведем
проверку. Так как все возможные значения случайной величины образуют полную
группу событий, сумма их вероятностей должна быть равна 1. Проверка: 0,37564 + 0,46233 + 0,14861 + 0,01321 + 0,00021 = 1. График полученного
распределения вероятностей дискретной случайной величины — полигон
распределения вероятностей (рис. 4.8).
Рис. 4.8 2) Найдем
основные числовые характеристики распределения данной случайной величины. Можно рассчитать
математическое ожидание, дисперсию и среднее квадратическое отклонение по общим для любой дискретной
случайной величины формулам. Но математическое ожидание
случайной величины, подчиняющейся гипергеометрическому распределению, может
быть рассчитано по более простой формуле
Рассчитаем математическое
ожидание числа выигрышных билетов среди отобранных:
Дисперсию случайной
величины, подчиняющейся распределению, также можно рассчитать по более
простой формуле
Вычислим дисперсию числа
выигрышных билетов среди отобранных:
Рассчитаем среднее
квадратическое отклонение числа выигрышных билетов среди отобранных:
3) Зададим дискретную
случайную величину в виде функции распределения
Рассчитаем значения F(x):
Эти данные можно представить
в виде графика функции распределения (рис. 4.9) и табл. 4.11.
Таблица 4.11
4) Определим вероятность
того, что среди 4 отобранных билетов окажется: а) не меньше 3 выигрышных. «Не меньше 3» — «как минимум
3» — «3 или больше». Другими словами, «не меньше 3» — это «или 3,
или 4». Исходя из этого, для
определения вероятности того, что среди отобранных 4 билетов окажется не меньше
3 выигрышных билетов, можно применить теорему сложения вероятностей
несовместных событий: Р(Х ³ 3) = Р(Х = 3) + Р(Х = 4) ==
0,01321 + 0,00021 = 0,01342. Вероятность того, что среди
отобранных окажется не меньше 3 выигрышных билетов, составляет 0,01342. . б) не больше 1 выигрышного
билета. «Не больше 1» — это «1 или меньше», «или 0, или 1». Следовательно, для
определения вероятности того, что среди отобранных окажется не больше одного
выигрышного билета, также применяем теорему сложения вероятностей для
несовместных событий Р(Х £ 1) = Р(Х = 0) + Р(Х = 1) =
0,37564 + 0,46233 = 0,83797. Задачи к теме 41. В городе 10
коммерческих банков. У каждого риск банкротства в течение года составляет 10%.
Составьте ряд распределения числа банков, которые могут обанкротиться в течение
следующего года; постройте его график. Найдите числовые характеристики этого
распределения. Запишите в общем виде функцию распределения вероятностей и
постройте ее график. Чему равна вероятность того, что в течение года
обанкротятся не больше одного банка? 2. В лотерее
на 100 билетов разыгрываются две вещи, стоимости которых 210 и 60 у. е.
Составьте ряд распределения суммы выигрыша для лица, имеющего: а) один билет;
б) два билета. Стоимость билета — 3 у. е. Найдите числовые характеристики этих
распределений. Запишите в общем виде функции распределений вероятностей и
постройте их графики. 3. Нефтеразведывательная
компания получила финансирование для проведения 6 нефтеразработок. Вероятность
успешной нефтеразведки 0,05. Предположим, что нефтеразведку осуществляют
независимые друг от друга разведывательные партии. Составьте ряд распределения
числа успешных нефтеразведок. Найдите числовые характеристики этого
распределения. Запишите в общем виде функцию распределения вероятностей и
постройте ее график. Чему равна вероятность того, что как минимум 2
нефтеразведки принесут успех? 4. Под руководством бригадира производственного участка работают
3 мужчин и 4 женщины. Бригадиру необходимо выбрать двух рабочих для специальной
работы. Не желая оказывать кому-либо предпочтения, он решил выбрать двух
рабочих случайно. Составьте ряд распределения числа женщин в выборке. Найдите
числовые характеристики этого распределения. Запишите в общем виде функцию
распределения вероятностей и постройте ее график. Какова вероятность того, что
будет выбрано не более одной женщины? 5. Некоторый ресторан
славится хорошей кухней. Управляющий ресторана хвастает, что в субботний
вечер в течение получаса подходит до 9 групп посетителей. Составьте ряд
распределения возможного числа групп посетителей ресторана в течение получаса;
постройте его график. Найдите числовые характеристики этого распределения.
Запишите в общем виде функцию распределения вероятностей и постройте ее
график. Чему равна вероятность того, что 3 или более групп посетителей прибудут
в ресторан в течение 10-минутного промежутка времени? 6. Хорошим считается
руководитель, принимающий не менее 70% правильных решений. Такому
управляющему банком предстоит принять решения по 4 важным вопросам банковской
политики. Считая вероятность принятия правильного решения постоянной,
составьте ряд распределения возможного числа правильных решений управляющего;
постройте его график. Найдите числовые характеристики этого распределения.
Запишите в общем виде функцию распределения вероятностей и постройте ее график.
Чему равна вероятность того, что управляющий примет менее 3 правильных
решений? 7.
В банк поступило 30 авизо. Подозревают, что среди них 5 фальшивых. Тщательной
проверке подвергается 15 случайно выбранных авизо. Составьте ряд распределения
числа фальшивых авизо, которые могут быть выявлены в ходе проверки; постройте
его график. Найдите числовые характеристики этого распределения. Запишите в
общем виде функцию распределения вероятностей и постройте ее график. Чему равна
вероятность того, что в ходе проверки обнаружится менее 2 фальшивок? 8. В течение семестра
преподаватели проводят консультации по вопросам, которые остались неясными для
студентов. Преподаватель, проводящий консультации по статистике, заметил, что в
среднем 8 студентов посещают его за час консультационного времени, хотя
точное число студентов, посещающих консультацию в определенный день, в назначенный
час, — случайная величина. Составьте ряд распределения числа студентов,
посещающих консультации преподавателя по статистике в течение часа. Найдите
числовые характеристики этого распределения. Запишите в общем виде функцию
распределения вероятностей и постройте ее график. Чему равна вероятность того,
что 3 студента придут на консультацию в течение определенного получаса? 9. В ходе аудиторской
проверки строительной компании аудитор случайным образом отбирает 5 счетов. При условии, что 3%
счетов содержат ошибки, составьте ряд распределения правильных счетов.
Найдите числовые характеристики этого распределения. Запишите в общем виде
функцию распределения вероятностей и постройте ее график. Чему равна
вероятность того, что хотя бы 1 счет будет с ошибкой? 10. Записи страховой
компании показали, что 30% держателей страховых полисов старше 50 лет потребовали
возмещения страховых сумм. Для проверки в случайном порядке было отобрано 15
человек старше 50 лет, имеющих полисы. Составьте ряд распределения числа
предъявленных претензий. Найдите числовые характеристики этого распределения.
Запишите в общем виде функцию распределения вероятностей и постройте ее
график. Чему равна вероятность того, что, по крайней мере, 10 человек
потребуют возмещения страховых сумм? 11. Экзаменационный тест
содержит 15 вопросов, каждый из которых имеет 5 возможных ответов и только 1
из них верный. Предположим, что студент, который сдает экзамен, знает ответы не
на все вопросы. Составьте ряд распределения числа правильных ответов студента
на вопросы теста и постройте его график. Найдите числовые характеристики этого
распределения. Запишите функцию распределения вероятностей и постройте ее
график. Чему равна вероятность того, что студент правильно ответит, по крайней
мере, на 10 вопросов? 12. Для того чтобы проверить
точность своих финансовых счетов, компания регулярно пользуется услугами
аудиторов для проверки бухгалтерских проводок счетов. Предположим, что служащие
компании при обработке входящих счетов допускают примерно 5% ошибок.
Предположим, аудитор случайно отбирает 3 входящих документа. Составьте ряд
распределения числа ошибок, выявленных аудитором. Найдите числовые
характеристики этого распределения. Запишите функцию распределения вероятностей
и постройте ее график. Определите вероятность того, что аудитор обнаружит
более чем 1 ошибку. 13. В городе 10 машиностроительных предприятий, из
которых 6 — рентабельных и 4 — убыточных. Программой приватизации намечено
приватизировать 5 предприятий. При условии проведения приватизации в
случайном порядке составьте ряд распределения рентабельных предприятий, попавших
в число приватизируемых; постройте его график. Найдите числовые характеристики
этого распределения. Запишите функцию распределения вероятностей и постройте ее
график. Чему равна вероятность того, что будет приватизировано не менее 4
рентабельных предприятий? 14. В международном
аэропорту время прибытия самолетов различных рейсов высвечивается на
электронном табло. Появление информации о различных рейсах происходит случайно
и независимо друг от друга. В среднем в аэропорт прибывает 10 рейсов в час.
Составьте ряд распределения числа сообщений о прибытии самолетов в течение
часа. Найдите числовые характеристики этого распределения. Запишите функцию
распределения вероятностей и постройте ее график. Чему равна вероятность того,
что в течение часа прибудут не менее 3 самолетов? Чему равна вероятность того,
что в течение четверти часа не прибудет ни один самолет? 15. Телевизионный канал
рекламирует новый вид детского питания. Вероятность того, что телезритель
увидит эту рекламу, оценивается в 0,2. В случайном порядке выбраны 10
телезрителей. Составьте ряд распределения числа лиц, видевших рекламу. Найдите
числовые характеристики этого распределения. Запишите функцию распределения
вероятностей и постройте ее график. Чему равна вероятность того, что, по
крайней мере, 2 телезрителя этого канала видели рекламу нового детского питания? 16. В часы пик для
общественного транспорта города происходит в среднем 2 дорожных происшествия в
час. Утренний пик длится 1,5 ч, а вечерний — 2ч. Составьте ряды распределения
числа дорожных происшествий в утренние и вечерние часы пик и постройте их
графики. Найдите числовые характеристики этих распределений. Запишите функции
распределений вероятностей и постройте их графики. Чему равна вероятность того,
что в определенный день во время и утреннего, и вечернего пика не произойдет
ни одного дорожного происшествия? 17. В магазине имеется 15
автомобилей определенной марки. Среди них — 7 черного цвета, 6 — серого и 2 —
белого. Представители фирмы обратились в магазин с предложением о продаже им 3
автомобилей этой марки, безразлично какого цвета. Составьте ряд распределения
числа проданных автомобилей черного цвета при условии, что автомобили
отбирались случайно, и постройте его график. Найдите числовые характеристики
этого распределения. Напишите функцию распределения вероятностей и постройте
ее график. Какова вероятность того, что среди проданных фирме автомобилей
окажется, по крайней мере, 2 автомобиля черного цвета? 18. На предприятии 1000 единиц оборудования
определенного вида. Вероятность отказа единицы оборудования в течение часа
составляет 0,001. Составьте ряд распределения числа отказов оборудования в
течение часа. Найдите числовые характеристики этого распределения. Запишите в
общем виде функцию распределения вероятностей и постройте ее график. Чему
равна вероятность того, что в течение часа откажут как минимум 2 единицы оборудования? 19. Торговый агент в среднем контактирует с 8 потенциальными
покупателями в день. Из опыта ему известно, что вероятность того, что потенциальный
покупатель совершит покупку, равна 0,1. Составьте ряд распределения
ежедневного числа продаж для агента и постройте его график. Найдите числовые
характеристики этого распределения. Запишите в общем виде функцию
распределения вероятностей и постройте ее график. Чему равна вероятность того,
что у агента будут хотя бы 2 продажи в течение дня? 20. Прибытие посетителей в
банк подчиняется одному из теоретических законов распределения. Предполагая,
что в среднем в банк каждые 3 минуты входит 1 посетитель, составьте ряд
распределения возможного числа посетителей банка в течение 15 мин. Найдите
числовые характеристики этого распределения. Запишите в общем виде функцию
распределения вероятностей и постройте ее график. Определите вероятность того,
что, по крайней мере, 3 посетителя войдут в банк в течение 1 минуты? 5. НЕПРЕРЫВНЫЕ СЛУЧАЙНЫЕ ВЕЛИЧИНЫ5.1. Функция распределения и плотность распределения непрерывной случайной величиныНам уже
известно, что такое функция распределения дискретной случайной величины. Эта
форма задания закона распределения случайной величины является универсальной и
используется для непрерывных случайных величин. Случайная величина Х называется непрерывной, если ее функция
распределения непрерывна и имеет производную. Рассмотрим свойства функции
распределения. 1. Вероятность попадания
случайной величины в промежуток от a до b равна приращению функции
распределения на концах этого промежутка P(a<X<b)=F(b)-F(a), (5.1) так как вероятность любого
отдельного значения случайной величины равна нулю, если функция распределения
непрерывна при этом значении Р(Х = х1) =
0, когда F(x)
непрерывна в точке х = х1. 2.
Функция распределения удовлетворяет условиям F(-¥)= 0, F(+¥) = 1.
(5.2) Плотностью распределения (дифференциальной функцией) непрерывной
случайной величины называется функция f(x) = F'(x). (5.3) Плотность распределения любой случайной величины
неотрицательна f(x) ≥ 0. Несобственный интеграл от дифференциальной функции в пределах от -¥ до +¥ равен
1:
График функции у = f(x) называется кривой распределения или графиком плотности распределения. Кривая у = f(x)
располагается над осью абсцисс. Вероятность попадания
случайной величины в промежуток от a доb может быть вычислена по
формуле
Подынтегральное выражение f(x)dx называется элементом вероятности. Оно выражает вероятность попадания случайной
точки в промежуток между точками х и х + Dх, где Dх — бесконечно малая величина. Функция распределения F(x),
выражаемая через плотность f(x),
имеет вид
Математическое ожидание
непрерывной случайной величины Х
вычисляется по формуле
5.2. Нормальное распределениеЕсли плотность распределения
(дифференциальная функция) случайной переменной определяется как
то говорят, что Х имеет нормальное распределение с
параметрами а и s2.
Вероятностный смысл параметров а = М(Х), а s2 = D(X), где Х ~ N(а; s2). Если задать параметры
нормального распределения, взяв а=0 и s=1,то получим так называемое нормированное
(стандартное) нормальное распределение. Плотность нормированного нормального
распределения описывается функцией
Значения этой функции
табулированы (приложение 1). Для расчета вероятности
попадания нормально распределенной случайной величины Х в промежуток от a до b используется формула
где - интеграл Лапласа. Формула (5.10)
иногда в литературе называется интегральной теоремой Лапласа. Функция
Ф0(х) обладает свойствами:
Функция Ф0(х)
табулирована. В частности для симметричного относительно а промежутка (а - Δ; а + D) имеем
Формула (5.11) применима и к частоте т, поскольку ее закон распределения при
достаточно большом числе испытаний практически совпадает с нормальным.
Применительно к случайной величине т
с учетом ее числовых характеристик М(т) = пр и s2(m) = npq (5.12) формула (5.11) примет вид
Формула (5.11) может быть
применена и к относительной частоте т/п
с числовыми характеристиками
С вероятностью, очень
близкой к единице (равной 2Ф0(3) = 0,9973), нормально
распределенная случайная величина Х
удовлетворяет неравенству а- Зs<Х< а + Зs. (5.16) В этом состоит правило 3 сигм: если случайная величина
распределена по нормальному закону, то ее отклонение от математического
ожидания практически не превышает ±3s. Локальная теорема Муавра — Лапласа. При р¹0 и p¹1 и достаточно большом п биномиальное распределение близко к нормальному закону (причем
их математические ожидания и дисперсии совпадают), т. е. имеет место равенство:
тогда
для достаточно больших п. Здесь j(х) (приложение 1) — плотность вероятностей стандартной нормальной
случайной величины
Пример 1. На рынок поступила крупная партия говядины. Предполагается, что вес
туш — случайная величина, подчиняющаяся нормальному закону распределения с
математическим ожиданием а = 950 кг и средним квадратическим отклонением
σ = 150 кг. 1) Определите вероятность
того, что вес случайно отобранной туши: а) окажется больше 1 250 кг; б) окажется меньше 850 кг;
в) будет находиться между 800 и 1 300 кг; г) отклонится от математического
ожидания меньше, чем на 50 кг; д) отклонится от математического ожидания
больше, чем на 50 кг. 2) Найдите границы, в
которых отклонение веса случайно отобранной туши от своего математического
ожидания не превысит утроенного среднего квадратического отклонения
(проиллюстрируйте правило 3 сигм). 3) С вероятностью 0,899
определите границы, в которых будет находиться вес случайно отобранной туши.
Какова при этом условии максимальная величина отклонения веса случайно
отобранной туши от своего математического ожидания? Решение. 1а) Вероятность того, что вес случайно отобранной туши окажется больше
1 250 кг, можно понимать как вероятность того, что вес случайно отобранной туши
окажется в интервале от 1 250 кг до +¥.. Формула расчета вероятности
попадания в заданный интервал нормально распределенной случайной величины Х имеет вид
где
Ф0(z) — функция Лапласа
Функция Ф0(z) является
нечетной функцией, т. е. Ф0(-z)
= -Ф0(z). Найдем вероятность того, что
вес случайно отобранной туши окажется больше 1 250 кг. По условию a = 1
250, b = +¥, а = 950,
s = 150. Используем формулу расчета
вероятности попадания в заданный интервал нормально распределенной случайной
величины Х
Найдем
по таблице функции Лапласа (приложение 2)
значения Ф0(z) Значения Ф0(+¥) в таблице нет. Однако
известно, что Ф0(z)→ 0,5 при z→ +¥. Уже при z=5 Ф0 (z =5) = 0,49999997 » 0,5. Очевидно, что Ф0(+¥)— величина, бесконечно
близкая к 0,5 , Ф0(-¥.) — величина, бесконечно близкая к -0,5. По таблице функции Лапласа Ф0(2) = 0,47725. Отсюда Р(Х > 1 250) = 0,5 - 0,47725 = 0,02275. Итак, вероятность того, что
вес случайно отобранной туши окажется больше 1 250 кг, составляет 0,02275. Проиллюстрируем решение задачи графически (рис. 5.1).
Итак, нам
задана нормально распределенная случайная величина Х с математическим ожиданием а
= 950 кг и средним квадратическим отклонением s= 150 кг, т. е. Х ~ N (950; 1502). Мы хотим
найти вероятность того, что Х больше
1 250, т. е. определить Р(Х > 1
250). Преобразуем X в Z, и
тогда искомая вероятность определится по таблице стандартного нормального
распределения (приложение 2)
Точка z=0 соответствует математическому ожиданию, т. е. а = 950 кг. 1б) Вероятность того, что вес случайно отобранной туши окажется меньше
850 кг — это то же самое, что и вероятность того, что вес случайно отобранной
туши окажется в интервале от -¥ до 850 кг. По условию α = -¥, b = 850, а = 950, s= 150. Для расчета искомой вероятности используем формулу расчета вероятности
попадания в заданный интервал нормально распределенной случайной величины Х
Согласно свойству функции Лапласа,
Найдем
по таблице функции Лапласа (приложение
2) значения Ф0(z). Ф0(+¥) » 0,5; Ф0(0,67) = 0,24857. ОтсюдаР(Х < 850) = 0,5 - 0,24857 =
0,25143. Вероятность того, что вес
случайно отобранной туши окажется меньше 850 кг составляет 0,25143. Проиллюстрируем решение
задачи графически (рис. 5.2).
По условию данной задачи
точка на оси абсцисс (z = -0,67)
соответствует х = 850, т.е. весу,
равному 850 кг. Заштрихованная на рис. 5.2 площадь представляет вероятность
того, что вес наудачу выбранной туши окажется меньше 850 кг, т. е. в интервале
от -¥
до 850 кг. 1в) Найдем вероятность того,
что вес случайно отобранной туши окажется в интервале от 800 до 1 300 кг. По условию a = 800, b=1
300, а = 950, s = 150. Для расчета искомой
вероятности используем формулу расчета вероятности попадания в заданный
интервал нормально распределенной случайной величины Х
Согласно свойству функции Лапласа, -Ф0(-1) = Ф0(1). Найдем по таблице функции
Лапласа (приложение 2) значения Ф0(z) Ф0(2,33) = 0,49010; Ф0(1) = 0,34134. Отсюда Р(800 < Х < 1 300) =
0,49010 + 0,34134 = 0,83144. Вероятность
того, что вес случайно отобранной туши окажется в интервале от 800 до 1300 кг,
составляет 0,83144.
Проиллюстрируем
решение задачи графически (рис. 5.3). По условию данной задачи
точка на оси абсцисс (z = -1)
соответствует х = 800, т. е. весу,
равному 800 кг, а точка (z = 2,33) — х = 1300, т. е. весу, равному 1 300 кг.
Заштрихованная на рис. 5.3 площадь представляет собой вероятность того, что
вес наудачу выбранной туши окажется в интервале от 800 до 1 300 кг.
На рис. 5.3 видно, что искомую вероятность того, что вес наудачу
выбранной туши окажется в интервале от 800 до 1 300 кг, можно было найти
другим способом. Для этого необходимо было найти вероятность того, что вес
наудачу выбранной туши окажется меньше 800 кг, а также больше 1 300 кг. Полученные
вероятности сложить и вычесть из 1. Итак, вероятность того, что
вес наудачу выбранной туши окажется меньше 800 кг, — это вероятность того, что
вес случайно отобранной туши окажется в интервале от —¥ до 850 кг.
Вероятность того, что вес
случайно отобранной туши окажется больше 1 300 кг — это вероятность того, что
вес случайно отобранной туши окажется в интервале от 1 300 кг до +¥.
Отсюда искомая вероятность
того, что вес наудачу выбранной туши окажется в интервале от 800 до 1300 кг: Р(800 < Х < 1 300) = 1
- (Р(Х < 800) + Р(Х > 1 300)) = 1 - (0,15866 + 0,0099) = 1 - 0,16856 =
0,83144. 1г) Найдем вероятность того,
что вес случайно отобранной туши отклонится от математического ожидания меньше,
чем на 50 кг, т. е. Р(|Х - 950| < 50) = ? Что значит |Х - 950| < 50 ? Это неравенство можно
заменить двойным неравенством -50 < Х - 950 < 50, или 950 - 50 < X < 950 +
50, 900 < X < 1 000. Следовательно, Р(|Х - 950| < 50) = Р(900 < X
< 1 000). А
это вероятность попадания в заданный интервал нормально распределенной
случайной величины X. Отсюда
Согласно свойству функции Лапласа, -Ф0(-0,33) = Ф0(0,33). Найдем по таблице функции
Лапласа (приложение 2) значения Ф0(z) Ф0(0,33) = 0,1293. Следовательно, Р(|Х - 950| < 50) = Р(900 < Х
< 1 000) = 2·0,1293 = 0,2586. Вероятность того, что вес
случайно отобранной туши отклонится от математического ожидания меньше, чем на
50 кг, составляет 0,2586. Эту задачу легче решить,
используя формулу расчета вероятности заданного отклонения нормально
распределенной случайной величины Х
от своего математического ожидания
где
Δ — величина отклонения случайной величины Х от математического ожидания. По условию D = 50; а = 950, s= 150. Используя эту
формулу, сразу получим Р(|Х — 950| < 50) = 2Ф0(50/150) = 2Ф0(0,33) =
2 · 0,1293 = 0,2586. Проиллюстрируем решение
задачи графически (рис. 5.4).
По условию данной задачи
точка на оси абсцисс (z =
-0,33) соответствует х = 900, т. е.
весу, равному 900 кг, а точка (z = 0,33) соответствует х = 1000, т. е. весу, равному 1 000 кг.
Заштрихованная на рис. 5.4 площадь представляет собой вероятность того, что вес
наудачу выбранной туши окажется в интервале от 900 до 1 000 кг, т. е.
отклонится от математического ожидания меньше, чем на 50 кг. 1д) Найдем вероятность того,
что вес случайно отобранной туши отклонится от математического ожидания больше,
чем на 50 кг, т. е. Р(|Х - 950| > 50) = ? Это
вероятность события, противоположного по отношению к событию, — вес случайно
отобранной туши отклонится от математического ожидания меньше, чем на 50 кг,
Следовательно,
Вероятность того, что вес
случайно отобранной туши отклонится от математического ожидания больше, чем на
50 кг, составляет 0,7414. Можно использовать другой
алгоритм решения. Вероятность того, что
вес случайно отобранной туши отклонится от математического ожидания больше, чем
на 50 кг, — это вероятность того, что вес случайно отобранной туши будет или
меньше (950 - 50 = 900) кг, или больше (950 + 50 = 1 000) кг. По теореме сложения вероятностей несовместных событий
имеем
Отсюда
2) Найдем границы, в которых
отклонение веса случайно отобранной туши от своего математического ожидания не
превысит утроенного среднего квадратического отклонения. В этом задании студентам предлагается
проиллюстрировать правило 3 сигм,
которое можно сформулировать следующим образом: Если случайная величина
распределена по нормальному закону, то ее отклонение от математического
ожидания практически не превышает ±3s. Р(|Х - а| < 3s) = 2Ф0(3) =
0,9973. Вероятность того, что
отклонение нормально распределенной случайной величины Х от своего математического ожидания будет меньше 3s или, другими словами,
вероятность того, что нормально распределенная случайная величина Х попадет в
интервал (а - 3s; а + 3s), равна 0,9973. Следовательно, вероятность
того, что отклонение случайной величины от своего математического ожидания по
абсолютной величине превысит утроенное среднее квадратическое отклонение, очень
мала и равна 0,0027. Другими словами, лишь в 27 случаях из 10 000 случайная
величина Х в результате испытания
может оказаться вне интервала (а - 3s;а + 3s). Такие события считаются практически невозможными. Формулу, описывающую правило
3 сигм, несложно получить из формулы вероятности заданного отклонения
нормально распределенной случайной величины Х от своего математического ожидания:
Если взять D = 3s, то получим D/s = 3. Отсюда Р(|Х - а|< 3s) =
2Ф0(3) = 0,9973. По условию задачи а = 950; s = 150. Правило 3 сигм можно
представить так: Р(а - 3s < Х < а + 3s) = 2Ф0(3) = 0,9973. Интересующие нас границы —
это границы интервала (а - 3s; а + 3s), т. е.
Учитывая, что вес отобранной
туши — нормально распределенная случайная величина, можно быть практически
уверенным, что вес случайно отобранной туши не выйдет за пределы от 500 до 1
400 кг. 3) Определим границы, в
которых с вероятностью 0,899 будет находиться вес случайно отобранной
туши. Формулу вероятности заданного
отклонения нормально распределенной случайной величины Х от своего математического ожидания можно представить следующим
образом:
или
где g — вероятность того, что
отклонение нормально распределенной случайной величины Х от своего математического ожидания не превысит заданной величины
Δ. По условию задачи а = 950; s = 150. Используя последнюю
формулу, получим:
Из соотношения 2Ф0(D/150) = 0,899 найдем Δ
:
По таблице функции Лапласа (приложение
2) найдем, при каком z = D/150 функция Ф0(2) = 0,4495. z = 1,64, т.е. Ф0(1,64)
= 0,4495. Отсюда D/150 = 1,64, D = 1,64 · 150 = 246. С вероятностью 0,899 можно
ожидать, что отклонение веса случайно отобранной туши от своего
математического ожидания не превысит 246 кг. Найдем границы интересующего
нас интервала: а-D<Х<а+D, 950 - 246 < X < 950 +
246, 704 < X < 1196. С вероятностью 0,899 можно
ожидать, что вес случайно отобранной туши будет находиться в пределах от 704 до
1 196 кг. Ответ.
1. а) 0,02275, б) 0,25143, в) 0,83144, г) 0,2586, д) 0,7414; 2. (500, 1 400); 3.
246 (704, 1196). Пример 2. Изменим условие предыдущей
задачи. На рынок поступила крупная партия говядины. Предполагается, что вес туш
— случайная величина, подчиняющаяся нормальному закону распределения с
неизвестным математическим ожиданием и средним квадратическим отклонением s= 150 кг. Известно, что
37,07% туш имеют вес более 1 000 кг. Определите ожидаемый вес случайно
отобранной туши. Решение. По условию задачи s= 150; а = 1 000; β = +¥; Р(Х > 1 000) = 0,3707. Ожидаемый вес случайно
отобранной туши — это среднеожидаемый вес (математическое ожидание), т. е. а = ? Используем формулу (5.10)
расчета вероятности попадания в заданный интервал нормально распределенной
случайной величины Х
По таблице функции Лапласа (приложение 2) найдем, при каком z = (100 - а)/150 функция Ф0(z) = 0,1293. z = 0,33, т.е. Ф0(0,33) = 0,1293. Отсюда
1 000 - а = 0,33 · 150 = 50, а = 1 000 - 50 = 950. Ответ.
Среднеожидаемый вес случайно отобранной туши составляет 950 кг. Пример 3. Вновь изменим условие
задачи. На рынок поступила крупная партия говядины. Предполагается, что вес туш
— случайная величина, подчиняющаяся нормальному закону распределения с
математическим ожиданием а = 950 кг и
неизвестным средним квадратическим отклонением. Известно, что 15,87% туш имеют
вес менее 800 кг. Определите среднее квадратическое (стандартное) отклонение веса
туш. Решение. По условию задачи: а = 950; a = -¥; b= 800; Р(Х < 800) =
0,1587; s =
? Используем формулу (5.10)
расчета вероятности попадания в заданный интервал нормально распределенной
случайной величины Х
По таблице функции Лапласа (приложение 2) найдем, при каком z = 150/ σ функция Ф0(z)
= 0,3413. z = 1, т. е. Ф0(1) =
0.3413. Отсюда
Ответ.
Среднее квадратическое отклонение веса туш
составляет 150 кг. Пример 4. Еще раз изменим условие задачи. На рынок поступила крупная партия
говядины. Предполагается, что вес туш —
случайная величина, подчиняющаяся нормальному закону распределения с
неизвестными математическим ожиданием и средним квадратическим отклонением.
Известно, что 15,87% туш имеют вес менее 800 кг и 37,07% туш — более 1 000 кг.
Определите средний ожидаемый вес и среднее квадратическое (стандартное)
отклонение веса туш. Решение. По условию задачи α = -¥; b = 800; Р(Х < 800) = 0,1587; Р(Х
> 1000) = 0,3707; а = ?; s= ? Используем формулу (5.10)
расчета вероятности попадания в заданный интервал нормально распределенной
случайной величины Х
По таблице функции Лапласа (приложение 2) найдем, при каком z = (а - 800)/s функция Ф0(z) = =0,3413. z=1,т. e. Ф0(1)
= 0,3413. Отсюда
С другой стороны,
По таблице функции Лапласа (приложение 2) найдем, при каком
Отсюда
Решим систему линейных уравнений:
Среднеожидаемый вес случайно
отобранной туши составляет 950 кг. Среднее квадратическое отклонение веса туш —
150 кг. Ответ.
а = 950; s= 150. Пример 5. В очередной раз изменим условие задачи. На рынок поступила крупная
партия говядины. Предполагается, что вес туш — случайная величина,
подчиняющаяся нормальному закону распределения, с математическим ожиданием а = 950 кг и неизвестным средним
квадратическим отклонением. Каким должно быть среднее квадратическое
(стандартное) отклонение, чтобы с вероятностью 0,81648 можно было утверждать,
что абсолютное отклонение веса случайно отобранной туши от математического
ожидания не превысит 200 кг? Решение. По условию задачи а = 950;
Δ = 200; Р(|Х - 950| < 200) = 0,81648; σ =? Используем формулу (5.11) расчета вероятности заданного отклонения
нормально распределенной случайной величины Х
от своего математического ожидания. Тогда получим
По таблице функции Лапласа (приложение 2) найдем, при каком z =
200/s
функция Ф0(z) = 0,40824. z = 1,33, т. е. Ф0(1.33)
= 0,40824. Отсюда
s=200/1,33=150. Чтобы с вероятностью 0,81648
можно было утверждать, что абсолютное отклонение веса случайно отобранной
туши от математического ожидания не превысит 200 кг, среднее квадратическое
отклонение веса туш должно составлять 150 кг. Ответ.
150. Пример 6. Фирма собирается приобрести партию из 100 000 единиц некоторого
товара. Из прошлого опыта известно, что 1 % товаров данного типа имеют
дефекты. Какова вероятность того, что в данной партии окажется от 950 до 1 050
дефектных единиц товара? Решение. В качестве случайной величины в данной задаче выступает число
дефектных единиц товара в общей партии из 100 000 единиц. Обозначим ее через X. Перечислим все возможные значения
случайной величины X: 0, 1, 2, ..., 99 999, 100 000. Это — дискретная случайная
величина, так как ее возможные значения отличаются друг от друга не менее чем
на 1, и множество ее возможных значений является счетным. По условию вероятность того,
что единица товара окажется дефектной, — постоянна и составляет 0,01 (р = 0,01). Вероятность противоположного
события, т. е. того, что единица товара не имеет дефекта, также постоянна и
составляет 0,99: q= 1 -p= 1
-0,01 =0,99. Все 100 000 испытаний —
независимы, т. е. вероятность того, что каждая единица товара окажется
дефектной, не зависит от того, окажется дефектной или нет любая другая единица
товара. Значения случайной величины
Х — это, в общем виде, число появлений интересующего нас события в 100 000
независимых испытаниях. Поэтому можно сделать вывод о том, что случайная величина
Х — число дефектных единиц товара в общей партии из 100 000 единиц —
подчиняется биномиальному закону распределения вероятностей с параметрами п = 100 000 и р = 0,01. Итак, по условию задачи n = 100
000; р = 0,01; q = 0,99; X = т. Необходимо найти вероятность
того, что число дефектных единиц товара окажется в пределах от т1 = 950 до т2 =1 050, т.
е. вероятность того, что случайная величина Х
= т попадет в интервал от 950 до 1050: Р(т1 < т < т2) = ? Так как мы имеем дело со
случайной величиной, подчиняющейся биномиальному распределению, вероятность
появления события т раз в п независимых испытаниях необходимо
вычислять по формуле Бернулли (4.10). В данном случае для определения
искомой вероятности нам необходимо с помощью формулы Бернулли найти P100000,
950 ,РР100000, 951
, РР100000, 952 ..., РР100000,1049 РР100000,1050 ,а
затем сложить их, используя теорему сложения вероятностей несовместных событий. Очевидно, что такой способ
определения искомой вероятности связан с громоздкими вычислениями. Так,
Можно значительно облегчить
расчеты, если аппроксимировать биномиальное распределение нормальным, т. е.
выразить функции биномиального распределения через функции нормального. Когда п — число испытаний в биномиальном эксперименте — возрастает,
дискретное биномиальное распределение стремится к непрерывному нормальному
распределению. Это означает, что для больших п мы можем аппроксимировать биномиальные вероятности
вероятностями, полученными для нормально распределенной случайной величины,
имеющей такое же математическое ожидание и такое же среднее квадратическое
отклонение. Подставим параметры
биномиального распределения (5.15) в формулу (5.10) и получим формулу для
приближенного расчета вероятности появления события от т1 до т2
раз в п независимых испытаниях Р(т1 < т < т2):
где Ф0(z) — функция Лапласа
Формулу для вычисления
вероятности появления события от т1
до т2 раз в п независимых испытаниях Рn(m1
< т < т2) называют интегральной теоремой
Лапласа. Использование локальной и
интегральной теорем Лапласа дает приближенные значения искомых вероятностей.
Погрешность будет невелика при условии, что npq > 9. Для решения данной задачи
воспользуемся интегральной теоремой Лапласа:
По таблице функции Лапласа (приложение 2) найдем Ф0(1,59). Ф0(1,59) =
0,44408. P100000 (950< т < 1 050) » 2 · 0,44408 = 0,88816. Вероятность того, что в
партии из 100 000 единиц окажется от 950 до 1 050 дефектных единиц товара,
составляет 0,88816. Данную конкретную задачу
можно было решить еще более просто. Математическое ожидание
числа дефектных единиц товара равно 1
000 единиц: М(т) = пр= 100 000 · 0,01 = 1 000. Абсолютное отклонение нижней
и верхней границ интервала (т1, т2) от математического ожидания М(т)
= пр составляет 50 единиц: |m1 - пр|
= |950 - 100 000 · 0,0l| = 50; |m2 - np| =
1 050 - 100 000 · 0,0l| = 50. Следовательно, искомую
вероятность можно рассматривать как вероятность заданного отклонения частоты
от своего математического ожидания: Р(|т – пр| < Δ). Подставив параметры
биномиального распределения в формулу расчета вероятности заданного отклонения
нормально распределенной случайной величины от своего математического ожидания,
получим формулу для приближенного расчета вероятности заданного отклонения
частоты от своего математического ожидания:
При использовании этой формулы для решения задачи сразу
получим
Ответ.
0,88816. Пример
7. Подлежат исследованию 400 проб руды. Вероятность промышленного содержания металла
в каждой пробе для всех проб одинакова и равна 0,8. Найти вероятность того, что
доля проб с промышленным содержанием металла отклонится от вероятности
промышленного содержания металла в каждой пробе не более, чем на 0,05. Решение. В отличие от предыдущей задачи, в данном случае речь идет о расчете
вероятности заданного отклонения частости (относительной частоты) появления
события от вероятности его появления в отдельном независимом испытании, т. е.
При возрастании числа
независимых испытаний распределение частости стремится к нормальному
распределению точно так же, как и распределение частоты. Это означает, что при
больших п мы можем аппроксимировать
распределение частости нормальным распределением случайной величины, имеющей
такое же математическое ожидание и такое же среднее квадратическое отклонение. Подставив параметры
распределения частости в формулу расчета вероятности заданного отклонения
нормально распределенной случайной величины
от своего математического ожидания, получим формулу для приближенного
расчета вероятности заданного отклонения частости от своего математического
ожидания (вероятности). Параметры распределения
частости:
Используя эти формулы,
получим
Применим
данную формулу для решения задачи. По
условию: n
= 400; р = 0,8; q = 1 - 0,8 = 0,2;
Вероятность
того, что доля проб с промышленным содержанием металла отклонится от
вероятности промышленного содержания металла в каждой пробе не более, чем на
0,05, составляет 0,98758. Ответ.
0,98758. Задачи к теме 51. Дневная добыча угля в
некоторой шахте распределена по нормальному закону с математическим ожиданием
785 т и стандартным отклонением 60 т. Найдите вероятность того, что в определенный
день будут добыты, по крайней мере, 800 т угля. Определите долю рабочих дней, в
которые будет добыто от 750 до 850 т угля. Найдите вероятность того, что в
данный день добыча угля окажется ниже 665 т. 2. Кандидат на выборах
считает, что 20% избирателей в определенной области поддерживают его
избирательную платформу. Если 64 избирателя случайно отобраны из числа
избирателей данной области, найдите вероятность того, что отобранная доля
избирателей, поддерживающих кандидата, не будет отличаться по абсолютной
величине от истинной доли более, чем на 0,07. 3. Авиакомпания знает, что в
среднем 5% людей, делающих предварительный заказ на определенный рейс, не
будет его использовать. Если авиакомпания продала 160 билетов на самолет, в
котором лишь 155 мест, чему равна вероятность того, что место будет доступно
для любого пассажира, имеющего заказ и планирующего улететь? 4. Вес тропического
грейпфрута, выращенного в Краснодарском крае, — нормально распределенная
случайная величина с неизвестным математическим ожиданием и дисперсией, равной
0,04. Агрономы знают, что 65% фруктов весят меньше, чем 0,5 кг. Найдите ожидаемый вес случайно выбранного грейпфрута. 5. Один из методов,
позволяющих добиться успешных экономических прогнозов, состоит в применении
согласованных подходов к решению конкретной проблемы. Обычно прогнозом
занимается большое число аналитиков. Средний результат таких индивидуальных
прогнозов представляет собой общий согласованный прогноз. Пусть этот прогноз
относительно величины банковской процентной ставки в текущем году подчиняется
нормальному закону со средним значением а
= 9% и стандартным отклонением α=
2,6%. Из группы аналитиков случайным образом отбирается один человек. Найдите
вероятность того, что согласно прогнозу этого аналитика уровень процентной
ставки: а) превысит 11%; б) окажется менее 14%; в) будет в пределах от 12 до
15%. 6. Предположим, что в
течение года цена на акции некоторой компании есть случайная величина,
распределенная по нормальному закону с математическим ожиданием, равным 48 у.
е., и стандартным отклонением, равным 6. Определите вероятность того, что в
случайно выбранный день обсуждаемого периода цена за акцию была: а) более 60
у. е.; б) ниже 60 за акцию; в) выше 40 за акцию; г) между 40 и 50 у. е. за
акцию. 7. Для поступления в
некоторый университет необходимо успешно сдать вступительные экзамены. В
среднем их выдерживают лишь 25% абитуриентов. Предположим, что в приемную
комиссию поступило 1 889 заявлений. Чему равна вероятность того, что хотя бы
500 поступающих сдадут все экзамены (наберут проходной балл)? 8. Средний срок службы коробки
передач до капитального ремонта у автомобиля определенной марки составляет 56
мес. со стандартным отклонением σ = 16 мес. Привлекая покупателей,
производитель хочет дать гарантию на этот узел, обещая сделать бесплатно любое
число ремонтов коробки передач нового автомобиля в случае ее поломки до
определенного срока. Пусть срок службы коробки передач подчиняется нормальному
закону. На сколько месяцев в таком случае производитель должен дать гарантию
для этой детали, чтобы число бесплатных ремонтов не превышало 2,275% проданных
автомобилей? 9. При производстве
безалкогольных напитков специальный аппарат разливает определенное число унций
(1 унция == 28,3 г) напитка в стандартную емкость. Число разлитых унций
подчиняется нормальному закону с математическим ожиданием, зависящим от
настройки аппарата. Количество унций напитка, разлитых отдельным аппаратом,
имеет стандартное отклонение s = 0,4 унции. Пусть емкости объемом в 8 унций наполняются кока-колой.
Сколько унций напитка должен в среднем разливать аппарат, чтобы не более 5%
емкостей оказалось переполненными? 10. Фирма, занимающаяся продажей товаров по
каталогу, ежемесячно получает по почте заказы. Число этих заказов есть
нормально распределенная случайная величина со средним квадратическим
отклонением s = 560 и неизвестным
математическим ожиданием. В 90% случаев число ежемесячных заказов превышает 12
439. Найдите ожидаемое среднее число заказов, получаемых фирмой за месяц. 11. Еженедельный выпуск
продукции на заводе приблизительно распределен по нормальному закону со средним
значением, равным 134 786 ед. продукции в неделю, и стандартным отклонением
— 13000 ед. Найдите вероятность
того, что еженедельный выпуск продукции: а) превысит 150000 ед.; б) окажется
ниже 100 000 ед. в данную неделю; в) предположим, что возникли трудовые споры,
и недельный выпуск продукции стал ниже 80 000 ед. Менеджеры обвиняют профсоюз в
беспрецедентном падении выпуска продукции, а профсоюз утверждает, что выпуск
продукции находится в пределах принятого уровня (±3s). Можно ли доверять профсоюзу? 12. Почтовое отделение
быстро оценивает объем переводов в рублях, взвешивая почту, полученную утром
каждого текущего рабочего дня. Установлено, что если вес почтовых отправлений
составляет N кг, то объем переводов в
рублях есть случайная величина, распределенная по нормальному закону со средним
значением 160N и стандартным отклонением 20N кг. Найдите вероятность того, что в день, когда вес почтовых
отправлений составит 150 кг, объем переводов в рублях будет находиться в
пределах: а) от 21 000 до 27 000 руб.; б) более 28 500 руб.; в) менее 22 000
руб. 13. Менеджер ресторана по
опыту знает, что 70% людей, сделавших заказ на вечер, придут в ресторан
поужинать. В один из вечеров менеджер решил принять 20 заказов, хотя в
ресторане было лишь 15 свободных столиков. Чему равна вероятность того, что
более 15 посетителей придут на заказанные места? 14. Процент протеина в пакете с сухим кормом для
собак — нормально распределенная случайная величина с математическим ожиданием
11,2% и стандартным отклонением 0,6%. Производителям корма необходимо, чтобы в
99% продаваемого корма доля протеина составляла не меньше х1 %, но не более х2%.
Найдите х1 и х2. 15. Вес товаров, помещаемых
в контейнер определенного размера, — нормально распределенная случайная
величина. Известно, что 65% контейнеров имеют чистый вес больше чем 4,9 т и
25% — имеют вес меньше чем 4,2 т. Найдите ожидаемый средний вес и среднее
квадратическое отклонение чистого веса контейнера. 16. Отклонение стрелки компаса из-за влияния магнитного
поля в определенной области Заполярья есть случайная величина Х ~ (0; 12). Чему равна
вероятность того, что абсолютная величина отклонения в определенный момент
времени будет больше чем 2,4? 17. Компания А покупает у компании В детали к контрольным приборам. Каждая
деталь имеет точно установленное значение размера. Деталь, размер которой
отличается от установленного размера более чем на ±0,25 мм, считается
дефектной. Компания А требует от компании В, чтобы доля брака не превышала 1%
деталей. Если компания В выполняет
требование компании А, то каким должно быть допустимое максимальное стандартное
отклонение размеров деталей? Учесть, что размер деталей есть случайная
величина, распределенная по нормальному закону. 18. Компьютерная система содержит
45 одинаковых микроэлементов. Вероятность того, что любой микроэлемент будет
работать в заданное время, равна 0,80. Для выполнения некоторой операции
требуется, чтобы по крайней мере 30 микроэлементов было в рабочем состоянии.
Чему равна вероятность того, что операция будет выполнена успешно? 19. Технический отдел
компании, производящей автопокрышки, планирует выпустить несколько
экспериментальных партий покрышек и проверить степень их износа на тестирующем
оборудовании. С этой целью предполагается увеличивать количество каучука в
покрышках каждой последующей партии до тех пор, пока срок службы покрышек
окажется приемлемым. Эксперимент показал, что стандартное отклонение срока
службы покрышек фактически остается постоянным от партии к партии и составляет
2 500 миль ( s = 2 500). Если компания хочет, чтобы 80% выпускаемых автопокрышек
имели срок службы не менее 25 000 миль, то какой наименьший средний срок службы
автопокрышек должен быть заложен в расчетах технического отдела? Считать срок
службы автопокрышек нормально распределенным. 20. Менеджер
торгово-посреднической фирмы получает жалобы от некоторых клиентов на то, что
служащие фирмы затрачивают слишком много времени на выполнение их заказов.
Собрав и проанализировав соответствующую информацию, он выяснил, что среднее
время выполнения заказа составляет 6,6 дн., однако для выполнения 20% заказов
потребовалось 15 дн. и более. Учитывая, что время выполнения заказа есть
случайная величина, распределенная по нормальному закону, определите фактическое
стандартное отклонение времени обслуживания клиентов. 6. ВАРИАЦИОННЫЕ РЯДЫ И ИХ ХАРАКТЕРИСТИКИ
6.1. Понятие вариационного ряда. Виды вариационных рядов Прежде чем приступить к
рассмотрению вариационных рядов дадим определение другим понятиям, используемым
в статистике. Так, совокупность
предметов или явлений, объединенных каким-либо общим признаком или свойством
качественного или количественного характера, называется объектом наблюдения. Всякий объект
статистического наблюдения состоит из отдельных элементов — единиц наблюдения. Результаты статистического
наблюдения представляют собой числовую информацию — данные. Статистические данные — это сведения о том, какие значения
принял интересующий исследователя признак в статистической совокупности. Признаки
бывают количественными и качественными. Количественным называется признак, значения которого выражаются
числами. Качественным называется признак, характеризующийся некоторым свойством
или состоянием элементов совокупности. Статистическая совокупность называется генеральной, если исследованию
подлежат все элементы совокупности (сплошное наблюдение). Часть элементов генеральной совокупности, подлежащая исследованию,
называется выборочной совокупностью (выборкой). Она извлекается из генеральной
совокупности случайно, так чтобы каждый из п
элементов выборки имел равные шансы быть отобранным. Значения признака, которые при переходе от одного элемента
совокупности к другому изменяются (варьируют), называются вариантами и обычно обозначаются малыми
латинскими буквами х, у,z. Порядковый номер варианта (значения признака) называется рангом: х1 — 1-й
вариант (1-е значение признака), х2 — 2-й вариант (2-е значение признака),
хi— i-й вариант (i-e значение признака). Ряд значений признака (вариантов), расположенных в порядке возрастания
или убывания с соответствующими им весами, называется вариационным рядом
(рядом распределения). В качестве весов выступают частоты или частости. Частота (т) показывает, сколько раз встречается тот или иной вариант (значение
признака) в статистической совокупности. Частость или относительная частота (ωi)
показывает, какая часть единиц совокупности имеет тот или иной вариант.
Частость рассчитывается как отношение частоты того или иного варианта к сумме
всех частот ряда
Сумма всех частостей равна 1
Вариационные ряды бывают
дискретными и интервальными. Дискретные вариационные ряды строят обычно в том случае, .если значения
изучаемого признака могут отличаться друг от друга не менее чем на некоторую
конечную величину. В дискретных вариационных рядах задаются точечные значения
признака. Общий вид дискретного вариационного ряда показан в табл. 6.1,
где i = 1, 2, ..., k. Таблица 6.1
Интервальные вариационные ряды строят обычно в том случае, если значения
изучаемого признака могут отличаться друг от друга на сколь угодно малую
величину. Значения признака в них задаются в виде интервалов. Общий вид
интервального вариационного ряда показан в табл. 6.2, где i= 1, 2, ..., l. Таблица 6.2
В интервальных вариационных
рядах в каждом интервале выделяют верхнюю и нижнюю границы. Разность между верхней и нижней границами
интервала называется интервальной разностью или длиной (величиной) интервала. Величина 1-го интервала k1 определяется по формуле k1 = a2 - а1; 2-го — k2= а3- a2
последнего: k1=ai-ai-1 В общем виде интервальную разность ki представим как ki=xi(max)-xi(min) (6.3) Если интервал имеет обе
границы, то его называют закрытым. Первый и последний интервалы
могут быть открытыми, т. е. иметь
только одну границу. Например, 1-й интервал может быть задан как «до 100», 2-й
— «100-110», .... предпоследний — «190-200», последний — «200 и более».
Очевидно, что 1-й интервал не имеет нижней границы, а последний — верхней, оба
они — открытые. Часто открытые интервалы
приходится условно закрывать. Обычно для этого величину 1-го интервала
принимают равной величине 2-го, а величину последнего — величине
предпоследнего. В нашем примере величина 2-го интервала равна 110 - 100 = 10,
следовательно, нижняя граница 1-го условно составит 100 - 10 = 90; величина
предпоследнего равна 200 - 190 = 10,
значит, верхняя граница последнего условно составит 200 + 10 = 210. Кроме этого в интервальном
вариационном ряде могут встречаться интервалы разной длины. Если интервалы в вариационном ряде имеют одинаковую длину
(интервальную разность), их называют равновеликими, в противном случае — неравновеликими. При построении интервального
вариационного ряда часто встает проблема выбора величины интервалов
(интервальной разности). Для определения оптимальной величины интервалов (в том
случае,если строится ряд с равными интервалами) применяют формулу Стэрджесса
где п — число единиц совокупности; хmax и xmin наибольшее и наименьшее
значения вариантов ряда. Для характеристики
вариационного ряда наряду с частотами и частостями используются накопленные
частоты и частости. Накопленные частоты (частости) показывают, сколько единиц
совокупности (какая их часть) не превышают заданного значения (варианта) х. Их можно рассчитать по
данным дискретного ряда, пользуясь формулой vi = тi + тi-1 +...+ т1. (6.5) Для интервального
вариационного ряда — это сумма частот (частостей) всех интервалов, не
превышающих данный. Дискретный вариационный ряд
графически можно представить с помощью полигона
распределения частот или частостей (рис.6.1).
Интервальные вариационные
ряды графически можно представить с помощью гистограммы,
т. е, столбчатой диаграммы (рис. 6.2).
При ее построении по оси
абсцисс откладываются значения изучаемого признака (границы интервалов). В том
случае, если интервалы одинаковой величины, по оси ординат можно откладывать
частоты или частости. Если же интервалы имеют разную величину, по оси ординат
необходимо откладывать значения абсолютной или относительной плотности
распределения. Абсолютная плотность —
отношение частости интервала к его величине:
где f(a)i — абсолютная плотность i-го интервала; mi — его частота; ki—
величина (интервальная разность). Абсолютная плотность
показывает, сколько единиц совокупности приходится на единицу интервала. Относительная плотность — отношение частости интервала к его величине:
где f(0).
— относительная плотность i-го интервала; wi —
его частость. Относительная плотность
показывает, какая часть единиц совокупности приходится на единицу интервала. И дискретные, и интервальные
вариационные ряды графически можно представить в виде кумуляты и огивы. При
построении первой по данным дискретного ряда по оси абсцисс откладываются
значения признака (варианты), а по оси ординат — накопленные частоты или
частости. На пересечении значений признака (вариантов) и соответствующих им
накопленных частот (частостей) строятся точки, которые в свою очередь
соединяются отрезками или кривой. Получающаяся таким образом ломаная (кривая)
называется кумулятой (кумулятивной
кривой). Абсциссами ее точек являются верхние границы интервалов. Ординаты образуют
накопленные частоты (частости) соответствующих интервалов. Часто добавляют еще
одну точку, абсциссой которой является нижняя граница первого интервала, а
ордината равна нулю. Соединяя точки отрезками или кривой, получаем кумуляту. Огива
строится аналогично кумуляте с той лишь разницей, что на оси абсцисс наносятся
точки, соответствующие накопленным частотам (частостям), а по оси ординат —
значения признака (варианты). 6.2. Числовые характеристики вариационного рядаОдной из
основных числовых характеристик ряда распределения (вариационного ряда)
является средняя арифметическая. Существует две формулы
расчета средней арифметической: простая
и взвешенная. Простую среднюю
арифметическую обычно используют, когда данные наблюдения не сведены в
вариационный ряд либо все частоты равны единице или одинаковы
где хi — i-e значение признака; п — объем ряда (число наблюдений; число
значений признака). Если частоты отличны друг от
друга, расчет производится по формуле средней
арифметической взвешенной
где хi — i-e значение признака; тi — частота i-го значения признака; k —
число его значений (вариантов). При расчете средней
арифметической в качестве весов могут выступать и частости, тогда формула
расчета средней арифметической взвешенной примет следующий вид:
где хi
— i-e значение признака; ωi — частость i-го
значения признака; k — число его
значений (вариантов). Колеблемость изучаемого
признака можно охарактеризовать с помощью различных показателей вариации. К числу основных показателей вариации
относятся: дисперсия, среднее квадратическое отклонение, коэффициент вариации. Дисперсию можно рассчитать по простой и взвешенной формулам, имеющим вид
Среднее квадратическое
отклонение рассчитывается по формуле
Коэффициент вариации
определяется формулой
Пример 1. При обследовании 50 членов семей рабочих и служащих установлено
следующее количество членов семьи: 5;3;2;1;4;6;3;7;9;1;3;2;5; 6; 8; 2; 5; 2; 3; 6; 8; 3;
4; 4; 5; 6; 5; 4; 7; 5; 6; 4; 8; 7; 4; 5; 7; 8; 6; 5; 7; 5; 6;
6; 7; 3; 4; 6; 5; 4. 1)
Составьте
вариационный ряд распределения частот. 2) Постройте полигон
распределения частот, кумуляту. 3) Определите средний размер
(среднее число членов) семьи. 4) Охарактеризуйте
колеблемость размера семьи с помощью показателей вариации (дисперсии, среднего
квадратического отклонения, коэффициента вариации). Объясните полученные
результаты, сделайте выводы. Решение. 1) В данной задаче изучаемый признак является дискретно варьирующим,
так как размер семей не может отличаться друг от друга менее чем на одного
человека. Следовательно, необходимо построить дискретный вариационный ряд.
Чтобы сделать это, необходимо подсчитать, сколько раз встречаются те или иные
значения признака, и расположить их в порядке возрастания или убывания. Значения
изучаемого признака — размер семьи — обозначим xi, частоты — тi. Произведем упомянутые
расчеты и запишем их результаты в табл. 6.3. Таблица
6.3
2) Дискретный вариационный
ряд можно представить графически, построив полигон распределения частот или
частостей (рис. 6.3). Для того чтобы построить
кумуляту, необходимо рассчитать накопленные частоты или частости. Накопленная
частота 1-го варианта (х1 =
1) равна самой частоте этого варианта, т. е. v1 = 2. Накопленная частота
2-го варианта (х2 = 2)
равна сумме частот 1-го и 2-го вариантов, т.е. v2 = 2 + 4 = 6.
Далее, аналогично v3 = 12; v4 = 20; v5 = 30; v6 = 39; v7= 45; v8 = 49; v9 =50.
Построим кумуляту (рис.
6.4).
3) Рассчитаем
средний размер (среднее число членов) семьи. Так как частоты отличны друг от
друга, расчет средней арифметической произведем по формуле (6.9)
Средний размер семьи — 5,06
чел. 4) Так как частоты неодинаковы, для расчета
дисперсии размера семьи используем формулу (6.12)
Дисперсия размера семьи — 3,6964
чел2. Найдем среднее квадратическое отклонение размера семьи по
формуле (6.13)
Среднее квадратическое
отклонение размера семьи — 1,9226 чел. Найдем коэффициент вариации
размера семьи по формуле (6.14)
Коэффициент вариации
составляет 38%. Так как коэффициент вариации больше 35%, можно сделать вывод о
том, что изучаемая совокупность семей является неоднородной, чем и объясняется
высокая колеблемость размера семьи в данной совокупности. Ввиду неоднородности семей,
попавших в выборку, использование средней арифметической для характеристики
наиболее типичного уровня размера семьи не вполне оправданно — средняя
арифметическая нетипична для изучаемой совокупности, в качестве характеристики
наиболее типичного уровня размера семьи в данной совокупности лучше
использовать моду или медиану. Пример 2. Имеются данные о годовой мощности предприятий
цементной промышленности в 1996 г.
1) Постройте гистограмму,
кумуляту. 2) Рассчитайте среднюю
мощность предприятий. 3) Найдите дисперсию,
среднее квадратическое отклонение, коэффициент вариации. Объясните полученные
результаты, сделайте выводы. Решение. 1) Данные о годовой мощности предприятий цементной промышленности
представлены в виде интервального вариационного ряда — значения признака
заданы в виде интервалов. При этом первый и последний интервалы — открытые: оба
интервала не имеют одной из границ. Наконец, данный интервальный вариационный
ряд — с неравными интервалами: интервальные разности (разность между верхней
и нижней границами) интервалов неодинаковы. Условно закроем границы открытых
интервалов. Интервальная разность 2-го
интервала 1 000 - 500 = 500. Следовательно, нижняя
граница 1-го интервала 500 - 500 = 0. Интервальная разность
предпоследнего интервала 3 000 - 2 000 = 1 000. Следовательно, верхняя
граница последнего интервала 3 000 + 1 000 = 4 000. В результате, получим
следующий вариационный ряд (табл. 6.4): Таблица
6.4
Учитывая неодинаковую
величину интервалов, для построения гистограммы рассчитаем абсолютные
плотности распределения по формуле (6.6)
Построим гистограмму (рис.
6.5).
Для того чтобы построить
кумуляту, необходимо рассчитать накопленные частоты или частости. Накопленная частота нижней
границы 1-го варианта х = 0 равна
нулю. Накопленная частота верхней границы 1-го интервала равна его частоте, т.
е. 27. Накопленная частота верхней
границы 2-го интервала равна сумме частот 1-го и 2-го интервалов, т.е.27 + 11 =
38. Далее, аналогично 38 + 8
=46; 46 + 8 = 54; 54 + 2 = 56. Построим кумуляту (рис.
6.6).
2) Рассчитаем среднюю
мощность предприятий цементной промышленности в 1996 г. Так как частоты
интервалов разные, используем для расчета средней арифметической формулу (6.9).
При расчете числовых характеристик интервального вариационного ряда в качестве
значений признака принимаются середины интервалов, найдем их.
Теперь
расчет средней арифметической примет вид Средняя мощность предприятий
цементной промышленности в 1996 г. составляла 964,29 тыс. т. Следует отметить, что
использование с той или иной целью средней арифметической, рассчитанной по
данным интервального ряда с открытыми интервалами, может привести к серьезным
ошибкам. Это связано с тем, что открытые интервалы закрываются условно, в
действительности значения признака у объектов, попадающих в открытые интервалы,
могут выходить далеко за их условные границы. В связи с этим для оценки
наиболее типичного уровня изучаемого признака по данным интервального ряда с открытыми
интервалами лучше использовать моду или медиану. 3) Оценим колеблемость
мощности предприятий цементной промышленности в 1996 г. Так как частоты неодинаковы, для расчета дисперсии
используем формулу (6.12)
Дисперсия мощности
предприятий — 862 563,78 (тыс. т)2. Найдем среднее
квадратическое отклонение мощности предприятий по формуле (6.13)
Среднее квадратическое
отклонение мощности предприятий — 928,74 тыс. т. Найдем коэффициент вариации
по формуле (6.14)
Коэффициент вариации годовой мощности предприятий цементной
промышленности составляет 96,31%. Поскольку он больше 35%, можно сделать вывод
о том, что изучаемая совокупность предприятий является неоднородной, в ее
состав вошли и крупные и мелкие предприятия, что и обусловило высокую
колеблемость годовой мощности. Следовательно, использование
средней арифметической для характеристики наиболее типичного уровня годовой
мощности предприятий цементной промышленности неверно — средняя арифметическая
нетипична для изучаемой совокупности. Это еще раз подтверждает необходимость
использования моды или медианы для характеристики наиболее типичного уровня годовой
мощности данной совокупности предприятий цементной промышленности. Задачи к теме 61. По данным выборочного обследования получено следующее распределение
семей по среднедушевому доходу
Постройте гистограмму распределения частот. Найдите cреднедушевой
доход семьи в выборке, дисперсию, среднее квадратическое отклонение, коэффициент
вариации. Объясните полученные результаты. 2. Постройте гистограмму частот, найдите среднюю заработную работников
одного из цехов промышленного предприятия.
Рассчитайте среднюю
арифметическую, среднее квадратическое отклонение, коэффициент вариации
заработной платы. 3. Ниже представлена группировка отраслей и подотраслей промышленности
по темпам роста цен на изготавливаемую продукцию за период с начала года.
Найдите среднюю арифметическую, дисперсию, среднее
квадратическое отклонение, коэффициент вариации. Постройте гистограмму.
Сделайте выводы. 4. По результатам
выборочного обследования торговых киосков города получены следующие данные о
дневной выручке частного бизнеса.
|