"Основы статистики с элементами теории вероятностей для экономистов. Рук-во для решения задач" - читать интересную книгу автора (Ниворожкина Л.П., Морозова 3.А.)

Учебники «Феникса»

 


Учебники «Феникса»

П. П. Ниворожкина, 3. А. Морозова,
 П. А. Герасимова., П. В. Житников

ОСНОВЫ СТАТИСТИКИ С ЭЛЕМЕНТАМИ ТЕОРИИ ВЕРОЯТНОСТЕЙ ДЛЯ ЭКОНОМИСТОВ

Руководство для решения задач

Рекомендовано

Министерством общего

и профессионального образования

Российской Федерации

в качестве учебного пособия

для студентов

высших учебных заведений,

обучающихся по экономическим

специальностям и направлениям

Ростов-на-Дону «Феникс» 1999

 

УДК 311(075.8)
 ББК 606я73
 Н60


 

Рецензенты:

Заслуженный деятель науки РФ, доктор экономических наук, профессор В. С. Князевский

Кафедра высшей математики Московского государствен­ного института стали и сплавов

Учебно-методический совет по специальности «Статисти­ка» УМО при Московском государственном университете экономики, статистики и информатики

Ниворожкина Л. П., Морозова 3. А.,
 Герасимова И. А., Житников И. В.

   Основы статистики с элементами теории вероят­ностей для экономистов: Руководство для решения задач. — Ростов н/Д: Феникс, 1999. — 320 с. — (Учебники «Феникса»).

ISBN 5-222-00560-7

В пособии кратко и просто изложены основные понятия статисти­ки и теории вероятностей, даны методические указания по решению типовых задач. В конце каждой главы приведены 20 вариантов задач, условия которых приближены к практическим ситуациям в области маркетинга, аудита, финансов и др.

Предназначено для студентов и аспирантов экономических вузов, преподавателей колледжей, вузов, а также для практических работ­ников, желающих научиться использовать современные статистичес­кие методы и их практические приложения при планировании своей деятельности.

 

 

ISBN 5-222-00560-7

©Ниворожкина Л. И., Морозова 3. А.,
 Герасимова И. А., Житников И. В., 1999
 ©Оформление. Издательство «Фе­никс», 1999


ПРЕДИСЛОВИЕ

 

Рыночная экономика существенно повышает тре­бования к качеству подготовки конкурентоспособных выпускников экономических вузов. Для этого необходимо владеть современным инструментари­ем математико-статистического анализа данных. Предлагаемое учебное пособие знакомит читателя с рядом важнейших разделов статистики и теории вероятностей, формирует основы статистического мышления. В пособии переработан и переосмыслен ряд методических подходов, используемых при чте­нии курсов по прикладной статистике и элементар­ной теории вероятностей на экономических факуль­тетах в США и Европе.

В процессе экономического образования математико-статистические дисциплины традиционно считаются наиболее сложными для студентов. Предла­гаемое пособие ставит своей целью помочь тем, кто осваивает эти курсы, особенно в системе заочного образования, понять прикладной, практический смысл проблем, решаемых с помощью статистики, а также помочь самостоятельно выполнить домашние задания по представленным темам.

Каждая глава начинается с краткого изложения основных теоретических понятий и формул. Авто­ры стремились подать этот материал так, чтобы, избегая громоздких математических доказательств, на доступном уровне донести до читателя сложные понятия современной статистики.

Для всех основных типов задач, которые можно решить на базе изложенного теоретического материала, приведены методики их решения, которые не только дают «рецепты» для получения ответов, но, прежде всего, помогают читателю освоить основы ста­тистического вывода при решении различных задач из области практической деятельности. Если чита­тель поймет, для чего необходимо использовать тот или иной статистический метод, ему легче будет ос­воить и его формальный вычислительный алгоритм, увидеть, что полученный результат — не просто чис­ло, а сконцентрированное выражение того, что ис­ходные данные несут в себе об изучаемом явлении.

Для того чтобы процесс обучения носил актив­ный характер, тексты задач максимально прибли­жены к реальным ситуациям в различных облас­тях экономики, таких, как бухгалтерский учет и аудит, финансы, маркетинг и т. д. Решение их по­может понять универсальность статистического ана­лиза как инструмента решения проблем, связанных с риском и неопределенностью.

В книге приведены основные таблицы математи­ческой статистики, необходимые для решения за­дач (приложения 1-6), а также список рекомендуе­мой литературы.

 

 

 

1. ЭЛЕМЕНТЫ КОМБИНАТОРИКИ

Этот материал не относится непосредственно к теории вероятностей и математической статистике, однако необходим в дальнейшем при расчетах ве­роятностей.

Комбинаторика происходит от латинского слова «combinatio» — соединение.

Группы, составленные из каких-либо предме­тов (безразлично каких, например, букв, цветных шаров, кубиков, чисел и т. п.), называются соеди­нениями (комбинациями).

Предметы, из которых состоят соединения, называются элементами.

Различают три типа соединений: размещения, перестановки и сочетания.

1.1. Размещения

Размещениями из п элементов по т в каждом называются такие соединения, из которых каждое содержит т элементов, взятых из числа дан­ных n элементов, и которые отличаются друг от друга либо самими элементами (хотя бы одним), либо лишь порядком их расположения.

Число размещений из п элементов по т в каж­дом обычно обозначается символом Аnm и вычисля­ется по следующей формуле*:


* Выводы формул для числа размещений, а в последующем изложении — для числа сочетаний, опускаются. Их можно найти в курсе элементарной алгебры.

 

1.2. Понятие факториала

Произведение п натуральных чисел от 1 до n обо­значается сокращенно п!, т. е. 1·2·3·...·(n -1)·n= n! (читается: п факториал). Например:

5!=1·2·3·4·5=120.

 

Считается, что 0! = 1.

Используя понятие факториала, формулу (1.1) можно представить так:


где 0 т  n.

Очевидно, что Аn1= п (при m = 1) и Аn0=n (при m= 0).

Пример 1. Правление коммерческого банка вы­бирает из 10 кандидатов 3 человек на различные должности (все 10 кандидатов имеют равные шан­сы). Сколько всевозможных групп по 3 человека можно составить из 10 кандидатов?

Решение. В условии задачи речь идет о расчете числа комбинаций из 10 элементов по 3. Так как

группы по 3 человека могут отличаться и составом претендентов, и заполняемыми ими вакансиями, т. е. порядком, то для ответа необходимо рассчитать число размещений из 10 элементов по 3:

N=А310=10·9·8=720

 

Ответ. Можно составить 720 групп по 3 человека из 10.

1.3. Размещения с повторениями

Размещение с повторениями из n элементов по m(mn) элементов может содержать любой элемент сколько угодно раз от 1 до m включительно, или не содержать его совсем, т. е. каждое размещение с повторениями из n элементов по m элементов мо­жет состоять не только из различных элементов, но из m каких угодно и как угодно повторяющихся элементов.

Соединения, отличающиеся друг от друга хотя бы порядком расположения элементов, считаются различными размещениями.

Число размещений с повторениями из n элемен­тов по m элементов будем обозначать символом Аnm(c повт.) . Можно доказать, что оно равно nm:

 

Аnm(c повт.) =nm               (1.3)

Пример 2. Изменим условие примера 1. Правле­ние коммерческого банка выбирает из 10 кандидатов 3 человек на 3 различные должности. Предпо­ложим, что один и тот же отобранный из 10 претендентов кандидат может занять не только одну, но и 2, и даже все 3 различные вакантные должности. Сколько в данном  случае возможно комбинаций замещения 3 вакантных должностей?

Решение. Как и в предыдущей задаче, комби­нации замещения вакантных должностей могут отличаться и составом претендентов и заполняе­мыми ими вакансиями, т.е. порядком. Следовательно, и в этом случае для ответа на вопрос зада­чи необходимо рассчитать число размещений. Од­нако теперь вакантные должности могут замещать­ся одним и тем же претендентом, а значит, здесь речь идет о расчете числа размещений с повторе­ниями.

По условию задачи п = 10, т = 3. Следователь­но, Аnm=103=1000.

Ответ. Можно составить 1000 комбинаций.

1.4. Сочетания

Сочетаниями из п элементов по m в каждом называются такие соединения, из которых каж­дое содержит т элементов, взятых из числа дан­ных п элементов, и которые отличаются друг от друга по крайней мере одним элементом.

Число сочетаний из п элементов по m в каждом обозначается символом Cnm и вычисляется так:


или


Пример 3. Правление коммерческого банка вы­бирает из 10 кандидатов 3 человек на одинаковые должности (все 10 кандидатов имеют равные шан­сы). Сколько всевозможных групп по 3 человека можно составить из 10 кандидатов?

Решение. Состав различных групп должен отли­чаться по крайней мере хотя бы одним кандидатом и порядок выбора кандидата не имеет значения, сле­довательно, этот вид соединений представляет собой сочетания. По условию задачи п = 10, т = 3. Подставив данные в формулу (1.5), получаем


 

Ответ. Можно составить 120 групп из 3 человек по 10.


Замечание. Надо уметь различать сочетания от раз­мещений. Например: если в группе 25 студентов и 10 человек из них, выйдя из аудитории на перерыв, стоят вместе и беседуют, то порядок, в котором они стоят, несуществен. Число всех возможных групп из 25 человек по 10 в данном случае — сочетания. Если же студенты отправились на перерыве в буфет или в кассу за стипендией, то тогда существенно, в каком, порядке они стали, т. е. кто из них первый, второй и т. д. В этой ситуации при подсчете возможных групп из 25 человек по 10 необходимо состав­лять размещения.

1.5. Сочетания с повторениями

Сочетание с повторениями из n элементов по m (n Î m) элементов может содержать любой элемент сколько угодно раз от 1 до m включительно или не содержать его совсем, т. е. каждое сочетание из n элементов по m элементов может состоять не толь­ко из m различных элементов, но из m каких угод­но и как угодно повторяющихся элементов.

Следует отметить, что если, например, два со­единения по m элементов отличаются друг от друга только порядком расположения элементов, то они не считаются различными сочетаниями.

Число сочетаний с повторениями из n элементов по m будем обозначать символом (Cnm)c повт и вычислять по формуле


Замечание, т может быть и больше n.

Пример 4. Сколькими способами можно выбрать 6 пирожных в кондитерской, где есть 4 разных сорта пирожных?

Решение.


Ответ. Существует 84 различных способа выбора пирожных.

1.6. Перестановки

Перестановками из п элементов называются та­кие соединения, из которых каждое содержит все п элементов и которые отличаются друг от друга лишь порядком расположения элементов.

Число перестановок из п элементов обозначается символом Pn, это то же самое, что число размещений из п элементов по n в каждом, поэтому


Пример 5. Менеджер ежедневно просматривает 6 изданий экономического содержания. Если порядок просмотра изданий случаен, то сколько суще­ствует способов его осуществления?

Решение. Способы просмотра изданий различа­ются только порядком, так как число, а значит, и состав изданий при каждом способе неизменны. Сле­довательно, при решении этой задачи необходимо рассчитать число перестановок.

По условию задачи п = 6. Следовательно,

 

Рn  = 6! =1·2·3·4·5·6 = 720.

Ответ. Можно просмотреть издания 720 способами.

1.7. Перестановки с повторениями

Число перестановок с повторениями выражает­ся формулой


Пример 6. Сколькими способами можно разде­лить т + п + s предметов на 3 группы, чтобы в одной группе было т предметов, в другой n пред­метов, в третьей — s предметов?

Решение.


Задачи к теме 1

1. Во многих странах водительское удостовере­ние (автомобильные права) имеет шифр, состоящий из 3 букв и 3 цифр. Чему равно общее число воз­можных номеров водительских удостоверений, счи­тая, что число букв русского алфавита, используе­мых для составления шифра, — 26, а буквы занима­ют первые 3 позиции шифра? Если шифр состоит только из 6 цифр, то чему в этом случае равно об­щее число всех возможных номеров удостоверений, если: а) цифры в шифре не повторяются; б) повто­ряются?

2. Сколько существует способов составления в случайном порядке списка из 7 кандидатов для выбора на руководящую должность? Какова вероят­ность того, что кандидаты будут расставлены в спис­ке по возрасту (от меньшего к большему)?*

3. Руководство фирмы выделило отделу рекла­мы средства для помещения в печати объявлений о предлагаемых фирмой товарах и услугах. По рас­четам отдела рекламы выделенных средств хватит для того, чтобы поместить объявления только в 15 из 25 городских газет. Сколько существует спосо­бов случайного отбора газет для помещения объяв­лений? Какова вероятность того, что в число отобранных попадут 15 газет, имеющих наибольший ти­раж?*

4. Менеджер рассматривает кандидатуры 8 чело­век, подавших заявления о приеме на работу. Сколько существует способов приглашения кандидатов на собеседование в случайном порядке? Какова ве­роятность того, что они случайно будут приглаше­ны на собеседование в зависимости от времени их прихода в офис?*

5. На железнодорожной станции имеется 5 путей. Сколькими способами можно расставить на них 3 состава? Какова вероятность того, что составы слу­чайно будут расставлены на путях в порядке возрастания их номеров?*

6. Покупая карточку лотереи «Спортлото», иг­рок должен зачеркнуть 6 из 49 возможных чисел от 1 до 49. Если при розыгрыше тиража лотереи он угадает все 6 чисел, то имеет шанс выиграть значительную сумму денег. Сколько возможных комби­наций можно составить из 49 по 6, если порядок чисел безразличен? Чему равна вероятность угадать все 6 номеров?*

7. Четыре человека случайно отбираются из 10 согласившихся участвовать в интервью для выяснения их отношения к продукции фирмы по производ­ству продуктов питания. Эти 4 человека прикреп­ляются к 4 интервьюерам. Сколько существует раз­личных способов составления таких групп? Если выбор случаен, чему равна вероятность прикрепле­ния определенного человека к интервьюеру?*

8. Сколькими способами можно рассадить 5 гос­тей за круглым столом? Какова вероятность того, что гости случайно окажутся рассаженными по ро­сту?*

9. Девять запечатанных пакетов с предложения­ми цены на аренду участков для бурения нефтяных скважин поступили утром в специальное агентство утренней почтой. Сколько существует различных способов очередности вскрытия конвертов с пред­ложениями цены? Какова вероятность того, что конверты случайно окажутся вскрытыми в зависимос­ти от величины предлагаемой за аренду участков цены?*

10. Фирма нуждается в организации 4 новых складов. Ее сотрудники подобрали 8 подходящих одинаково удобных помещений. Сколько существу­ет способов отбора 4 помещений из 8 в случайном порядке? Какова вероятность того, что в число ото­бранных попадут 4 помещения, расположенные в многоэтажных зданиях?*

11. Для разгрузки поступивших товаров менедже­ру требуется выделить 6 из 20 имеющихся рабочих. Сколькими способами можно это сделать, осуще­ствляя отбор в случайном порядке? Какова вероят­ность того, что в число отобранных войдут самые высокие рабочие?*

12. Руководство фирмы может обратиться в 6 туристических агентств с просьбой об организации для своих сотрудников 3 различных туристичес­ких поездок. Сколько существует способов распре­деления 3 заявок между 6 агентствами, если каждое агентство может получить не более одной заявки? Какова вероятность того, что заявки получат агент­ства с наибольшим оборотом, причем, чем крупнее агентство, тем крупнее заявку оно получает?*

13. Для доступа в компьютерную сеть оператору необходимо набрать пароль из 4 цифр. Оператор забыл или не знает необходимого кода. Сколько все­возможных комбинаций он может составить для набора пароля: а) если цифры в коде не повторяют­ся; б) если повторяются? С какой вероятностью мож­но открыть замок с первой попытки?*

14. Сколько существует способов составления списка 20 деловых звонков случайным образом? Какова вероятность того, что список окажется со­ставленным в алфавитном порядке?*

15. На рынке представлено 8 различных пакетов программ для бухгалтерии с приблизительно равными возможностями. Для апробации в своих фи­лиалах фирма решила отобрать 3 из них. Сколько существует способов отбора 3 программ из 8, если отбор осуществлен в случайном порядке? Какова вероятность того, что среди отобранных случайно окажутся 3 программы, занимающие наименьший объем памяти?*

16. Выделены крупные суммы на выполнение 4 крупных правительственных программ, сулящих исполнителям высокую прибыль. Сколько существует способов случайного распределения этих 4 программ между 6 возможными исполнителями? Какова ве­роятность того, что средства на выполнение про­грамм при таком распределении получат 4 испол­нителя, имеющие наибольшую прибыль, причем ве­личина выделяемых средств зависит от величины прибыли исполнителей?*

17. Брокерская фирма предлагает акции различных компаний. Акции 10 из них продаются по наименьшей  среди имеющихся акций цене и обладают одинако­вой доходностью. Клиент собирается приобрести ак­ции 3 таких компаний — по 1 от каждой компании. Сколько существует способов выбора 3 таких ак­ций из 10, если выбор осуществляется в случайном порядке? Какова вероятность того, что в число слу­чайно отобранных попадут акции, рост цен на ко­торые будет наибольшим в следующем году?*

18. Фирмы Fl, F2, F3, F4, F5 предлагают свои условия по выполнению 3 различных контрактов Cl, C2 и СЗ. Любая фирма может получить только один контракт. Контракты различны, т. е. если фирма Fl получит контракт Cl, то это не то же самое, если она получит контракт C2. Сколько спо­собов получения контрактов имеют фирмы? Если предположить равновозможность заключения кон­трактов, чему равна вероятность того, что фирма F3 получит контракт?*

19. По сведениям геологоразведки 1 из 15 участ­ков земли по всей вероятности содержит нефть. Однако компания имеет средства для бурения только 8 скважин. Сколько способов отбора 8 различных скважин у компании? Какова вероятность того, что случайно отобранные для бурения участки окажутся, например, самыми северными?*

20. На 9 вакантных мест по определенной специ­альности претендуют 15 безработных, состоящих на учете в службе занятости. Сколько возможно ком­бинаций выбора 9 из 15 безработных?

* Для вычисления вероятностей здесь и далее ознакомьтесь с материалом гл. 2.

 

2. ЭЛЕМЕНТЫ ТЕОРИИ ВЕРОЯТНОСТЕЙ

2.1. Определение вероятности и свойства, вытекающие из ее определения, классификация событий, диаграммы Венна

Под вероятностью в широком смысле понимают количественную меру неопределенности или число, которое выражает степень уверенности в наступле­нии того или иного случайного события. Напри­мер, нас может интересовать вероятность того, что объем продаж некоторого продукта не упадет, если цены вырастут, или вероятность того, что строи­тельство нового дома завершится в срок.

Случайным называется событие, которое может произойти или не произойти в результате некото­рого испытания. В дальнейшем для простоты мы будем опускать термин «случайный».

Испытание (опыт, эксперимент) — это процесс, включающий определенные условия и приводящий к одному из нескольких возможных исходов. Исхо­дом опыта может быть результат наблюдения или измерения (табл. 2.1).

Единичный, отдельный исход испытания назы­вается элементарным событием.

Случайное событие может состоять из несколь­ких элементарных событий, подразделяющихся на достоверные, невозможные, совместные, несовместные, единственно возможные, равновозможные, противоположные.

Таблица 2.1

Испытание

Исход испытания

Подбрасывание монеты

Контроль качества деталей

Продажа квартиры

Результат футбольного матча

Цифра, герб

Годная, бракованная

Продана, не продана
Победа, проигрыш, ничья

 

Событие, которое обязательно произойдет в ре­зультате испытания, называется достоверным. На­пример, если в урне содержатся только белые шары, то извлечение из нее белого шара есть событие дос­товерное; другой пример, если мы подбросим вверх камень, то он обязательно упадет на землю в силу действия закона притяжения, т. е. результат этого опыта заведомо известен. Достоверные события ус­ловимся обозначать символом W.

Событие, которое не может произойти в резуль­тате данного опыта (испытания), называется не­возможным. Извлечение черного шара из урны с белыми шарами есть событие невозможное; выпадение выигрыша на все номера облигаций в каком-либо тираже выигрышного займа также невозможное событие. Невозможное событие обозначим ø.

Достоверные и невозможные события, вообще го­воря, не являются случайными.

Несколько событий называются совместными, если в результате эксперимента наступление од­ного из них не исключает появления других. Например, при бросании 3 монет выпадение цифры

на одной не исключает появления цифр на других монетах.

В магазин вошел покупатель. События «В мага­зин вошел покупатель старше 60 лет» и «В магазин вошла женщина» — совместные, так как в магазин может войти женщина старше 60 лет.

Несколько событий называются несовместны­ми в данном опыте, если появление одного из них исключает появление других. Например, выигрыш, ничейный исход и проигрыш при игре в шахматы (одной партии) — 3 несовместных события.

События называются единственно возможными, если в результате испытания хотя бы одно из них обязательно произойдет (или 1, или 2, или... или все события из рассматриваемой совокупности со­бытий произойдут; одно точно произойдет). Напри­мер, некая фирма рекламирует свой товар по радио и в газете. Обязательно произойдет одно и только одно из следующих событий: «Потребитель услы­шал о товаре по радио», «Потребитель прочитал о товаре в газете», «Потребитель получил информа­цию о товаре по радио и из газеты», «Потребитель не слышал о товаре по радио и не читал газеты». Эти 4 события единственно возможные.

Несколько событий называются равновозможными, если в результате испытания ни одно из них не имеет объективно большую возможность появления, чем другие. При бросании игральной

кости появление каждой из ее граней — события равновозможные.

Два единственно возможных и несовместных со­бытия называются противоположными. Купля и продажа определенного вида товара есть события противоположные.

Совокупность всех единственно возможных и не­совместных событий называется полной группой событий.

Различные события и действия с ними удобно рассматривать с помощью так называемых диаграмм Венна (по имени английского математика-логика Джона Венна).

Изобразим полную группу событий в виде квад­рата, тогда круг внутри квадрата будет обозначать некоторое событие, скажем. А, а точка - элемен­тарное событие - Е (рис. 2.1).


Рис. 2.1 демонстрирует два противоположных со­бытия А и не А, которые дополняют друг друга до полной группы событий. Противоположное событие обозначается Ā.

Пересечение А и В (обозначается как А Ç В) есть набор, содержащий все элементы, которые являются членами и А и В (рис. 2.2).

 


Рис. 2.2

Объединение А и В (обозначается A È В) есть набор, содержащий все элементы, которые являются членами или А, или В, или А и В вместе.

Полную группу можно определить так:


тогда {А1, А2, ..., Аn} — полная группа событий.

Вероятностью появления события А называют отношение числа исходов, благоприятствующих наступлению этого события, к общему числу всех единственно возможных и несовместных элемен­тарных исходов.

Обозначим число благоприятствующих событию А исходов через М, а число всех исходов — N:

P(A)=M/N,             (2.1)

где М — целое неотрицательное число, 0 £ М £  N.

Другой тип объективной вероятности определя­ется исходя из относительной частоты (частости) появления события. Например: если некоторая фирма в течение времени провела опрос 1 000 покупателей нового сорта напитка и 20 из них оценили его как вкусный, то мы можем оценить вероятность того, что потребителям понравится новый напиток как 20/1 000 = 0,02. В этом примере 20 — это час­тота наступления события, а 20/1 000 = 0,02 — это относительная частота.

Относительной частотой события называется от­ношение числа испытаний т, при которых собы­тие появилось, к общему числу проведенных ис­пытаний п.

 

W(A) == т/п            (2.2)

где т — целое неотрицательное число, 0 £ т£  п.

Статистической вероятностью события А назы­вается относительная частота (частость) этого со­бытия, вычисленная по результатам большого числа испытаний. Будем обозначать ее Р*(А). Сле­довательно,


При очень большом числе испытаний статисти­ческая вероятность приближенно равна классичес­кой вероятности, т. е.


Для определения вероятности выпадения 1 или 2 при подбрасывании кости нам необходимо только знать «модель игры», в данном случае — кость с 6 гранями. Мы можем определить наши шансы теоретически, без подбрасывания кости, это априорная (доопытная) вероятность. Во втором примере мы мо­жем определить вероятность только по результатам опыта, это — апостериорная (послеопытная) веро­ятность. То есть классическая вероятность — апри­орная, а статистическая — апостериорная.

Какой бы вид вероятности ни был выбран, для их вычисления и анализа используется один и тот же набор математических правил.

Свойства вероятности, вытекающие из классического определения.

1. Вероятность достоверного события равна 1, т. е. P(W) =1.

Действительно, если событие А = W, то М = N, значит,

Р(W) = N/N = 1.

2. Если событие невозможное, то его вероятность равна 0, т. е.

Р(Æ)= 0.

Если А = Æ, то оно не осуществится ни при од­ном испытании, т. е.

М = 0 и Р(Æ) = 0/N = 0.

3. Вероятность случайного события есть поло­жительное число, заключенное между 0 и 1.

В самом деле, так как 0£ M £ N, 0£ M/N £ 1, т. е. 0 £ Р(А) £ 1.

4. Сумма вероятностей противоположных собы­тий равна 1, т. е. Р(А) + Р(А) = 1. В самом деле,

Р(А) = (N - M)/N = 1 - M/N = 1 - P(A), следовательно,

Р(А)+Р(А)=1.             (2.3)

Например, если вероятность извлечения туза из колоды, состоящей из 52 карт, равна 4/52, то вероятность извлечения карты, не являющейся тузом, равна

1 - 4/52 = 48/52

Пример 1. Магазин в целях рекламы нового товара проводит лотерею, в которой 1 главный приз, 5 вторых, 100 — третьих и 1 000 — чет­вертых. В конце рекламного дня выяснилось, что лотерейные билеты получили 10 000 покупателей. По правилам розыгрыша после извлечения выигрышного билета он возвращается в урну, и поку­патель не может получить более одного выигрыша. Чему равна вероятность того, что покупатель, который приобрел рекламируемый товар: а) вы­играет 1-й приз; б) выиграет хотя бы 1 приз; в) не выиграет ни одного приза?

Решение, а) Определим событие А: «Покупатель выиграл 1-й приз». Согласно условию задачи, в лотерее участвовало 10 000 покупателей, отсюда общее число испытаний N = 10 000, а число исходов, благо­приятствующих событию А, М = 1. Все исходы явля­ются равновозможными, единственно возможными и несовместными элементарными событиями. Следо­вательно, по формуле классической вероятности:

б) определим событие В: «Покупатель выиграл хотя бы 1 приз». Для этого события число благоприятствующих исходов

М = 1 + 5 +100 + 1 000 = 1 106. P(B) = M/N = 1106/10 000 = 0,1106;

в) событие «Покупатель не выиграет ни одного при­за» — противоположное событию В: «Покупатель вы­играет хотя бы один приз», поэтому обозначим его как  . По формуле (2.3) найдем

Р(В) =1- Р(В) = 1 - 0,1106 = 0,8894 .

Ответ. Вероятность того, что покупатель выигра­ет 1-й приз равна 0,0001, один приз — 0,1106, не выиграет ни одного приза — 0,8894.

Пример 2. Структура занятых в региональном отделении крупного банка имеет следующий вид (табл. 2.2):

Таблица 2.2

Структура

Женщины

Мужчины

Администрация

25

15

Операционисты

35

25

 

Если один из служащих выбран случайным об­разом, то какова вероятность, что он: а) мужчина-администратор; б) женщина-операционист; в) муж­чина; г) операционист?

Решение.

а) В банке работают 100 человек, N = 100.

Из них 15 - мужчины-администраторы, М = 15. следовательно,

Р(мужчина-администратор) = 15/100 = 0,15.

б) 35 служащих в банке - женщины-операцио­нисты, следовательно,

P(женщина-операционист) == 35/100 = 0,35.

в) 40 служащих в банке - мужчины, следова­тельно,

Р(мужчина) = 40/100 = 0,40.

г) Из общего числа служащих в банке 60 - операционисты, следовательно,

P(операционист) = 60/100= 0,60.

 

2.2. Правила сложения и умножения вероятностей. Зависимые и независимые события

Вероятность суммы двух событий равна сумме вероятностей этих событий без вероятности их со­вместного наступления

Р(А + В) = Р(А) + Р(В) - Р(АВ),       

или                                                                     (2.4)

Р(А È В) - Р(А) + Р(В) - Р(А Ç В).

Для несовместных событий их совместное на­ступление есть невозможное событие, а вероятность его равна нулю, следовательно, вероятность сум­мы двух несовместных событий равна сумме вероятностей этих событий.


или                                                                  (2.5)

Р(А È В) = Р(А) + Р(В).

Правило сложения вероятностей справедливо и для конечного числа п попарно несовместных событий


В случае нескольких совместных событий необ­ходимо по аналогии с рассуждениями о пересечении двух совместных событий исключить повтор­ный учет областей пересечения событий. Рассмот­рим три совместных события (рис. 2.3).


Рис. 2.3

Для случая трех совместных событий можно записать

Р(А + В + С) = Р(А) + Р(В) + Р(С) - Р(АВ)-  Р(АС) - Р(ВС) + Р(АВС).

Сумма вероятностей событий А1, А2, А3 , ..., Аn, образующих полную группу, равна 1

Р(А1) + Р(А2) + Р(А3) + ... + Р(Аn) = 1.

или

 


Пример 3. Компания производит 40 000 холо­дильников в год, которые реализуются в различ­ных регионах России. Из них 10 000 экспортиру­ются в страны СНГ, 8 000 продаются в регионах Европейской части России, 7 000 продаются в стра­ны дальнего зарубежья, 6 000 в Западной Сибири, 5000 в Восточной Сибири, 4 000 в Дальневосточ­ном районе. Чему равна вероятность того, что определенный холодильник будет: а) произведен на эк­спорт; б) продан в России?

Решение. Обозначим события:

А - «Холодильник будет продан в странах СНГ»;

В - «Холодильник будет продан в Европейской части России»;

С - «Холодильник будет продан в страны даль­него зарубежья»;

D - «Холодильник будет продан в Западной Си­бири»;

Е — «Холодильник будет продан в Восточной Сибири»;

F «Холодильник будет продан в Дальневосточ­ном районе».

Соответственно, вероятность того, что холодиль­ник будет продан в странах СНГ:

Р(А) = 10000/40000 =0,25;

вероятность того, что холодильник будет продан в Европейской части России:

Р(В) = 8 000/40 000 = 0,20;

вероятность того, что холодильник будет продан в страны дальнего зарубежья:

Р(С) = 7 000/40 000 = 0,175;

вероятность того, что холодильник будет продан в Западной Сибири;

Р(D) = 6 000/40 000 = 0,15;

вероятность того, что холодильник будет продан в Восточной Сибири:

 

Р(Е) = 5 000/40 000 = 0,125;

вероятность того, что холодильник будет продан на Дальнем Востоке:

P(F) = 4 000/40 000 =0,10. События А, В, С, D, Е, F несовместные.

1) Событие, состоящее в том, что холодильник произведен на экспорт, означает, что холодильник будет продан или в страны СНГ, или в страны даль­него зарубежья. Отсюда по формуле (2.5) находим его вероятность:

Р(холодильник произведен на экспорт) = Р(А + В) = Р(А) + Р(В) = 0,25 + 0,175 = 0,425.

2) Событие, состоящее в том, что холодильник будет продан в России, означает, что холодильник будет продан или в Европейской части России, или в Западной Сибири, или в Восточной Сибири, или на Дальнем Востоке. Отсюда по формуле (2.6) нахо­дим его вероятность:

Р(холодильник будет продан в России)  = Р(А +D+E+ F) = Р(В) + P(D) + Р(Е) + P(F) = 0,20 + 0,15 + +0,125 + 0,10 = 0,575.

Этот же результат можно было получить рассуж­дая по-другому. События «Холодильник произве­ден на экспорт» и «Холодильник будет продан в России» — два взаимно противоположных события, отсюда по формуле (2.3):

Р(холодильник будет продан в России) = 1 - Р(холодильник произведен на экспорт)  = 1 - 0,425 = =0,575.

 

Пример 4. Опыт состоит в случайном извлече­нии карты из колоды в 52 карты. Чему равна вероятность того, что это будет или туз, или карта масти треф?

Решение. Определим события: А — «Извлече­ние туза», В — «Извлечение карты трефовой мас­ти». Вероятность извлечения туза из колоды карт Р(А) = 4/52; вероятность извлечения карты трефо­вой масти — Р(В) = 13/52; вероятность их пересече­ния — извлечение трефового туза - Р(АВ) = 1/52 (рис. 2.4).


События А и В — совместные, поскольку в коло­де есть трефовый туз.

Согласно условию задачи, нас интересует веро­ятность суммы совместных событий А и. В. По формуле (2.4) получим

     Р(А + В) = Р(А) + Р(В) - Р(АВ) = 4/52 + 13/52 - 1/52 = 16/52 = 1/2.

Пример 5. В урне 2 белых и 3 черных шара. Чему равна вероятность появления белого шара: а) при 1-м извлечении из урны; б) при 2-м извлечении из урны?

Решение. Здесь возможны 2 случая.

1-й случай. Схема возвращенного шара, т. е. шар после 1-го извлечения возвращается в урну.

Пусть событие А — «Появление белого шара при 1-м извлечении», так как N = 5, а М = 2, то Р(А) = 2/5.

Пусть событие В — «Появление белого шара при 2-м извлечении», так как шар после 1-го извлечения возвратился в урну, то N=5,а М=2 и Р(В) = 2/5.

Таким образом, вероятность каждого из событий не зависит от того, произошло или не произошло другое событие. События А и В в этом случае явля­ются независимыми.

Итак, события А и В называются независимы­ми, если вероятность каждого из них не зависит от того, произошло или нет другое событие.

Вероятности независимых событий называют­ся безусловными.

2-й случай. Схема невозвращенного шара, т. е. шар после 1-го извлечения в урну не возвращается.

Вероятность появления белого шара при 1-м извлечении Р(А) = 2/5. Белый шар в урну не возвращается, следовательно, в урне остались 1 бе­лый и 3 черных шара. Чему равна вероятность события В при условии, что событие А произошло? N = 4, М = 1.

Искомую вероятность обозначают Р(В/А) или Р(В)A или РA(В). Итак, Р(В/А) = 1/4 называют ус­ловной вероятностью, а события А, В — зависимыми. В предыдущем примере с картами Р(А) = 4/52;
Р(А/В) =
4/16.

Например, тот факт, что человек работает науч­ным сотрудником, не является независимым от наличия у него высшего образования; событие, состо­ящее в том, что станок может выйти из строя, не является независимым от срока его эксплуатации; событие, состоящее в том, что цена акций компа­нии пошла вверх, не является независимым от того с прибылью или с убытком сработала компания в прошлом периоде; и т. д.

Таким образом, события А и В называются за­висимыми, если вероятность каждого из них зависит от того произошло или нет другое событие. Вероятность события В, вычисленная в предполо­жении, что другое событие А уже осуществилось, называется условной вероятностью.

Вероятность произведения двух независимых со­бытий А и В равна произведению их вероятностей

Р(А В) = Р(А)Р(В),       

или                     (2.8)

Р(А Ç В) = Р(А)Р(В).

События А1, А2, ..., Аn (п > 2) называются неза­висимыми в совокупности, если вероятность каждого из них не зависит от того, произошли или нет любые события из числа остальных.

Распространим теоремы умножения на случаи п независимых и зависимых в совокупности событий.

 

 Вероятность совместного появления нескольких событий, независимых в совокупности, равна про­изведению вероятностей этих событий

Р(А1·А2·А3·...·Аn) = Р(А1)·Р(А2)·Р(А3)·...·Р(Аn).   (2.9)

 

Вероятность произведения двух зависимых со­бытий А и В равна произведению вероятности од­ного из них на условную вероятность другого


Вероятность события В при условии появления события А


Вероятность совместного наступления конечного числа n зависимых событий равна произведению вероятности одного из них на условные вероятно­сти всех остальных, причем условная вероятность каждого последующего события вычисляется в предположении, что все предыдущие уже наступили


Если события А1 , А2 ,..., Аn зависимые в со­вокупности, то вероятность наступления хотя бы одного из них равна


Вероятность появления хотя бы одного собы­тия из п независимых в совокупности равна разности между 1 и произведением вероятностей со­бытий, противоположных данным,


Пример 6. Консультационная фирма претендует на 2 заказа от 2 крупных корпораций. Эксперты фирмы считают, что вероятность получения кон­сультационной работы в корпорации А равна 0,45. Эксперты также полагают, что если фирма получит заказ у корпорации А, то вероятность того, что и корпорация В обратится к ним, равна 0,9. Какова вероятность того, что консультационная фирма получит оба заказа?

Решение. Обозначим события:

А — «Получение консультационной работы в кор­порации А»;

В — «Получение консультационной работы в кор­порации В».

События А и В — зависимые, так как событие В зависит от того, произойдет или нет событие А.

По условию мы имеем Р(А) = 0,45, а также зна­ем, что Р(В/А) = 0,9.

Необходимо найти вероятность того, что оба со­бытия (и событие А, и событие В) произойдут, т.е. Р(АВ). Для этого используем правило умножения вероятностей (2.10).

Отсюда получим

Р(АВ) = Р(А)Р( B/А) = 0,45 · 0,9 = 0,405.

Пример 7. В большой рекламной фирме 21% ра­ботников получают высокую заработную плату. Из­вестно также, что 40% работников фирмы — жен­щины, а 6,4% работников — женщины, получающие высокую заработную плату. Можем ли мы ут­верждать, что на фирме существует дискримина­ция женщин в оплате труда?

Решение. Сформулируем условие этой задачи в терминах теории вероятностей. Для ее решения не­обходимо ответить на вопрос: «Чему равняется ве­роятность того, что случайно выбранный работник будет женщиной, имеющей высокую заработную плату?» и сравнить ее с вероятностью того, что наудачу выбранный работник любого пола имеет вы­сокую зарплату.

Обозначим события:

А — «Случайно выбранный работник имеет вы­сокую зарплату»;

В — «Случайно выбранный работник — женщина». События А и В — зависимые. По условию

Р(АВ) = 0,064; Р(В) = 0,40; Р(А) = 0,21.

Нас интересует вероятность того, что наудачу выб­ранный работник имеет высокую зарплату при условии, что это женщина, т. е. — условная вероят­ность события А.

Тогда, используя теорему умножения вероятностей, получим

Р(А/В) = Р(АВ)/Р(В) = 0,064/0,40 = 0,16.

Поскольку Р(А/В) = 0,16 меньше, чем Р(А) = 0,21, то мы можем заключить, что женщины, работающие в рекламной фирме, имеют меньше шансов получить высокую заработную плату по сравнению с мужчинами.

Пример 8. Студент пришел на экзамен, изучив только 20 из 25 вопросов программы. Экзаменатор задал студенту 3 вопроса. Вычислить вероятность того, что студент ответит: а) на все 3 вопроса; б) хотя бы на 1 вопрос.

Решение. Обозначим события:

А — «Студент знает все 3 вопроса»;

А1 — «Студент знает 1-й вопрос»;

А2 «Студент знает 2-й вопрос»;

А3 — «Студент знает 3-й вопрос».

По условию

Р(А1) = 20/25; Р(А21) = 19/24; Р(А3,/А2A1) = 18/23.

1) Искомое событие А состоит в совместном на­ступлении событий А1, А2, А3.

События А1, А2, A3 — зависимые.

Для решения задачи используем правило умно­жения вероятностей конечного числа п зависимых событий (2.10):

Р(А) = (20/25)(19/24)(18/23) = 57/115 = 0,496.

Вероятность того, что студент ответит на все 3 вопроса, равна 0,496.

2) Обозначим событие:

В — «Студент ответит хотя бы на один вопрос». Событие В состоит в том, что произойдет или со­бытие А1, а события А2 и А3 — не произойдут, или произойдет событие А2, а события А1 и A3 — не произойдут, или произойдет событие А3 , а события А1 и А2 — не произойдут, или произойдут события А1 и А2 ,а событие A3 — не произойдет, или произойдут события А1 и А3, а событие А2 — не произойдет, или произойдут события А2 и А3 , а событие А1 — не про­изойдет, или произойдут все три ,события А1, А2, А3.

Для решения этой задачи можно было бы исполь­зовать правила сложения и умножения вероятностей. Однако здесь проще применить правило для вероятности наступления хотя бы одного из n зависимых событий (2.13).

Учитывая, что


получим

Р(В) = 1 - (5/25)(4/24)(3/23) = 229/230 = 0,9957.

Вероятность того, что студент ответит хотя бы на один вопрос, равна 0,9957.

Пример 9. Вероятность того, что потребитель уви­дит рекламу определенного продукта по телевиде­нию, равна 0,04. Вероятность того, что потребитель увидит рекламу того же продукта на рекламном стенде, равна 0,06. Предполагается, что оба собы­тия — независимы. Чему равна вероятность того, что потребитель увидит: а) обе рекламы; б) хотя бы одну рекламу?

Решение. Обозначим события:

А — «Потребитель увидит рекламу по телевиде­нию»;

    В — «Потребитель увидит рекламу на стенде»;

С — «Потребитель увидит хотя бы одну рекламу». Это значит, что потребитель увидит рекламу по

телевидению, или на стенде, или по телевидению и на стенде. По условию

Р(А) = 0,04; Р(В) = 0,06.

 

        События А и. В — совместные и независимые.

а) Поскольку вероятность искомого события есть вероятность совместного наступления независимых событий А и В (потребитель увидит рекламу и по телевидению и на стенде), т. е. их пересечения, для решения задачи используем правило умножения вероятностей для независимых событий.

Отсюда

Р(АВ) = Р(А) · Р(В) = 0,04 · 0,06 = 0,0024.

Вероятность того, что потребитель увидит обе рек­ламы, равна 0,0024.

б) Так как событие С состоит в совместном на­ступлении событий А и В, искомая вероятность может быть найдена с помощью правила сложения вероятностей.

Р(С) = Р(А + В) = Р(А) + Р(В) - Р(АВ) = = 0,04 + 0,06 - 0,0024 = 0,0976.

Вместе с тем, при решении этой задачи может быть использовано правило о вероятности наступ­ления хотя бы одного из п независимых событий.

Учитывая, что



Вычисление вероятностей событий такого типа характеризует эффективность рекламы, поскольку эта вероятность может означать долю (процент) на­селения, охватываемого ею, и отсюда следует оцен­ка рекламных усилий.

Задачи к теме 2

1. Анализ работы кредитного отдела банка выя­вил, что 12% фирм, бравших кредит в банке, обанкротились и не вернут кредиты по крайней мере в течение 5 лет. Также известно, что обанкротились 20% кредитовавшихся в банке фирм. Если один из клиентов банка обанкротился, то чему равна веро­ятность того, что он окажется не в состоянии вер­нуть долг банку?

2. Модельер, разрабатывающий новую коллек­цию одежды к весеннему сезону, создает модели в зеленой, черной и красной цветовой гамме. Вероят­ность того, что зеленый цвет будет в моде весной, модельер оценивает в 0,3, что черный — в 0,2, а вероятность того, что будет моден красный цвет — в 0,15. Предполагая, что цвета выбираются незави­симо друг от друга, оцените вероятность того, что цветовое решение коллекции будет удачным хотя бы по одному из выбранных цветов.

3. Вероятность того, что потребитель увидит рек­ламу определенного продукта по каждому из 3 центральных телевизионных каналов, равна 0,05. Пред­полагается, что эти события — независимы в сово­купности. Чему равна вероятность того, что потреби­тель увидит рекламу: а) по всем 3 каналам; б) хотя бы по 1 из этих каналов?

4. Торговый агент предлагает клиентам иллюс­трированную книгу. Из предыдущего опыта ему известно, что в среднем 1 из 65 клиентов, кото­рым он предлагает книгу, покупает ее. В течение некоторого промежутка времени он предложил кни­гу 20 клиентам. Чему равна вероятность того, что он продаст им хотя бы 1 книгу? Прокомментируйте предположения, которые вы использовали при решении задачи.

5. В налоговом управлении работает 120 сотруд­ников, занимающих различные должности.

Все

сотрудники

Руководители

Рядовые сотрудники

Итого

Мужчины

29

67

96

Женщины

4

20

24

Итого

33

87

120

 

На профсоюзном собрании женщины заявили о дискриминации при выдвижении на руководящие должности. Правы ли они?

6. В фирме 550 работников, 380 из них имеют высшее образование, а 412 — среднее специальное образование, у 357 высшее и среднее специальное образование. Чему равна вероятность того, что случайно выбранный работник имеет или среднее специ­альное, или высшее образование, или и то и другое?

7. Финансовый аналитик предполагает, что если норма (ставка) процента упадет за определенный период, то вероятность того, что рынок акций бу­дет расти в это же время, равна 0,80. Аналитик также считает, что норма процента может упасть за этот же период с вероятностью 0,40. Используя полученную информацию, определите вероятность того, что рынок акций будет расти, а норма процента падать в течение обсуждаемого периода.

8. Вероятность для компании, занимающейся строительством терминалов для аэропортов, полу­чить контракт в стране А равна 0,4, вероятность выиграть его в стране В равна 0,3. Вероятность того, что контракты будут заключены и в стране А, и в стране В, равна 0,12. Чему равна вероятность того, что компания получит контракт хотя бы в одной стране?

9. Город имеет 3 независимых резервных источ­ника электроэнергии для использования в случае аварийного отключения постоянного источника электроэнергии. Вероятность того, что любой из 3 резервных источников будет доступен при отклю­чении постоянного источника, составляет 0,8. Ка­кова вероятность того, что не произойдет аварий­ное отключение электроэнергии, если выйдет из строя постоянный источник?

10. Покупатель может приобрести акции 2 ком­паний А и В. Надежность 1-й оценивается экспер­тами на уровне 90%, а 2-й — 80%. Чему равна вероятность того, что: а) обе компании в течение года не станут банкротами; б) наступит хотя бы одно банк­ротство?

11. Стандарт заполнения счетов, установленный фирмой, предполагает, что не более 5% счетов будут заполняться с ошибками. Время от времени компа­ния проводит случайную выборку счетов для про­верки правильности их заполнения. Исходя из того, что допустимый уровень ошибок — 5% и 10 счетов отобраны в случайном порядке, чему равна вероят­ность того, что среди них нет ошибок?

12. На сахарном заводе один из цехов произво­дит рафинад. Контроль качества обнаружил, что 1 из 100 кусочков сахара разбит. Если вы случайным образом извлекаете 2 кусочка сахара, чему равна вероятность того, что, по крайней мере, 1 из них будет разбит? Предполагаем независимость событий, это предположение справедливо вследствие случай­ности отбора.

13. Эксперты торговой компании полагают, что покупатели, обладающие пластиковой карточкой этой компании, дающей право на скидку, с 90%-й вероятностью обратятся за покупкой определенного ассортимента товаров в ее магазины. Если это прои­зойдет, обладатель пластиковой карточки приобретет необходимый ему товар в магазинах этой компании с вероятностью 0,8. Какова вероятность того, что об­ладатель пластиковой карточки торговой компании приобретет необходимый ему товар в ее магазинах?

14. Аудиторская фирма размещает рекламу в жур­нале «Коммерсант». По оценкам фирмы 60% людей, читающих журнал, являются потенциальными клиентами фирмы. Выборочный опрос читателей журнала показал также, что 85% людей, которые читают журнал, помнят о рекламе фирмы, помещенной в конце журнала. Оцените, чему равен процент людей, которые являются потенциальными клиен­тами фирмы и могут вспомнить ее рекламу?

15. В городе 3 коммерческих банка, оценка на­дежности которых — 0,95, 0,90 и 0,85 соответственно. В связи с определением хозяйственных перс­пектив развития города администрацию интересу­ют ответы на следующие вопросы: а) какова веро­ятность того, что в течение года обанкротятся все 3 банка; б) что обанкротится хотя бы 1 банк?

16. О двух акциях А и В известно, что они выпу­щены одной и той же отраслью. Вероятность того, что акция А поднимется завтра в цене, равна 0,2. Вероятность того, что обе акции А и В поднимутся завтра в цене, равна 0,12. Предположим, что вы знаете, что акция А поднимется в цене завтра. Чему равна вероятность того, что и акция В завтра под­нимется в цене?

17. Инвестор предполагает, что в следующем пе­риоде вероятность роста цены акций компании N будет составлять 0,7, а компании М — 0,4. Вероят­ность того, что цены поднимутся на те и другие акции, равна 0,28. Вычислите вероятность их рос­та или компании N, или компании М, или обеих компаний вместе.

18. Крупная торговая компания занимается оп­товой продажей материалов для строительства и ремонта жилья и, имея список покупателей в 3 ре­гионах, основанный на ее собственной системе ко­дов, рассылает им по почте каталог товаров. Ме­неджер компании полагает, что вероятность того, что компания не получит откликов на разосланные предложения ни из одного региона, равна 0,25. Чему в этом случае равна вероятность того, что компа­ния получит ответ хотя бы из одного региона?

19. Секрет увеличения доли определенного това­ра на рынке состоит в привлечении новых потребителей и их сохранении. Сохранение потребителей то­вара («brand loyalty» — приверженность потребите­ля к данной марке или разновидности товара) — одна из наиболее ответственных областей рыночных ис­следований. Производители нового сорта духов зна­ют, что вероятность того, что потребители сразу примут новый продукт и создание «brand loyalty» потребует, по крайней мере, 6 месяцев, равна 0,02. Производитель также знает, что вероятность того, что случайно отобранный потребитель примет но­вый сорт, равна 0,05. Предположим, потребитель только что приобрел новый сорт духов (изменил марку товара). Чему равна вероятность того, что он сохранит свои предпочтения в течение 6 месяцев?

20. Вероятность того, что покупатель, собираю­щийся приобрести компьютер и пакет прикладных программ, приобретет только компьютер, равна 0,15, только пакет программ — 0,1. Вероятность того, что будет куплен и компьютер, и пакет программ, равна 0,05. Чему равна вероятность того, что будет куплен или компьютер, или пакет программ, или компьютер и пакет программ вместе?

 

3. ФОРМУЛЫ ПОЛНОЙ ВЕРОЯТНОСТИ И БАЙЕСА

Часто мы начинаем анализ вероятностей, имея предварительные, априорные значения вероятнос­тей интересующих нас событий. Затем из источни­ков информации, таких как выборка, отчет, опыт и т. д., мы получаем дополнительную информацию об интересующем нас событии. Имея эту новую информацию, мы можем уточнить, пересчитать зна­чения априорных вероятностей. Новые значения вероятностей для тех же интересующих нас собы­тий будут уже апостериорными (послеопытными) вероятностями. Теорема Байеса дает нам правило для вычисления таких вероятностей.

Последовательность процесса переоценки вероят­ностей можно схематично изобразить так:


Пусть событие А может осуществиться лишь вме­сте с одним из событий Н1, Н2, H3, ..., Hn, образующих полную группу. Пусть известны вероятности Р(Н1), Р(Н2), ..., Р(Нi), ..., Р(Нn). Так как события Нi образуют полную группу, то


а также известны и условные вероятности события А:


Так как заранее неизвестно, с каким из событий Нi произойдет событие А, то события Нi, называют гипотезами.

Необходимо определить вероятность события А и переоценить вероятности событий Нi с учетом полной информации о событии А.

Вероятность события А определяется как


Эта вероятность называется полной вероятностью. Если событие А может наступить только вмес­те с одним из событий Н123, ..., Нn, образую­щих полную группу несовместных событий и на­зываемых гипотезами, то вероятность события А равна сумме произведений вероятностей каждого из событий Н1, Н2, ..., Нn на соответствующую ус­ловную вероятность события А.              

Условные вероятности гипотез вычисляются по формуле


или


Это — формулы Байеса (по имени английского математика Т.Байеса, опубликовавшего их в 1764 г.), выражение в знаменателе — формула полной вероятности.

Пример 1. Предприятие, производящее компью­теры, получает одинаковые ЧИПы от 2 поставщиков. 1-й поставляет 65% ЧИПов, 2-й — 35%. Изве­стно, что качество поставляемых ЧИПов разное. На основании предыдущих данных о рейтингах каче­ства составлена табл. 3.1.

Таблица 3.1

Поставщик

 

% качественной продукции

 

% брака

 

1-й поставщик
2-й поставщик

 

98
95

 

2
5

 

 

Предприятие осуществляет гарантийный ремонт компьютеров. Имея данные о числе компьютеров, поступающих на гарантийный ремонт в связи с не­исправностью ЧИПов, переоцените вероятности того, что возвращенный для ремонта компьютер укомп­лектован ЧИПом: а) от 1-го поставщика; б) от 2-го поставщика.

Решение задач с использованием формул пол­ной вероятности и Байеса удобнее оформлять в виде табл. 3.2.

Таблица 3.2

Гипотезы

Нi

Вероятности

априорные Р(Нi)

условные Р(А/Нi)

совместные Р(Нi  Ç А)

апостериорные Р(Нi/А)

1

2

3

4

5

 

Шаг 1. В колонке 1 перечисляем события, кото­рые задают априорную информацию в контексте решаемой проблемы: Соб. Н1 ЧИП от 1-го постав­щика; Соб. Н2 — ЧИП от 2-го поставщика. Это — гипотезы и они образуют полную группу независи­мых и несовместных событий.

В колонке 2 записываем вероятности этих событий:

Р(Н1) = 0,65, Р(Н2) = 0,35.

В колонке 3 определим условные вероятности со­бытия А — «ЧИП бракованный» для каждой из

гипотез.

Шаг 2. В колонке 4 находим вероятности для со­бытий «ЧИП от 1-го поставщика и он бракованный» и «ЧИП от 2-го поставщика и он бракованный». Они определяются по правилу умножения вероятностей путем перемножения значений колонок 2 и 3. По­скольку сформулированные события являются ре­зультатом пересечения двух событий А и Нi, то их вероятности называют совместными:

Р(Нi Ç А) = Р(Нi)Р(А/Нi).

Шаг 3. Суммируем вероятности в колонке 4 для того, чтобы найти вероятность события А. В нашем примере 0,0130 — вероятность поставки некачествен­ного ЧИПа от 1-го поставщика, 0,0175 — вероятность поставки некачественного ЧИПа от 2-го постав­щика. Поскольку, как мы уже сказали выше, ЧИПы поступают только от 2 поставщиков, то сумма вероятностей 0,0130 и 0,0175 показывает, что 0,0305 есть вероятность бракованного ЧИПа в общей поставке, определяемая с помощью формулы (3.1)


Шаг 4. В колонке 5 вычисляем апостериорные вероятности, используя формулу (3.2):


Заметим, что совместные вероятности находятся в строках колонки 4, а вероятность события А как сумма колонки 4 (табл. 3.3).

Таблица 3.3

Гипотезы

Нi

 

Вероятности

априорные
Р(Нi)

 

Условные
 Р(А/Нi)

 

Совместные
Р(Нi Ç А)

 

апостериорные Р(Нi/А)

 

1

 

2

 

3

 

4

 

5

 

ЧИП от 1-го постав­щика

 

0,65

 

0,02

 

0,0130

 

0,426

 

ЧИП от 2-го постав­щика

0,35

0,05

0,0175

0,574

å

 

å=1

 

 

 

P(A)=0,0305

 

å=l

 

 

Пример 2. Экономист полагает, что вероятность роста стоимости акций некоторой компании в следующем году будет равна 0,75, если экономика стра­ны будет на подъеме; и эта же вероятность будет равна 0,30, если экономика страны не будет успеш­но развиваться. По его мнению, вероятность экономического подъема в новом году равна 0,80. Ис­пользуя предположения экономиста, оцените вероятность того, что акции компании поднимутся в цене в следующем году.

Решение. Определим события:

А — «Акции компании поднимутся в цене в бу­дущем году».

Событие А может произойти только вместе с од­ной из гипотез:

Н1 — «Экономика страны будет на подъеме»;

Н2 «Экономика страны не будет успешно развиваться».

По условию известны вероятности гипотез:

Р(Н1) = 0,80; Р(Н2) = 0,20 и условные вероятности события А:

Р(А/Н1)= 0,75; Р(А/Н2)= 0,30.

Гипотезы образуют полную группу, сумма их вероятностей равна 1. Рассмотрим событие А — это или Н1А, или Н2А. События Н1А и Н2А — несовместные попарно, так как события Н1 и Н2

несовместны.

События Н1 и А, Н2 и А — зависимые. Вышеизложенное позволяет применить для оп­ределения искомой вероятности события А форму­лу полной вероятности

 

Р(А) = Р(Н1)Р(А/Н1) + Р(Н2)Р(А/Н2) = == 0,80 · 0,75 + 0,20 · 0,30 = 0,66.

Решение оформим в виде табл. 3.4.

Таблица 3.4

Гипотезы Нi

Р(Нi)

Р(А/Нi)

Р(Нi)Р(А/Нi)

Н1 «подъем экономики»

0,80

0,75

0,60

Н2 «спад экономики»

0,20

0,30

0,06

å

1,00

 

0,66

 

Вероятность того, что акции компании поднимут­ся в цене в следующем году, составляет 0,66. Ответ. 0,66.

Пример 3. Экономист полагает, что в течение периода активного экономического роста американ­ский доллар будет расти в цене с вероятностью 0,70, в период умеренного экономического роста он по­дорожает с вероятностью 0,40 и при низких темпах экономического роста доллар подорожает с вероят­ностью 0,20. В течение любого периода времени ве­роятность активного экономического роста — 0,30;

умеренного экономического роста — 0,50 и низко­го роста — 0,20. Предположим, что доллар дорожа­ет в течение текущего периода. Чему равна вероят­ность того, что анализируемый период совпал с пери­одом активного экономического роста?

Решение. Определим события:

А — «Доллар дорожает». Оно может произойти только вместе с одной из гипотез:

Н1 — «Активный экономический рост»;

Н2 «Умеренный экономический рост»;

Н3 «Низкий экономический рост». По условию известны доопытные (априорные) ве­роятности гипотез и условные вероятности события А:

 

Р(Н1) = 0,30, Р(Н2) = 0,50, Р(Н3) = 0,20, Р(А/Н1) = 0,70, Р(А/Н2) = 0,40, Р(А/Н3) = 0,20.

Гипотезы образуют полную группу, сумма их ве­роятностей равна 1. Событие А — это или Н1А, или Н2А, или Н3А. События Н1А, Н2А. и Н3А. — не­совместные попарно, так как события Н1, Н2 и Н3 — несовместны. События Н1 и А, Н2 и А, Н3 и А — зависимые.

Требуется найти уточненную (послеопытную, апостериорную) вероятность первой гипотезы, т. е. необходимо найти вероятность активного экономи­ческого роста, при условии, что доллар дорожает (событие А уже произошло), т. е. Р(Н1/А).

Используя формулу Байеса (3.2) и подставляя заданные значения вероятностей, имеем


Мы можем получить тот же результат с помо­щью табл. 3.5.

Вероятность активного экономического роста, при условии, что доллар дорожает, составляет 0,467.

 

Таблица 3.5


Для более наглядного восприятия решения на­шей задачи мы можем также построить дерево ре­шений:


Пример 4. В каждой из двух урн содержится 6 чер­ных и 4 белых шара. Из 1-й урны во 2-ю наудачу переложен один шар.

а) Найти вероятность того, что шар, извлечен­ный из 2-й урны после перекладывания, окажется черным.

б) Предположим, что шар, извлеченный из 2-й урны после перекладывания, оказался черным. Какова тогда вероятность того, что из 1-й урны во 2-ю был переложен белый шар?

Решение. Определим события:

А — «Шар, извлеченный из 2-й урны, черный». Оно может произойти только вместе с одной из ги­потез:

Н1 — «Из 1-й урны во 2-ю урну переложили чер­ный шар» и Н2 — «Из 1-й урны во 2-ю переложили

белый шар».

Используя классическое определение вероятнос­ти, найдем вероятности гипотез

Р(Н1) = 6/10; Р(Н2) = 4/10

и условные вероятности события А.

После перекладывания во 2-й урне окажется 11 шаров. Если из 1-й урны во 2-ю переложили чер­ный шар, то во 2-й урне окажется 7 черных и 4 бе­лых шаров, тогда

Р(А/Н1) = 7/11.

Если из 1-й урны во 2-ю переложили белый шар, то во 2-й урне окажется 6 черных и 5 белых шаров, тогда

Р(А/Н2) = 6/11.

Гипотезы образуют полную группу, сумма их веро­ятностей равна 1. Рассмотрим событие А — это или Н1А, или Н2А. События Н1А и Н2А — несовместные попарно, так как события Н1 и Н2 несовместны. События Н1 и А, Н2 и А — зависимые.

1. Вышеизложенное позволяет применить для определения вероятности события А и ответа на 1-й вопрос формулу полной вероятности (3.1)

Р(А) = Р(Н1) Р(А/Н1) + Р(Н2) Р(А/Н2)= = 6/10 · 7/11 + 4/10 · 6/11 = 0,6.

Это же решение можно оформить в виде табл. 3.6.

Таблица 3.6

Гипотезы Нi

Р(Нi)

Р(А/Нi)

Р(Нi)Р(А/Нi)

Н1 «из 1-й урны во 2-ю переложили черный шар»

6/10

7/11

42/110

Н2— «из 1-й урны во 2-ю переложили белый шар»

4/10

6/11

24/110

å

1,00

0,6

 

 

Вероятность того, что шар, извлеченный из 2-й урны после перекладывания, окажется черным, составляет 0,6.

2. Во 2-й части задачи предполагается, что собы­тие А уже произошло, т. е. шар, извлеченный из 2-й урны, оказался черным. Требуется найти уточненную (послеопытную, апостериорную) вероятность 2-й гипотезы, т. е. необходимо определить вероятность того, что из 1-й урны во 2-ю был переложен белый шар при условии, что шар, извлеченный из 2-й урны после перекладывания, оказался черным:

Р(Н2/А).

Для определения искомой вероятности восполь­зуемся формулой Байеса (3.2)


Мы можем получить тот же результат с помо­щью табл. 3.7.

Таблица 3.7


Вероятность того, что из 1-й урны во 2-ю был переложен белый шар при условии, что шар, извлеченный из 2-й урны после перекладывания, ока­зался черным, составляет 0,3636.

Ответ. а) 0,6; б) 0,3636.

Задачи к теме 3

1. Директор компании имеет 2 списка с фамили­ями претендентов на работу. В 1-м списке — фамилии 6 женщин и 3 мужчин. Во 2-м списке оказа­лись 4 женщины и 7 мужчин. Фамилия одного из претендентов случайно переносится из 1-го списка во 2-й. Затем фамилия одного из претендентов случайно выбирается из 2-го списка. Если предполо­жить, что эта фамилия принадлежит мужчине, чему равна вероятность того, что из 1-го списка была пе­ренесена фамилия женщины?

2. Агент по недвижимости пытается продать уча­сток земли под застройку. Он полагает, что участок будет продан в течение ближайших 6 месяцев с ве­роятностью 0,9, если экономическая ситуация в регионе не будет ухудшаться. Если же экономичес­кая ситуация будет ухудшаться, то вероятность продать участок составит 0,5. Экономист, консуль­тирующий агента, полагает, что с вероятностью, равной 0,7, экономическая ситуация в регионе в течение следующих 6 месяцев будет ухудшаться. Чему равна вероятность того, что участок будет продан в течение ближайших 6 месяцев?

3. Судоходная компания организует средиземно­морские круизы в течение летнего времени и проводит несколько круизов в сезон. Поскольку в этом виде бизнеса очень высокая конкуренция, то важ­но, чтобы все каюты зафрахтованного под круизы корабля были полностью заняты туристами, тогда компания получит прибыль. Эксперт по туризму, нанятый компанией, предсказывает, что вероятность того, что корабль будет полон в течение сезона, бу­дет равна 0,92, если доллар не подорожает по отно­шению к рублю, и с вероятностью — 0,75, если дол­лар подорожает. По оценкам экономистов, вероят­ность того, что в течение сезона доллар подорожает по отношению к рублю, равна 0,23. Чему равна ве­роятность того, что билеты на все круизы будут проданы?

4. В корпорации обсуждается маркетинг нового продукта, выпускаемого на рынок. Исполнительный директор корпорации желал бы, чтобы новый товар превосходил по своим характеристикам соответству­ющие товары конкурирующих фирм. Основываясь на предварительных оценках экспертов, он опреде­ляет вероятность того, что новый товар более высо­кого качества по сравнению с аналогичными в 0,5, такого же качества — в 0,3, хуже по качеству — в 0,2. Опрос рынка показал, что новый товар конку­рентоспособен. Из предыдущего опыта проведения опросов следует, что если товар действительно кон­курентоспособный, то предсказание такого же выво­да имеет вероятность, равную 0,7. Если товар такой же, как и аналогичные, то вероятность того, что оп­рос укажет на его превосходство, равна 0,4. И если товар более низкого качества, то вероятность того, что опрос укажет на его конкурентоспособность, рав­на 0,2. С учетом результата опроса оцените вероят­ность того, что товар действительно более высокого качества и, следовательно, обладает более высокой конкурентоспособностью, чем аналогичные.

5. Сотрудники отдела маркетинга полагают, что в ближайшее время ожидается рост спроса на продукцию фирмы. Вероятность этого они оценивают  в 80%. Консультационная фирма, занимающаяся

прогнозом рыночной ситуации, подтвердила пред­положение о росте спроса. Положительные прогно­зы консультационной фирмы сбываются с вероят­ностью 95%, а отрицательные — с вероятностью 99%. Какова вероятность того, что рост спроса дей­ствительно произойдет?

6. Исследователь рынка заинтересован в прове­дении интервью с супружескими парами для выяснения их предпочтений к некоторым видам това­ров. Он приходит по выбранному адресу, попадает в трехквартирный дом и по надписям на почтовых ящиках выясняет, что в 1-й квартире живут 2 мужчин, во 2-й — супружеская пара, в 3-й — 2 женщи­ны. Когда исследователь поднимается по лестнице, то выясняется, что на дверях квартир нет никаких указателей. Исследователь звонит в случайно выб­ранную дверь и на его звонок выходит женщина. Предположим, что если бы он позвонил в дверь квартиры, где живут 2 мужчин, то к двери мог по­дойти только мужчина; если бы он позвонил в дверь квартиры, где живут только женщины, то к двери подошла бы только женщина; если бы он позвонил в дверь супружеской пары, то мужчина или жен­щина имели бы равные шансы подойти к двери. Имея эту информацию, оцените вероятность того, что исследователь выбрал нужную ему дверь.

7. Среди студентов института — 30% первокурс­ники, 35% студентов учатся на 2-м курсе, на 3-м и 4-м курсе их 20% и 15% соответственно. По дан­ным деканатов известно, что на первом курсе 20% студентов сдали сессию только на отличные оцен­ки, на 2-м — 30%, на 3-м — 35%, на 4-м — 40% отличников. Наудачу вызванный студент оказался отличником. Чему равна вероятность того, что он (или она) — третьекурсник?

8. Отдел менеджмента одного из супермаркетов разрабатывает новую кредитную политику с целью снижения числа тех покупателей, которые, полу­чая кредит, не выполняют своих платежных обязательств. Менеджер по кредитам предлагает в буду­щем отказывать в кредитной поддержке тем поку­пателям, которые на 2 недели и более задерживают очередной взнос, тем более что примерно 90% та­ких покупателей задерживают платежи, по край­ней мере, на 2 месяца.

Дополнительные исследования показали, что 2% всех покупателей товаров в кредит не только задерживают очередной взнос, но и вообще не выполня­ют своих обязательств, а 45% тех, кто уже имеют 2-месячную задолженность по кредиту, уплатил оче­редной взнос в данный момент. Учитывая все это, найти вероятность того, что покупатель, имеющий 2-месячную задолженность, в действительности не выполнит своих платежных обязательств по креди­ту. Проанализировав полученные вероятности, кри­тически оцените новую кредитную политику, раз­работанную отделом менеджмента.

9. Из числа авиалиний некоторого аэропорта 60% — местные, 30% — по СНГ и 10% — международные. Среди пассажиров местных авиалиний 50% путешествуют по делам, связанным с бизнесом, на линиях СНГ таких пассажиров 60%, на междуна­родных — 90%. Из прибывших в аэропорт пасса­жиров случайно выбирается 1. Чему равна вероят­ность того, что он: а) бизнесмен; б) прибыл из стран СНГ по делам бизнеса; в) прилетел местным рейсом по делам бизнеса; г) прибывший международным рейсом бизнесмен?

10. Нефтеразведочная экспедиция проводит ис­следования для определения вероятности наличия нефти на месте предполагаемого бурения скважи­ны. Исходя из результатов предыдущих исследова­ний, нефтеразведчики считают, что вероятность наличия нефти на проверяемом участке равна 0,4. На завершающем этапе разведки проводится сейс­мический тест, который имеет определенную сте­пень надежности: если на проверяемом участке есть нефть, то тест укажет на ее наличие в 85% случаев; если нефти нет, то в 10% случаев тест может оши­бочно указать на это. Сейсмический тест указал на присутствие нефти. Чему равна вероятность того, что запасы нефти на данном участке существуют реально?

11. Экспортно-импортная фирма собирается зак­лючить контракт на поставку сельскохозяйствен­ного оборудования в одну из развивающихся стран. Если основной конкурент фирмы не станет одновременно претендовать на заключение контракта, то вероятность получения контракта оценивается в 0,45; в противном случае — в 0,25. По оценкам экспертов компании вероятность того, что конку­рент выдвинет свои предложения по заключению контракта, равна 0,40. Чему равна вероятность заключения контракта?

12. Транснациональная компания обсуждает воз­можности инвестиций в некоторое государство с неустойчивой политической ситуацией. Менедже­ры компании считают, что успех предполагаемых инвестиций зависит, в частности, и от политичес­кого климата в стране, в которую предполагается вливание инвестиционных средств. Менеджеры оце­нивают вероятность успеха (в терминах годового дохода от субсидий в течение 1-го года работы) в 0,55, если преобладающая политическая ситуация будет благоприятной; в 0,30, если политическая си­туация будет нейтральной; в 0,10, если политичес­кая ситуация в течение года будет неблагоприят­ной. Менеджеры компании также полагают, что вероятности благоприятной, нейтральной и небла­гоприятной политических ситуаций соответствен­но равны: 0,60, 0,20 и 0,20. Чему равна вероят­ность успеха инвестиций?

13. Экономист-аналитик условно подразделяет экономическую ситуацию в стране на «хорошую», «посредственную» и «плохую» и оценивает их ве­роятности для данного момента времени в 0,15; 0,70 и 0,15 соответственно. Некоторый индекс экономи­ческого состояния возрастает с вероятностью 0,60, когда ситуация «хорошая»; с вероятностью 0,30, когда ситуация «посредственная», и с вероятнос­тью 0,10, когда ситуация «плохая». Пусть в насто­ящий момент индекс экономического состояния воз­рос. Чему равна вероятность того, что экономика страны на подъеме?

14. При слиянии акционерного капитала 2 фирм аналитики фирмы, получающей контрольный па­кет акций, полагают, что сделка принесет успех с вероятностью, равной 0,65, если председатель сове­та директоров поглощаемой фирмы выйдет в отстав­ку; если он откажется, то вероятность успеха будет равна 0,30. Предполагается, что вероятность ухода в отставку председателя составляет 0,70. Чему рав­на вероятность успеха сделки?

15. На химическом заводе установлена система аварийной сигнализации. Когда возникает аварий­ная ситуация, звуковой сигнал срабатывает с веро­ятностью 0,950. Звуковой сигнал может сработать случайно и без аварийной ситуации с вероятностью 0,02. Реальная вероятность аварийной ситуации равна 0,004. Предположим, что звуковой сигнал сработал. Чему равна вероятность реальной аварий­ной ситуации?

16. Вероятность того, что клиент банка не вер­нет заем в период экономического роста, равна 0,04, а в период экономического кризиса — 0,13. Пред­положим, что вероятность того, что начнется пери­од экономического роста, равна 0,65. Чему равна вероятность того, что случайно выбранный клиент банка не вернет полученный кредит?

17. Перед тем, как начать маркетинг нового това­ра по всей стране, компании-производители часто проверяют спрос на него по отзывам случайно выб­ранных потенциальных покупателей. Методы про­ведения выборочных процедур уже проверены и имеют определенную степень надежности. Для опре­деленного товара известно, что вероятность его воз­можного успеха на рынке составит 0,75, если товар действительно удачный, и 0,15, если он неудачен. Из прошлого опыта известно, что новый товар мо­жет иметь успех на рынке с вероятностью 0,60. Если новый товар прошел выборочную проверку, и ее ре­зультаты указали на возможный его успех, то чему равна вероятность того, что это действительно так?


18. 2 автомата производят одинаковые детали, которые поступают на общий конвейер. Производительность 1-го автомата вдвое больше производи­тельности 2-го. 1-й автомат производит в среднем 60% деталей отличного качества, а 2-й — 84% де­талей отличного качества. Наудачу взятая с кон­вейера деталь оказалась отличного качества. Найти вероятность того, что эта деталь изготовлена: а) 1-м автоматом; б) 2-м автоматом.

19. Исследованиями психологов установлено, что мужчины и женщины по-разному реагируют на некоторые жизненные обстоятельства. Результаты исследований показали, что 70% женщин позитив­но реагируют на изучаемый круг ситуаций, в то время как 40% мужчин реагируют на них негатив­но. 15 женщин и 5 мужчин заполнили анкету, в которой отразили свое отношение к предлагаемым ситуациям. Случайно извлеченная анкета содержит негативную реакцию. Чему равна вероятность того, что ее заполнял мужчина?

20. Вероятность того, что новый товар будет пользоваться спросом на рынке, если конкурент не выпустит в продажу аналогичный продукт, равна 0,67. Вероятность того, что товар будет пользовать­ся спросом при наличии на рынке конкурирующе­го товара, равна 0,42. Вероятность того, что конкурирующая фирма выпустит аналогичный товар на рынок в течение интересующего нас периода, рав­на 0,35. Чему равна вероятность того, что товар будет иметь успех?

 

4. ДИСКРЕТНЫЕ СЛУЧАЙНЫЕ ВЕЛИЧИНЫ

4.1. Определение дискретной случайной величины

Величина, которая в результате испытания мо­жет принять то или иное значение, заранее неизвестно, какое именно, считается случайной.

Дискретной случайной величиной называется такая переменная величина, которая может при­нимать конечную или бесконечную совокупность значений, причем принятие ею каждого из значе­ний есть случайное событие с определенной веро­ятностью.

Соотношение, устанавливающее связь между от­дельными возможными значениями случайной ве­личины и соответствующими им вероятностями, называется законом распределения дискретной случайной величины. Если обозначить возмож­ные числовые значения случайной величины Х че­рез x1, x2, ..., xn..., а через pi = Р(Х = хi) вероят­ность появления значения xi, то дискретная слу­чайная величина полностью определяется табл. 4.1.

Таблица 4.1

xi

 

x1

 

x2

 

...

 

xn

 

pi

 

p1

 

p2

 

...

 

pn

 

 

Здесь значения x1, x2, ..., xn записываются, как правило, в порядке возрастания. Таблица называет­ся законом (рядом) распределения дискретной слу­чайной величины X. Поскольку в его верхней строч­ке записаны все значения случайной величины X, то нижняя обладает следующим свойством:


Ряд распределения можно изобразить графически (рис. 4.1).


Рис. 4.1

Если на рис. 4.1 по оси абсцисс отложить значе­ния случайной величины, по оси ординат — вероятности значений, полученные точки соединить от­резками прямой, то получим многоугольник рас­пределения вероятностей (полигон распределения).

Дискретная случайная величина может быть за­дана функцией распределения.

Функцией распределения случайной величины Х называется функция F(x), выражающая вероят­ность того, что Х примет значение, меньшее чем х:


Здесь для каждого значения х суммируются ве­роятности тех значений xi, которые лежат левее точ­ки х.

Функция F(x) есть неубывающая функция. Для дискретных случайных величин функция распределения F(x) есть разрывная ступенчатая функция, непрерывная слева (рис. 4.2).


Вероятность попадания случайной величины Х в промежуток от  a до b (включая a) выражается формулой

Р(a £ Х < b) = F(b) - F(a).        (4.3)

Одной из важных числовых характеристик слу­чайной величины Х является математическое ожидание

М(Х) = x1p1, + x2p2 +...+ x3p3.      (4.4)

В случае бесконечного множества значений xi в правой части (4.4) находится ряд, и мы будем рассматривать только те значения Х, для которых он абсолютно сходится.

М(Х) представляет собой среднее ожидаемое зна­чение случайной величины. Оно обладает следующими свойствами:

1) М(С) = С, где С = const;

2) М(СХ) = СМ(Х);                   

3) М(Х + Y) = М(Х) + М(Y), для любых Х и Y;

4) М(ХУ) = М(Х)М(У), если Х и Y  независимы.

(4.5)

Для оценки степени рассеяния значений случай­ной величины около ее среднего значения М(Х) = а вводятся понятия дисперсии D(X) и среднего квадратического (стандартного) отклонения s(х). Дисперсией называется математическое ожидание квадрата разности (Ха),


где а = М(Х); s (х) определяется как квадратный корень из дисперсии, т. е.


Для вычисления дисперсии пользуются форму­лой

D(X) = М(Х2) - М2(Х).        (4.6)

Свойства дисперсии и среднего квадратического отклонения:

1) D(C) = 0, где С = const;

 


если Х и У независимы.

Размерность величин М(Х) и s(Х) совпадает с размерностью самой случайной величины X, а размерность D(X) равна квадрату размерности случай­ной величины X.

 

4.2. Математические операции над случайными величинами

Пусть случайная величина Х принимает значе­ния хi с вероятностями Р(Х = xi) =pi(i= 1, 2, ..., п), а случайная величина Y — значения уj с вероятно­стями Р(Y = у) =pj(j = 1, 2, ..., m). Произведение КХ случайной величины Х на постоянную величи­ну K — это новая случайная величина, которая с теми же вероятностями, что и случайная величина X, принимает значения, равные произведениям на К значений случайной величины X. Следователь­но, закон ее распределения имеет вид табл. 4.2.

Таблица 4.2

kxi

 

kx1

 

kx2

 

...

 

kxn

 

pi

 

p1

 

p2

 

...

 

pn

 

 

Квадрат случайной величины (X 2) — это новая случайная величина, которая с теми же вероятностями, что и случайная величина X, принимает зна­чения, равные квадратам ее значений.

Сумма случайных величин Х и Y — это новая случайная величина, принимающая все значения вида xi + уj, (i = 1, 2, .... п; j = 1, 2, ..., т) с вероят­ностями рij, выражающими вероятность того, что случайная величина Х примет значение xi ,a Yзначение yj, т. е.

рij = Р(Х = xi; У = уj) = Р(Х = xiX=xi(Y = уi). (4.8) Если случайные величины Х и Y независимы, то


Аналогично определяются разность и произведе­ние случайных величин Х и Y. .

Разность случайных величин Х и Y — это новая случайная величина, которая принимает все значе­ния вида хi – уj, а произведение — все значения вида хiуj с вероятностями, определяемыми по формуле (4.8), а если случайные величины Х и Y неза­висимы, то по (4.9).

 

4.3. Распределения Бернулли и Пуассона

Рассмотрим последовательность п идентичных повторных испытаний, удовлетворяющих следующим условиям:

1) каждое испытание имеет 2 исхода, называе­мые успех и неуспех; это — взаимно несовместные и противоположные события;

2) вероятность успеха — р — остается постоян­ной от испытания к испытанию. Вероятность неуспеха — q;

3) все п испытаний — независимы. Это значит, что вероятность наступления события в любом из п повторных испытаний не зависит от результатов других испытаний.

Вероятность того, что в п независимых повтор­ных испытаниях, в каждом из которых вероятность появления события равна р(0 < р < 1), событие наступит ровно т раз (в любой последовательно­сти), равна


где q = 1— р.

Выражение (4.10) называется формулой Бернулли.

Вероятности того, что событие наступит: а) ме­нее т раз; б) более т раз; в) не менее т раз; г) не более т раз — находятся по формулам:


Биномиальным называют закон распределения дискретной случайной величины Х — числа появлений события в n независимых испытаниях, в каждом из которых вероятность наступления события равна р; вероятности возможных значений Х = О, 1, 2, ..., т, ..., п вычисляются по формуле Бернулли (табл.4.3).

Таблица 4.3


Так как правая часть формулы (4.10) представля­ет общий член биномиального разложения (q + р)n, то этот закон распределения называют биномиаль­ным. Для случайной величины X, распределенной по биномиальному закону, имеем

М(Х) = np;    (4.11)

D(X) = npq.  (4.12)

Если число испытаний велико, а вероятность появления события р в каждом испытании очень мала, то вместо формулы (4.10) пользуются при­ближенной формулой


где т — число появлений события в п независи­мых испытаниях; l = пр ( среднее число появлений события в п испытаниях).

Выражение (4.13) называется формулой Пуассо­на. Придавая т целые неотрицательные значения т = 0, 1, 2, ..., п, можно записать ряд распределе­ния вероятностей, вычисленных по формуле (4.13), который называется законом распределения Пуас­сона (табл. 4.4).

Таблица 4.4


Распределение Пуассона (приложение 3) часто ис­пользуется, когда мы имеем дело с числом событий, появляющихся в промежутке времени или про­странства, например: число машин, прибывших на автомойку в течение часа; число дефектов на новом отрезке шоссе длиной в 10 км; число мест утечки воды на 100 км водопровода; число остановок стан­ков в неделю; число дорожных происшествий.

Если распределение Пуассона применяется вме­сто биномиального, то п должно иметь порядок не менее нескольких десятков, лучше нескольких со­тен, а пр < 10.

Математическое ожидание и дисперсия случай­ной величины, распределенной по закону Пуассо­на, совпадают и равны параметру l, который опре­деляет этот закон, т. е.

М(Х) = D(X) = l.         (4.14)

4.4. Гипергеометрическое распределение

Пусть имеется множество N элементов, из кото­рых М элементов обладают некоторым признаком А. Извлекается случайным образом без возвраще­ния п элементов. Требуется найти вероятность того, что из них т элементов обладают признаком А. Искомая вероятность (зависящая от N, М, п, т) определяется по формуле


Полученный с помощью формулы (4.15) ряд рас­пределения называется гипергеометрическим законом распределения (табл. 4.5).

Таблица 4.5


Математическое ожидание и дисперсия случай­ной величины т, распределенной по гипергеометрическому закону, определяются формулами:


Пример 1. Известно, что в определенном городе 20% горожан предпочитают добираться на работу личным автотранспортом. Случайно выбраны 4 че­ловека.

1) Составьте ряд распределения числа людей в выборке, предпочитающих добираться на работу личным автотранспортом, и постройте его график.

2) Найдите числовые характеристики этого рас­пределения.

3) Напишите функцию распределения числа лю­дей в выборке, предпочитающих добираться на работу личным автотранспортом, и постройте ее гра­фик.

4) Чему равна вероятность того, что среди 4 слу­чайно отобранных человек: а) не будет ни одного человека, предпочитающего добираться на работу лич­ным автотранспортом; б) окажется хотя бы 1 чело­век, предпочитающий добираться на работу личным автотранспортом; в) будет не больше 2, предпочи­тающих добираться на работу личным автотранс­портом?

Решение. В качестве случайной величины в дан­ной задаче выступает число людей в выборке, предпо­читающих добираться на работу личным автотранс­портом. Обозначим ее через X. Перечислим все возмо­жные значения случайной величины X: 0, 1, 2, 3, 4.

Вероятность того, что каждый из отобранных людей предпочитает добираться на работу личным автотранспортом, постоянна и равна 0,2 (р = 0,2). Вероятность противоположного события, т. е. того, что каждый из отобранных людей предпочитает добираться на работу не личным автотранспортом, а как-то иначе, также постоянна и составляет 0,8 (q= 1 - p= 10,2=0,8).

Все 4 испытания — независимы, т. е. вероятность того, что каждый из отобранных людей предпочитает добираться на работу личным автотранспор­том, не зависит от того, каким способом предпочи­тает добираться на работу любой другой человек из числа случайно отобранных.

Очевидно, что случайная величина Х подчиня­ется биномиальному закону распределения вероятностей с параметрами n=4 и р = 0,2.

Итак, по условию задачи:

n = 4; р = 0,2; q = 0,8; X = т.

1) Чтобы построить ряд распределения, необхо­димо вычислить вероятности того, что случайная величина примет каждое из своих возможных зна­чений, и записать полученные результаты в таблицу.

Расчет искомых вероятностей осуществляется по формуле Бернулли


 

Поставим в эту формулу данные задачи.

 



Получим ряд распределения числа людей в вы­борке, предпочитающих добираться на работу лич­ным автотранспортом (табл. 4.6).

Таблица 4.6

X

 

0

 

1

 

2

 

3

 

4

 

P

 

0,4096

 

0,4096

 

0,1536

 

0,0256

 

0,0016

 

 

Так как все возможные значения случайной ве­личины образуют полную группу событий, то сум­ма их вероятностей должна быть равна 1.

Проверка: 0,4096 + 0,4096 + 0,1536 + 0,0256 + + 0,0016 = 1.

Вместо ряда распределения дискретная случай­ная величина может быть задана графически многоугольником (полигоном) распределения (рис. 4.3).


Рис. 4.3

2) Найдем основные числовые характеристики распределения данной случайной величины: математическое ожидание, дисперсию и среднее квадратическое (стандартное) отклонение.

Математическое ожидание любой дискретной случайной величины может быть рассчитано по формуле (4.4)


Но, ввиду того, что в данном случае речь идет о математическом ожидании частоты, для его расче­та можно воспользоваться более простой формулой (4.11)

М(Х = т) = = 4 · 0,2 = 0,8 (чел.).

Рассчитаем дисперсию числа человек, предпочи­тающих добираться на работу личным автотранспортом, среди 4 отобранных. Дисперсия любой дискретной случайной величины может быть рассчи­тана по формуле


В данном случае речь идет о дисперсии частоты, а ее можно найти по формуле (4.12)

D(X = т) = npq = 4 · 0,2 · 0,8 = 0,64 (чел.2).

Рассчитаем среднее квадратическое отклонение числа людей в выборке, предпочитающих добираться на работу личным автотранспортом. Среднее квад­ратическое отклонение рассчитывается по формуле


3) Дискретную случайную величину можно за­дать функцией распределения


где для каждого значения х суммируются вероятно­сти тех значений хi, которые лежат левее точки х.

Зададим функцию распределения дискретной случайной величины применительно к условию дан­ной задачи


Для построения графика функции распределения вероятностей дискретной случайной величины необходимо рассчитать кумулятивные (накопленные) вероятности, соответствующие значениям случай­ной величины. Алгоритм их расчета вытекает из смысла функции распределения

F(Xi) = Р(Х1) + Р(Х2) + ... + Р(Хi-2) + Р(Хi-1).

Эта формула справедлива для всех F(Xi), кроме F(X0). Так как функция распределения определяет вероятность того, что случайная величина примет значение, меньшее заданного, понятно, что вероятность того, что случайная величина примет значе­ние, не более минимального, равна 0, т. е. F(X0) = 0.

Рассчитаем значения F(x)


Эти данные можно представить и в виде табл. 4.7.

Таблица 4.7

Х

х £ 0

0 < х £1

1 < x £2

2< x £3

3 < x £ 4

х > 4

F(x)

0

0,4096

0,8192

0,9728

0,9984

1

 

График функции распределения вероятностей дискретной случайной величины имеет ступенчатый вид. Скачки равны вероятностям, с которыми случайная величина принимает возможные значе­ния (рис. 4.4).


4) Определим вероятность того, что среди 4 слу­чайно отобранных человек:

а) Не будет ни одного человека, предпочитающе­го добираться на работу личным автотранспортом.

Р(Х = 0) = 0,4096.

Вероятность того, что среди четырех случайно отобранных человек не будет ни одного, предпочи­тающего добираться на работу личным автотранс­портом, составляет 0,4096.

б) Будет хотя бы 1 человек, предпочитающий до­бираться на работу личным автотранспортом.

«Хотя бы 1» — «как минимум 1» — «1 или боль­ше». Другими словами, «хотя бы 1» — это «или 1, или 2, или 3, или 4».

Исходя из этого, для определения вероятности того, что среди 4 случайно отобранных человек бу­дет хотя бы 1, предпочитающий добираться на ра­боту личным автотранспортом, можно использовать теорему сложения вероятностей несовместных со­бытий:

Р(Х  ³ 1) = Р(Х = 1) + Р(Х = 2) + Р(Х = 3) + Р(Х = 4);

Р(Х  ³ 1) = 0,4096 + 0,1536 + 0,0256 + 0,0016 = 0,5904.

С другой стороны, все возможные значения слу­чайной величины образуют полную группу собы­тий, а сумма их вероятностей равна 1. По отноше­нию к событию (X ³ 1) до полной группы событий не хватает события (X = 0), которое является про­тивоположным событию (X £ 1). Поэтому искомую вероятность того, среди 4 случайно отобранных че­ловек будет хотя бы 1 человек, предпочитающий добираться на работу личным автотранспортом, про­ще найти следующим образом:

Р(Х  ³ 1) + Р(Х < 1) = 1, откуда Р(Х  ³ 1)=1 - Р(Х = 0) = 1 - 0,4096 = 0,5904.

Вероятность того, что среди 4 случайно отобран­ных человек будет хотя бы 1 человек, предпочитающий добираться на работу личным автотранспор­том, составляет 0,5904.

в) Будет не больше 2, предпочитающих добирать­ся на работу личным автотранспортом.

«Не больше 2» — «2 или меньше», т. е. «или 0, или 1, или 2».

Используем теорему сложения вероятностей не­совместных событий

Р(Х £ 2) = Р(Х = 0) + Р(Х = 1) + Р(Х = 2);

Р(Х £ 2) = 0,4096 + 0,4096 + 0,1536 = 0,9728.

Вероятность того, что среди 4 случайно отобран­ных человек будет не больше 2, предпочитающих добираться на работу личным автотранспортом, со­ставляет 0,9728.

Пример 2. Среднее число инкассаторов, прибы­вающих утром на автомобиле в банк в 15-минут­ный интервал, равно 2. Прибытие инкассаторов происходит случайно и независимо друг от друга.

1) Составьте ряд распределения числа инкасса­торов, прибывающих утром на автомобиле в банк в течение 15 мин.

2) Найдите числовые характеристики этого рас­пределения.

3) Напишите функцию распределения числа ин­кассаторов, прибывающих утром на автомобиле в банк в течение 15 мин, и постройте ее график.

4) Определите, чему равна вероятность того, что в течение 15 мин в банк прибудут на автомобиле хотя бы 2 инкассатора.

5) Определите вероятность того, что в течение 15 мин число прибывших инкассаторов окажется меньше 3.

Решение. Пусть случайная величина Х — число инкассаторов, прибывающих утром на автомобиле в банк в течение 15 мин. Перечислим все возмож­ные значения случайной величины X: 0, 1, 2, 3, 4, 5, ..., п.

Это — дискретная случайная величина, так как ее возможные значения отличаются друг от друга не менее чем на 1, и множество ее возможных зна­чений является счетным.

По условию, прибытие инкассаторов происходит случайно и независимо друг от друга. Следовательно, мы имеем дело с независимыми испытаниями.

Если мы предположим, что вероятность прибы­тия инкассаторов на автомобиле одинакова в лю­бые 2 периода времени равной длины и что прибы­тие или неприбытие автомобиля в любой период времени не зависит от прибытия или неприбытия в любой другой период времени, то последовательность прибытия инкассаторов в банк может быть описана распределением Пуассона.

Итак, случайная величина Х — число инкасса­торов, прибывающих утром на автомобиле в тече­ние 15 мин, подчиняется распределению Пуассона. По условию задачи: l = пр = 2; Х = т.

1) Составим ряд распределения.

Вычислим вероятности того, что случайная ве­личина примет каждое из своих возможных значе­ний, и запишем полученные результаты в таблицу.

Так как данная случайная величина Х подчинена распределению Пуассона, расчет искомых вероятно­стей осуществляется по формуле Пуассона (4.13).

Найдем по этой формуле вероятность того, что в течение 15 мин утром на автомобиле прибудет 0 ин­кассаторов;


Однако расчет вероятностей распределения Пу­ассона легче осуществлять, пользуясь специальными таблицами вероятностей распределения Пуассо­на. В этих таблицах содержатся значения вероят­ностей при заданных m и  l (приложение 6). По условию l = 2, а т изменяется от 0 до n. Воспользовавшись таблицей распределения Пу­ассона (приложение 3), получим:

Р(Х = 0) = 0,1353; Р(Х = 1) = 0,2707;

Р(Х = 2) = 0,2707; Р(Х = 3) = 0,1804;

Р(Х = 4) = 0,0902; Р(Х = 5) == 0,0361;

Р(Х = 6) = 0,0120; Р(Х = 7) = 0,0034;

Р(Х = 8) = 0,0009; Р(Х = 9) = 0,0002.

Данных для l=2 и m ³ 10в таблице нет, что указывает на то, что эти вероятности составляют менее 0,0001, т. е.

Р(Х = 10) » 0.

Понятно, что Р(Х =11) еще меньше отличается от 0.

Занесем полученные результаты в табл. 4.8.

Таблица 4.8

Р

 

Р(Х)

 

0

 

0,1353

 

1

 

0,2707

 

2

 

0,2707

 

3

 

0,1804

 

4

 

0,0902

 

5

 

0,0361

 

6

 

0,0120

 

7

 

0,0034

 

8

 

0,0009

 

9

 

0,0002

 

10

 

0,0000

 

 

Так как все возможные значения случайной ве­личины образуют полную группу событий, сумма их вероятностей должна быть равна 1.

Проверим:

-0,1353 + 0,2707 + 0,2707 + 0,1804 + 0,0902 + 0,0361 + + 0,0120 + 0,0034 + 0.0009 + 0,0002 = 0,9999 »1.

График полученного ряда распределения дискретной случайной величины Х - полигон распределения вероятностей (рис. 4.5).


Рис. 4.5

2) Найдем основные числовые характеристики полученного распределения случайной величины X.

Можно рассчитать математическое ожидание, дисперсию и среднее квадратическое отклонение по общим для любой дискретной случайной величины формулам.

Математическое ожидание случайной величины, подчиняющейся распределению Пуассона, может быть рассчитано и по формуле

М(Х = т) = пр = l, М(Х = т) = l = 2 (инкассатора).

Для выполнения дисперсии случайной величи­ны, подчиняющейся распределению Пуассона, мож­но применить формулу

D(X = т) = l.

Итак, дисперсия числа инкассаторов, прибыва­ющих утром на автомобиле в течение 15 мин,

D(X = т) = l = 2 (инкассатора2).

Среднее квадратическое отклонение числа инкас­саторов, прибывающих утром на автомобиле в течение 15 мин,


3) Зададим теперь дискретную случайную вели­чину в виде функции распределения


График функции вероятностей дискретной слу­чайной величины — полигон распределения вероятностей (рис. 4.6).

Рассчитаем значения F(x):




Эти данные можно представить и в виде табл. 4.9.

Таблица 4.9

Х

 

Р(Х)

 

х £ 0

 

0

 

0<х£1

 

0,1353

 

1<х£2

 

0,4060

 

2<х£3

 

0,6767

 

3<х£4

 

0,8571

 

4.<х£5

 

0,9473

 

5<x£6

 

0,9834

 

6<х£7

 

0,9954

 

7 <x£8

 

0,9988

 

8<х£9

 

0,9997

 

х>9

 

1

 

 

4) Определим вероятность того, что в течение 15 мин в банк прибудут хотя бы 2 инкассатора.

«Хотя бы 2» — «как минимум 2» — «2 или боль­ше». Другими словами, «хотя бы 2» — это «или 2, или 3, или 4, или ...».

Исходя из этого, для определения вероятности того, что в течение 15 мин в банк прибудут хотя бы 2 инкассатора, можно использовать теорему сложе­ния вероятностей несовместных событий:

Р(Х ³ 2) = Р(Х=2) + Р(Х=3) + Р(Х=4) + ... + Р(Х=n).

С другой стороны, все возможные значения слу­чайной величины образуют полную группу собы­тий, а сумма их вероятностей равна 1. По отноше­нию к событию (X ³ 2) до полной группы событий не хватает события (X < 2), т. е. (х £ 1), которое является противоположным событию (X ³ 2). Поэто­му искомую вероятность того, что в течение 15 мин в банк прибудут на автомобиле хотя бы 2 инкасса­тора, проще найти следующим образом:

Р(Х ³ 2) = 1 - Р(Х £ 1) = 1 - (Р(Х = 0) + Р(Х = 1)) = = 1 - (0,1353 + 0,2707) = 1 - 0,406 = 0,594.

Вероятность того, что в течение 15 мин в банк прибудут на автомобиле хотя бы 2 инкассатора, составляет 0,594.

5) Определим вероятность того, что в течение 15 мин число прибывших инкассаторов окажется меньше 3.

«Меньше 3» — это «или 0, или 1, или 2». Из теоремы сложения вероятностей несовмест­ных событий следует:

Р(Х < 3) = Р(Х = 0) + Р(Х = 1) + Р(Х = 2);


Р(Х < 3) = 0,1353 + 0,2707 + 0,2707 – 0,6767.

Вероятность того, что в течение 15 мин в банк прибудут меньше 3 инкассаторов, составляет 0,6767.

Пример 3. Из 20 лотерейных билетов выигрыш­ными являются 4. Наудачу извлекаются 4 билета.

1) Составьте ряд распределения числа выигрыш­ных билетов среди отобранных.

2) Найдите числовые характеристики этого рас­пределения.

3) Напишите функцию распределения числа вы­игрышных билетов среди отобранных и постройте

ее график.

4) Определите вероятность того, что среди ото­бранных 4 билетов окажется: а) не меньше 3 выигрышных билетов; б) не больше 1-го выигрышного билета.

Решение. В качестве случайной величины в дан­ной задаче выступает число выигрышных билетов среди отобранных. Обозначим ее через X.

Перечислим все возможные значения случайной величины X: 0, 1, 2, 3, 4.

Это — дискретная случайная величина, так как ее возможные значения отличаются друг от друга не менее, чем на 1, и множество ее возможных зна­чений является счетным.

 Очевидно, что отбор лотерейных билетов — бес­повторный. Следовательно, испытания — зависимые.

Вышеперечисленные признаки указывают на то, что рассматриваемая случайная величина — чис­ло выигрышных билетов среди отобранных — под­чиняется гипергеометрическому закону распреде­ления.

Изобразим ситуацию на схеме (рис. 4.7).


Случайная величина, интересующая нас, Х = т — число выигрышных билетов в выборке объемом в п билетов. Число всех возможных случаев отбора п билетов из общего числа N билетов равно числу сочетаний из N по п (СnN ), а число случаев отбора т выигрышных билетов из общего числа М выигрышных билетов (и значит, (n-m) проигрышных из общего числа (N — М) проигрышных) равно произведению СmM · Сn-mN-M (отбор каждого из т вы­игрышных билетов может сочетаться с отбором любого из (n-m) проигрышных). Событие, вероятность которого мы хотим определить, состоит в том, что в выборке из n лотерейных билетов окажется ров­но m выигрышных. По формуле для расчета вероятности события в классической модели веро­ятность получения в выборке m выигрышных би­летов (т. е. вероятность того, что случайная вели­чина Х примет значение m) равна


где СnN общее число всех единственно возмож­ных, равновозможных и несовместных исходов;

СnM · Сn-mN-M число исходов, благоприятствующих наступлению интересующего нас события;

m £ n, если n £ M и m £ M, если М < п.

Если по этой формуле вычислить вероятности для всех возможных значений m и поместить их в таблицу, то получим ряд распределения.

1) Составим ряд распределения.

Вычислим вероятности того, что случайная величина примет каждое из своих возможных значений, и запишем полученные результаты в таблицу.

По условию задачи N = 20; М = 4; n = 4; m = 0, 1, 2, 3, 4.


Занесем полученные результаты в табл. 4.10.

Таблица 4.10

Х

 

0

 

1

 

2

 

3

 

4

 

Р(Х)

 

0,37564

 

0,46233

 

0,14861

 

0,01321

 

0,00021

 

 

Произведем проверку. Так как все возможные значения случайной величины образуют полную группу событий, сумма их вероятностей должна быть равна 1.

Проверка:

0,37564 + 0,46233 + 0,14861 + 0,01321 + 0,00021 = 1.

График полученного распределения вероятностей дискретной случайной величины — полигон распределения вероятностей (рис. 4.8).


Рис. 4.8

2) Найдем основные числовые характеристики распределения данной случайной величины.

Можно рассчитать математическое ожидание, дисперсию и среднее квадратическое отклонение по


общим для любой дискретной случайной величины формулам.

Но математическое ожидание случайной величи­ны, подчиняющейся гипергеометрическому распределению, может быть рассчитано по более простой формуле


Рассчитаем математическое ожидание числа вы­игрышных билетов среди отобранных:


Дисперсию случайной величины, подчиняющей­ся распределению, также можно рассчитать по бо­лее простой формуле


Вычислим дисперсию числа выигрышных биле­тов среди отобранных:


Рассчитаем среднее квадратическое отклонение числа выигрышных билетов среди отобранных:


3) Зададим дискретную случайную величину в виде функции распределения


Рассчитаем значения F(x):


Эти данные можно представить в виде графика функции распределения (рис. 4.9) и табл. 4.11.


 

Таблица 4.11

Х

 

х £ 0

 

0 <х £ 1

 

1 £ 2

 

2 £ 3

 

3 £4

 

х > 4

 

F(x)

 

0

 

0,37564

 

0,83797

 

0,98658

 

0,99979

 

1

 

4) Определим вероятность того, что среди 4 ото­бранных билетов окажется:

а) не меньше 3 выигрышных.

«Не меньше 3» — «как минимум 3» — «3 или больше». Другими словами, «не меньше 3» — это «или 3, или 4».

Исходя из этого, для определения вероятности то­го, что среди отобранных 4 билетов окажется не мень­ше 3 выигрышных билетов, можно применить тео­рему сложения вероятностей несовместных событий:

Р(Х ³ 3) = Р(Х = 3) + Р(Х = 4) == 0,01321 + 0,00021 = 0,01342.

Вероятность того, что среди отобранных окажет­ся не меньше 3 выигрышных билетов, составляет 0,01342.     .

б) не больше 1 выигрышного билета. «Не боль­ше 1» — это «1 или меньше», «или 0, или 1».

Следовательно, для определения вероятности того, что среди отобранных окажется не больше одного выигрышного билета, также применяем теорему сло­жения вероятностей для несовместных событий

Р(Х  £ 1) = Р(Х = 0) + Р(Х = 1) = 0,37564 + 0,46233 = 0,83797.

 

Задачи к теме 4

1. В городе 10 коммерческих банков. У каждого риск банкротства в течение года составляет 10%. Составьте ряд распределения числа банков, кото­рые могут обанкротиться в течение следующего года; постройте его график. Найдите числовые ха­рактеристики этого распределения. Запишите в общем виде функцию распределения вероятностей и постройте ее график. Чему равна вероятность того, что в течение года обанкротятся не больше одного банка?

2. В лотерее на 100 билетов разыгрываются две вещи, стоимости которых 210 и 60 у. е. Составьте ряд распределения суммы выигрыша для лица, имеющего: а) один билет; б) два билета. Стоимость билета — 3 у. е. Найдите числовые характеристи­ки этих распределений. Запишите в общем виде функции распределений вероятностей и постройте их графики.

3. Нефтеразведывательная компания получила финансирование для проведения 6 нефтеразработок. Вероятность успешной нефтеразведки 0,05. Пред­положим, что нефтеразведку осуществляют независимые друг от друга разведывательные партии. Со­ставьте ряд распределения числа успешных нефтеразведок. Найдите числовые характеристики этого распределения. Запишите в общем виде функцию распределения вероятностей и постройте ее график. Чему равна вероятность того, что как минимум 2 нефтеразведки принесут успех?

 4. Под руководством бригадира производствен­ного участка работают 3 мужчин и 4 женщины. Бригадиру необходимо выбрать двух рабочих для специальной работы. Не желая оказывать кому-либо предпочтения, он решил выбрать двух рабочих слу­чайно. Составьте ряд распределения числа женщин в выборке. Найдите числовые характеристики это­го распределения. Запишите в общем виде функ­цию распределения вероятностей и постройте ее график. Какова вероятность того, что будет выбра­но не более одной женщины?

5. Некоторый ресторан славится хорошей кух­ней. Управляющий ресторана хвастает, что в суб­ботний вечер в течение получаса подходит до 9 групп посетителей. Составьте ряд распределения возмож­ного числа групп посетителей ресторана в течение получаса; постройте его график. Найдите число­вые характеристики этого распределения. Запиши­те в общем виде функцию распределения вероят­ностей и постройте ее график. Чему равна вероят­ность того, что 3 или более групп посетителей при­будут в ресторан в течение 10-минутного проме­жутка времени?

6. Хорошим считается руководитель, принима­ющий не менее 70% правильных решений. Тако­му управляющему банком предстоит принять ре­шения по 4 важным вопросам банковской полити­ки. Считая вероятность принятия правильного ре­шения постоянной, составьте ряд распределения возможного числа правильных решений управля­ющего; постройте его график. Найдите числовые характеристики этого распределения. Запишите в общем виде функцию распределения вероятностей и постройте ее график. Чему равна вероятность того, что управляющий примет менее 3 правиль­ных решений?

7. В банк поступило 30 авизо. Подозревают, что среди них 5 фальшивых. Тщательной проверке подвергается 15 случайно выбранных авизо. Составьте ряд распределения числа фальшивых авизо, кото­рые могут быть выявлены в ходе проверки; пост­ройте его график. Найдите числовые характеристики этого распределения. Запишите в общем виде функцию распределения вероятностей и постройте ее график. Чему равна вероятность того, что в ходе проверки обнаружится менее 2 фальшивок?

8. В течение семестра преподаватели проводят консультации по вопросам, которые остались неясными для студентов. Преподаватель, проводящий консультации по статистике, заметил, что в сред­нем 8 студентов посещают его за час консультаци­онного времени, хотя точное число студентов, посе­щающих консультацию в определенный день, в на­значенный час, — случайная величина. Составьте ряд распределения числа студентов, посещающих консультации преподавателя по статистике в тече­ние часа. Найдите числовые характеристики этого распределения. Запишите в общем виде функцию распределения вероятностей и постройте ее график. Чему равна вероятность того, что 3 студента придут на консультацию в течение определенного по­лучаса?

9. В ходе аудиторской проверки строительной компании аудитор случайным образом отбирает 5

счетов. При условии, что 3% счетов содержат ошиб­ки, составьте ряд распределения правильных сче­тов. Найдите числовые характеристики этого рас­пределения. Запишите в общем виде функцию распределения вероятностей и постройте ее график. Чему равна вероятность того, что хотя бы 1 счет будет с ошибкой?

10. Записи страховой компании показали, что 30% держателей страховых полисов старше 50 лет потребовали возмещения страховых сумм. Для про­верки в случайном порядке было отобрано 15 человек старше 50 лет, имеющих полисы. Составьте ряд распределения числа предъявленных претензий. Найдите числовые характеристики этого распреде­ления. Запишите в общем виде функцию распределе­ния вероятностей и постройте ее график. Чему рав­на вероятность того, что, по крайней мере, 10 чело­век потребуют возмещения страховых сумм?

11. Экзаменационный тест содержит 15 вопро­сов, каждый из которых имеет 5 возможных отве­тов и только 1 из них верный. Предположим, что студент, который сдает экзамен, знает ответы не на все вопросы. Составьте ряд распределения числа пра­вильных ответов студента на вопросы теста и постройте его график. Найдите числовые характерис­тики этого распределения. Запишите функцию рас­пределения вероятностей и постройте ее график. Чему равна вероятность того, что студент правильно ответит, по крайней мере, на 10 вопросов?

12. Для того чтобы проверить точность своих финансовых счетов, компания регулярно пользуется услугами аудиторов для проверки бухгалтерских проводок счетов. Предположим, что служащие компании при обработке входящих счетов допускают примерно 5% ошибок. Предположим, аудитор слу­чайно отбирает 3 входящих документа. Составьте ряд распределения числа ошибок, выявленных ауди­тором. Найдите числовые характеристики этого распределения. Запишите функцию распределения вероятностей и постройте ее график. Определите ве­роятность того, что аудитор обнаружит более чем 1 ошибку.

13. В городе 10 машиностроительных предприя­тий, из которых 6 — рентабельных и 4 — убыточ­ных. Программой приватизации намечено прива­тизировать 5 предприятий. При условии проведе­ния приватизации в случайном порядке составьте ряд распределения рентабельных предприятий, по­павших в число приватизируемых; постройте его график. Найдите числовые характеристики этого распределения. Запишите функцию распределения вероятностей и постройте ее график. Чему равна вероятность того, что будет приватизировано не менее 4 рентабельных предприятий?

14. В международном аэропорту время прибы­тия самолетов различных рейсов высвечивается на электронном табло. Появление информации о раз­личных рейсах происходит случайно и независи­мо друг от друга. В среднем в аэропорт прибывает 10 рейсов в час. Составьте ряд распределения чис­ла сообщений о прибытии самолетов в течение часа. Найдите числовые характеристики этого распределения. Запишите функцию распределения вероятностей и постройте ее график. Чему равна веро­ятность того, что в течение часа прибудут не менее 3 самолетов? Чему равна вероятность того, что в течение четверти часа не прибудет ни один само­лет?

15. Телевизионный канал рекламирует новый вид детского питания. Вероятность того, что телезритель увидит эту рекламу, оценивается в 0,2. В случайном порядке выбраны 10 телезрителей. Составьте ряд распределения числа лиц, видевших рекламу. Найдите числовые характеристики этого распределения. Запишите функцию распределения вероятностей и постройте ее график. Чему равна вероятность того, что, по крайней мере, 2 телезри­теля этого канала видели рекламу нового детского питания?

16. В часы пик для общественного транспорта города происходит в среднем 2 дорожных происшествия в час. Утренний пик длится 1,5 ч, а ве­черний — 2ч. Составьте ряды распределения чис­ла дорожных происшествий в утренние и вечер­ние часы пик и постройте их графики. Найдите числовые характеристики этих распределений. Запишите функции распределений вероятностей и постройте их графики. Чему равна вероятность того, что в определенный день во время и утренне­го, и вечернего пика не произойдет ни одного до­рожного происшествия?

17. В магазине имеется 15 автомобилей опреде­ленной марки. Среди них — 7 черного цвета, 6 — серого и 2 — белого. Представители фирмы обратились в магазин с предложением о продаже им 3 автомобилей этой марки, безразлично какого цве­та. Составьте ряд распределения числа проданных автомобилей черного цвета при условии, что автомобили отбирались случайно, и постройте его гра­фик. Найдите числовые характеристики этого рас­пределения. Напишите функцию распределения вероятностей и постройте ее график. Какова вероят­ность того, что среди проданных фирме автомоби­лей окажется, по крайней мере, 2 автомобиля чер­ного цвета?

18. На предприятии 1000 единиц оборудования определенного вида. Вероятность отказа единицы оборудования в течение часа составляет 0,001. Со­ставьте ряд распределения числа отказов оборудо­вания в течение часа. Найдите числовые характе­ристики этого распределения. Запишите в общем виде функцию распределения вероятностей и пост­ройте ее график. Чему равна вероятность того, что в течение часа откажут как минимум 2 единицы обо­рудования?

19. Торговый агент в среднем контактирует с 8 по­тенциальными покупателями в день. Из опыта ему известно, что вероятность того, что потенциальный покупатель совершит покупку, равна 0,1. Составь­те ряд распределения ежедневного числа продаж для агента и постройте его график. Найдите числовые характеристики этого распределения. Запиши­те в общем виде функцию распределения вероятно­стей и постройте ее график. Чему равна вероятность того, что у агента будут хотя бы 2 продажи в тече­ние дня?

 

20. Прибытие посетителей в банк подчиняется одному из теоретических законов распределения. Предполагая, что в среднем в банк каждые 3 мину­ты входит 1 посетитель, составьте ряд распределе­ния возможного числа посетителей банка в течение 15 мин. Найдите числовые характеристики этого распределения. Запишите в общем виде функцию распределения вероятностей и постройте ее график. Определите вероятность того, что, по крайней мере, 3 посетителя войдут в банк в течение 1 минуты?

 

5. НЕПРЕРЫВНЫЕ СЛУЧАЙНЫЕ ВЕЛИЧИНЫ

5.1. Функция распределения и плотность распределения непрерывной случайной величины

Нам уже известно, что такое функция распреде­ления дискретной случайной величины. Эта форма задания закона распределения случайной величи­ны является универсальной и используется для непрерывных случайных величин.

Случайная величина Х называется непрерыв­ной, если ее функция распределения непрерывна и имеет производную.

Рассмотрим свойства функ­ции распределения.

1. Вероятность попадания случайной величины в промежуток от a до b равна приращению функ­ции распределения на концах этого промежутка

P(a<X<b)=F(b)-F(a),        (5.1)

так как вероятность любого отдельного значения случайной величины равна нулю, если функция распределения непрерывна при этом значении

Р(Х = х1) = 0, когда F(x) непрерывна в точке х = х1.

 

2. Функция распределения удовлетворяет условиям

F(-¥)= 0, F(+¥) = 1.          (5.2)

Плотностью распределения (дифференциальной функцией) непрерывной случайной величины на­зывается функция

f(x) = F'(x).                 (5.3)

Плотность распределения любой случайной ве­личины неотрицательна f(x) ≥ 0.

Несобственный интеграл от дифференциальной функции в пределах от -¥ до +¥ равен 1:


График функции у = f(x) называется кривой распределения или графиком плотности распределения. Кривая у = f(x) располагается над осью абсцисс.

Вероятность попадания случайной величины в промежуток от a доb может быть вычислена по формуле

 


Подынтегральное выражение f(x)dx называет­ся элементом вероятности. Оно выражает вероятность попадания случайной точки в промежуток между точками х и х + Dх, где Dх — бесконечно

малая величина.

Функция распределения F(x), выражаемая через плотность f(x), имеет вид


Математическое ожидание непрерывной случай­ной величины Х вычисляется по формуле


5.2. Нормальное распределение

Если плотность распределения (дифференциаль­ная функция) случайной переменной определяется

как


то говорят, что Х имеет нормальное распределение с параметрами а и s2. Вероятностный смысл параметров

а = М(Х), а s2 = D(X),

где    Х ~ N(а; s2).

Если задать параметры нормального распределе­ния, взяв а=0 и s=1,то получим так называемое нормированное (стандартное) нормальное распреде­ление. Плотность нормированного нормального распределения описывается функцией


Значения этой функции табулированы (приложение 1).

Для расчета вероятности попадания нормально распределенной случайной величины Х в промежу­ток от a до b используется формула


где   - интеграл Лапласа.

Формула (5.10) иногда в литературе называется интегральной теоремой Лапласа.

Функция Ф0(х) обладает свойствами:

 


Функция Ф0(х) табулирована. В частности для симметричного относительно а промежутка (а - Δ;

а + D) имеем


Формула (5.11) применима и к частоте т, по­скольку ее закон распределения при достаточно большом числе испытаний практически совпадает с нормальным. Применительно к случайной вели­чине т с учетом ее числовых характеристик

М(т) = пр и s2(m) = npq      (5.12)

формула (5.11) примет вид


Формула (5.11) может быть применена и к отно­сительной частоте т/п с числовыми характеристиками


С вероятностью, очень близкой к единице (рав­ной 2Ф0(3) = 0,9973), нормально распределенная случайная величина Х удовлетворяет неравенству

а- Зs<Х< а + Зs.        (5.16)

В этом состоит правило 3 сигм: если случайная величина распределена по нормальному закону, то ее отклонение от математического ожидания прак­тически не превышает ±3s.

Локальная теорема Муавра — Лапласа. При р¹0 и p¹1 и достаточно большом п биномиальное распределение близко к нормальному закону (при­чем их математические ожидания и дисперсии совпадают), т. е. имеет место равенство:


тогда


для достаточно больших п.

Здесь j(х) (приложение 1) — плотность веро­ятностей стандартной нормальной случайной вели­чины


Пример 1. На рынок поступила крупная партия говядины. Предполагается, что вес туш — случай­ная величина, подчиняющаяся нормальному за­кону распределения с математическим ожидани­ем а = 950 кг и средним квадратическим отклоне­нием σ = 150 кг.

1) Определите вероятность того, что вес случай­но отобранной туши: а) окажется больше 1 250 кг;

б) окажется меньше 850 кг; в) будет находиться между 800 и 1 300 кг; г) отклонится от математи­ческого ожидания меньше, чем на 50 кг; д) откло­нится от математического ожидания больше, чем на 50 кг.

2) Найдите границы, в которых отклонение веса случайно отобранной туши от своего математического ожидания не превысит утроенного среднего квадратического отклонения (проиллюстрируйте правило 3 сигм).

3) С вероятностью 0,899 определите границы, в которых будет находиться вес случайно отобранной туши. Какова при этом условии максимальная ве­личина отклонения веса случайно отобранной туши от своего математического ожидания?

Решение. 1а) Вероятность того, что вес случайно отобранной туши окажется больше 1 250 кг, можно понимать как вероятность того, что вес случайно отобранной туши окажется в интервале от 1 250 кг до +¥..

Формула расчета вероятности попадания в задан­ный интервал нормально распределенной случай­ной величины Х имеет вид


где Ф0(z) — функция Лапласа


Функция Ф0(z) является нечетной функцией, т. е.

Ф0(-z) = 0(z).

Найдем вероятность того, что вес случайно ото­бранной туши окажется больше 1 250 кг. По усло­вию a = 1 250, b = +¥, а = 950, s = 150.

Используем формулу расчета вероятности попа­дания в заданный интервал нормально распределенной случайной величины Х


Найдем по таблице функции Лапласа (приложение 2) значения Ф0(z)

Значения Ф0(+¥) в таблице нет. Однако извест­но, что Ф0(z)→ 0,5 при z +¥. Уже при z=5           Ф0 (z =5) = 0,49999997 » 0,5. Очевидно, что Ф0(+¥)— величина, бесконечно близкая к 0,5 , Ф0(-¥.) — величина, бесконечно близкая к -0,5.

По таблице функции Лапласа Ф0(2) = 0,47725.

Отсюда

Р(Х > 1 250) = 0,5 - 0,47725 = 0,02275.

Итак, вероятность того, что вес случайно отобран­ной туши окажется больше 1 250 кг, составляет

0,02275.

Проиллюстрируем решение задачи графически (рис. 5.1).


Итак, нам задана нормально распределенная слу­чайная величина Х с математическим ожиданием а = 950 кг и средним квадратическим отклонением s= 150 кг, т. е. Х ~ N (950; 1502). Мы хотим найти вероятность того, что Х больше 1 250, т. е. определить Р(Х > 1 250). Преобразуем X в Z, и тогда иско­мая вероятность определится по таблице стандарт­ного нормального распределения (приложение 2)


Точка z=0 соответствует математическому ожи­данию, т. е. а = 950 кг.

1б) Вероятность того, что вес случайно отобранной туши окажется меньше 850 кг — это то же самое, что и вероятность того, что вес случайно отобранной туши окажется в интервале от -¥ до 850 кг. По условию α = -¥, b = 850, а = 950, s= 150.

Для расчета искомой вероятности используем формулу расчета вероятности попадания в задан­ный интервал нормально распределенной случай­ной величины Х


Согласно свойству функции Лапласа,


Найдем по таблице функции Лапласа (приложе­ние 2) значения Ф0(z).

 

Ф0(+¥) » 0,5; Ф0(0,67) = 0,24857.

 

Отсюда

Р(Х < 850) = 0,5 - 0,24857 = 0,25143.

Вероятность того, что вес случайно отобранной туши окажется меньше 850 кг составляет 0,25143.

Проиллюстрируем решение задачи графически (рис. 5.2).


По условию данной задачи точка на оси абсцисс (z = -0,67) соответствует х = 850, т.е. весу, равно­му 850 кг. Заштрихованная на рис. 5.2 площадь представляет вероятность того, что вес наудачу выб­ранной туши окажется меньше 850 кг, т. е. в ин­тервале от -¥ до 850 кг.

1в) Найдем вероятность того, что вес случайно отобранной туши окажется в интервале от 800 до 1 300 кг.

По условию a = 800, b=1 300, а = 950, s = 150. Для расчета искомой вероятности используем формулу расчета вероятности попадания в задан­ный интервал нормально распределенной случай­ной величины Х


Согласно свойству функции Лапласа,

0(-1) = Ф0(1).

Найдем по таблице функции Лапласа (приложение 2) значения Ф0(z)

Ф0(2,33) = 0,49010; Ф0(1) = 0,34134.

Отсюда

Р(800 < Х < 1 300) = 0,49010 + 0,34134 = 0,83144.

Вероятность того, что вес случайно отобранной туши окажется в интервале от 800 до 1300 кг, составляет 0,83144.

Проиллюстрируем решение задачи графически (рис. 5.3).

По условию данной задачи точка на оси абсцисс (z = -1) соответствует х = 800, т. е. весу, равному 800 кг, а точка (z = 2,33) — х = 1300, т. е. весу, равному 1 300 кг. Заштрихованная на рис. 5.3 пло­щадь представляет собой вероятность того, что вес наудачу выбранной туши окажется в интервале от 800 до 1 300 кг.


На рис. 5.3 видно, что искомую вероятность того, что вес наудачу выбранной туши окажется в интер­вале от 800 до 1 300 кг, можно было найти другим способом. Для этого необходимо было найти вероят­ность того, что вес наудачу выбранной туши окажет­ся меньше 800 кг, а также больше 1 300 кг. Полу­ченные вероятности сложить и вычесть из 1.

Итак, вероятность того, что вес наудачу выбран­ной туши окажется меньше 800 кг, — это вероятность того, что вес случайно отобранной туши ока­жется в интервале от —¥ до 850 кг.


Вероятность того, что вес случайно отобранной туши окажется больше 1 300 кг — это вероятность того, что вес случайно отобранной туши окажется в интервале от 1 300 кг до +¥.


Отсюда искомая вероятность того, что вес науда­чу выбранной туши окажется в интервале от 800 до 1300 кг:

Р(800 < Х < 1 300) = 1 - (Р(Х < 800) + Р(Х > 1 300)) =  1 - (0,15866 + 0,0099) = 1 - 0,16856 = 0,83144.

1г) Найдем вероятность того, что вес случайно отобранной туши отклонится от математического ожидания меньше, чем на 50 кг, т. е.

Р(|Х - 950| < 50) = ?

Что значит |Х - 950| < 50 ?

Это неравенство можно заменить двойным нера­венством

-50 < Х - 950 < 50,

или

950 - 50 < X < 950 + 50, 900 < X < 1 000.

Следовательно,

Р(|Х - 950| < 50) = Р(900 < X < 1 000).

А это вероятность попадания в заданный интервал нормально распределенной случайной величины X. Отсюда


Согласно свойству функции Лапласа,

0(-0,33) = Ф0(0,33).

Найдем по таблице функции Лапласа (приложение 2) значения Ф0(z)

Ф0(0,33) = 0,1293.

Следовательно,

Р(|Х - 950| < 50) = Р(900 < Х < 1 000) =  2·0,1293 = 0,2586.

Вероятность того, что вес случайно отобранной туши отклонится от математического ожидания меньше, чем на 50 кг, составляет 0,2586.

Эту задачу легче решить, используя формулу расчета вероятности заданного отклонения нормаль­но распределенной случайной величины Х от свое­го математического ожидания


где Δ — величина отклонения случайной величины Х от математического ожидания.

По условию D = 50; а = 950, s= 150. Используя эту формулу, сразу получим

Р(|Х — 950| < 50) = 2Ф0(50/150) = 2Ф0(0,33) = 2 · 0,1293 = 0,2586.

Проиллюстрируем решение задачи графически (рис. 5.4).


По условию данной задачи точка на оси абсцисс (z = -0,33) соответствует х = 900, т. е. весу, равно­му 900 кг, а точка (z = 0,33) соответствует х = 1000, т. е. весу, равному 1 000 кг. Заштрихованная на рис. 5.4 площадь представляет собой вероятность того, что вес наудачу выбранной туши окажется в интервале от 900 до 1 000 кг, т. е. отклонится от математического ожидания меньше, чем на 50 кг.

1д) Найдем вероятность того, что вес случайно отобранной туши отклонится от математического ожидания больше, чем на 50 кг, т. е.

Р(|Х - 950| > 50) = ?

Это вероятность события, противоположного по отношению к событию, — вес случайно отобранной туши отклонится от математического ожидания меньше, чем на 50 кг,


Следовательно,


Вероятность того, что вес случайно отобранной туши отклонится от математического ожидания больше, чем на 50 кг, составляет 0,7414.

Можно использовать другой алгоритм решения.  Вероятность того, что вес случайно отобранной туши отклонится от математического ожидания больше, чем на 50 кг, — это вероятность того, что вес случайно отобранной туши будет или меньше (950 - 50 = 900) кг, или больше (950 + 50 = 1 000) кг.

По теореме сложения вероятностей несовместных событий имеем

 


Отсюда


2) Найдем границы, в которых отклонение веса случайно отобранной туши от своего математического ожидания не превысит утроенного среднего квадратического отклонения.

В этом задании студентам предлагается проил­люстрировать правило 3 сигм, которое можно сформулировать следующим образом:

Если случайная величина распределена по нор­мальному закону, то ее отклонение от математического ожидания практически не превышает ±3s.

Р(|Х - а| < 3s) = 2Ф0(3) = 0,9973.

Вероятность того, что отклонение нормально рас­пределенной случайной величины Х от своего математического ожидания будет меньше 3s или, дру­гими словами, вероятность того, что нормально рас­пределенная случайная величина Х попадет в ин­тервал (а - 3s; а + 3s), равна 0,9973.

Следовательно, вероятность того, что отклонение случайной величины от своего математического ожи­дания по абсолютной величине превысит утроенное среднее квадратическое отклонение, очень мала и равна 0,0027. Другими словами, лишь в 27 случа­ях из 10 000 случайная величина Х в результате испытания может оказаться вне интервала (а - 3s;а + 3s). Такие события считаются практически невозможными.

Формулу, описывающую правило 3 сигм, неслож­но получить из формулы вероятности заданного отклонения нормально распределенной случайной ве­личины Х от своего математического ожидания:


Если взять D = 3s, то получим D/s = 3.

Отсюда

Р(|Х - а|< 3s) = 2Ф0(3) = 0,9973.

По условию задачи а = 950; s = 150.

Правило 3 сигм можно представить так:

Р(а - 3s < Х < а + 3s) = 2Ф0(3) = 0,9973.

Интересующие нас границы — это границы интервала (а - 3s; а + 3s), т. е.


Учитывая, что вес отобранной туши — нормаль­но распределенная случайная величина, можно быть практически уверенным, что вес случайно отобран­ной туши не выйдет за пределы от 500 до 1 400 кг.

3) Определим границы, в которых с вероятностью 0,899 будет находиться вес случайно отобранной туши.  Формулу вероятности заданного отклонения нормально распределенной случайной величины Х от своего математического ожидания можно представить следующим образом:


или


где g — вероятность того, что отклонение нормаль­но распределенной случайной величины Х от своего математического ожидания не превысит задан­ной величины Δ.

По условию задачи а = 950; s = 150. Используя последнюю формулу, получим:


Из соотношения 2Ф0(D/150) = 0,899 найдем Δ :


По таблице функции Лапласа (приложение 2) най­дем, при каком z = D/150 функция Ф0(2) = 0,4495.

z = 1,64, т.е. Ф0(1,64) = 0,4495.

Отсюда

D/150 = 1,64, D = 1,64 · 150 = 246.

С вероятностью 0,899 можно ожидать, что откло­нение веса случайно отобранной туши от своего математического ожидания не превысит 246 кг.

Найдем границы интересующего нас интервала:

а-D<Х<а+D,

950 - 246 < X < 950 + 246,

704 < X < 1196.

С вероятностью 0,899 можно ожидать, что вес случайно отобранной туши будет находиться в пределах от 704 до 1 196 кг.

Ответ. 1. а) 0,02275, б) 0,25143, в) 0,83144, г) 0,2586, д) 0,7414; 2. (500, 1 400);

3. 246 (704, 1196).


Пример 2. Изменим условие предыдущей задачи.

На рынок поступила крупная партия говядины. Предполагается, что вес туш — случайная величина, подчиняющаяся нормальному закону распределе­ния с неизвестным математическим ожиданием и средним квадратическим отклонением s= 150 кг. Известно, что 37,07% туш имеют вес более 1 000 кг. Определите ожидаемый вес случайно отобранной туши.

Решение. По условию задачи s= 150; а = 1 000; β = +¥; Р(Х > 1 000) = 0,3707.

Ожидаемый вес случайно отобранной туши — это среднеожидаемый вес (математическое ожидание), т. е. а = ?

Используем формулу (5.10) расчета вероятности попадания в заданный интервал нормально распределенной случайной величины Х


По таблице функции Лапласа (приложение 2) найдем, при каком z = (100 - а)/150 функция Ф0(z) = 0,1293.

z = 0,33, т.е. Ф0(0,33) = 0,1293.

Отсюда


1 000 - а = 0,33 · 150 = 50,

а = 1 000 - 50 = 950.

Ответ. Среднеожидаемый вес случайно отобран­ной туши составляет 950 кг.

Пример 3. Вновь изменим условие задачи.

На рынок поступила крупная партия говядины. Предполагается, что вес туш — случайная величи­на, подчиняющаяся нормальному закону распреде­ления с математическим ожиданием а = 950 кг и неизвестным средним квадратическим отклонением. Известно, что 15,87% туш имеют вес менее 800 кг. Определите среднее квадратическое (стандартное) отклонение веса туш.

Решение. По условию задачи: а = 950; a = ; b= 800; Р(Х < 800) = 0,1587; s = ?

Используем формулу (5.10) расчета вероятности попадания в заданный интервал нормально распределенной случайной величины Х


 


 

 По таблице функции Лапласа (приложение 2) най­дем, при каком z = 150/ σ функция Ф0(z) = 0,3413.

z = 1, т. е. Ф0(1) = 0.3413.

Отсюда


 

Ответ. Среднее квадратическое отклонение веса туш составляет 150 кг.

Пример 4. Еще раз изменим условие задачи. На рынок поступила крупная партия говядины.  Предполагается, что вес туш — случайная величи­на, подчиняющаяся нормальному закону распределения с неизвестными математическим ожиданием и средним квадратическим отклонением. Известно, что 15,87% туш имеют вес менее 800 кг и 37,07% туш — более 1 000 кг. Определите средний ожидае­мый вес и среднее квадратическое (стандартное) отклонение веса туш.

 

Решение. По условию задачи α = -¥; b = 800; Р(Х < 800) = 0,1587; Р(Х > 1000) = 0,3707; а = ?; s= ?

Используем формулу (5.10) расчета вероятности попадания в заданный интервал нормально распределенной случайной величины Х


 


По таблице функции Лапласа (приложение 2) най­дем, при каком z = (а - 800)/s функция Ф0(z) =  =0,3413.

z=1,т. e. Ф0(1) = 0,3413.

Отсюда


С другой стороны,


По таблице функции Лапласа (приложение 2) най­дем, при каком


 

Отсюда


Решим систему линейных уравнений:


Среднеожидаемый вес случайно отобранной туши составляет 950 кг. Среднее квадратическое отклонение веса туш — 150 кг.

Ответ. а = 950; s= 150.

Пример 5. В очередной раз изменим условие задачи. На рынок поступила крупная партия говядины. Предполагается, что вес туш — случайная величина, подчиняющаяся нормальному закону распределения, с математическим ожиданием а = 950 кг и неизвестным средним квадратическим отклонени­ем. Каким должно быть среднее квадратическое (стандартное) отклонение, чтобы с вероятностью 0,81648 можно было утверждать, что абсолютное отклонение веса случайно отобранной туши от ма­тематического ожидания не превысит 200 кг?

Решение. По условию задачи а = 950; Δ = 200; Р(|Х - 950| < 200) = 0,81648; σ =?

Используем формулу (5.11) расчета вероятности заданного отклонения нормально распределенной случайной величины Х от своего математического ожидания.

Тогда получим


По таблице функции Лапласа (приложение 2) най­дем, при каком z = 200/s функция Ф0(z) = 0,40824.

z = 1,33, т. е. Ф0(1.33) = 0,40824.

Отсюда


s=200/1,33=150.

Чтобы с вероятностью 0,81648 можно было ут­верждать, что абсолютное отклонение веса случай­но отобранной туши от математического ожидания не превысит 200 кг, среднее квадратическое отклонение веса туш должно составлять 150 кг.

Ответ. 150.

 

Пример 6. Фирма собирается приобрести партию из 100 000 единиц некоторого товара. Из прошлого опыта известно, что 1 % товаров данного типа име­ют дефекты. Какова вероятность того, что в данной партии окажется от 950 до 1 050 дефектных еди­ниц товара?

Решение. В качестве случайной величины в дан­ной задаче выступает число дефектных единиц товара в общей партии из 100 000 единиц. Обозначим ее через X.

Перечислим все возможные значения случайной величины X: 0, 1, 2, ..., 99 999, 100 000.

Это — дискретная случайная величина, так как ее возможные значения отличаются друг от друга не менее чем на 1, и множество ее возможных зна­чений является счетным.

По условию вероятность того, что единица това­ра окажется дефектной, — постоянна и составляет 0,01 (р = 0,01). Вероятность противоположного со­бытия, т. е. того, что единица товара не имеет дефекта, также постоянна и составляет 0,99:

q= 1 -p= 1 -0,01 =0,99.

Все 100 000 испытаний — независимы, т. е. веро­ятность того, что каждая единица товара окажется дефектной, не зависит от того, окажется дефектной или нет любая другая единица товара.

Значения случайной величины Х — это, в об­щем виде, число появлений интересующего нас со­бытия в 100 000 независимых испытаниях. Поэто­му можно сделать вывод о том, что случайная ве­личина Х — число дефектных единиц товара в об­щей партии из 100 000 единиц — подчиняется би­номиальному закону распределения вероятностей с параметрами п = 100 000 и р = 0,01.

Итак, по условию задачи n = 100 000; р = 0,01; q = 0,99; X = т.

Необходимо найти вероятность того, что число дефектных единиц товара окажется в пределах от    т1 = 950 до т2 =1 050, т. е. вероятность того, что случайная величина Х = т попадет в интервал от 950 до 1050:

Р(т1 < т < т2) = ?

Так как мы имеем дело со случайной величиной, подчиняющейся биномиальному распределению, вероятность появления события т раз в п незави­симых испытаниях необходимо вычислять по фор­муле Бернулли (4.10).

В данном случае для определения искомой вероят­ности нам необходимо с помощью формулы Бернулли найти P100000, 950       Р100000, 951 , РР100000, 952   ...,  РР100000,1049

РР100000,1050 ,а затем сложить их, используя теорему сложения вероятностей несовместных событий.

Очевидно, что такой способ определения иско­мой вероятности связан с громоздкими вычислени­ями. Так,


Можно значительно облегчить расчеты, если ап­проксимировать биномиальное распределение нор­мальным, т. е. выразить функции биномиального распределения через функции нормального.

Когда п — число испытаний в биномиальном эксперименте — возрастает, дискретное биномиаль­ное распределение стремится к непрерывному нор­мальному распределению. Это означает, что для больших п мы можем аппроксимировать биноми­альные вероятности вероятностями, полученными для нормально распределенной случайной величины, имеющей такое же математическое ожидание и такое же среднее квадратическое отклонение.

Подставим параметры биномиального распреде­ления (5.15) в формулу (5.10) и получим формулу для приближенного расчета вероятности появления события от т1 до т2 раз в п независимых испыта­ниях Р(т1 < т < т2):


где Ф0(z) — функция Лапласа


Формулу для вычисления вероятности появле­ния события от т1 до т2 раз в п независимых испытаниях Рn(m1 < т < т2) называют интегральной теоремой Лапласа.

Использование локальной и интегральной теорем Лапласа дает приближенные значения искомых вероятностей. Погрешность будет невелика при ус­ловии, что npq > 9.

Для решения данной задачи воспользуемся ин­тегральной теоремой Лапласа:


 


По таблице функции Лапласа (приложение 2) найдем Ф0(1,59).

Ф0(1,59) = 0,44408.

P100000 (950< т < 1 050) » 2 · 0,44408 = 0,88816.

Вероятность того, что в партии из 100 000 еди­ниц окажется от 950 до 1 050 дефектных единиц товара, составляет 0,88816.

Данную конкретную задачу можно было решить еще более просто.

Математическое ожидание числа дефектных еди­ниц товара равно 1 000 единиц:

М(т) = пр= 100 000 · 0,01 = 1 000.

Абсолютное отклонение нижней и верхней гра­ниц интервала 1, т2) от математического ожида­ния М(т) = пр составляет 50 единиц:

|m1 - пр| = |950 - 100 000 · 0,0l| = 50;

|m2 - np| = 1 050 - 100 000 · 0,0l| = 50.

Следовательно, искомую вероятность можно рас­сматривать как вероятность заданного отклонения частоты от своего математического ожидания:

Р(|т – пр| < Δ).

Подставив параметры биномиального распреде­ления в формулу расчета вероятности заданного отклонения нормально распределенной случайной величины от своего математического ожидания, получим формулу для приближенного расчета ве­роятности заданного отклонения частоты от своего математического ожидания:


При использовании этой формулы для решения задачи сразу получим


Ответ. 0,88816.

Пример 7. Подлежат исследованию 400 проб руды. Вероятность промышленного содержания металла в каждой пробе для всех проб одинакова и равна 0,8. Найти вероятность того, что доля проб с промышленным содержанием металла отклонится от вероятности промышленного содержания метал­ла в каждой пробе не более, чем на 0,05.

Решение. В отличие от предыдущей задачи, в данном случае речь идет о расчете вероятности заданного отклонения частости (относительной час­тоты) появления события от вероятности его появления в отдельном независимом испытании, т. е.


При возрастании числа независимых испытаний распределение частости стремится к нормальному распределению точно так же, как и распределение частоты. Это означает, что при больших п мы мо­жем аппроксимировать распределение частости нор­мальным распределением случайной величины, имеющей такое же математическое ожидание и та­кое же среднее квадратическое отклонение.

Подставив параметры распределения частости в формулу расчета вероятности заданного отклонения нормально распределенной случайной величины от своего математического ожидания, получим формулу для приближенного расчета вероятности задан­ного отклонения частости от своего математическо­го ожидания (вероятности).

Параметры распределения частости:


Используя эти формулы, получим


Применим данную формулу для решения задачи.

По условию: n = 400; р = 0,8; q = 1 - 0,8 = 0,2;



Вероятность того, что доля проб с промышлен­ным содержанием металла отклонится от вероятности промышленного содержания металла в каждой пробе не более, чем на 0,05, составляет 0,98758.

Ответ. 0,98758.

Задачи к теме 5

1. Дневная добыча угля в некоторой шахте рас­пределена по нормальному закону с математиче­ским ожиданием 785 т и стандартным отклонени­ем 60 т. Найдите вероятность того, что в опреде­ленный день будут добыты, по крайней мере, 800 т угля. Определите долю рабочих дней, в которые бу­дет добыто от 750 до 850 т угля. Найдите вероят­ность того, что в данный день добыча угля окажет­ся ниже 665 т.

2. Кандидат на выборах считает, что 20% изби­рателей в определенной области поддерживают его избирательную платформу. Если 64 избирателя слу­чайно отобраны из числа избирателей данной области, найдите вероятность того, что отобранная доля избирателей, поддерживающих кандидата, не бу­дет отличаться по абсолютной величине от истин­ной доли более, чем на 0,07.

3. Авиакомпания знает, что в среднем 5% лю­дей, делающих предварительный заказ на опреде­ленный рейс, не будет его использовать. Если авиа­компания продала 160 билетов на самолет, в кото­ром лишь 155 мест, чему равна вероятность того, что место будет доступно для любого пассажира, имеющего заказ и планирующего улететь?

4. Вес тропического грейпфрута, выращенного в Краснодарском крае, — нормально распределен­ная случайная величина с неизвестным математи­ческим ожиданием и дисперсией, равной 0,04. Агрономы знают, что 65% фруктов весят меньше, чем 0,5 кг. Найдите ожидаемый вес случайно выб­ранного грейпфрута.

5. Один из методов, позволяющих добиться ус­пешных экономических прогнозов, состоит в применении согласованных подходов к решению конк­ретной проблемы. Обычно прогнозом занимается большое число аналитиков. Средний результат та­ких индивидуальных прогнозов представляет собой общий согласованный прогноз. Пусть этот прогноз относительно величины банковской процентной ставки в текущем году подчиняется нормальному закону со средним значением а = 9% и стандарт­ным отклонением α= 2,6%. Из группы аналитиков случайным образом отбирается один человек. Най­дите вероятность того, что согласно прогнозу этого аналитика уровень процентной ставки: а) превысит 11%; б) окажется менее 14%; в) будет в пределах от 12 до 15%.

6. Предположим, что в течение года цена на ак­ции некоторой компании есть случайная величина, распределенная по нормальному закону с матема­тическим ожиданием, равным 48 у. е., и стандарт­ным отклонением, равным 6. Определите вероят­ность того, что в случайно выбранный день обсужда­емого периода цена за акцию была: а) более 60 у. е.; б) ниже 60 за акцию; в) выше 40 за акцию; г) между 40 и 50 у. е. за акцию.

7. Для поступления в некоторый университет необходимо успешно сдать вступительные экзаме­ны. В среднем их выдерживают лишь 25% абиту­риентов. Предположим, что в приемную комиссию поступило 1 889 заявлений. Чему равна вероятность того, что хотя бы 500 поступающих сдадут все экзамены (наберут проходной балл)?

8. Средний срок службы коробки передач до ка­питального ремонта у автомобиля определенной марки составляет 56 мес. со стандартным отклоне­нием σ = 16 мес. Привлекая покупателей, производитель хочет дать гарантию на этот узел, обещая сделать бесплатно любое число ремонтов коробки передач нового автомобиля в случае ее поломки до определенного срока. Пусть срок службы коробки передач подчиняется нормальному закону. На сколь­ко месяцев в таком случае производитель должен дать гарантию для этой детали, чтобы число бес­платных ремонтов не превышало 2,275% продан­ных автомобилей?

9. При производстве безалкогольных напитков специальный аппарат разливает определенное чис­ло унций (1 унция == 28,3 г) напитка в стандартную емкость. Число разлитых унций подчиняется нормальному закону с математическим ожиданием, зависящим от настройки аппарата. Количество унций напитка, разлитых отдельным аппаратом, имеет стандартное отклонение s = 0,4 унции. Пусть емкости объемом в 8 унций наполняются кока-колой. Сколько унций напитка должен в среднем разливать аппарат, чтобы не более 5% емкостей оказа­лось переполненными?

10. Фирма, занимающаяся продажей товаров по каталогу, ежемесячно получает по почте заказы. Число этих заказов есть нормально распределен­ная случайная величина со средним квадратическим отклонением s = 560 и неизвестным математическим ожиданием. В 90% случаев число ежемесячных заказов превышает 12 439. Найдите ожидаемое среднее число заказов, получаемых фирмой за месяц.

11. Еженедельный выпуск продукции на заводе приблизительно распределен по нормальному закону со средним значением, равным 134 786 ед. продук­ции в неделю, и стандартным отклонением —     13000 ед. Найдите вероятность того, что еженедель­ный выпуск продукции: а) превысит 150000 ед.; б) окажется ниже 100 000 ед. в данную неделю; в) предположим, что возникли трудовые споры, и недельный выпуск продукции стал ниже 80 000 ед. Менеджеры обвиняют профсоюз в беспрецедентном падении выпуска продукции, а профсоюз утверждает, что выпуск продукции находится в пределах принятого уровня (±3s). Можно ли доверять проф­союзу?

12. Почтовое отделение быстро оценивает объем переводов в рублях, взвешивая почту, полученную утром каждого текущего рабочего дня. Установле­но, что если вес почтовых отправлений составляет N кг, то объем переводов в рублях есть случайная величина, распределенная по нормальному закону со средним значением 160N и стандартным откло­нением 20N кг. Найдите вероятность того, что в день, когда вес почтовых отправлений составит 150 кг, объем переводов в рублях будет находиться в пределах: а) от 21 000 до 27 000 руб.; б) более 28 500 руб.; в) менее 22 000 руб.

 

13. Менеджер ресторана по опыту знает, что 70% людей, сделавших заказ на вечер, придут в ресторан поужинать. В один из вечеров менеджер ре­шил принять 20 заказов, хотя в ресторане было лишь 15 свободных столиков. Чему равна вероят­ность того, что более 15 посетителей придут на заказанные места?

14. Процент протеина в пакете с сухим кормом для собак — нормально распределенная случайная величина с математическим ожиданием 11,2% и стандартным отклонением 0,6%. Производителям корма необходимо, чтобы в 99% продаваемого кор­ма доля протеина составляла не меньше х1 %, но не более х2%. Найдите х1 и х2.

15. Вес товаров, помещаемых в контейнер опре­деленного размера, — нормально распределенная случайная величина. Известно, что 65% контейне­ров имеют чистый вес больше чем 4,9 т и 25% — имеют вес меньше чем 4,2 т. Найдите ожидаемый средний вес и среднее квадратическое отклонение чистого веса контейнера.

16. Отклонение стрелки компаса из-за влияния магнитного поля в определенной области Заполя­рья есть случайная величина Х ~ (0; 12). Чему рав­на вероятность того, что абсолютная величина от­клонения в определенный момент времени будет больше чем 2,4?

17. Компания А покупает у компании В детали к контрольным приборам. Каждая деталь имеет точ­но установленное значение размера. Деталь, размер которой отличается от установленного размера бо­лее чем на ±0,25 мм, считается дефектной. Компа­ния А требует от компании В, чтобы доля брака не превышала 1% деталей. Если компания В выпол­няет требование компании А, то каким должно быть допустимое максимальное стандартное отклонение размеров деталей? Учесть, что размер деталей есть случайная величина, распределенная по нормаль­ному закону.

18. Компьютерная система содержит 45 одина­ковых микроэлементов. Вероятность того, что лю­бой микроэлемент будет работать в заданное время, равна 0,80. Для выполнения некоторой опера­ции требуется, чтобы по крайней мере 30 микро­элементов было в рабочем состоянии. Чему равна вероятность того, что операция будет выполнена успешно?

19. Технический отдел компании, производящей автопокрышки, планирует выпустить несколько экспериментальных партий покрышек и проверить степень их износа на тестирующем оборудовании. С этой целью предполагается увеличивать количе­ство каучука в покрышках каждой последующей партии до тех пор, пока срок службы покрышек окажется приемлемым. Эксперимент показал, что стандартное отклонение срока службы покрышек фактически остается постоянным от партии к партии и составляет 2 500 миль ( s = 2 500). Если компания хочет, чтобы 80% выпускаемых автопок­рышек имели срок службы не менее 25 000 миль, то какой наименьший средний срок службы авто­покрышек должен быть заложен в расчетах технического отдела? Считать срок службы автопокрышек нормально распределенным.

20. Менеджер торгово-посреднической фирмы получает жалобы от некоторых клиентов на то, что служащие фирмы затрачивают слишком много вре­мени на выполнение их заказов. Собрав и проанализировав соответствующую информацию, он вы­яснил, что среднее время выполнения заказа состав­ляет 6,6 дн., однако для выполнения 20% заказов потребовалось 15 дн. и более. Учитывая, что время выполнения заказа есть случайная величина, рас­пределенная по нормальному закону, определите фактическое стандартное отклонение времени об­служивания клиентов.

 

6. ВАРИАЦИОННЫЕ РЯДЫ И ИХ ХАРАКТЕРИСТИКИ

 

6.1. Понятие вариационного ряда. Виды вариационных рядов

 

Прежде чем приступить к рассмотрению вариационных рядов дадим определение другим поняти­ям, используемым в статистике. Так, совокупность предметов или явлений, объединенных каким-либо общим признаком или свойством качественного или количественного характера, называется объек­том наблюдения.

Всякий объект статистического наблюдения состо­ит из отдельных элементов — единиц наблюдения.

Результаты статистического наблюдения пред­ставляют собой числовую информацию — данные. Статистические данные — это сведения о том, какие значения принял интересующий исследова­теля признак в статистической совокупности. При­знаки бывают количественными и качественными.

Количественным называется признак, значения которого выражаются числами.

Качественным называется признак, характери­зующийся некоторым свойством или состоянием элементов совокупности.

Статистическая совокупность называется гене­ральной, если исследованию подлежат все элемен­ты совокупности (сплошное наблюдение).

Часть элементов генеральной совокупности, под­лежащая исследованию, называется выборочной совокупностью (выборкой). Она извлекается из ге­неральной совокупности случайно, так чтобы каж­дый из п элементов выборки имел равные шансы быть отобранным.

Значения признака, которые при переходе от од­ного элемента совокупности к другому изменяют­ся (варьируют), называются вариантами и обычно обозначаются малыми латинскими буквами х, у,z.

Порядковый номер варианта (значения призна­ка) называется рангом: х1 1-й вариант (1-е значе­ние признака), х2 2-й вариант (2-е значение при­знака), хi i-й вариант (i-e значение признака).

Ряд значений признака (вариантов), располо­женных в порядке возрастания или убывания с соответствующими им весами, называется вариа­ционным рядом (рядом распределения).

В качестве весов выступают частоты или частости.

Частота (т) показывает, сколько раз встреча­ется тот или иной вариант (значение признака) в статистической совокупности.

Частость или относительная частота (ωi) по­казывает, какая часть единиц совокупности имеет тот или иной вариант. Частость рассчитывается как отношение частоты того или иного варианта к сумме всех частот ряда


Сумма всех частостей равна 1


Вариационные ряды бывают дискретными и ин­тервальными.

Дискретные вариационные ряды строят обычно в том случае, .если значения изучаемого признака могут отличаться друг от друга не менее чем на некоторую конечную величину. В дискретных вариационных рядах задаются точечные значения признака. Общий вид дискретного вариационного ряда показан в табл. 6.1, где i = 1, 2, ..., k.

Таблица 6.1

Значения признака (xi)

x1

x2

 

xk

Частоты i)

т1

m2

 

mk

 

Интервальные вариационные ряды строят обыч­но в том случае, если значения изучаемого при­знака могут отличаться друг от друга на сколь угод­но малую величину. Значения признака в них за­даются в виде интервалов. Общий вид интерваль­ного вариационного ряда показан в табл. 6.2, где i= 1, 2, ..., l.

Таблица 6.2

Значения признака (xi)

а1-а2

a2-a3

...

ai-1-ai

Частоты i)

m1

т2

...

ml

 

В интервальных вариационных рядах в каждом интервале выделяют верхнюю и нижнюю границы. Разность между верхней и нижней границами интервала называется интервальной разностью или длиной (величиной) интервала.

Величина 1-го интервала k1 определяется по фор­муле k1 = a2 - а1; 2-го — k2= а3-  a2 последнего:

k1=ai-ai-1

В общем виде интервальную разность ki пред­ставим как

 

ki=xi(max)-xi(min)                         (6.3)

Если интервал имеет обе границы, то его назы­вают закрытым.

Первый и последний интервалы могут быть от­крытыми, т. е. иметь только одну границу. Напри­мер, 1-й интервал может быть задан как «до 100», 2-й — «100-110», .... предпоследний — «190-200», последний — «200 и более». Очевидно, что 1-й ин­тервал не имеет нижней границы, а последний — верхней, оба они — открытые.

Часто открытые интервалы приходится условно закрывать. Обычно для этого величину 1-го интервала принимают равной величине 2-го, а величину последнего — величине предпоследнего. В нашем примере величина 2-го интервала равна 110 - 100 = 10, следовательно, нижняя граница 1-го условно соста­вит 100 - 10 = 90; величина предпоследнего равна 200 - 190 = 10, значит, верхняя граница последне­го условно составит 200 + 10 = 210.

Кроме этого в интервальном вариационном ряде могут встречаться интервалы разной длины. Если ин­тервалы в вариационном ряде имеют одинаковую длину (интервальную разность), их называют равно­великими, в противном случае — неравновеликими.

При построении интервального вариационного ряда часто встает проблема выбора величины интервалов (интервальной разности). Для определения оптимальной величины интервалов (в том случае,если строится ряд с равными интервалами) приме­няют формулу Стэрджесса


где п — число единиц совокупности; хmax  и xmin наибольшее и наименьшее значения вариантов ряда.

Для характеристики вариационного ряда наря­ду с частотами и частостями используются накопленные частоты и частости. Накопленные частоты (частости) показывают, сколько единиц совокупно­сти (какая их часть) не превышают заданного зна­чения (варианта) х.

Их можно рассчитать по данным дискретного ряда, пользуясь формулой

vi = тi + тi-1 +...+ т1.          (6.5)

Для интервального вариационного ряда — это сумма частот (частостей) всех интервалов, не превышающих данный.

Дискретный вариационный ряд графически мож­но представить с помощью полигона распределения частот или частостей (рис.6.1).


Интервальные вариационные ряды графически можно представить с помощью гистограммы, т. е, столбчатой диаграммы (рис. 6.2).


При ее построении по оси абсцисс откладыва­ются значения изучаемого признака (границы интервалов). В том случае, если интервалы одинако­вой величины, по оси ординат можно откладывать частоты или частости. Если же интервалы имеют разную величину, по оси ординат необходимо откладывать значения абсолютной или относитель­ной плотности распределения. Абсолютная плотность — отношение частости интервала к его ве­личине:


где f(a)i абсолютная плотность i-го интервала;

mi — его частота;

ki величина (интервальная разность).

Абсолютная плотность показывает, сколько еди­ниц совокупности приходится на единицу интервала.

Относительная плотность — отношение частости интервала к его величине:


где f(0). — относительная плотность i-го интервала;

wi его частость.

Относительная плотность показывает, какая часть единиц совокупности приходится на единицу ин­тервала.

И дискретные, и интервальные вариационные ряды графически можно представить в виде кумуляты и огивы. При построении первой по данным дискретного ряда по оси абсцисс откладываются значения признака (варианты), а по оси ординат — накопленные частоты или частости. На пересече­нии значений признака (вариантов) и соответству­ющих им накопленных частот (частостей) строят­ся точки, которые в свою очередь соединяются от­резками или кривой. Получающаяся таким обра­зом ломаная (кривая) называется кумулятой (ку­мулятивной кривой). Абсциссами ее точек явля­ются верхние границы интервалов. Ординаты об­разуют накопленные частоты (частости) соответ­ствующих интервалов. Часто добавляют еще одну точку, абсциссой которой является нижняя гра­ница первого интервала, а ордината равна нулю. Соединяя точки отрезками или кривой, получаем кумуляту.

Огива строится аналогично кумуляте с той лишь разницей, что на оси абсцисс наносятся точки, соответствующие накопленным частотам (частостям), а по оси ординат — значения признака (варианты).

 

6.2. Числовые характеристики вариационного ряда

Одной из основных числовых характеристик ряда распределения (вариационного ряда) является сред­няя арифметическая.

Существует две формулы расчета средней ариф­метической: простая и взвешенная. Простую среднюю арифметическую обычно используют, когда данные наблюдения не сведены в вариационный ряд либо все частоты равны единице или одинаковы


где хii-e значение признака; п — объем ряда (чис­ло наблюдений; число значений признака).

Если частоты отличны друг от друга, расчет про­изводится по формуле средней арифметической взве­шенной


где хii-e значение признака; тi частота i-го значе­ния признака; k число его значений (вариантов).

При расчете средней арифметической в качестве весов могут выступать и частости, тогда формула расчета средней арифметической взвешенной при­мет следующий вид:


где хi — i-e значение признака; ωi частость i-го значения признака; k — число его значений (вари­антов).

Колеблемость изучаемого признака можно оха­рактеризовать с помощью различных показателей вариации. К числу основных показателей вариации относятся: дисперсия, среднее квадратическое отклонение, коэффициент вариации.

Дисперсию можно рассчитать по простой и взвешенной формулам, имеющим вид


Среднее квадратическое отклонение рассчитыва­ется по формуле


Коэффициент вариации определяется формулой


Пример 1. При обследовании 50 членов семей рабочих и служащих установлено следующее количество членов семьи: 5;3;2;1;4;6;3;7;9;1;3;2;5; 6; 8; 2; 5; 2; 3; 6; 8; 3; 4; 4; 5; 6; 5; 4; 7; 5; 6; 4; 8; 7;

4; 5; 7; 8; 6; 5; 7; 5; 6; 6; 7; 3; 4; 6; 5; 4.

1)      Составьте вариационный ряд распределения частот.

2) Постройте полигон распределения частот, кумуляту.

3) Определите средний размер (среднее число членов) семьи.

4) Охарактеризуйте колеблемость размера семьи с помощью показателей вариации (дисперсии, среднего квадратического отклонения, коэффициента вариации).

Объясните полученные результаты, сделайте вы­воды.

Решение. 1) В данной задаче изучаемый признак является дискретно варьирующим, так как размер семей не может отличаться друг от друга менее чем на одного человека. Следовательно, необходимо по­строить дискретный вариационный ряд. Чтобы сде­лать это, необходимо подсчитать, сколько раз встре­чаются те или иные значения признака, и располо­жить их в порядке возрастания или убывания. Зна­чения изучаемого признака — размер семьи — обо­значим xi, частоты — тi.

Произведем упомянутые расчеты и запишем их результаты в табл. 6.3.

Таблица 6.3

хi

 

1

 

2

 

3

 

4

 

5

 

6

 

7

 

8

 

9

 

mi

 

2

 

4

 

6

 

8

 

10

 

9

 

6

 

4

 

1

 

 

2) Дискретный вариационный ряд можно пред­ставить графически, построив полигон распределе­ния частот или частостей (рис. 6.3).

Для того чтобы построить кумуляту, необходимо рассчитать накопленные частоты или частости. Накопленная частота 1-го варианта 1 = 1) равна самой частоте этого варианта, т. е. v1 = 2. Накопленная частота 2-го варианта (х2 = 2) равна сумме частот 1-го и 2-го вариантов, т.е. v2 = 2 + 4 = 6. Далее, аналогично v3 = 12; v4 = 20; v5 = 30; v6 = 39; v7= 45; v8 = 49;  v9 =50.


Построим кумуляту (рис. 6.4).


3) Рассчитаем средний размер (среднее число членов) семьи. Так как частоты отличны друг от друга, расчет средней арифметической произведем по формуле (6.9)


Средний размер семьи — 5,06 чел.

4) Так как частоты неодинаковы, для расчета дисперсии размера семьи используем формулу (6.12)


Дисперсия размера семьи — 3,6964 чел2. Найдем среднее квадратическое отклонение раз­мера семьи по формуле (6.13)


Среднее квадратическое отклонение размера се­мьи — 1,9226 чел.

Найдем коэффициент вариации размера семьи по формуле (6.14)


Коэффициент вариации составляет 38%. Так как коэффициент вариации больше 35%, можно сделать вывод о том, что изучаемая совокупность семей яв­ляется неоднородной, чем и объясняется высокая колеблемость размера семьи в данной совокупности.

Ввиду неоднородности семей, попавших в выбор­ку, использование средней арифметической для характеристики наиболее типичного уровня разме­ра семьи не вполне оправданно — средняя арифметическая нетипична для изучаемой совокупности, в качестве характеристики наиболее типичного уров­ня размера семьи в данной совокупности лучше использовать моду или медиану.

Пример 2. Имеются данные о годовой мощности предприятий цементной промышленности в 1996 г.

Предприятия с годовой мощностью, тыс. т

 

Количество предприятий

 

До 500

 

27

 

500 - 1 000

 

11

 

1 000 - 2 000

 

8

 

2 000 - 3 000

 

8

 

Свыше 3 000

 

2

 

 

1) Постройте гистограмму, кумуляту.

2) Рассчитайте среднюю мощность предприятий.

3) Найдите дисперсию, среднее квадратическое отклонение, коэффициент вариации.

Объясните полученные результаты, сделайте вы­воды.

Решение. 1) Данные о годовой мощности пред­приятий цементной промышленности представле­ны в виде интервального вариационного ряда — значения признака заданы в виде интервалов. При этом первый и последний интервалы — открытые: оба интервала не имеют одной из границ. Наконец, данный интервальный вариационный ряд — с нерав­ными интервалами: интервальные разности (раз­ность между верхней и нижней границами) интер­валов неодинаковы. Условно закроем границы от­крытых интервалов.

Интервальная разность 2-го интервала

1 000 - 500 = 500.

Следовательно, нижняя граница 1-го интервала

500 - 500 = 0.

Интервальная разность предпоследнего интервала

3 000 - 2 000 = 1 000.

Следовательно, верхняя граница последнего ин­тервала

3 000 + 1 000 = 4 000.

В результате, получим следующий вариационный ряд (табл. 6.4):

Таблица 6.4

xi

 

mi

 

0-500

 

27

 

500 - 1 000

 

11

 

1 000 - 2 000

 

8

 

2 000 - 3 000

 

8

 

3 000 - 4 000

 

2

 

 

Учитывая неодинаковую величину интервалов, для построения гистограммы рассчитаем абсолют­ные плотности распределения по формуле (6.6)




Построим гистограмму (рис. 6.5).


Для того чтобы построить кумуляту, необходимо рассчитать накопленные частоты или частости.

Накопленная частота нижней границы 1-го варианта х = 0 равна нулю. Накопленная частота верхней границы 1-го интервала равна его частоте, т. е. 27.

Накопленная частота верхней границы 2-го интервала равна сумме частот 1-го и 2-го интервалов, т.е.27 + 11 = 38.

Далее, аналогично 38 + 8 =46; 46 + 8 = 54; 54 + 2 = 56.

Построим кумуляту (рис. 6.6).


2) Рассчитаем среднюю мощность предприятий цементной промышленности в 1996 г. Так как частоты интервалов разные, используем для расчета средней арифметической формулу (6.9). При расчете числовых характеристик интервального вариа­ционного ряда в качестве значений признака принимаются середины интервалов, найдем их.


Теперь расчет средней арифметической примет вид


Средняя мощность предприятий цементной про­мышленности в 1996 г. составляла 964,29 тыс. т.

Следует отметить, что использование с той или иной целью средней арифметической, рассчитанной по данным интервального ряда с открытыми ин­тервалами, может привести к серьезным ошибкам. Это связано с тем, что открытые интервалы закры­ваются условно, в действительности значения при­знака у объектов, попадающих в открытые интер­валы, могут выходить далеко за их условные гра­ницы.

В связи с этим для оценки наиболее типичного уровня изучаемого признака по данным интерваль­ного ряда с открытыми интервалами лучше исполь­зовать моду или медиану.

3) Оценим колеблемость мощности предприятий цементной промышленности в 1996 г.

Так как частоты неодинаковы, для расчета дис­персии используем формулу (6.12)


Дисперсия мощности предприятий — 862 563,78 (тыс. т)2.

Найдем среднее квадратическое отклонение мощности предприятий по формуле (6.13)


Среднее квадратическое отклонение мощности предприятий — 928,74 тыс. т.


Найдем коэффициент вариации по формуле (6.14)


Коэффициент вариации годовой мощности пред­приятий цементной промышленности составляет 96,31%. Поскольку он больше 35%, можно сделать вывод о том, что изучаемая совокупность предприятий является неоднородной, в ее состав вошли и крупные и мелкие предприятия, что и обусловило высокую колеблемость годовой мощности.

Следовательно, использование средней арифме­тической для характеристики наиболее типичного уровня годовой мощности предприятий цементной промышленности неверно — средняя арифметическая нетипична для изучаемой совокупности. Это еще раз подтверждает необходимость использования моды или медианы для характеристики наиболее типичного уровня годовой мощности данной сово­купности предприятий цементной промышленности.

 

Задачи к теме 6

1. По данным выборочного обследования получе­но следующее распределение семей по среднедушевому доходу

Среднедушевой доход семьи в месяц, у. е.

до 25

25-50

50-75

75-100

100-125

125-150

150 и

выше

Количество обследованных семей

46

236

250

176

102

78

12

 

Постройте гистограмму распределения частот. Найдите cреднедушевой доход семьи в выборке, дисперсию, среднее квадратическое отклонение, коэффи­циент вариации. Объясните полученные результаты.

2. Постройте гистограмму частот, найдите сред­нюю заработную работников одного из цехов промышленного предприятия.

Заработная плата, у. е.

50-75

75-100

125-150

150-175

175-200

200-225

Число работников

12

23

37

19

15

9

 

Рассчитайте среднюю арифметическую, среднее квадратическое отклонение, коэффициент вариации заработной платы.

3. Ниже представлена группировка отраслей и под­отраслей промышленности по темпам роста цен на изготавливаемую продукцию за период с начала года.

Сентябрь 1996 г., % к декабрю 1995 г.

 

92,1-100,0

100,1-108,0

108,1-116,0

116,1-124,0

124,1-132,0

132,1-140,0

Число отраслей и подотраслей, единиц

 

4

15

21

31

19

18

 

Найдите среднюю арифметическую, дисперсию, среднее квадратическое отклонение, коэффициент ва­риации. Постройте гистограмму. Сделайте выводы.

4. По результатам выборочного обследования тор­говых киосков города получены следующие данные о дневной выручке частного бизнеса.

Выручка от продажи товара, тыс. у. е.

 

до 1

 

1-1,2

 

1,2-1,4

 

1,4-1,6

 

1,6-1,8

 

1,8-2,0

 

2,0 и выше

 

Число торговых киосков

 

10

 

12

 

22

 

26

 

18

 

7

 

5

 

 

Постройте гистограмму распределения частот. Найдите среднедневную выручку от продажи товаров, дисперсию, среднее квадратическое отклонение, коэффициент вариации. Объясните полученные результаты.

5. Имеются данные о денежной эмиссии, осуще­ствлявшейся ЦБ РФ в период 1991-1994 гг.

Годы

1991

1992

1993

1994

Размер эмиссии, млрд руб.

89,3

1 513,0

10 904,8

23169,9

 

Найдите среднегодовой размер эмиссии за ука­занный период. Охарактеризуйте колеблемость размера эмиссии с помощью различных показателей вариации.

6. Для оценки состояния деловой активности промышленных предприятий различных форм собственности были проведены выборочные бизнес-об­следования и получены следующие результаты:

Интервалы значений показателя деловой активности, бал.

0-8

8-16

16-24

24-32

Число предприятий (акционерные общества открытого типа)

10

15

8

5

 

Постройте гистограмму распределения частот. Найдите среднее значение показателя деловой активности, дисперсию, среднее квадратическое от­клонение, коэффициент вариации. Объясните полученные результаты.

7. Продажа акций на аукционе акционерными обществами города характеризуется следующими данными:

Продажа акций, % от уставного капитала

9-15

15-21

21-27

27-33

Число акционерных обществ открытого типа

3

5

4

 

2

 

Постройте гистограмму распределения частот. Найдите средний процент продажи акций. Охарактеризуйте колеблемость процента продажи акций с помощью соответствующих показателей.

8. Имеются выборочные данные о числе сделок, заключенных брокерскими фирмами и конторами города в течение месяца.

Число заключенных сделок

 

10-30

30-50

50-70

70-90

Число брокерских фирм и контор

 

20

18

12

5

 

Постройте гистограмму распределения частот. Найдите среднее число заключенных сделок, дисперсию, среднее квадратическое отклонение, коэф­фициент вариации, размах вариации. Объясните полученные результаты.

9. Имеются выборочные данные о стоимости по­требительской корзины из 19 основных продуктов по городам Ростовской области (на начало апреля 1996 г.).

Стоимость  потребительской корзины, тыс. руб.

196

208

216

222

227

240

Число городов области

2

3

4

4

5

7

 

Постройте полигон распределения частот. Най­дите среднюю стоимость потребительской корзины в выборке, дисперсию, среднее квадратическое от­клонение, коэффициент вариации. Объясните полученные результаты.

10. Кредиты ЦБ РФ предприятиям России за 7 ме­сяцев 1992 г. (с апреля по октябрь) характеризуют­ся следующими данными:

Месяц

Апрель

Май

Июнь

Июль

Август

Сентябрь

Октябрь

Размер кредитов, млрд руб.

918,1

1 025,3

1041,8

1 393,0

1 860,0

2 153,2

2 731,0

 

Найдите среднемесячный размер кредита за ука­занный период. Охарактеризуйте колеблемость размеров кредита с помощью соответствующих пока­зателей.

11. Предположим, что на некотором предприя­тии собраны данные о числе дней, пропущенных работниками по болезни.

Число дней, пропущенных в текущем месяце

0

1

2

3

4

5

Число работников

10

17

25

28

30

27

 

Постройте полигон распределения частот. Най­дите среднее число пропущенных дней, стандарт­ное отклонение, коэффициент вариации. Является ли распределение симметричным?

 

12. Постройте гистограмму частот, найдите сред­нюю арифметическую, среднее квадратическое отклонение и коэффициент вариации для данных о дневной выручке в магазине электроники.

Выручка, у. е.

0-200

200-300

300-400

400-500

500-600

600-700

Число дн.

3

5

9

14

8

3

13. Имеются данные о числе тонн грузов, пере­возимых еженедельно паромом некоторого морско­го порта в период навигации: 398, 412, 560, 474, 544, 690, 587, 600, 613, 457, 504, 477, 530, 641, 359, 566, 452, 633, 474, 499, 580, 606, 344, 455, 505, 396, 347, 441, 390, 632, 400, 582.

Составьте вариационный ряд. Найдите среднюю арифметическую. Рассчитайте показатели вариации ряда. Сделайте анализ полученных результатов.

14. Предположим, у вас есть следующая информация об акциях А и В:

Экономическое состояние в следующем году

Вероятность того, что произойдет

Возврат по акции В в следующем году, %

Возврат по

акции А в следующем году, %

Снижение деловой активности

0,3

9,8

10

Умеренный рост

0,4

11,2

11

Подъем деловой активности

0,3

13

12

 

Рассчитайте среднюю арифметическую, диспер­сию и коэффициент вариации для акций А и В. Если вы решили купить одну акцию, какую из двух вы выберете? Почему?

15. Проанализируйте данные годовых уровней прибыли трех компаний.

Год

Cherry Computers

 

Lemon Motors

 

Orange Electronics

 

1983

14,2

-6,2

37,5

1984

12,3

13,3

-10,6

1985

-16,2

-8,4

40,3

1986

15,4

27,3

5,4

1987

17,2

28,2

6,2

1988

10,3

14,5

10,2

1989

-6,3

-2,4

13,8

1990

-7,8

-3,1

11,5

1991

3,4

15,6

-6,2

1992

12,2

18,2

27,5

 

Найдите среднее значение и стандартное откло­нение прибыли для каждой из компаний. Сравните результаты их деятельности за 10 лет. Деятельность какой из компаний, по вашему мнению, более успешна?

16. Таблица, приведенная ниже, содержит дан­ные о стоимости акций Charleston Corporation в различных экономических ситуациях.

Экономическое состояние в следующем году

Вероятность того, что произойдет

Цена за акцию, дол. США

Кризис

0,25

65

Снижение деловой активности

0,25

80

Умеренный рост

0,3

95

Подъем деловой активности

0,2

100

 

Рассчитайте среднюю стоимость акций, диспер­сию и коэффициент вариации. Проанализируйте полученные результаты.

17. Администрацию универсама интересует оп­тимальный уровень запасов продуктов в торговом зале, а также среднемесячный объем покупок това­ров, не являющихся предметом ежедневного потребления в семье (таких, например, как сода). Для вы­яснения этого вопроса менеджер универсама в те­чение января регистрировал частоту покупок сто­граммовых пакетиков с содой и собрал следующие данные (хi): 8, 4, 4, 9, 3, 3, 1, 2, 0, 4, 2, 3, 5, 7, 10, 6,5,7,3,2,9,8,1,4,6,5,4,2,1, 0,8.

Постройте вариационный ряд, определите его числовые характеристики. Какие рекомендации вы дали бы администрации универсама?

18. Ниже приводятся данные о возрастном со­ставе безработных по Российской Федерации, зарегистрированных в службе занятости по сведениям на последнюю неделю марта 1996 г., %.

Возраст, лет

16-20

20-24

25-29

30-49

50-54

55-59

60-65

Мужчины

7,7

17,0

11,9

50,9

4,2

5,7

2,6

Женщины

11,2

18,5

11,7

49,5

4,0

3,8

1,3

 

Найдите средний возраст безработных мужчин и женщин, дисперсию, среднее квадратическое отклонение и коэффициент вариации. Оцените различия показателей возрастного состава безработных муж­чин и женщин. Сделайте выводы.

19. Число пассажиров компании «Донские авиа­линии» одного из рейсов на рейсах между Ростовом и Москвой за 30 дней между апрелем и маем текущего года составило: 128, 121, 134, 118, 123, 109,120,116,125,128,121,129,130,131, 127, 119, 114, 124, 110, 126, 134, 125, 128, 123, 128, 133, 132,136,134,129.

Составьте вариационный ряд. Чему равно сред­нее число пассажиров в рейсе? Рассчитайте показатели вариации. Сделайте анализ полученных резуль­татов.

20. Имеются данные о группировке коммерчес­ких банков РФ по величине объявленного уставно­го фонда (на 1 марта 1995 г.).

Объявленный уставной фонд, руб.

До 100 млн

100-500 млн

500 млн-1 млрд

Свыше 1 млрд

Число коммерческих банков

87

1075

377

1004

 

Постройте гистограмму распределения частот. Найдите средний размер объявленного уставного фонда коммерческих банков РФ. Охарактеризуйте колеблемость размера объявленного уставного фон­да коммерческих банков с помощью соответствую­щих показателей.

 

7. ВЫБОРОЧНЫЙ МЕТОД И СТАТИСТИЧЕСКОЕ ОЦЕНИВАНИЕ

7.1. Основные понятия и определения выборочного метода

По одному из популярных определений, статис­тика — это наука, позволяющая распространять выводы, сделанные на основе изучения части со­вокупности (случайной выборки), на всю совокуп­ность (генеральную совокупность). В этом опреде­лении заключена сущность выборочного метода и его ведущая роль в статистике.

Все единицы совокупности, обладающие интере­сующими исследователя признаками, составляют генеральную совокупность.

Часть совокупности, случайным образом отобран­ная из генеральной совокупности, — выборочная совокупность — выборка.

Число единиц (элементов) статистической со­вокупности называется ее объемом*. Объем генеральной совокупности обозначается N, а объем вы­борочной совокупности — п. Если объем совокупно­сти велик, то его полагают равным бесконечности.

* В учебниках по математической статистике вместо терми­на «статистическая совокупность» используется термин «набор данных», а вместо термина «единица совокупности» ис­пользуется термин «элемент выборки».

 

Случайная выборка из п элементов — это такой отбор, при котором элементы извлекаются по одному из всей генеральной совокупности и каждый из них имеет равный шанс быть отобранным. Требо­вание случайности обеспечивается отбором по таб­лицам случайных чисел или по жребию. Такая выборка называется собственно-случайной. Одним из примеров использования собственно-случайной выборки является проведение тиражей выигрышей денежно-вещевых лотерей, при которых обеспечивается равная возможность попадания в тираж лю­бого номера лотерейного билета.

По способу отбора элементов различают два типа случайных выборок: собственно-случайная повтор­ная (схема возвращенного шара); собственно-случай­ная бесповторная (схема невозвращенного шара).

Выбор схемы отбора зависит от характера изучае­мого объекта. Напомним, что при повторном отборе единица наблюдения после извлечения из генераль­ной совокупности регистрируется и вновь возвращается в генеральную совокупность, откуда опять мо­жет быть извлечена случайным образом. При бес­повторном отборе элемент в выборку не возвращает­ся. Следует отметить, что независимо от способа орга­низации выборки она должна представлять собой уменьшенную копию генеральной совокупности, т. е. быть представительной (репрезентативной).

 

7.2. Статистическое оценивание

Пусть из генеральной совокупности извлекается вы­борка объемом n, причем значение признака х1 наблю­дается т1 раз, x2  т2 раз,..., хk наблюдается тk раз,


Мы можем сопоставить каждому значению хi от­носительную частоту mi/n.

Статистическим распределением выборки назы­вается перечень возможных значений признака хi и соответствующих ему частот или относитель­ных частот (частостей) mi i).

Числовые характеристики генеральной совокупности, как правило, неизвестные (средняя, дисперсия и др.), называются параметрами генеральной совокупности (обозначают, например, `X или  Xген , s2ген). Доля единиц, обладающих тем или иным признаком в генеральной совокупности, называется генеральной долей и обозначается р.

По данным выборки рассчитывают числовые характеристики, которые называют cтатистиками (обозначают X̃, или X/ ген ,s2ген, выборочная доля обозначается ω). Статистики, получаемые по раз­личным выборкам, как правило, отличаются друг от друга. Поэтому статистика, полученная из вы­борки, является только оценкой неизвестного пара­метра генеральной совокупности. Оценка парамет­ра — определенная числовая характеристика, по­лученная из выборки. Когда оценка определяется одним числом, ее называют точечной оценкой.

В качестве точечных оценок параметров генеральной совокупности используются соответствующие выборочные характеристики. Теоретическое обосно­вание возможности использования этих выборочных оценок для суждений о характеристиках и свойствах генеральной совокупности дают закон больших чи­сел и центральная предельная теорема Ляпунова.

Выборочная средняя является точечной оценкой генеральной средней, т. е.

 


Генеральная дисперсия имеет 2 точечные оцен­ки: s2выб — выборочная дисперсия; S2 исправлен­ная выборочная дисперсия*. s2выб исчисляется при п > 30, a S2 — при n < 30. Причем в математичес­кой статистике доказывается, что


При больших объемах выборки s2выб и S2 практи­чески совпадают.

Генеральное среднее квадратическое отклонение sген также имеет 2 точечные оценки: sвыб — выбо­рочное среднее квадратическое отклонение и S — исправленное выборочное среднее квадратическое отклонение. sвыб используется для оценивания sген при п > 30, а S для оценивания (sген при п < 30; при этом


7.3. Ошибки выборки

Поскольку выборочная совокупность представля­ет собой лишь часть генеральной совокупности, то вполне естественно, что выборочные характеристи­ки не будут точно совпадать с соответствующими генеральными. Ошибка репрезентативности может быть представлена как разность между генеральными и выборочными характеристиками изучаемой совокупности: e =  X/ -`X  , либо е= р –ω.

 

 Применительно к выборочному методу из теоре­мы Чебышева следует, что с вероятностью, сколь угодно близкой к единице, можно утверждать, что при достаточно большом объеме выборки и ограниченной дисперсии генеральной совокупности разность между выборочной средней и генеральной средней будет сколь угодно мала.

 


где Х̃ средняя по совокупности выбранных единиц; `X  средняя по генеральной совокупности.

sген — среднее квадратическое отклонение в гене­ральной совокупности.

Запись показывает, что о величине расхождения между параметром и статистикой


можно судить лишь с определенной вероятностью, от которой зависит величина t.

Формула (7.2) устанавливает связь между преде­лом ошибки, гарантируемым с некоторой вероят­ностью Р, величиной t и средней ошибкой выборки


Согласно центральной предельной теореме Ляпуно­ва, выборочные распределения статистик (при      пV 30) будут иметь нормальное распределение независимо от того, какое распределение имеет генеральная со­вокупность. Следовательно,


где Ф0(t) — функция Лапласа.

Значения вероятностей, соответствующие раз­личным t, содержатся в специальных таблицах:

при п > 30 — в таблице значений Ф0(t), а при n < 30 в таблице распределения t-Стьюдента. Неизвест­ное значение  sген при расчете ошибки выборки за­меняется sвыб.

В зависимости от способа отбора средняя ошиб­ка выборки определяется по-разному (табл. 7.1).

Таблица 7.1

Формулы расчета ошибки выборки для собственно-случайного отбора


Здесь s2 — выборочная дисперсия значений при­знака; ω (1 - ω ) выборочная дисперсия доли значений признака; n — объем выборки; N — объем генеральной совокупности; n/N доля обследован­ной совокупности; (1- n/N) — поправка на конеч­ность совокупности (в литературе (1 - n/N) иногда называется «поправкой на бесповторность отбора»).

7.4. Определение численности (объема) выборки

Одной из важнейших проблем выборочного метода является определение необходимого объема выборки (табл. 7.2). От объема выборки зависит размер средней ошибки (m) и экономичность проводимого выборочного наблюдения, так как чем больше объем выборки, тем больше затраты на изучение элементов выборки, но тем меньше при этом ошибка выборки. Из формулы предельной ошибки D = tm. и фор­мул средних ошибок выборки определяются фор­мулы необходимой численности выборки для различных способов отбора.

Таблица 7.2

Формулы, расчета необходимой численности выборки для собственно-случайного отбора


 

7.5. Интервальное оценивание

Пусть  ε = X- - X . Если D представляет собой пре­дел, которым ограничена сверху абсолютная величина |e| < D, то |  Х -X | < D. Следовательно,


Мы получили интервальную оценку генеральной средней. Из теоремы Чебышева следует, что


Интервальной оценкой называют оценку, кото­рая определяется 2 числами — концами интерва­ла, который с определенной вероятностью накры­вает неизвестный параметр генеральной совокуп­ности. Интервал, содержащий оцениваемый пара­метр генеральной совокупности, называют дове­рительным интервалом. Для его определения вы­числяется предельная ошибка выборки D, позволя­ющая установить предельные границы, в которых с заданной вероятностью (надежностью) должен на­ходиться параметр генеральной совокупности.

Предельная ошибка выборки равна t-кратному числу средних ошибок выборки. Коэффициент t позволяет установить, насколько надежно выска­зывание о том, что заданный интервал содержит параметр генеральной совокупности. Если мы вы­берем коэффициент таким, что высказывание в 95% случаев окажется правильным и только в 5% — неправильным, то мы говорим: со статистичес­кой надежностью в 95% доверительный интервал выборочной статистики содержит параметр генеральной совокупности. Статистической надежности в 95% соответствует доверительная вероятность — 0,95. В 5% случаев утверждение «параметр принадлежит доверительному интервалу» будет неверным, т. е. 5% задает уровень значимости (a) или 0,05 вероятность ошибки. Обычно в статистике уровень значимости выбирают таким, чтобы он не превы­сил 5% (a < 0,05). Доверительная вероятность и уровень значимости дополняют друг друга до 1 (или 100%) и определяют надежность статистического высказывания.

С помощью доверительного интервала можно оце­нить не только генеральную среднюю, но и другие неизвестные параметры генеральной совокупности.

Для оценки математического ожидания а (ге­неральной средней)* нормально распределенного количественного признака Х по выборочной средней X- при известном среднем квадратическом отклоне­нии s генеральной совокупности (на практике — при большом объеме выборки, т. е. при п ≥ 30) и собственно-случайном повторном отборе формула (7.5) примет вид


где t определяется по таблицам функции Лапласа (приложение 2) из соотношения 2Ф0(t) = γ; s сред­нее квадратическое отклонение; п — объем выбор­ки (число обследованных единиц).


* Для нормально распределенной случайной величины М(X-) = а »`X.  Поэтому справедливо Р(X-- а| < D) »`X.

 

Для оценки математического ожидания а (гене­ральной средней) нормально распределенного количественного признака Х по выборочной средней X- при известном среднем квадратическом отклонении s генеральной совокупности (при большом объе­ме выборки, т. е. при п ≥ 30) и собственно-случай­ном бесповторном отборе формула (7.6) примет вид


Для оценки математического ожидания а (гене­ральной средней) нормально распределенного количественного признака Х по выборочной средней Х- при неизвестном среднем квадратическом отклонении (σ генеральной совокупности (на практике — при малом объеме выборки, т. е. при п < 30) и соб­ственно-случайном повторном отборе формула (7.6) будет иметь вид


где t определяется по таблицам Стьюдента (прило­жение 5), по уровню значимости α = 1 — g и числу степеней свободы k = п — 1; s — исправленное вы­борочное среднее квадратическое отклонение; п — объем выборки.


Для оценки математического ожидания а (гене­ральной средней) нормально распределенного количественного признака Х по выборочной средней X- при неизвестном среднем квадратическом отклонении σ- генеральной совокупности (при малом объе­ме выборки, т. е. при п < 30) и собственно-случай­ном бесповторном отборе формула (7.8) примет вид


Для оценки генеральной доли р нормально рас­пределенного количественного признака по выборочной доле ω= т/п (при большом объеме выбор­ки, т. е. при п ³ 30) и собственно-случайном повторном отборе формула (7.5) будет иметь вид


где t определяется по таблицам функции Лапласа (приложение 2) из соотношения 2Ф0(t) = g; ω  выборочная доля; п — объем выборки (число обсле­дованных единиц);


Для оценки генеральной доли р нормально рас­пределенного количественного признака по выбо­рочной доле ω = т/п (при большом объеме выборки, т. е. при п ³ 30) и собственно-случайном бесповторном отборе формула (7.10) примет вид


Для оценки генеральной доли р нормально рас­пределенного количественного признака по выборочной доле ω = т/п (при малом объеме выборки, т. е. при п < 30) и собственно-случайном повторном отборе формула (7.10) примет вид


где t определяется по таблицам Стьюдента (прило­жение 5), по уровню значимости α = 1 - γ и числу степеней свободы k = п - 1.


Для оценки генеральной доли р нормально рас­пределенного количественного признака по выборочной доле ω = т/п (при малом объеме выборки, т. е. при п < 30) и собственно-случайном беспоторном отборе формула (7.12) будет иметь вид


Пример 1. С помощью собственно-случайного повторного отбора руководство фирмы провело выборочное обследование 900 своих служащих. Сред­ний стаж их работы в фирме равен 8,70 года, а сред­нее квадратическое (стандартное) отклонение — 2,70 года. Среди обследованных оказалось 270 женщин. Считая стаж работы служащих фирмы распреде­ленным по нормальному закону, определите: а) с вероятностью 0,95 доверительный интервал, в ко­тором окажется средний стаж работы всех служащих фирмы; б) с вероятностью 0,90 доверительный интервал, накрывающий неизвестную долю женщин во всем коллективе фирмы.

Решение. По условию задачи выборочное обсле­дование проведено с помощью собственно-случайного повторного отбора. Объем выборки п = 900 единиц, т. е. выборка большая.

а) Найдем границы доверительного интервала среднего стажа работы всего коллектива фирмы, т. е. границы доверительного интервала для генераль­ной средней.

По условию X- = 8,70; s= 2,70; п = 900; g= 0,95. Используем формулу


Найдем t из соотношения 2Ф0(t) = g: 2Ф0(t) = 0,95; Ф0(t) = 0,95/2 = 0.475.

По таблице функции Лапласа (приложение 2) найдем, при каком t Ф0(t) = 0,475. Ф0(1,96) = 0,475.

Следовательно, t = 1,96.

Найдем предельную ошибку выборки


С вероятностью 0,95 можно ожидать, что сред­ний стаж работы всего коллектива фирмы находит­ся в интервале от 8,5236 до 8,8764 года.

б) Теперь оценим истинное значение доли жен­щин во всем коллективе фирмы.

По условию т = 270; п = 900; γ= 0,90.

Выборочная доля ω = 270/900 = 0,30.

Используем формулу


 

Найдем t из соотношения 2Ф0(t) = γ 2Ф0(t) = 0,90; Ф0(t) = 0,90/2 = 0,45.

По таблице функции Лапласа (приложение 2) определим, при каком t Ф0(t) = 0,45. Ф0(1,64) = 0,45.

Следовательно, t = 1,64.

Предельная ошибка выборки определяется по формуле


Итак, с вероятностью 0,90 можно ожидать, что доля женщин во всем коллективе фирмы находит­ся в интервале от 0,2749 до 0,3251.

Ответ. Можно ожидать, что с вероятностью 0,95 средний стаж работы всех служащих фирмы находится в интервале от 8,5236 до 8,8764 года. С веро­ятностью 0,90 можно гарантировать, что доля жен­щин во всем коллективе фирмы находится в интер­вале от 0,2749 до 0,3251.

Пример 2. Изменим условие примера 1.

1) С помощью собственно-случайного повторного отбора определяется средний стаж работы служа­щих фирмы. Предполагается, что он подчиняется нормальному закону. Каким должен быть объем выборки, чтобы с доверительной вероятностью 0,95 можно было утверждать, что, принимая полученный средний стаж работы за истинный, совершается погрешность, не превышающая 0,50 года, если стан­дартное отклонение σ равно 2,70 года?

2) Каким должен быть объем собственно-случай­ной повторной выборки, чтобы с надежностью 0,90 можно было утверждать, что максимальное откло­нение выборочной доли женщин в выборке от доли женщин во всем коллективе фирмы не превышало 0,05, если в прошлом аналогичном обследовании выборочная доля женщин оказалась равной 0,30?

Решение. В данной задаче нужно найти необхо­димую численность выборки. Ее расчет дает ответ на вопрос: «Сколько нужно обследовать единиц со­вокупности, чтобы с заранее заданной вероятнос­тью не превысить заранее заданную ошибку?»

1) Дано: D = 0,50; s= 2,70; g= 0,95.

По условию задачи требуется найти необходимую численность выборки для средней при повторном отборе. Воспользуемся формулой расчета необходи­мой численности выборки для средней при собствен­но-случайном повторном отборе: п = t2s2/D2.

Неизвестное значение t найдем из соотношения 2Ф0(t) = g0(t) = 0,95; Ф0(t)= 0,95/2 = 0,475.

По таблице функции Лапласа (приложение 2) найдем, при каком t Ф0(t) = 0,475. Ф0(1,96) = 0,475.

Следовательно, t = 1,96.

Рассчитаем необходимую численность выборки


Так как п — целое число, округлим полученный результат до большего целого, учитывая, что необходимо не превышать заданную ошибку.

Следовательно, надо обследовать не менее 113 слу­жащих.

Ответ. Чтобы с вероятностью 0,95 и D = 0,50 года с помощью собственно-случайного повторного отбо­ра определить средний стаж работы в фирме, необ­ходимо обследовать не менее 113 служащих.

2) Дано: D = 0,05; ω = 0,30; g= 0,90.

По условию задачи требуется найти необходимую численность выборки для доли при собственно-слу­чайном повторном отборе.

Воспользуемся формулой расчета необходимой численности выборки для доли при собственно-случайном повторном отборе:


Найдем t из соотношения 2Ф0(t) = g. 2Ф0(t) = 0,90; Ф0(t) = 0,90/2 = 0,45.

По таблице функции Лапласа (приложение 2) най­дем, при каком t Ф0(t) = 0,45. Ф0(1,64) = 0,45. Следовательно, t = 1,64.

Рассчитаем необходимую численность выборки:


Так как п — целое число, округлим полученный результат до большего целого, учитывая, что необходимо не превышать заданную ошибку.

Следовательно, п 226.

Ответ. Чтобы с вероятностью 0,90 и ошибкой D=0,05 с помощью собственно-случайного повтор­ного отбора определить долю женщин во всем кол­лективе фирмы, необходимо обследовать не менее 226 служащих.

Пример 3. Владелец автостоянки опасается об­мана со стороны своих служащих (охраны автостоянки). В течение года (365 дней) владельцем авто­стоянки проведено 40 проверок. По данным прове­рок среднее число автомобилей, оставляемых на ночь на охрану, составило 400 единиц, а среднее квадратическое (стандартное) отклонение их числа — 10 автомобилей. Считая отбор собственно-случай­ным, с вероятностью 0,99 оцените с помощью дове­рительного интервала истинное среднее число авто­мобилей, оставляемых на ночь на охрану. Обосно­ваны ли опасения владельца автостоянки, если по отчетности охранников среднее число автомобилей, оставляемых на ночь на охрану, составляет 395 автомобилей?

Решение. По условию задачи выборочное обсле­дование проведено с помощью собственно-случайного отбора. Очевидно, что отбор — бесповторный, так как не имеет смысла производить проверку бо­лее 1 раза в сутки. Объем выборки n = 40, что боль­ше 30 единиц, т. е. выборка большая. Объем гене­ральной совокупности N = 365.

Найдем границы доверительного интервала для оценки среднего числа автомобилей, оставляемых на ночь на охрану, т.е. границы доверительного интервала для генеральной средней.

По условию

Х-= 400; s = 10; п = 40; g= 0,99; N=365. Используем формулу


Найдем t из соотношения 2Ф (t) = g. 2Ф0(t) = 0,99; Ф0(t) = 0,99/2 = 0,495.

По таблице функции Лапласа (приложение 2) найдем, при каком t Ф0(t) = 0,495. Ф0(2,58) = 0,495.

Следовательно, t = 2,58.

Найдем предельную ошибку выборки:


Ответ. С уверенностью в 99% можно ожидать, что среднее число автомобилей, оставляемых на ночь на охрану, находится в интервале от 396 до 404. Таким образом, можно утверждать, что служащие автостоянки обманывают ее владельца.

Пример 4. В 24 из 40 проверок число автомоби­лей на автостоянке не превышало 400 единиц. С вероятностью 0,98 найдите доверительный интер­вал для оценки истинной доли дней в течение года, когда число оставляемых на стоянке автомобилей не превышало 400 единиц.

Решение. Определим границы доверительного интервала для доли дней в течение года, когда чис­ло оставляемых на стоянке автомобилей не превы­шало 400 единиц.

По условию т = 24; п = 40; g =.0,98.

Выборочная доля ω = 24/40 = 0,60. Так как


то найдем t из соотношения 2Ф0(t) = g. 2Ф0(t) = 0,98; Ф0(t) = 0,98/2 = 0,49.

По таблице функции Лапласа (приложение 2) найдем, при каком t Ф0(t) = 0,49. Ф0(2,33) = 0,49.

Следовательно, t = 2,33.

Найдем предельную ошибку выборки:


Ответ. С вероятностью 0,98 можно ожидать, что доля дней в течение года, когда число оставляемых на стоянке автомобилей не превышало 400 единиц, находится в интервале от 0,4297 до 0,7703.

Пример 5. Изменим условие примера 3.

С помощью собственно-случайного бесповторно­го отбора определяется среднее число автомобилей, оставляемых на ночь на охрану. Предполагается, что оно подчиняется нормальному закону. Каким должен быть объем выборки, чтобы с вероятностью 0,95 можно было утверждать, что когда принимается полученное среднее число автомобилей по вы­борке за истинное, совершается погрешность, не пре­вышающая 3 автомобилей, если среднее квадратическое отклонение s равно 10 автомобилям?

Решение. Дано: D= 3; σ = 10; g= 0,95; N=365. Воспользуемся формулой расчета необходимой численности выборки для средней при собственно-случайном бесповторном отборе;


Найдем t из соотношения 2Ф0(t) = g. 2Ф0(t) = 0,95; Ф0(t) = 0,95/2 = 0,475.

По таблице функции Лапласа (приложение 2) найдем, при каком t Ф0(t) = 0,475. Ф0(1,96) = 0,475.

Следовательно, t = 1,96.

Рассчитаем объем выборки:


Так как п — целое число, округлим полученный результат до большего целого, учитывая, что необходимо не превышать заданную ошибку.

Следовательно, необходимо провести не менее 39 проверок.

Ответ. Для определения среднего числа автомо­билей, оставляемых на ночь на охрану с вероятностью 0,95 и D = 3, необходимо провести не менее 39 проверок.

Пример 6. Изменим условие примера 4.

Каким должен быть объем собственно-случайной бесповторной выборки, чтобы с вероятностью 0,90 можно было утверждать, что максимальное откло­нение выборочной доли дней от доли дней в тече­ние года (когда среднее число оставляемых на ох­рану автомобилей не превышало 400 единиц) не превышало 0,10, если по данным прошлых прове­рок выборочная доля таких дней составляла 0,60?

Решение. Дано: Δ = 0,10; ω = 0,60; g= 0,90; N=365. Воспользуемся формулой расчета необходимой численности выборки для доли при собственно-слу­чайном бесповторном отборе


Найдем t из соотношения 2Ф0(t) = у. 2Ф0(t) = 0,90; Ф0(t) = 0,90/2 = 0,45.

По таблице функции Лапласа (приложение 2) найдем, при каком t Ф0(t) = 0,45. Ф0(1,64) = 0,45.

Следовательно, t = 1,64.

Рассчитаем необходимую численность выборки:


Так как п — целое число, округлим полученный результат до большего целого, учитывая, что необходимо не превышать заданную ошибку.

Следовательно, n » 55.

Ответ. Для того чтобы с вероятностью 0,90 и пре­дельной ошибкой 0,10 с помощью собственно-случайного бесповторного отбора определить искомую долю дней в течение года, необходимо провести не менее 55 проверок.

Пример 7. Служба контроля энергосбыта прове­ла выборочную проверку расхода электроэнергии жителями одного из многоквартирных домов. С помо­щью собственно-случайного отбора выбрано 10 квар­тир и определен расход электроэнергии в течение одного из летних месяцев (кВт · ч): 125; 78; 102;

140; 90; 45; 50;125; 115;112.

С вероятностью 0,95 определите доверительный интервал для оценки среднего расхода электроэнергии на 1 квартиру во всем доме при условии, что в доме 70 квартир, а отбор был: а) повторным; б) бес­повторным.

Решение. По условию задачи выборочное обсле­дование проведено с помощью собственно-случайного отбора. Объем выборки n = 10 единиц, т. е. выборка малая.

а) Считая отбор повторным, найдем доверитель­ный интервал для оценки среднего расхода электроэнергии на 1 квартиру во всем доме, т. е. грани­цы доверительного интервала для оценки генераль­ной средней.

Для этого используем формулы:


Для определения границ доверительного интер­вала необходимо рассчитать выборочные среднюю и среднее квадратическое (стандартное) отклонение.

Рассчитаем выборочную среднюю арифметическую:


Найдем исправленную выборочную дисперсию:


Найдем исправленное выборочное среднее квадратическое отклонение


Итак, дано: Х. = 98,2; s= 32,1448; п = 10; у= 0,95. По таблице Стьюдента (приложение 5) найдем t по уровню значимости α и числу степеней свободы k.

α = 1 - γ= 1 - 0,95 = 0,05;

k=n-1=10-1=9;

ta=0,05;k=9=2,26

Найдем предельную ошибку выборки



Ответ. При условии, что отбор квартир был по­вторным, с вероятностью 0,95 можно ожидать, что средний расход электроэнергии на 1 квартиру во всем доме находится в интервале от 75,2269 до

121,1731 кВт.ч.

б) Найдем границы доверительного интервала для оценки среднего расхода электроэнергии на 1 квар­тиру во всем доме, считая отбор бесповторным.

Для этого используем формулы:


По условию Х. = 98,2; s = 32,1448;п = 10; g= 0,95;ta=0,05;k=9= 2,26; N = 70.

Найдем предельную ошибку выборки:


76,9311 <`X<119,4689.

Ответ. При условии, что отбор квартир был бес­повторным, с вероятностью 0,95 можно ожидать, что средний расход электроэнергии на 1 квартиру во всем доме находится в интервале от 76,9311 до 119,4689 кВт ч.

 

Задачи к теме 7

1. С целью изучения размеров дневной выручки в сфере мелкого частного бизнеса была произведена 10%-я случайная бесповторная выборка из 1 000 торговых киосков города. В результате были полу­чены данные о средней дневной выручке, которая составила 500 у.е. В каких пределах с доверитель­ной вероятностью 0,95 может находиться средняя дневная выручка всех торговых точек изучаемой совокупности, если среднее квадратическое откло­нение составило 150 у. е.?

2. Фирма, торгующая автомобилями в неболь­шом городе, собирает информацию о состоянии местного автомобильного рынка в текущем году. С этой целью из 8 746 лиц в возрасте 18 лет и старше, про­живающих в этом городе, отобрано 500 человек. Среди них оказалось 29 человек, планирующих приобрести новый автомобиль в текущем году. Оце­ните долю лиц в генеральной совокупности в возрасте 18 лет и старше, планирующих приобрести но­вый автомобиль в текущем году, если a = 0,05.

3. Для оценки числа безработных среди рабочих одного из районов города в порядке случайной повторной выборки отобраны 400 человек рабочих спе­циальностей. 25 из них оказались безработными. Используя 95%-й доверительный интервал, оцени­те истинные размеры безработицы среди рабочих этого района.

4. Туристическое бюро, рекламируя отдых на одном из морских курортов, утверждает, что для этого курорта характерна идеальная погода со среднегодовой температурой +20° С. Пусть случай­но отобраны 35 дней в году. Какова в этом случае вероятность того, что отклонение средней темпера­туры за отобранные дни от среднегодовой темпера­туры не превысит по абсолютной величине 2° С, если температура воздуха распределена по нормальному закону, а стандартное отклонение дневной температуры составляет 4° С ?

5. Выборочные обследования малых предприя­тий города показали, что 95% малых предприятий в выборке относятся к негосударственной форме собственности. Приняв доверительную вероятность равной 0,954, определите, в каких границах нахо­дится доля негосударственных малых предприятий в генеральной совокупности, если в выборку попа­ло 100 предприятий?

6. В целях изучения среднедушевого дохода се­мей города в 1995 г. была произведена 1% -я повторная выборка из 30 тыс. семей. По результатам об­следования среднедушевой доход семьи в месяц со­ставил 200 тыс. руб. со средним квадратическим от­клонением, равным 150 тыс. руб. С вероятностью 0,95 найдите доверительный интервал, в котором на­ходится величина среднедушевого дохода всех семей города, считая среднедушевой доход случайной ве­личиной, распределенной по нормальному закону.

7. Для изучения различных демографических характеристик населения выборочно обследовано 300 семей города. Оказалось, что среди обследован­ных семей 15% состоят из 2 человек. В каких пре­делах находится в генеральной совокупности доля семей, состоящих из 2 человек, если принять доверительную вероятность равной 0,95?

8. По данным выборочных обследований в 1995 г. прожиточный минимум населения Северо-Кавказ­ского района составил в среднем на душу населе­ния 87 тыс. руб. в месяц. Каким должен был быть минимально необходимый объем выборки, чтобы с вероятностью 0,997 можно было утверждать, что этот показатель уровня жизни населения в выбор­ке отличается от своего значения в генеральной совокупности не более чем на 10 тыс. руб., если сред­нее квадратическое отклонение принять равным 30 тыс. руб.?

9. В 1995 г. выборочное обследование распреде­ления населения города по среднедушевому денежному доходу показало, что 40% обследованных в выборке имеют среднедушевой денежный доход не более 200 тыс. руб. В каких пределах находится доля населения, имеющего такой среднедушевой доход, во всей генеральной совокупности, если объем генеральной совокупности составляет 1 000 000 единиц, выборка не превышает 10% объе­ма генеральной совокупности и осуществляется по методу собственно-случайного бесповторного отбо­ра, а доверительная вероятность принимается рав­ной 0,954?

10. Аудиторская фирма хочет проконтролиро­вать состояние счетов одного из коммерческих бан­ков. Для этого случайно отбираются 50 счетов. По 20 счетам из 50. отобранных имело место движе­ние денежных средств в течение месяца. Построй­те 99%-й доверительный интервал, оценивающий долю счетов в генеральной совокупности, по кото­рым имело место движение денежных средств в течение месяца.

11. Строительная компания хочет оценить воз­можности успешного бизнеса на рынке ремонтностроительных работ. Эта оценка базируется на слу­чайной бесповторной выборке, в соответствии с ко­торой из 1 000 домовладельцев, собирающихся ре­монтировать или перестраивать свои дома, отобра­ны 600 человек. По этой выборке определено, что средняя стоимость строительных работ, которую предполагает оплатить отдельный домовладелец, составляет 5 000 у. е. С какой вероятностью можно гарантировать, что эта стоимость будет отличаться от средней стоимости строительных работ в гене­ральной совокупности по абсолютной величине не более, чем на 100 у. е., если стандартное отклоне­ние стоимости строительных работ в выборке со­ставило 500 у. е.?

12. Менеджер компании, занимающейся прока­том автомобилей, хочет оценить среднюю величину пробега одного автомобиля в течение месяца. Из 280 автомобилей, принадлежащих компании, методом случайной бесповторной выборки отобрано 30. По данным этой выборки установлено, что средний пробег автомобиля в течение месяца составляет 1 342 км со стандартным отклонением 227 км. Считая про­бег автомобиля случайной величиной, распределен­ной по нормальному закону, найдите 95%-й доверительный интервал, оценивающий средний про­бег автомобилей всего парка в течение месяца.

13. Среднемесячный бюджет студентов в коллед­жах одного из штатов США оценивается по случайной выборке. С вероятностью 0,954 найдите наи­меньший объем выборки, необходимый для такой оценки, если среднее квадратическое отклонение предполагается равным 100 у. е., а предельная ошибка средней не должна превышать 20 у. е.

14. Коммерческий банк, изучая возможности предоставления долгосрочных кредитов населению, опрашивает своих клиентов для определения сред­него размера такого кредита. Из 9 706 клиентов бан­ка опрошено 1 000 человек. Среднее значение необ­ходимого кредита в выборке составило 6 750 у. е. со стандартным отклонением 1 460 у. е. Найдите границы 95%-го доверительного интервала для оцен­ки неизвестного среднего значения кредита в гене­ральной совокупности.

15. Выборочные обследования показали, что доля покупателей, предпочитающих новую модификацию товара А, составляет 60% от общего числа покупа­телей данного товара. Каким должен быть объем выборки, чтобы можно было получить оценку гене­ральной доли с точностью не менее 0,05 при дове­рительной вероятности 0,90?

16. С помощью случайной выборки оценивается среднее время ежедневного просмотра телепередач абонентами кабельного телевидения в период с 18 до 22 ч. Каким должен быть объем выборки в этом случае, если в предыдущих выборочных обследова­ниях стандартное отклонение времени просмотра передач составило 40 мин, а отклонение выбороч­ной средней от генеральной средней по абсолютной величине не должно превышать 5 мин с вероятнос­тью 0,99?

17. При выборочном опросе 1200 телезрителей оказалось, что 456 из них регулярно смотрят программы телеканала НТВ. Постройте 99%-й доверительный интервал, оценивающий долю всех телезрителей, предпочитающих программы телеканала НТВ.

18. Для оценки остаточных знаний по общеэконо­мическим предметам были протестированы 25 студентов 2-го курса факультета. Получены следую­щие результаты в баллах: 107, 90, 114, 88, 117, 110, 103, 120, 96, 122, 93, 100, 121, 110, 135, 85, 120, 89, 100, 126, 90, 94, 99, 116, 111. По этим данным найдите 95%-й доверительный интервал для оценки среднего балла тестирования всех студен­тов 2-го курса факультета.

19. Для изучения размера среднемесячной зара­ботной платы занятого населения региона производится случайная повторная выборка. Каким дол­жен быть объем этой выборки, чтобы с доверитель­ной вероятностью 0,997 можно было утверждать, что среднемесячная заработная плата в выборке отличается от среднемесячной заработной платы работников во всем регионе по абсолютной величи­не не более чем на 25%, если среднемесячная зара­ботная плата в выборке составила 220 у. е. со сред­ним квадратическим отклонением 120 у. е.?

20. Выборочное исследование деятельности ком­мерческих банков региона показало, что в среднем каждый банк имеет 10 филиалов в регионе (со стан­дартным отклонением, равным 5). Найдите объем выборки, позволивший сделать такую оценку, если предельная ошибка выборочной средней находится в пределах 20% от ее фактического значения, а до­верительная вероятность составляет 0,95.

 

8. ПРОВЕРКА СТАТИСТИЧЕСКИХ ГИПОТЕЗ

В процессе статистического анализа иногда быва­ет необходимо сформулировать и проверить предпо­ложения (гипотезы) относительно величины незави­симых параметров или закона распределения изуча­емой генеральной совокупности (совокупностей). На­пример, исследователь выдвигает гипотезу о том, что «выборка извлечена из нормальной генеральной со­вокупности» или «генеральные средние двух анали­зируемых совокупностей равны». Такие предполо­жения называются статистическими гипотезами.

Сопоставление высказанной гипотезы относи­тельно генеральной совокупности с имеющимися выборочными данными, сопровождаемое количе­ственной оценкой степени достоверности получа­емого вывода и осуществляемое с помощью того или иного статистического критерия, называется проверкой статистических гипотез.

Выдвинутая гипотеза называется нулевой (ос­новной). Ее принято обозначать Н0.

По отношению к высказанной (основной) гипо­тезе всегда можно сформулировать альтернатив­ную (конкурирующую), противоречащую ей. Аль­тернативную (конкурирующую) гипотезу принято обозначать Н1 .

Цель статистической проверки гипотез состо­ит в том, чтобы на основании выборочных данных принять решение о справедливости основной гипо­тезы Н0

Если выдвигаемая гипотеза сводится к утверж­дению о том, что значение некоторого неизвестно­го параметра генеральной совокупности в точнос­ти равно заданной величине, то эта гипотеза на­зывается простой, например: «Среднедушевой сово­купный доход населения России составляет 650 руб. в месяц»; «Уровень безработицы (доля безработных в численности экономически активного населения) в России равен 9%». В других случаях гипотеза называется сложной.

В качестве нулевой гипотезы Н0 принято выдви­гать простую гипотезу, так как обычно бывает удобнее проверять более строгое утверждение.

По своему содержанию статистические гипотезы можно подразделить на несколько основных типов*:

— гипотезы о виде закона распределения иссле­дуемой случайной величины;

— гипотезы о числовых значениях параметров исследуемой генеральной совокупности**;

— гипотезы об однородности двух или несколь­ких выборок или некоторых характеристик анали­зируемых совокупностей;

                       гипотезы об общем виде модели, описываю­щей статистическую зависимость между признака­ми; и др.

* В этой работе рассматриваются первые два типа гипотез.

** Эти гипотезы часто называют параметрическими, тогда как все остальные — непараметрическими.

 

Так как проверка статистических гипотез осу­ществляется на основании выборочных данных, т. е. ограниченного ряда наблюдений, решения относительно нулевой гипотезы Н0 имеют вероятностный характер. Другими словами, такое решение неиз­бежно сопровождается некоторой, хотя возможно и очень малой, вероятностью ошибочного заключения как в ту, так и в другую сторону.

Так, в какой-то небольшой доле случаев α нуле­вая гипотеза Н0 может оказаться отвергнутой, в то время как в действительности в генеральной сово­купности она является справедливой. Такую ошиб­ку называют ошибкой 1-го рода, а ее вероятность — 1 уровнем значимости и обозначают α.

Наоборот, в какой-то небольшой доле случаев b нулевая гипотеза Н0 принимается, в то время как на самом деле в генеральной совокупности она ошибоч­на, а справедлива альтернативная гипотеза Н1. Такую ошибку называют ошибкой 2-го рода. Вероят­ность ошибки 2-го рода обозначается как b. Вероятность 1 - b называют мощностью критерия.

При фиксированном объеме выборки можно выб­рать по своему усмотрению величину вероятности только одной из ошибок α или b. Увеличение веро­ятности одной из них приводит к снижению дру­гой. Принято задавать вероятность ошибки 1-го рода a уровень значимости. Как правило, пользуются некоторыми стандартными значениями уровня зна­чимости a: 0,1; 0,05; 0,025; 0,01; 0,005; 0,001. Тог­да, очевидно, из двух критериев, характеризующих­ся одной и той же вероятностью a (отклонить правильную в действительности гипотезу Н0), следует принять тот, которому соответствует меньшая ошиб­ка 2-го рода b, т.е. большая мощность. Снижения вероятностей обеих ошибок a и b можно добиться путем увеличения объема выборки.

Правильное решение относительно нулевой ги­потезы Н0 также может быть двух видов:

— будет принята нулевая гипотеза Н0, когда в генеральной совокупности верна нулевая гипотеза Н0 ; вероятность такого решения 1 - a;

нулевая гипотеза Н0 будет отклонена в пользу альтернативной Н1, когда в генеральной совокупности нулевая гипотеза Н0 отклоняется в пользу альтер­нативной Н1, вероятность такого решения 1 - bмощность критерия.

Результаты решения относительно нулевой гипо­тезы можно проиллюстрировать с помощью табл. 8.1.

Таблица 8.1

Нулевая гипотеза Н0

 

Результаты решения относительно нулевой гипотезы Н0

 

Отклонена

 

Принята

 

Верна

Ошибка 1-го рода, ее вероятность

Р(Н10) = a

Правильное решение, его вероятность Р(Н0/Н0) = 1 - a

Неверна

Правильное решение, его вероятность Р(Н11) = 1 -  b

Ошибка 2-го рода, ее вероятность

Р(Н0/Н0) =  b

 

Проверка статистических гипотез осуществляет­ся с помощью статистического критерия (назо­вем его в общем виде К), являющего функцией от результатов наблюдения.

Статистический критерий — это правило (фор­мула), по которому определяется мера расхожде­ния результатов выборочного наблюдения с выс­казанной гипотезой Н0.

Статистический критерий, как и всякая функ­ция от результатов наблюдения, является случайной величиной и в предположении справедливости нулевой гипотезы Н0 подчинен некоторому хорошо изученному (и затабулированному) теоретическому закону распределения с плотностью распределения

f(k).

Выбор критерия для проверки статистических гипотез может быть осуществлен на основании различных принципов. Чаще всего для этого пользу­ются принципом отношения правдоподобия, который позволяет построить критерий, наиболее мощ­ный среди всех возможных критериев. Суть его сво­дится к выбору такого критерия К с известной фун­кцией плотности f(k) при условии справедливости гипотезы Н0, чтобы при заданном уровне значимос­ти α можно было бы найти критическую точку К распределения f(k), которая разделила бы область значений критерия на две части: область допусти­мых значений, в которой результаты выборочного наблюдения выглядят наиболее правдоподобными, и критическую область, в которой результаты вы­борочного наблюдения выглядят менее правдоподобными в отношении нулевой гипотезы Н0.

Если такой критерий К выбран, и известна плот­ность его распределения, то задача проверки статистической гипотезы сводится к тому, чтобы при заданном уровне значимости α рассчитать по выбо­рочным данным наблюдаемое значение критерия Kнабл определить, является ли оно наиболее или наименее правдоподобным в отношении нулевой ги­потезы Н0.

Проверка каждого типа статистических гипотез осуществляется с помощью соответствующего критерия, являющегося наиболее мощным в каждом конкретном случае. Например, проверка гипотезы о виде закона распределения случайной величины может быть осуществлена с помощью критерия согласия Пирсона x2; проверка гипотезы о равенстве неизвестных значений дисперсий двух генеральных совокупностей — с помощью критерия Фише­ра F; ряд гипотез о неизвестных значениях пара­метров генеральных совокупностей проверяется с помощью критерия Z нормальной распределен­ной случайной величины и критерия t-Стьюдента и т. д.

Значение критерия, рассчитываемое по специ­альным правилам на основании выборочных дан­ных, называется наблюдаемым значением критерия(Kнабл).

Значения критерия, разделяющие совокупность значений критерия на область допустимых значе­ний (наиболее правдоподобных в отношении нуле­вой гипотезы Н0) и критическую область (область значений, менее правдоподобных в отношении ну­левой гипотезы Н0), определяемые на заданном уровне значимости α  по таблицам распределения случайной величины К, выбранной в качестве критерия, называются критическими точками кр ).

Областью допустимых значений (областью при­нятия нулевой гипотезы Н0) называют совокуп­ность значений критерия К, при которых нулевая гипотеза Н0 не отклоняется.

Критической областью называют совокупность значений критерия К, при которых нулевая гипо­теза Н0 отклоняется в пользу конкурирующей Н1.

Различают одностороннюю (правостороннюю или левостороннюю) и двустороннюю критические об­ласти.

Если конкурирующая гипотеза — правосторон­няя, например, Н1: а > a0, то и критическая область — правосторонняя (рис. 8.1). При правосто­ронней конкурирующей гипотезе критическая точка кр.п) принимает положительные значения.


Если конкурирующая гипотеза — левосторонняя, например, Н1 : а < а0, то и критическая область — левосторонняя (рис. 8.2). При левосторонней кон­курирующей гипотезе критическая точка принимает отрицательные значения кр.л).


Если конкурирующая гипотеза — двусторонняя, например. Н1: а ¹ а0 , то и критическая область — двусторонняя (рис. 8.3). При двусторонней конку­рирующей гипотезе определяются 2 критические точки кр.л  и K кр..п)


Основной принцип проверки статистических гипотез состоит в следующем:

— если наблюдаемое значение критерия набл) принадлежит критической области, то нулевая ги­потеза Н0 отклоняется в пользу конкурирующей H1;

— если наблюдаемое значение критерия набл) принадлежит области допустимых значений, то нулевую гипотезу Н0 нельзя отклонить.

Можно принять решение относительно нулевой гипотезы Н0 путем сравнения наблюдаемого набл) и критического значений критерия кр. ).

При правосторонней конкурирующей гипотезе:

если Кнабл£Ккр. , то нулевую гипотезу Н0нельзя отклонить;

— если Кнабл > Kкр , то нулевая гипотеза Н0 откло­няется в пользу конкурирующей Н1.

При левосторонней конкурирующей гипотезе:

если Кнабл³кр, то нулевую гипотезу Н0  нельзя отклонить;

— если Кнабл < -Ккр , то нулевая гипотеза Н0 от­клоняется в пользу конкурирующей Н1.

При двусторонней конкурирующей гипотезе:

     если кр £ Кнабл£ Ккр, то нулевую гипотезу Н0 нельзя отклонить;

— если Кнабл > Ккр или Кнабл < -Ккр, то нулевая гипотеза Н0  отклоняется в пользу конкурирующей Н1.

 

Алгоритм проверки статистических гипотез сводится к следующему:

1) сформулировать нулевую Н0  и альтернатив­ную Н1 гипотезы;

2) выбрать уровень значимости α;

3) в соответствии с видом выдвигаемой нулевой гипотезы Н0 выбрать статистический критерий для ее проверки, т.е. — специально подобранную слу­чайную величину К, точное или приближенное распределение которой заранее известно;

4) по таблицам распределения случайной вели­чины К, выбранной в качестве статистического критерия, найти критическое значение Ккр (критиче­скую точку или точки);

5) на основании выборочных данных по специ­альному алгоритму вычислить наблюдаемое значе­ние критерия Кнабл;

6) по виду конкурирующей гипотезы Н1 опреде­лить тип критической области;

7) определить, в какую область (допустимых зна­чений или критическую) попадает наблюдаемое значение критерия Кнабл ,  и в зависимости от этого — принять решение относительно нулевой гипотезы

Н0

           Следует заметить, что даже в том случае, если нулевую гипотезу Н0 , нельзя отклонить, это не означает, что высказанное предположение о генераль­ной совокупности является единственно подходя­щим: просто ему не противоречат имеющиеся вы­борочные данные, однако таким же свойством на­ряду с высказанной могут обладать и другие гипо­тезы.

Можно интерпретировать результаты проверки нулевой гипотезы следующим образом:

— если в результате проверки нулевую гипотезу Н0 нельзя отклонить, то это означает, что имеющиеся выборочные данные не позволяют с достаточ­ной уверенностью отклонить нулевую гипотезу Н0, вероятность нулевой гипотезы Н0 больше a, а кон­курирующей Н1 меньше 1 - a;

если в результате проверки нулевая гипотеза Н0 отклоняется в пользу конкурирующей Н1, то имеющиеся выборочные данные не позволяют с до­статочной уверенностью принять нулевую гипотезу Н0, вероятность нулевой гипотезы Н0 меньше a, а конкурирующей Н1 больше 1 - a.

Пример 1. В 7 случаях из 10 фирма-конкурент компании «А» действовала на рынке так, как будто ей заранее были известны решения, принимаемые фирмой «А». На уровне значимости 0,05 определи­те, случайно ли это, или в фирме «А» работает ос­ведомитель фирмы-конкурента?

Решение. Для того чтобы ответить на поставлен­ный вопрос, необходимо проверить статистическую гипотезу о том, совпадает ли данное эмпирическое распределение числа действий фирмы-конкурента с равномерным теоретическим распределением?

Если ходы, предпринимаемые конкурентом, вы­бираются случайно, т. е. в фирме «А» — нет осведомителя (инсайдера), то число «правильных» и «не­правильных» ее действий должно распределиться поровну, т. е. по 5 (10/2), а это и есть отличитель­ная особенность равномерного распределения.

Этот вид статистических гипотез относится к гипотезам о виде закона распределения генераль­ной совокупности.

Сформулируем нулевую и конкурирующую ги­потезы согласно условию задачи.

Н0 : Х ~ R(a; b) — случайная величина Х подчи­няется равномерному распределению с параметра­ми (a; b) (в контексте задачи — «В фирме «А» — нет осведомителя (инсайдера)»; «Распределение чис­ла удачных ходов фирмы-конкурента — случайно»);

Н1 : случайная величина Х не подчиняется рав­номерному распределению (в контексте задачи — «В фирме «А» — есть осведомитель (инсайдер)»;

«Распределение числа удачных ходов фирмы-кон­курента — неслучайно»).

В качестве критерия для проверки статистичес­ких гипотез о неизвестном законе распределения генеральной совокупности используется случайная величина c2 . Этот критерий называют критерием Пирсона.

Его наблюдаемое значение (c2набл) рассчитывает­ся по формуле


где m(эмп)i — эмпирическая частота i-й группы вы­борки; т(теор)i,  теоретическая частота i-й группы выборки.

Составим таблицу распределения эмпирических и теоретических частот (табл. 8.2).

Таблица 8.2

m(эмп)i

 

7

 

3

 

т(тeop)i

 

5

 

5

 

 

Найдем наблюдаемое значение c2набл


Критическое значение (c2кр.) следует определять с помощью таблиц распределения c2 (приложение 4) по уровню значимости α и числу степеней свободы k.

По условию a = 0,05, а число степеней свободы рассчитывается по формуле

k = п - l - 1,

где k — число степеней свободы; п — число групп выборки; l число неизвестных параметров предполагаемой модели, оцениваемых по данным вы­борки (если все параметры предполагаемого закона известны точно, то l = 0).

По условию задачи, число групп выборки (п) рав­но 2, так как могут быть только 2 варианта дей­ствий фирмы-конкурента: «удачные» и «неудач­ные», а число неизвестных параметров равномер­ного распределения (l) равно 0.

Отсюда k=2-0-l=l.

Найдем  c2кр. по уровню значимости a = 0,05 и числу степеней свободы k = 1:

c2кр(a =0,05 ;k=1). =3.8

c2набл. < c2кр.следовательно, на данном уровне зна­чимости нулевую гипотезу нельзя отклонить, расхождения эмпирических и теоретических час­тот — незначимые. Данные наблюдений согласуют­ся с гипотезой о равномерном распределении гене­ральной совокупности.

Это означает, что для утверждения о том, что действия фирмы-конкурента на рынке неслучайны, нет оснований и на уровне значимости a = 0,05 можно утверждать, что в фирме «А» нет платного осведомителя фирмы-конкурента.

Ответ. На уровне значимости a = 0,05 можно ут­верждать, что в фирме «А» нет платного осведомителя фирмы-конкурента.

Пример 2. На уровне значимости a = 0,025 про­верить гипотезу о нормальном распределении генеральной совокупности, если известны эмпиричес­кие и теоретические частоты (табл. 8.3):

Таблица 8.3

m(эмп)i

 

5

 

10

 

20

 

25

 

14

 

3

 

т(теор)i

 

6

 

14

 

28

 

18

 

8

 

3

 

 

Решение. Сформулируем нулевую и конкуриру­ющую гипотезы согласно условию задачи.

Нγ: Х ~ N(a; s2) — случайная величина Х подчи­няется нормальному закону распределения с параметрами а и s2.

Н1. случайная величина Х не подчиняется нор­мальному закону распределения с параметрами а и s2.

В качестве критерия для проверки нулевой ги­потезы используем критерий Пирсона c2 .

Найдем наблюдаемое значение (c2 набл):


Найдем критическое значение критерия (c2кр ) по таблице распределения c2 (приложение 4) по уровню значимости α и числу степеней свободы k.

По условию α  = 0,025; число степеней свободы найдем по формуле

k = пI - 1,

где k — число степеней свободы;

п — число групп выборки;

I число неизвестных параметров предполагае­мой модели, оцениваемых по данным выборки.

По условию задачи число групп выборки (п) рав­но 6, а число параметров нормального неизвестных распределения (I) равно 2.

Отсюда k=6-2-1=3.

Найдем c2кр по уровню значимости a = 0,025 и числу степеней свободы k = 3:

c2кр(a=0,025;k=3) =9,4

 

c2набл > c2кр  следовательно, на данном уровне зна­чимости нулевая гипотеза отклоняется в пользу конкурирующей, расхождения эмпирических и те­оретических частот — значимые. Данные наблюде­ний не согласуются с гипотезой о нормальном рас­пределении генеральной совокупности.

Ответ. На уровне значимости a = 0,025 данные наблюдений не согласуются с гипотезой о нормальном распределении генеральной совокупности.

Пример 3. Техническая норма предусматривает в среднем 40 с на выполнение определенной технологической операции на конвейере по производству часов. От работающих на этой операции поступили жалобы, что они в действительности затрачивают на нее больше времени. Для проверки данной жалобы произведены хронометрические измерения вре­мени выполнения этой технологической операции у 16 работниц, занятых на ней, и получено среднее время выполнения операции `X = 42 с. Можно ли по имеющимся хронометрическим данным на уров­не значимости a = 0,01 отклонить гипотезу о том, что среднее время выполнения этой операции со­ответствует норме, если: а) исправленное выбороч­ное среднее квадратическое отклонение s3,5 с; б) выборочное среднее квадратическое отклонение s 3,5 с?

Решение. а) Для решения данной задачи необхо­димо проверить гипотезу о том, что неизвестная генеральная средняя нормальной совокупности точ­но равна определенному числу, когда дисперсия генеральной совокупности неизвестна (выборка мала, так как n = 16 меньше 30).

Сформулируем нулевую и конкурирующую ги­потезы согласно условию задачи.

H0: а = a0 = 40 — неизвестное математическое ожидание а (нормально распределенной генераль­ной совокупности с неизвестной дисперсией) равно гипотетически предполагаемому числовому значению a0 (применительно к условию данной задачи — вре­мя выполнения технологической операции соответствует норме).

H1: а > 40 — неизвестное математическое ожи­дание а (нормально распределенной генеральной совокупности с неизвестной дисперсией) больше числового значения a0 (применительно к условию данной задачи — время выполнения технологичес­кой операции больше установленной нормы).

Так как конкурирующая гипотеза — правосторон­няя, то и критическая область — правосторонняя.

В качестве критерия для сравнения неизвестно­го математического ожидания а (нормально распределенной генеральной совокупности с неизвестной дисперсией) с гипотетическим числовым значени­ем a0 используется случайная величина t-критерий Стьюдента.

Его наблюдаемое значение (tнабл) рассчитывается по формуле


где X. — выборочная средняя; a0 числовое значе­ние генеральной средней; s — исправленное среднее квадратическое отклонение; п — объем выборки. Найдем наблюдаемое значение tнабл


Критическое значение (tкр) следует находить с помощью таблиц распределения Стьюдента (приложение 5) по уровню значимости α и числу степеней свободы k.

По условию a = 0,01; число степеней свободы найдем по формуле k = п - 1,

где k — число степеней свободы; п — объем выборки.

k = 16 - 1 = 15.

Найдем tкр по уровню значимости a = 0,01 (для односторонней критической области) и числу степеней свободы k = 15:

tкр(α=0,01;k=1)=2,6

Заметим, что при левосторонней конкурирующей гипотезе Н1 : а < 40 tкр следует находить по таблицам распределения Стьюдента (приложение 5) по уровню значимости α (для односторонней критичес­кой области) и числу степеней свободы k = п - 1 и присваивать ему знак «минус».

При двусторонней конкурирующей гипотезе Н1 : а ¹ 40 tкр следует находить по таблицам распределения Стьюдента (приложение 5) по уровню значимо­сти a (для двусторонней критической области) и числу степеней свободы k = п - 1.

tнабл < tкр , следовательно, на данном уровне значи­мости нет оснований отклонить нулевую гипотезу.

Ответ. По имеющимся хронометрическим дан­ным на уровне значимости α = 0,01 нельзя откло­нить гипотезу о том, что среднее время выполне­ния этой операции соответствует норме. Следова­тельно, жалобы работниц — необоснованны.

Наблюдаемое значение критерия попадает в об­ласть допустимых значений (рис. 8.4), следователь­но, нет оснований отклонить нулевую гипотезу.


б) Для решения данной задачи необходимо проверить гипотезу о том, что неизвестная генеральная средняя нормальной совокупности точно равна определенному числу, когда дисперсия генеральной совокупности неизвестна.

Алгоритм решения задачи будет тот же, что и в первом случае. Однако наблюдаемое значение tнабл рассчитывается по формуле


где X0— выборочная средняя; а0 числовое значе­ние генеральной средней; sвыб  — выборочное среднее квадратическое отклонение; л — объем выборки. Найдем наблюдаемое значение (tнабл)


Критическое значение (tкр) следует находить по таблице распределения Стьюдента (приложение 5) по уровню значимости α и числу степеней свободы k.

tнабл   < tкр , следовательно, на данном уровне зна­чимости нет оснований отвергнуть нулевую гипотезу, жалобы работниц — необоснованны.

Ответ. По имеющимся хронометрическим дан­ным на уровне значимости  a = 0,01 нельзя откло­нить гипотезу о том, что среднее время выполне­ния этой операции соответствует норме, жалобы работниц — необоснованны.

Пример 4. Изменим условие предыдущей зада­чи. Техническая норма предусматривает в среднем 40 с на выполнение определенной технологичес­кой операции на конвейере по производству ча­сов. От работающих поступили жалобы, что они в действительности затрачивают на эту операцию больше времени. Для проверки данной жалобы про­изведены хронометрические измерения времени ее выполнения у 36 работниц, занятых на этой опе­рации, и получено среднее время выполнения операции X0 = 42 с. Можно ли (предполагая время выполнения технологической операции случайной величиной, подчиняющейся нормальному закону) по имеющимся хронометрическим данным на уров­не значимости a = 0,01 отклонить гипотезу о том, что среднее время выполнения этой операции со­ответствует норме, если известно, что среднее квад­ратическое отклонение генеральной совокупности s составляет 3,5 с?

Решение. Для решения данной задачи необходи­мо проверить гипотезу о том, что неизвестная генеральная средняя нормальной совокупности точно равна числовому значению, когда дисперсия генеральной совокупности известна (большая выбор­ка, так как п = 36 больше 30).

Сформулируем нулевую и конкурирующую ги­потезы согласно условию задачи.

Н0 : а = a0 = 40 — неизвестная генеральная сред­няя нормально распределенной совокупности с известной дисперсией равна числовому значению (при­менительно к условию данной задачи — время вы­полнения технологической операции соответствует норме).

Н1: а > 40 — неизвестная генеральная средняя нормально распределенной совокупности с извест­ной дисперсией больше числового значения (при­менительно к условию данной задачи — время вы­полнения технологической операции больше уста­новленной нормы).

 Так как конкурирующая гипотеза — правосторонняя, то и критическая область — правосторонняя.

В качестве критерия для сравнения выборочной бедней с гипотетической генеральной средней нормальной совокупности, когда дисперсия генеральной совокупности известна, используется случайная величина U.                           

Его наблюдаемое значение (uнабл) рассчитывается по формуле


где X.— выборочная средняя; а0 числовое значе­ние генеральной средней; sген выборочное среднее квадратическое отклонение; п — объем выборки. Найдем наблюдаемое значение (инабл):


Так как конкурирующая гипотеза — правосто­ронняя, критическое значение и следует находить по таблице функции Лапласа (приложение 2) из равенства

ф0(икр) = (1 - 2a)/2.

По условию a = 0,01.

Отсюда

Ф0(икр) = (1 - 2·0,01)/2 = 0,49.

По таблице функции Лапласа (приложение 2) найдем, при каком икр  Ф0кр) = 0,49.

Ф0(2,33) = 0,49.

Следовательно, икр = 2,33.

Заметим, что при левосторонней конкурирующей гипотезе Н1 : а < 40 uкр следует находить по таблице функции Лапласа (приложение 2) из равенства Ф0(uкр ) = (1 - 2a)/2 и присваивать ему знак «минус».

При двусторонней конкурирующей гипотезе Н1 : а ¹ 40 икр следует находить по таблице функции Лапласа (приложение 2) из равенства


инабл  >uкр , следовательно, на данном уровне зна­чимости нулевая гипотеза отвергается в пользу конкурирующей. По имеющимся хронометрическим данным с более чем 99%-й надежностью можно ут­верждать, что среднее время выполнения этой опе­рации превышает норму. Следовательно, жалобы работниц — обоснованны.

Наблюдаемое значение критерия попадает в кри­тическую область (рис. 8.5), следовательно, нуле­вая гипотеза отвергается в пользу конкурирующей.


Ответ. По имеющимся хронометрическим дан­ным на уровне значимости a = 0,01 можно утверждать, что среднее время выполнения этой опера­ции превышает норму, жалобы работниц — обо­снованны.

Пример 5. Экономический анализ производитель­ности труда предприятий отрасли позволил выдвинуть гипотезу о наличии 2 типов предприятий с раз­личной средней величиной показателя производительности труда. Выборочное обследование 42 пред­приятий 1-й группы дало следующие результаты: средняя производительность труда  X.— 119 деталей. По данным выборочного обследования, на 35 предприятиях 2-й группы средняя производительность труда— 107 деталей. Генеральные дисперсии из­вестны: D(X) = 126,91 (дет.2); D(Y) = 136,1 (дет.2). Считая, что выборки извлечены из нормально распределенных генеральных совокупностей Х и Y, на уровне значимости 0,05, проверьте, случайно ли по­лученное различие средних показателей произво­дительности труда в группах или же имеются 2 ти­па предприятий с различной средней величиной про­изводительности труда.

Решение. Для решения данной задачи необходи­мо сравнить 2 средние нормально распределенных генеральных совокупностей, генеральные дисперсии которых известны (большие независимые выбор­ки). В данной задаче речь идет о больших выборках, так как пx = 42 и пy =35 больше 30. Выборки — независимые, так как из контекста задачи видно, что они извлечены из непересекающихся генераль­ных совокупностей.

Сформулируем нулевую и конкурирующую ги­потезы согласно условию задачи.

Н0: `X = `Y — генеральные средние 2 нормально распределенных совокупностей с известными дисперсиями равны (применительно к условию данной задачи — предприятия 2 групп относятся к одному типу предприятий: средняя производительность труда в 2 группах — одинакова).

Н1: `X ¹`Y — генеральные средние 2 нормально распределенных совокупностей с известными дисперсиями неравны (применительно к условию дан­ной задачи — предприятия 2 групп относятся к разному типу предприятий: средняя производитель­ность труда в 2 группах — неодинакова).

Выдвигаем двустороннюю конкурирующую ги­потезу, так как из условия задачи не следует, что необходимо выяснить больше или меньше произво­дительность труда в одной из групп предприятий по сравнению с другой.

Поскольку конкурирующая гипотеза — двусто­ронняя, то и критическая область — двусторонняя.

В качестве критерия для сравнения 2 средних генеральных совокупностей, дисперсии которых известны (большие независимые выборки), исполь­зуется случайная величина Z.

Его наблюдаемое значение (zнабл) рассчитывается по формуле


где X.— выборочная средняя для X; — выбороч­ная средняя для Y; D(X) — генеральная дисперсия для X; D(Y) — генеральная дисперсия для Y; пxобъем выборки для X; пy объем выборки для Y. Найдем наблюдаемое значение (zнабл):


Так как конкурирующая гипотеза — двусторонняя, критическое значение (zкр ) следует находить по таблице функции Лапласа (приложение 2) из ра­венства

Ф0(zкр) = (1 - a)/2.

По условию a= 0,05.

Отсюда

Ф0(zкр)=(1-0,05)/2=0,475.

По таблице функции Лапласа (приложение 2) найдем, при каком zкрФ0(zкр) = 0,475.

Ф0(1,96) = 0,475.

Учитывая, что конкурирующая гипотеза — дву­сторонняя, находим две критические точки:


Заметим, что при левосторонней конкурирующей гипотезе Н1:`X < `Y zкр  следует находить по табли­це функции Лапласа (приложение 2) из равенства Ф0(zкр ) = (1 - 2a)/2 и присваивать ему знак «минус».

При правосторонней конкурирующей гипотезе Н1: `X > `Y zкр находим по таблице функции Лапла­са (приложение 2) из равенства Ф0(zкр)= (1- 2a)/2.

zнабл> zкрследовательно, на данном уровне зна­чимости нулевая гипотеза отвергается в пользу конкурирующей. На уровне значимости a= 0,05 мож­но утверждать, что полученное различие средних показателей производительности труда в группах неслучайно, имеются 2 типа предприятий с раз­личной средней величиной производительности труда.

Наблюдаемое значение критерия попадает в кри­тическую область (рис. 8.6), следовательно, нуле­вая гипотеза отклоняется в пользу конкурирующей.

Ответ. На уровне значимости a = 0,05 можно ут­верждать, что полученное различие средних показателей производительности труда в группах не­ случайно, имеются 2 типа предприятий с различ­ной средней величиной производительности труда.


Пример 6. Предполагается, что применение но­вого типа резца сократит время обработки некото­рой детали. Хронометраж времени обработки 9 де­талей, обработанных старым типом резцов, дал следующие результаты: среднее время обработки детали X.— 57 мин, исправленная выборочная дисперсия s2x  = 186,2 (мин2). Среднее время обработки 15 дета­лей, обработанных новым типом резцов, - Ỹ по данным хронометражных измерений — 52 мин, а ис­правленная выборочная дисперсия s2y = 166,4 (мин2). На уровне значимости α = 0,01 ответьте на вопрос, позволило ли использование нового типа резцов со­кратить время обработки детали?

Решение. Для решения данной задачи необходи­мо сравнить 2 средние нормально распределенных генеральных совокупностей, генеральные дисперсии которых неизвестны, но предполагаются одинаковыми (малые независимые выборки). В этой задаче речь идет о малых выборках, так как пx = 9 и ny = 15 меньше 30. Выборки — независимые, поскольку из контекста задачи видно, что они извле­чены из непересекающихся генеральных совокупностей.

Сформулируем нулевую и конкурирующую ги­потезы, согласно условию задачи.

Н0: `X = `Y генеральные средние 2 нормально распределенных совокупностей с неизвестными дис­персиями (но предполагаемыми одинаковыми) рав­ны (применительно к условию данной задачи — среднее время, затрачиваемое на обработку детали резцами нового и старого типа, — одинаково, т. е. использование нового типа резца не позволяет сни­зить время на обработку детали).

Н1:  `X > `Y — генеральная средняя для Х боль­ше, чем генеральная средняя для Y (применитель­но к условию данной задачи — среднее время, зат­рачиваемое на обработку детали резцами старого типа, больше, чем — нового, т. е. использование но­вого типа резца позволяет снизить время на обра­ботку детали).

Так как конкурирующая гипотеза — правосторон­няя, то и критическая область — правосторонняя.

Приступать к проверке гипотезы о равенстве ге­неральных средних 2 нормально распределенных совокупностей с неизвестными дисперсиями мож­но лишь в том случае, если генеральные дисперсии равны. В противном случае, данная задача в тео­рии неразрешима.

Поэтому, прежде чем проверять эту гипотезу, проверим гипотезу о равенстве генеральных диспер­сий нормальных совокупностей.

Сформулируем нулевую и конкурирующую ги­потезы, согласно условию задачи.

Н0: D(X) = D(Y) — генеральные дисперсии 2 нор­мально распределенных совокупностей равны.

Н1: D(X) > D(Y) — генеральная дисперсия для Х больше генеральной дисперсии для Y. Выдвигаем правостороннюю конкурирующую гипотезу, так как исправленная выборочная дисперсия для Х значительно больше, чем исправленная выборочная дис­персия для Y.

Так как конкурирующая гипотеза — правосторон­няя, то и критическая область — правосторонняя.

В качестве критерия для сравнения 2 дисперсий нормальных генеральных совокупностей используется случайная величина F критерий Фишера-Снедекора (приложение 6).

Его наблюдаемое значение (fнабл) рассчитывается по формуле


где s2б — большая (по величине) исправленная вы­борочная дисперсия; s2м меньшая (по величине) исправленная выборочная дисперсия.

Найдем fнабл


Критическое значение (fкр)следует находить с помощью таблицы распределения Фишера-Снедекора (приложение 6) по уровню значимости a и числу степеней свободы k1 и k2.

По условию a = 0,01; число степеней свободы найдем по формуле

k1= n1 - 1; k2 = n2 - 1,

где k1 число степеней свободы большей (по вели­чине) исправленной дисперсии; k2 число степе­ней свободы меньшей (по величине) исправленной дисперсии; п1 объем выборки большей (по величине) исправленной дисперсии; n2 объем выбор­ки меньшей (по величине) исправленной дисперсии. Найдем k1 и k2

k1 = 10 - 1 = 9;

k2=15 - 1 = 14.

Определяем fкр по уровню значимости a = 0,01 и числу степеней свободы k1 =9 и k2=14 :


fнабл< fкр следовательно, на данном уровне зна­чимости нет оснований отвергнуть нулевую гипоте­зу о равенстве генеральных дисперсий нормальных совокупностей.

Следовательно, можно приступить к проверке гипотезы о равенстве генеральных средних двух нормально распределенных совокупностей.

В качестве критерия для проверки этой гипоте­зы используется случайная величина t-критерий Стьюдента.

Его наблюдаемое значение (tнабл ) рассчитывается по формуле


где X.— выборочная средняя для X;Ỹ— выбороч­ная средняя для Y; s2x — «неправленная» выбороч­ная дисперсия для X; s2y «неправленная» выбо­рочная дисперсия для Y; пx — объем выборки, из­влеченной из генеральной совокупности X; пy — объем выборки, извлеченной из генеральной сово­купностиY. Найдем tнабл,


Критическое значение (tкр ) следует находить по таблице распределения Стьюдента (приложение 5) по уровню значимости a и числу степеней свободы k.

По условию a = 0,01; число степеней свободы найдем по формуле

k = пx + ny - 2,

где k — число степеней свободы; пx объем выбор­ки для X; пy объем выборки для Y.

k = 9 + 15 - 2 = 22.

Найдем t кр по уровню значимости a = 0,01 (для односторонней критической области) и числу степеней свободы k = 22


Заметим, что при левосторонней конкурирующей гипотезе `X < `Y tкр следует находить по таблицам распределения Стьюдента (приложение 5) по уров­ню значимости α  (для односторонней критической области) и числу степеней свободы k = пx + пy — 2 и присваивать ему знак «минус».             

При двусторонней конкурирующей гипотезе `X ¹`Y tкр находим по таблицам распределения Стьюдента приложение 5) по уровню значимости α (для двусторонней критической области) и числу степеней свободы k= пx+ пy - 2.

tнабл < tкр , следовательно, на этом уровне значимости нет оснований отвергнуть нулевую гипотезу. По имеющимся хронометрическим данным на уров­не значимости a = 0,01 нельзя отклонить гипотезу о том, что генеральные средние равны, т. е. среднее время, затрачиваемое на обработку детали старым и новым типом резцов, отличается незначимо, рас­хождения между средними — случайны, использо­вание нового типа резцов не позволяет снизить вре­мя обработки детали.

Наблюдаемое значение критерия попадает в об­ласть допустимых значений (рис. 8.7), следователь­но, нулевую гипотезу нельзя отклонить.


Ответ. На уровне значимости a = 0,01 нельзя утверждать, что использование нового типа резцов позволило сократить время обработки детали.

Пример 7. Партия изделий принимается в том случае, если вероятность того, что изделие окажет­ся соответствующим стандарту, составляет не ме­нее 0,97. Среди случайно отобранных 200 изделий проверяемой партии оказалось 193 соответствующих стандарту. Можно ли на уровне значимости          a = 0,02 принять партию?

Решение. Для решения данной задачи необходи­мо проверить гипотезу о том, что неизвестная гене­ральная доля точно равна определенному числу.

Сформулируем нулевую и конкурирующую ги­потезы согласно условию задачи.

Н1: р =р0 = 0,97 — неизвестная генеральная доля р равна р0 (применительно к условию этой задачи — вероятность того, что деталь из проверяемой партии окажется соответствующей стандарту, равна 0,97, т. е. партию изделий можно принять).

Н1: р < 0,97 — неизвестная вероятность р мень­ше гипотетической вероятности p0 (применительно к условию данной задачи — вероятность того, что деталь из проверяемой партии окажется соответствующей стандарту, меньше 0,97, т. е. партию из­делий нельзя принять).

Так как конкурирующая гипотеза — левосторон­няя, то и критическая область — левосторонняя.

В качестве критерия для сравнения наблюдае­мой относительной частоты с гипотетической вероятностью появления события используется случай­ная величина U.

Его наблюдаемое значение (uнабл) рассчитывается по формуле


где т/п — относительная частота (частость) появ­ления события;p0 гипотетическая вероятность появления события; q0 гипотетическая вероят­ность непоявления события; п — объем выборки.

По условию т = 193; п = 200; р0 = 0,97; q0 = 1 - р0= 0,03; a = 0,02.

Найдем наблюдаемое значение (uнабл )


Так как конкурирующая гипотеза — левосторон­няя, то критическое значение кр ) следует находить по таблице функции Лапласа (приложение 2) из равенства

Ф0кр)= (1 - 2а)/2.

По условию a= 0,02.

Отсюда

Ф0(икр)=(1-2·0,02)/2=0,48.

По таблице функции Лапласа (приложение 2) найдем, при каком икрФ0(икр ) = 0,48.

Ф0(2,05)= 0,48.

Учитывая, что конкурирующая гипотеза — ле­восторонняя, критическому значению необходимо присвоить знак «минус».

Следовательно, -икр= -2,05.

Заметим, что при правосторонней конкурирую­щей гипотезе Н1: р > 0,97 икр следует находить по таблице функции Лапласа (приложение 2) из ра­венства Ф0кр ) == (1 - 2a)/2.

При двусторонней конкурирующей гипотезе Н1: р ¹ 0,97 икр находим по таблице функции Лапласа (приложение 2) из равенства Ф0(икр) = (1 - a)/2.

инаблкр , следовательно, на данном уровне зна­чимости нет оснований отклонить нулевую гипо­тезу. По имеющимся данным на уровне значимос­ти a = 0,02 нельзя отклонить гипотезу о том, что вероятность того, что изделие окажется соответ­ствующим стандарту, составляет 0,97. Следователь­но, партию изделий принять можно.

Наблюдаемое значение критерия попадает в об­ласть допустимых значений (рис. 8.8), следователь­но, нет оснований отклонить нулевую гипотезу.


Ответ. На уровне значимости a = 0,02 партию изделий принять можно.

Пример 8. Два завода изготавливают однотип­ные детали. Для оценки их качества сделаны вы­борки из продукции этих заводов и получены сле­дующие результаты (табл. 8.4):

Таблица 8.4

Выборки

 

Завод №1

 

Завод №2

 

Объем выборки

 

n1

 

n2

 

Число бракованных деталей

 

m1

 

m2

 

 

На уровне значимости a = 0,025 определите, име­ется ли существенное различие в качестве изготавливаемых этими заводами деталей?

Решение. Для решения данной задачи необходи­мо сравнить 2 вероятности биномиальных распределений.

Сформулируем нулевую и конкурирующую ги­потезы согласно условию задачи.

Н0: р1= р2 вероятности появления события в 2 генеральных совокупностях, имеющих биномиальное распределение, равны (применительно к ус­ловию данной задачи — вероятность того, что де­таль, изготовленная на заводе №1, окажется брако­ванной, равна вероятности того, что деталь, изготовленная на заводе №2, окажется бракованной).

Н1: р1 ¹ р2 вероятности появления события в 2 генеральных совокупностях, имеющих биномиальное распределение, не равны (применительно к усло­вию этой задачи — вероятность того, что деталь, из­готовленная на заводе №1, окажется бракованной, не равна вероятности того, что деталь, изготовлен­ная на заводе №2, окажется бракованной; заводы изготавливают детали разного качества). Так как по условию задачи не требуется проверить, на каком заводе качество изготавливаемых деталей выше, выд­вигаем двустороннюю конкурирующую гипотезу.

Поскольку конкурирующая гипотеза — двусто­ронняя, то и критическая область — двусторонняя.

В качестве критерия для сравнения 2 вероятно­стей биномиальных распределений используется случайная величина U.

Его наблюдаемое значение uнабл рассчитывается по формуле


где т1/n1- — относительная частота (частость) появ­ления события в 1-й выборке; т2/п2 относитель­ная частота (частость) появления события во 2-й выборке;    -средняя частость появления события


` средняя частость непоявления события


=1-`

п1 объем 1-й выборки; п2 объем 2-й выборки.

По условию т1=20; n1=200; m2=15; n2=300; a= 0,025.

Найдем среднюю частость появления события


Найдем среднюю частость непоявления события

` = 1 - ` = 1 — 0,07 = 0,93.

Найдем инабл


Так как конкурирующая гипотеза — двусторон­няя, критическое значение кр)следует находить по таблице функции Лапласа (приложение 2) из равенства

Ф0(икр)= (1 - a)/2.

По условию α = 0,025. Отсюда

Ф0(икр) = (1 - 0,025)/2 = 0,4875.

По таблице функции Лапласа (приложение 2) найдем, при каком икрФ0кр ) = 0,4875.

Ф0(2,24) = 0,4875.

Учитывая, что конкурирующая гипотеза — дву­сторонняя, находим две критические точки

uкр.п.=2,24; кр.л.= -2,24.

Заметим, что при правосторонней конкурирую­щей гипотезе Н1: р1 > р2икр следует находить по таблице функции Лапласа (приложение 2) из ра­венства Ф0кр ) = (1 - 2a)/2.

При левосторонней конкурирующей гипотезе Н1. p 1 < p2 uкр следует находить по таблице функции Лапласа (приложение 2) из равенства Ф0кр) = (1 - 2a)/2 и присваивать ему знак «минус».

кр < инабл < икр , следовательно, на данном уров­не значимости нет оснований отвергнуть нулевую гипотезу. По имеющимся данным на уровне значи­мости a = 0,025 нет оснований отклонить нулевую гипотезу. Следовательно, заводы изготавливают де­тали одинакового качества.

Наблюдаемое значение критерия попадает в область допустимых значений (рис. 8.9), следовательно, нет оснований отклонить нулевую гипотезу.


Ответ. Нет оснований отклонить нулевую гипо­тезу, т. е. имеющееся различие в качестве изготав­ливаемых этими заводами деталей — случайно, незначимо.

 

Задачи к теме 8

1. Компания, производящая средства для потери веса, утверждает, что прием таблеток в сочетании со специальной диетой позволяет сбросить в сред­нем в неделю 400 г веса. Случайным образом отобраны 25 человек, использующих эту терапию, и обнаружено, что в среднем еженедельная потеря в весе составила 430 г со средним квадратическим отклонением 110 г. Проверьте гипотезу о том, что средняя потеря в весе составляет 400 г. Уровень значимости a = 0,05.

2. Поступление страховых взносов в 130 филиа­лов страховых организаций в регионе А составило 26·104 у. е., в регионе В на 100 филиалов пришлось 18·104 у. е. Дисперсия величины страховых взно­сов в регионе А равна 39·108 (у. е.)2, в регионе В — 25·108 (у. е.)2. На уровне значимости a= 0,05 опре­делите, существенно ли различается средняя ве­личина поступления страховых взносов в регионах А и В из расчета на 1 филиал.

3. Компания утверждает, что новый вид зубной пасты для детей лучше предохраняет зубы от кариеса, чем зубные пасты, производимые другими фир­мами. Для проверки эффекта в случайном порядке была отобрана группа из 400 детей, которые пользо­вались новым видом зубной пасты. Другая группа из 300 детей, также случайно выбранных, в это же время пользовалась другими видами зубной пасты. После окончания эксперимента было выяснено, что у 30 детей, использующих новую пасту, и 25 детей из контрольной группы появились новые признаки кариеса. Имеются ли у компании достаточные ос­нования для утверждения о том, что новый сорт зубной пасты эффективнее предотвращает кариес, чем другие виды зубной пасты? Принять уровень значимости a = 0,05.

4. В 1995 г. число договоров добровольного стра­хования, заключенных государственными страховыми организациями, составило в Ростовской об­ласти 1 858·103 на сумму 7 461·106 руб. Негосудар­ственные страховые организации заключили 1 250·104 договоров добровольного страхования на сумму 34 884·106 руб. Предположительно диспер­сия страховой суммы договоров, заключенных государственными страховыми организациями, равна 1016 руб.2, а договоров, заключенных негосударствен­ными страховыми организациями, — 8·1017 руб.2. Имеются ли существенные различия в средних раз­мерах страховых сумм договоров добровольного страхования, заключаемых государственными и не­государственными страховыми организациями? Уровень значимости a принять равным 0,01.

5. Крупный коммерческий банк заказал марке­тинговое исследование по выявлению эффекта «премирования» (калькулятор, набор ручек и др.) как стимула для открытия счета в банке. Для проверки случайным образом было отобрано 200 «премиро­ванных» посетителей и 200 «непремированных». В результате выяснилось, что 89% посетителей, ко­торым предлагалась премия, и 79% посетителей, которым не предлагалась премия, открыли счет в банке в течение 6 мес. Используя эти данные, про­верьте гипотезу о том, что доля «премированных» посетителей, открывших счет в банке, статистичес­ки существенно отличается от удельного веса «не­премированных» посетителей, открывших счет в банке. Принять уровень значимости a = 0,05.

6. Инженер по контролю качества проверяет сред­нее время горения нового вида электроламп. Для проверки в порядке случайной выборки было ото­брано 100 ламп, среднее время горения которых со­ставило 1 075 ч. Предположим, что среднее квадратическое отклонение времени горения для генераль­ной совокупности известно и составляет 100 ч. Ис­пользуя уровень значимости a= 0,05, проверьте ги­потезу о том, что среднее время горения ламп — более 1 000 ч.

Предположим, что инженер по контролю каче­ства не имеет информации о генеральной диспер­сии и использует выборочное среднее квадратическое отклонение. Изменится ли ответ задачи?

7. Компания, выпускающая в продажу новый сорт растворимого кофе, провела проверку вкусов поку­пателей по случайной выборке из 400 человек и вы­яснила, что 220 из них предпочли новый сорт всем остальным. Проверьте на уровне значимости a = 0,01 гипотезу о том, что, по крайней мере, 52% потреби­телей предпочтут новый сорт кофе.

8. Страховая компания изучает вероятность до­рожных происшествий для подростков, имеющих мотоциклы. За прошедший год проведена случай­ная выборка 2 000 страховых полисов подростков-мотоциклистов и выявлено, что 15 из них попада­ли в дорожные происшествия и предъявили компа­нии требование о компенсации за ущерб. Может ли аналитик компании отклонить гипотезу о том, что менее 1% всех подростков-мотоциклистов, имею­щих страховые полисы, попадали в дорожные происшествия в прошлом году? Принять уровень зна­чимости a = 0,05.

 

9. Новое лекарство, изобретенное для лечения атеросклероза, должно пройти экспериментальную проверку для выяснения возможных побочных эф­фектов. В ходе эксперимента лекарство принимали 4 тыс. мужчин и 5 тыс. женщин. Результаты выя­вили, что 60 мужчин и 100 женщин испытывали побочные эффекты при приеме нового медикамен­та. Можем ли мы на основании эксперимента ут­верждать, что побочные эффекты нового лекарства у женщин проявляются в большей степени, чем у мужчин? Принять уровень значимости a = 0,05.

10. В 1995 г. в Ростовской области обследовано 12 промышленных предприятий и 14 строительных (подрядных) организаций. Средняя балансовая при­быль промышленных предприятий оказалась равной 25·107pyб., а строительных организаций - 12·108 руб. Исправленная выборочная дисперсия прибыли про­мышленных предприятий составила 64·1016 руб.2, строительных организаций — 16·1016 руб.2. На уров­не значимости a = 0,01 определите, являются ли различия в результатах финансовой деятельности промышленных предприятий и строительных орга­низаций случайными.

11. На 1 января 1996 г. численность беженцев в Ростовской области составляла 32 412 чел. при об­щей численности наличного населения 4 425 400 чел. В Краснодарском крае на 5 043 900 чел. на­личного населения приходилось 30 423 беженца. На уровне значимости α = 0,05 ответьте на вопрос: «Объясняется ли более высокий удельный вес бе­женцев в общей численности населения в Ростовской области в сравнении с Краснодарским краем случайными факторами или имеет смысл поиск факторов, обусловивших это явление?».

12. Компания по производству безалкогольных напитков предполагает выпустить на рынок новую модификацию популярного напитка, в котором са­хар заменен сукразитом. Компания хотела бы быть уверенной в том, что не менее 70% ее потребителей предпочтут новую модификацию напитка. Новый напиток был предложен на пробу 2 тыс. чел., и 1 422 из них сказали, что он вкуснее старого. Может ли компания отклонить предположение о том, что толь­ко 70% всех ее потребителей предпочтут новую модификацию напитка старой? Принять уровень зна­чимости a = 0,05.

13. Производители нового типа аспирина утвер­ждают, что он снимает головную боль за 30 мин. Случайная выборка 100 чел., страдающих голов­ными болями, показала, что новый тип аспирина снимает головную боль за 28,6 мин при среднем квадратическом отклонении 4,2 мин. Проверьте на уровне значимости a= 0,05 справедливость утверж­дения производителей аспирина о том, что это лекарство излечивает головную боль за 30 мин.

14. Доля убыточных предприятий в промышлен­ности в целом по России в 1995 г. составила 26%, а в Ростовской области — 27%. В 1995 г. в Ростов­ской области насчитывалось 7 579 промышленных предприятий. На уровне значимости a = 0,05 опре­делите, являются ли различия в удельном весе убы­точных промышленных предприятий в России и в Ростовской области случайными или в Ростовской области действует комплекс экономических усло­вий, обусловливающих повышенную долю вила 2,3% от общего числа промышленных пред­приятий. Среди 2 236 машиностроительных и ­ нерентабельных предприятий?

 

15. В 1995 г. доля предприятий государственной формы собственности в Ростовской области метаталлообрабатывающих предприятий она оказалась равной 2,1%. На уровне значимости α = 0,01 опре­делите, существенно ли меньше удельный вес госу­дарственных предприятий в машиностроении и ме­таллообработке, чем в целом в промышленности области?

16. В 1996 г. годовой оборот 4 бирж в регионе А составил 12·104 у. е.; в регионе В годовой оборот 5 бирж — 125·103 у. е. Исправленная выборочная дисперсия оборота в регионе А оказалась равной 3·104(у.е.)2, в регионе В — 2·104 (у.е.)2. Можно ли на уровне значимости a = 0,05 утверждать, что средний оборот бирж в регионе А больше, чем в регионе B?

17. Компания, занимающаяся консультировани­ем в области инвестиций, заявляет, что среднего­довой процент по акциям определенной отрасли промышленности составляет 11,5%. Инвестор, желая проверить истинность этого утверждения, на основе случайной выборки 50 акций выявил, что среднегодовой процент по ним составил 10,8% с исправленным средним квадратическим отклоне­нием s = 3,4%. На основе имеющейся информации определите, имеет ли инвестор достаточно основа­ний, чтобы опровергнуть заявление компании? При­нять уровень значимости a = 0,05.

18. Производитель некоторого вида продукции утверждает, что 95% выпускаемой продукции не имеют дефектов. Случайная выборка 100 изделий показала, что только 92 из них свободны от дефек­тов. Проверьте справедливость утверждения произ­водителя продукции на уровне значимости a = 0,05.

19. Главный бухгалтер большой корпорации про­вел обследование по данным прошедшего года с целью выяснения доли некорректных счетов. Из 2000 выбранных счетов в 25 оказались некоррект­ные проводки. Для уменьшения доли ошибок он внедрил новую систему. Год спустя он решил про­верить, как работает новая система, и выбрал для проверки в порядке случайного отбора 3 000 счетов компании. Среди них оказалось 30 некорректных. Можем ли мы утверждать, что новая система позволила уменьшить долю некорректных проводок в счетах? Принять уровень значимости a = 0,05.

20. Владелец фирмы считает, что добиться более высоких финансовых результатов ему помешала неравномерность поставок комплектующих по месяцам года, несмотря на то, что поставщик в пол­ном объеме выполнил свои обязательства за год. Поставщик утверждает, что поставки были не так уж неравномерны. Распределение поставок по ме­сяцам года имеет следующий вид:

Месяц

1

2

3

4

5

6

7

8

9

10

11

12

Объем поставок, ед.

19

23

26

18

20

20

20

20

32

27

35

40

 

На уровне значимости a = 0,05 определите, кто прав: владелец фирмы или поставщик? Изменится ли ответ на поставленный вопрос, если уровень значимости принять равным 0,01? Объясните результаты.

 

9. СТАТИСТИЧЕСКОЕ ИЗУЧЕНИЕ СВЯЗЕЙ МЕЖДУ ЯВЛЕНИЯМИ И ИХ ИСПОЛЬЗОВАНИЕ ДЛЯ УПРАВЛЕНИЯ СОЦИАЛЬНО-ЭКОНОМИЧЕСКИМИ ПРОЦЕССАМИ

9.1. Виды и формы связей, различаемые в статистике

Современная наука об обществе объясняет суть явлений через изучение взаимосвязей явлений. Объем продукции предприятия связан с численностью работников, стоимостью основных фондов и т. д.

Различают два типа взаимосвязей между различ­ными явлениями и их признаками: функциональ­ную или жестко детерминированную и статистичес­кую или стохастически детерминированную.

Функциональная связь — это вид причинной зависимости, при которой определенному значению факторного признака соответствует одно или несколько точно заданных значений результатив­ного признака. Например, при у = Öx— связь между у и х является строго функциональной, но значению х = 4 соответствует не одно, а два значе­ния y1 = +2; y2= -2.

Стохастическая связь — это вид причинной за­висимости, проявляющейся не в каждом отдельном случае, а в общем, в среднем, при большом числе наблюдений. Например, изучается зависи­мость роста детей от роста родителей. В семьях, где родители более высокого роста, дети в среднем ниже, чем родители. И, наоборот, в семьях, где родители ниже ростом, дети в среднем выше, чем родители. Еще один пример: потребление продуктов питания пенсионеров зависит от душевого дохода: чем выше доход, тем больше потребление. Однако такого рода зависимости проявляются лишь при большом чис­ле наблюдений.

Корреляционная связь — это зависимость сред­него значения результативного признака от изме­нения факторного признака; в то время как каж­дому отдельному значению факторного признака Х может соответствовать множество различных зна­чений результативного (Y).

Задачами корреляционного анализа являются:

1) изучение степени тесноты связи 2 и более яв­лений;

2) отбор факторов, оказывающих наиболее суще­ственное влияние на результативный признак;

3) выявление неизвестных причинных связей. Исследование корреляционных зависимостей включает ряд этапов:

1) предварительный анализ свойств совокупности;

2) установление факта наличия связи, определе­ние ее направления и формы;

3) измерение степени тесноты связи между при­знаками;

4) построение регрессионной модели, т. е. нахож­дение аналитического выражения связи;

5) оценку адекватности модели, ее экономическую интерпретацию и практическое использование.

Корреляционная связь между признаками может возникать различными путями. Важнейший путь-причинная зависимость результативного признака (его вариации) от вариации факторного признака. Например, Х — балл оценки плодородия почв, Y — урожайность сельскохозяйственной культуры. Здесь ясно, какой признак выступает как независимая переменная (фактор), а какой как зависимая пере­менная (результат).

Очень важно понимать суть изучаемой связи, по­скольку корреляционная связь может возникнуть между двумя следствиями общей причины. Здесь можно привести множество примеров. Так, классическим является пример, приведенный известным статистиком начала XX в. А.А.Чупровым. Если в качестве признака Х взять число пожарных команд в городе, а за признак Y — сумму убытков в городе от пожаров, то между признаками Х и Y в городах обнаружится значительная прямая корреляция. В среднем, чем больше пожарников в городе, тем боль­ше убытков от пожаров. В чем же дело? Данную корреляцию нельзя интерпретировать как связь причины и следствия, оба признака - следствия общей причины - размера города. В крупных горо­дах больше пожарных частей, но больше и пожа­ров, и убытков от них за год, чем в мелких.

Современный пример. Сразу после 17 августа 1998 г. резко возросли цена валюты и объем покуп­ки валюты частными лицами. Здесь также нельзя рассматривать эти два явления как причину и след­ствие. Общая причина - обострение финансового кризиса, приведшее к росту курсовой стоимости валюты и стремлению населения сохранить свои накопления в твердой валюте. Такого рода корре­ляцию называют ложной корреляцией.

Корреляция возникает и в случае, когда каждый из признаков и причина, и следствие. Например, при сдельной оплате труда существует корреляция между производительностью труда и заработком. С одной стороны, чем выше производительность тру­да, тем выше заработок. С другой — высокий заработок сам по себе является стимулирующим факто­ром, заставляющим работника трудиться более ин­тенсивно.

По направлению выделяют связь прямую и об­ратную, по аналитическому выражению — прямолинейную и нелинейную.

В начальной стадии анализа статистических дан­ных не всегда требуются количественные оценки, достаточно лишь определить направление и харак­тер связи, выявить форму воздействия одних фак­торов на другие. Для этих целей применяются ме­тоды приведения параллельных данных, аналити­ческих группировок и графический.

Метод приведения параллельных данных осно­ван на сопоставлении 2 или нескольких рядов ста­тистических величин. Такое сопоставление позво­ляет установить наличие связи и получить пред­ставление о ее характере. Сравним изменения двух величин (табл. 9.1).

Таблица 9.1

Х

1

2

3

4

5

6

7

8

9

Y

5

9

6

10

12

17

15

20

23

 

С увеличением Х возрастает и Y, поэтому связь между ними можно описать уравнением прямой.

Метод аналитических группировок характеризует влияние качественного признака на относительные средние величины, на показатели вариации коли­чественных признаков. В качестве группировочного признака выбирается факторный. В таблице раз­мещают средние значения одного или нескольких результативных признаков. Изменения факторно­го признака при переходе от одной группы к дру­гой вызывают соответствующие изменения резуль­тативного признака (табл. 9.2).

Оборачиваемость в днях - факторный признак, обозначаемый обычно X, а прибыль - результатив­ный - Y. Табл. 9.2 ясно демонстрирует присутствие связи между признаками, это - отрицательная связь. Судить о том, линейная она или нет, по этим данным сложно.

Таблица 9.2

Характеристика зависимости прибыли малых предприятий от оборачиваемости оборотных средств на 1998 г.

Продолжительность оборота средств, дн.(Х)

Число малых предприятий

Средняя прибыль, млн. руб. (Y)

40-50

6

14,57

51-70

8

12,95

71-101

6

7,40

Итого

20

11,77

 

Графический метод используется для наглядно­го изображения формы связи между изучаемыми признаками. Для этого в прямоугольных осях ко­ординат строят график, по оси ординат которого откладывают индивидуальные значения результа­тивного признака, а по оси абсцисс - индивидуаль­ные значения факторного признака. Совокупность точек результативного и факторного признаков называется полем корреляции (рис. 9.1).



Оценка тесноты связи между признаками пред­полагает определение меры соответствия вариации результативного признака от одного (при изучении парных зависимостей) или нескольких (множественных) факторов.

Большинство методов измерения тесноты связи заключается в сопоставлении отклонений абсолютных значений величин от их средних. Они основа­ны на предположении, что при полной независимо­сти переменных отклонения значений факторного признака от средней (X )носят случайный ха­рактер и должны случайно сочетаться с различны­ми отклонениями значений результативного при­знака (Y - `Y). При наличии значительного переве­са совпадений или несовпадений знаков отклонений делается предположение о наличии связи между Х и Y. Одну из первых попыток установления тесноты связи между переменными сделал Г. Фехнер, пред­ложивший простейший показатель тесноты связи:


Показатель Фехнера изменяется в промежутке [-1; 1]. При значении, равном 1, он указывает на положительную функциональную связь, при зна­чении -1 — на отрицательную функциональную связь, при i = 0 связь отсутствует. Промежуточные значения i характеризуют степень близости связи к функциональной (табл. 9.3).

Таблица 9.3

Х

1

2

3

4

5

6

7

8

9

Y

5

9

6

10

12

17

15

20

23

Х-`Х

-4

-5

-2

-1

0

1

2

3

4

Y-`Y

-8

-4

-7

-3

-1

4

2

7

10

 

Например, для данных табл. 9.1.

Получим `Х = 5; `Y = 13; sx, = 3,2; sy = 5,85;

i = (9 - 1)/9 = 0,89.

Недостаток показателя Фехнера состоит в том, что разные по абсолютной величине отклонения имеют одинаковый вес. Более совершенный изме­ритель тесноты связи между признаками — ли­нейный коэффициент корреляции Пирсона (назван по имени английского статистика К. Пирсона) ха­рактеризует тесноту и направление связи между двумя коррелируемыми признаками в случае на­личия между ними линейной зависимости.

Смысл линейного коэффициента корреляции Пирсона более понятен, если его расчет производить с использованием коэффициента ковариации. Это — мера совместной вариации признаков. Ко­эффициент ковариации рассчитывается с помощью формулы


С помощью коэффициента ковариации можно определить наличие и направление связи. Однако его нельзя использовать для определения степени тесноты связи, так как он имеет смешанную раз­мерность (Х•Y). Коэффициент ковариации — не нормирован, следовательно, нельзя сравнивать ко­эффициенты ковариации разных пар переменных. Для преодоления этого недостатка можно выраже­ние (9.2) разделить на средние квадратические от­клонения по х и по у. Полученный показатель ин­тенсивности линейной связи называется коэффи­циентом корреляции:


Это — безразмерная величина, которая изменя­ется в интервале от -1 до +1, -1 £ r £ 1.

Путем ряда преобразований можно получить сле­дующие аналитические выражения для коэффициента корреляции:


Производя расчет по итоговым значениям исход­ных переменных, линейный коэффициент корреляции можно вычислить по формуле


Линейный коэффициент корреляции имеет боль­шое значение при исследовании социально-экономических явлений и процессов, распределения ко­торых близки к нормальным.

 

9.2. Оценка достоверности коэффициента корреляции

Коэффициент парной корреляции, исчисленный по выборочным данным, является случайной величиной. С уменьшением числа наблюдений надеж­ность коэффициента корреляции падает. С увеличением числа наблюдений (свыше 500) распределе­ние коэффициента корреляции r (не превышающее 0,9) стремится к нормальному.

Полученный из выборки коэффициент корреля­ции r является оценкой коэффициента корреляции ρ в генеральной совокупности.

Определим доверительный интервал для оценки истинного значения коэффициента корреляции в генеральной совокупности (ρ )


где σr . — среднеквадратическая ошибка выборочного коэффициента парной корреляции;


t распределение Стьюдента с числом степеней свободы k = п - 2 и уровнем значимости a.

Если коэффициент корреляции меньше 0,9 или выборка мала, среднеквадратическая ошибка выборочного коэффициента корреляции sr рассчиты­вается по формуле


Значимость коэффициента корреляции можно проверить с помощью статистики t, имеющей распределение Стьюдента с п - 2 степенями свободы.

Наблюдаемое значение t (tнабл) вычисляется как


Критическое значение (tкр) определяется по табли­це распределения Стьюдента (приложение 5) по уров­ню значимости a и числу степеней свободы k = п - 2.

По общему правилу проверки статистических гипотез:

— если tнабл £ tкр, нулевую гипотезу о том, что между Х и Y отсутствует корреляционная связь
0: r = 0), нельзя отклонить на заданном уровне значимости а;

— если  tнабл< tкр , нулевая гипотеза отклоняется в пользу альтернативной о том, что коэффициент корреляции значимо отличается от нуля 1: r¹0), т. е. о наличии линейной корреляционной зависимости между Х и Y.

Критерий tрасч подчиняется закону распределения Стьюдента с п - 2 степенями свободы.


При малом числе наблюдений в выборке и вы­соком коэффициенте корреляции (распределение r отличается от нормального) для проверки гипо­тезы о наличии корреляционной связи, а также при построения доверительного интервала приме­няется z-преобразование Фишера.

Для этого применяется статистика


Распределение z асимптотически приближается к нормальному. Вариация z выражается формулой


9.3. Эмпирическое и теоретическое корреляционные отношения

При выявлении статистической зависимости по данным аналитической группировки в качестве меры степени тесноты связи может быть использо­вано эмпирическое корреляционное отношение (hэмп)



где


межгрупповая дисперсия зависимой переменной Y;


общая дисперсия зависимой переменной Y;

`уj — средняя арифметическая j-й группы, где j= 1..., k;

`у — общая средняя арифметическая;

тj объем j-й группы;

п — объем выборки;

у — наблюдаемые значения Y.

Значения hэмп распределены на отрезке [0; 1]


 Чем ближе hэмп к 1, тем теснее связь между пере­менными Х и Y, тем больше колеблемость Y объясняется колеблемостью X.

Квадрат эмпирического корреляционного отно­шения (h2эмп ) называют коэффициентом детерми­нации. Он показывает, какая часть Y колеблемости объясняется колеблемостью X.


Степень тесноты связи между переменными в случае не только линейной, но и нелинейной регрессионной зависимости можно оценить с помощью теоретического корреляционного отношения (hтеор). Поэтому ηтеор   часто называют «индексом корреля­ции». Теоретическое корреляционное отношение рассчитывается по формуле


где SR сумма квадратов вследствие регрессии;

ST общая сумма квадратов.

Ниже (п. 9.11) приведены формулы расчета SR (9.29) и ST (9.27).

Легко увидеть, что в случае линейной регресси­онной зависимости r = hтеор . Если связь — нелинейная, h < hтеор . Это позволяет использовать hтеор   в качестве меры линейности связи между переменны­ми X и Y. Если линейный коэффициент корреляции Пирсона (r) мало отличается от теоретического кор­реляционного отношения (hтеор), т.е. r » hтеор , то за­висимость между переменными близка к линей­ной. В противном случае имеет, место нелинейная зависимость между X и Y.

Проверка значимости и эмпирического (hэмп), и теоретического (hтеор) корреляционного отношения осуществляется с помощью критерия Фишера — F. Его наблюдаемое значение рассчитывается по формуле


где n — число наблюдений (объем выборки); т — число групп (если проверяется значимость эмпири­ческого корреляционного отношения hэмп ) или чис­ло параметров в уравнении регрессии (если прове­ряется значимость теоретического корреляционно­го отношения hтеор).

Ясно, что в уравнении парной регрессии — 2 па­раметра: b0 и b1, т. е. т = 2.

Критическое значение F определяется по табли­цам распределения Фишера (приложение 6) по уро­ню значимости α и числу степеней свободы.


Наблюдаемое значение (Fнабл) необходимо срав­нить с критическим (Fкр). По общему правилу проверки статистических гипотез:

— если Fнабл £ Fкр , нулевую гипотезу (H1:h = 0) о том, что h незначим, нельзя отклонить;

— если Fнабл > Fкр нулевая гипотеза отклоняется в пользу альтернативной (H1:h ¹ 0) о том, что h значимо отличается от нуля.

9.4. Ранговая корреляция

Если п объектов какой-либо совокупности N про­нумерованы в соответствии с возрастанием или убыванием какого-либо признака X, то говорят, что объекты ранжированы по этому признаку. Ранг xi, указывает место, которое занимает i-й объект среди других n объектов, расположенных в соот­ветствии с признаком Х (i= 1,2,.... п). Например, при исследовании рынка мы можем задать вопрос с целью выяснения предпочтений потребителей при выборе товара (при покупке акций, мороженого, водки и т. п.) таким образом, чтобы они распреде­лили товар в порядке возрастания (или убывания) своих потребительских предпочтений. Если мы имеем 2 набора ранжированных данных, то мож­но попытаться установить степень линейной зави­симости между ними. Предположим, имеется 5 про­дуктов, расположенных по порядку предпочтений от 1 до 5 в соответствии с двумя характеристика­ми А и В (табл.9.4).

Таблица 9.4

Характеристики для ранжирования

Продукт

V

W

X

Y

Z

А

 

2

 

5

 

1

 

3

 

4

 

B

1

3

2

4

5

 

Для определения наличия взаимосвязи между ранговыми оценками используется коэффициент ранговой корреляции Спирмена. Его расчет осно­ван на различии между рангами:

D = Ранг А - Ранг В.

Коэффициент корреляции рангов Спирмена ρ рассчитывается по формуле


где п - число пар ранжированных наблюдений.

В нашем примере мы имеем 5 пар рангов, следо­вательно, п = 5.



т. е. между признаками есть достаточно сильная линейная связь. Этот коэффициент изменяется в промежутке от [-1; 1] и интерпретируется так же, как и коэффициент Пирсона. Разница лишь в том, что он применяется для ранжированных данных.

Значимость коэффициента Спирмена проверяет­ся на основе t критерия Стьюдента по формуле


Значение коэффициента считается существен­ным, если tнабл > tкрит (a ;k = п — 2).

 

9.5. Корреляция альтернативных признаков

Альтернативные признаки — это признаки, при­нимающие только два возможных значения. Ис­следование их корреляции основано на показате­лях, построенных на четырехклеточных таблицах, в которых сводятся значения признаков:

а

в

с

d

 

Например, требуется измерить связь между прививками от гриппа и пониженной заболеваемостью от гриппа в группе случайно отобранных студентов (табл. 9.5).

Таблица 9.5

 

Заболели

Не заболели

Итого

Привитые

30

20

50

Непривитые

15

5

20

Всего

45

25

70

 

Для измерения тесноты взаимосвязи признаков производится расчет коэффициента контингенции по формуле


Коэффициент контингенции принимает значение в промежутке [-1; 1]. Его интерпретация аналогич­на интерпретации коэффициента корреляции. Мы получили слабую отрицательную связь -0,14.

Другой метод измерения связи основан на расче­те коэффициента ассоциации


Минус перед коэффициентом говорит об обрат­ном направлении связи, т. е. чем больше прививок, тем меньше заболеваний.

9.6. Оценка уравнения парной регрессии

В начале этой главы было установлено, каким об­разом можно провести предварительный анализ наличия связи, определить ее направление и форму c помощью метода приведения параллельных данных, аналитических группировок, графического метода.

Изучение степени тесноты взаимосвязи между признаками было проведено с помощью корреляционного анализа (расчета различных мер связи).

Уточнение формы связи, нахождение ее анали­тического выражения производится путем построе­ния уравнения связи (уравнения регрессии).

Регрессия — это односторонняя статистичес­кая зависимость.

Уравнение регрессии позволяет определить, ка­ким в среднем будет значение результативного признака (Y) при том или ином значении факторного признака (X), если остальные факторы, влияющие на Y и не связанные с X, рассматривались неиз­менными (т. е. мы абстрагировались от них).

К задачам регрессионного анализа относятся:

1) установление формы зависимости;

2) определение функции регрессии;

3) оценка неизвестных значений зависимой пе­ременной.

По аналитическому выражению различают пря­молинейную и криволинейную связи.

Прямолинейная связь имеет место, когда с воз­растанием (или убыванием) значений Х значения Y увеличиваются (или уменьшаются) более или менее равномерно.

В этом случае уравнение связи записывается так:

`yх  = b0 + b1х.

Криволинейная форма связи может выражаться различными кривыми, из которых простейшими являются:

1) парабола второго порядка

`yх = b0 + b1х +b2х2;

 

2) гипербола

`yx =b0+b1 /x;

3) показательная

`yx = b0b1x;

либо в логарифмическом виде

ln`yx = lnb0 + xlnb1.

После определения формы связи, т. е. вида урав­нения регрессии, по эмпирическим данным определяют параметры искомого уравнения.

При этом отыскиваемые параметры должны быть такими, чтобы рассчитанные по уравнению теоретические значения результативного признака мак­симально приближались к эмпирическим данным.

Чаще всего определение параметров уравнения регрессии осуществляется с помощью метода наименьших квадратов, в котором предполагается, что сумма квадратов отклонений теоретических значе­ний от эмпирических должна быть минимальной,

В зависимости от формы связи в каждом конк­ретном случае определяется своя система уравне­ний, удовлетворяющая принципу минимизации.

 

9.7. Парная линейная зависимость

Предположение о парной линейной зависимости между Х и Y можно описать функцией

Y = b0 + b1Х + и,

где b0, b1 — истинные значения параметров урав­нения регрессии в генеральной совокупности; и — случайная составляющая.

Существует несколько причин возникновения случайной составляющей:

1) невключение объясняющих переменных в урав­нение регрессии;

2) агрегирование объясняющих переменных, включенных в уравнение регрессии;

3) неправильное описание структуры модели, т. е. неверный выбор объясняющих переменных;

4) неправильная функциональная спецификация модели. Например, для моделирования использо­вана линейная функция, в то время как зависи­мость между переменными — нелинейная;

5) ошибки наблюдения (ошибки данных).

По выборочным данным определяются оценки истинных (в случае правильной спецификации модели) параметров уравнения регрессии и случайной составляющей

`yx=b0+b1х+e

где b0,b1, е — оценки неизвестных b0 , b1, и. В случае парной линейной зависимости вида

`yx=b0+b1х

 условие минимума суммы квадратов отклонений теоретических значений от эмпирических (ST) имеет вид


Условие 1-го порядка для минимума




Отсюда получаем систему нормальных уравнений


где n — число рассматриваемых пар взаимозависи­мых величин;

Sx — сумма значений факторного признака;

Sy — сумма значений результативного признака. Вычислив по эмпирическим данным все записанные выше суммы и подставив их в систему уравне­ний, находим оценки параметров искомой прямой:

b0 и b1

В настоящее время необходимость в ручных рас­четах отпала, так как существует множество компьютерных программ, реализующих методы регрес­сионного анализа. Важно понимать смысл параметров и уметь их адекватно интерпретировать.

Из системы нормальных уравнений можно вы­вести формулы для расчета b0 и b1


 

b0=`y-b1·`x.             (9.23)

Здесь  b1 это коэффициент регрессии, характе­ризующий влияние, которое оказывает изменение X на Y. Он показывает, на сколько единиц изме­нится в среднем Y при изменении Х на 1 единицу. Если    b1 > 0, то наблюдаем положительную связь. Если b1 < 0, то связь — отрицательная.

Параметр b1 обладает размерностью отношения у к х.

Параметр b0 постоянная величина в уравне­нии регрессии (свободный член уравнения). Его интерпретация зависит от того, какой смысл име­ют изучаемые признаки.

 

9.8. Коэффициент эластичности

На основе уравнений регрессии часто рассчиты­вают коэффициенты эластичности результативного признака относительно факторного.

Коэффициент эластичности (Э) показывает, на сколько процентов в среднем изменится результативный признак Y при изменении факторного при­знака Х на 1%. Он рассчитывается по формуле


или для практических расчетов



где

 — 1-я производная уравнения регрессии у по х.

 

9.9. Пример расчета коэффициента уравнения регрессии

Рассмотрим методы регрессионного и корреля­ционного анализов. Предположим, что нас интере­сует выручка от продажи баночного пива в магази­нах города в течение дня. Мы провели исследова­ние в 20 случайно выбранных магазинах и получи­ли следующие данные (табл. 9.6):

Таблица 9.6

Номер магазина

Число посетителей

Выручка, у.е.

1

907

11,20

2

926

11,05

3

506

6,84

4

741

9,21

5

789

9,42

6

889

10,08

7

874

9,45

8

510

6,73

9

529

7,24

10

420

6,12

11

679

7,63

12

872

9,43

13

924

9,46

14

607

7,64

15

452

6,92

16

729

8,95

17

794

9,33

18

844

10,23

19

1010

11,77

20

621

7,41

Итого

14,623

176,11

 

Для прогноза объемов продаж применим про­стую модель парной регрессии, в которой используется только одна факторная переменная — Х (чис­ло посетителей магазина). Данные, приведенные в табл. 9.6, можно представить в виде точечной диаг­раммы (диаграммы рассеивания) (рис. 9.2).


Диаграмма (рис. 9.2) наглядно показывает на­личие линейной зависимости выручки от продажи пива от числа посетителей магазина. С увеличени­ем числа посетителей растет выручка от продажи. Рассчитаем параметры уравнения регрессии:

`yx =b0+b1x

Для облегчения расчетов воспользуемся табл. 9.7.

Таблица 9.7

Магазин

Число покупателей X

Выручка Y

X2

Y2

XY

1

907

11,20

822 649

 

125,4400

 

 

10 158,40

 

2

 

926

 

 

11,05

 

857 476

 

122,1025

 

 

10 232,30

 

3

 

506

 

 

6,84

 

256,036

 

46,7856

 

 

3461,04

 

4

 

741

 

 

9,21

 

549 081

 

84,8241

 

 

6 824,61

 

5

 

789

 

 

9,42

 

622 521

 

88,7364

 

 

7 432,38

 

6

 

889

 

 

10,08

 

 

790 321

 

 

101,6064

 

 

8961,12

 

7

874

 

9,45

 

763 876

 

89,3025

 

8 259,30

 

8

510

 

6,73

 

260 100

 

45,2929

 

3 432,30

 

9

529

 

7,24

 

279 841

 

52,4176

 

3 829,96

 

10

420

 

6,12

 

176 400

 

37,4544

 

2 570,40

 

11

679

 

7,63

 

461 041

 

58,2169

 

5 180,77

 

12

872

 

9,43

 

760 384

 

88,9249

 

8 222,96

 

13

924

 

9,46

 

853 776

 

89,4916

 

8 741,04

 

14

607

 

7,64

 

368 449

 

58,3696

 

4 637,48

 

15

452

 

6,92

 

204304

 

47,8864

 

3 127,84

 

16

729

 

8,95

 

531 441

 

80,1025

 

6 254,55

 

17

794

 

9,33

 

630 436

 

87,0489

 

7 408,02

 

18

844 ;

 

10,23

 

712 336

 

104,6529

 

8634,12

 

19

1010

 

11,77

 

1 020 100

 

138,5329

 

11 887,70

 

20

621

 

7,41

 

385 641

 

54,9081

 

4 601,61

 

Итого

 

14623

 

 

176,11

 

 

11 306 209

 

 

1 602,0971

 

 

134 127,90

 

 

Используя формулу (9.22), получим


или соответственно:


Для наших данных уравнение регрессии имеет вид

`yx =2,423 +0,0873x.

 

Коэффициент b1 характеризует наклон линии регрессии. b1 = 0,00873. Это означает, что при увеличении Х на единицу ожидаемое значение Y воз­растет на 0,00873. То есть регрессионная модель указывает на то, что каждый новый посетитель ма­газина в среднем увеличивает недельную выручку магазина на 0,00873 у. е. (или можно сказать, что ожидаемый прирост ежедневной выручки составит 8,73 у. е. при привлечении в магазин 100 дополни­тельных посетителей). Отсюда b1 может быть интерпретирован как прирост ежедневной выручки, который варьирует в зависимости от числа посетителей магазина.

Свободный член уравнения b0 = +2,423 у. е., это — эначение Y при X, равном нулю. Поскольку маловероятно число посетителей магазина, равное нулю, то можно интерпретировать b0 как меру влияния на величину ежедневной выручки других факторов, не включенных в уравнение регрессии.

Регрессионная модель может быть использована для прогноза объема ежедневной выручки. Например, мы хотим использовать модель для предсказа­ния средней ежедневной выручки магазина, кото­рый посетят 600 покупателей.

Для того чтобы определить прогнозируемое зна­чение, следует Х = 600 подставить в наше регрессионное уравнение:

 


Отсюда прогнозируемая дневная выручка для магазина с 600 посетителями в день равна 7,661 у. е.

Когда мы используем регрессионные модели для прогноза, важно помнить, что обсуждаются только значения независимых переменных, находящиеся в пределах от наименьшего до наибольшего значе­ний факторного признака, используемые при созда­нии модели. Отсюда, когда мы предсказываем Y по заданным значениям X, мы можем интерполиро­вать значения в пределах заданных рангов Х , но мы не можем экстраполировать вне рангов X. На­пример, когда используется число посетителей для прогноза дневной выручки магазина, то мы знаем из данных примера, что их число находится в преде­лах от 420 до 1010. Следовательно, предсказание недельной выручки может быть сделано только для магазинов с числом покупателей от 420 до 1010 чел. Коэффициент эластичности для модели


т. е. при увеличении среднего числа посетителей магазина на 1% еженедельная выручка в среднем вырастет на 0,7%.

 

9.10. Стандартная ошибка оценки уравнения регрессии

Хотя метод наименьших квадратов дает нам ли­нию регрессии, которая обеспечивает минимум вариа­ции, регрессионное уравнение не является идеальным в смысле предсказания, поскольку не все значения зависимого признака Y удовлетворяют уравнению ре­грессии. Нам необходима статистическая мера вари­ации фактических значений Y от предсказанных зна­чений Y. Эта мера в то же время является средней вариацией каждого значения относительно среднего значения Y. Мера вариации относительно линии регрессии называется стандартной ошибкой оценки.

Колеблемость фактических значений признака Y относительно линии регрессии показана на рис. 9.3.

Из диаграммы видно, что хотя теоретическая линия регрессии проходит относительно близко от фактических значений Y, часть этих точек лежит выше или ниже линии регрессии. При этом


Стандартная ошибка оценки определяется как


где   уi - фактические значения Y;

`yx предсказанные значения Y для заданного х.


Для вычисления более удобна следующая фор­мула:


Нам уже известны




Тогда


Итак, для нашего примера: Syx = 0,497. Эта стандартная ошибка характеризует меру вариа­ции фактических данных относительно линии ре­грессии. Интерпретация этой меры аналогична интерпретации среднего квадратического отклоне­ния. Если среднее квадратическое отклонение — это мера вариации относительно средней, то стан­дартная ошибка - это оценка меры вариации отно­сительно линии регрессии. Однако стандартная ошибка оценки может быть использована для вы­водов о значении `yx и выяснения, является ли статистически значимой взаимосвязь между дву­мя переменными.

 

9.11. Измерение вариации по уравнению регрессии

Для проверки того, насколько хорошо независи­мая переменная предсказывает зависимую переменную в нашей модели, необходим расчет ряда мер вариации. Первая из них — общая (полная) сумма квадратов отклонений результативного признака от средней — есть мера вариации значений Y относи­тельно их среднего `Y . В регрессионном анализе об­щая сумма квадратов может быть разложена на объясняемую вариацию или сумму квадратов от­клонений за счет регрессии и необъясняемую вариацию или остаточную сумму квадратов отклонений (рис. 9.4).


Сумма квадратов отклонений вследствие регрес­сии это — сумма квадратов разностей между `y


(средним значением Y) и `yx (значением Y, предска­занным по уравнению регрессии). Сумма квадратов отклонений, не объясняемая регрессией (остаточ­ная сумма квадратов), — это сумма квадратов раз­ностей y и `yx . Эти меры вариации могут быть пред­ставлены следующим образом (табл. 9.8):

Таблица 9.8

Общая сумма квадратов

(ST)

=

Сумма квадратов за счет регрессии

(SR)

+

Остаточная сумма квадратов

(SE)

 


Легко увидеть, что остаточная сумма квадратов S(y-`yx)2 — это выражение, стоящее под знаком корня в формуле (9.25) (стандартной ошибки оцен­ки). Тем не менее в процессе вычислений стандартной ошибки мы всегда вначале вычисляем сумму квадратов ошибки.

Остаточная сумма квадратов может быть пред­ставлена следующим образом:



Объясняемая сумма квадратов выразится так:


В самом деле

51,3605 = 46,9145 + 4,4460.

Из этого соотношения определяется коэффициент детерминации:


Отсюда коэффициент детерминации — доля ва­риации Y, которая объясняется независимыми переменными в регрессионной модели. Для нашего примера rг= 46,9145/51,3605 = 0,913.

Следовательно, 91,3% вариации еженедельной выручки магазинов могут быть объяснены числом покупателей, варьирующим от магазина к магази­ну. Только 8,7% вариации можно объяснить ины­ми факторами, не включенными в уравнение рег­рессии.

В случае парной регрессии коэффициент детер­минации равен квадратному корню из квадрата коэффициента линейной корреляции Пирсона


В простой линейной регрессии г имеет тот же знак, что и b1, Если b1 > 0, то r > 0; если b1 < 0, то r < 0, если b1 = 0, то r = 0.

В нашем примере r2 = 0,913 и b1 > 0, коэффици­ент корреляции r = 0,956. Близость коэффициента корреляции к 1 свидетельствует о тесной положи­тельной связи между выручкой магазина от прода­жи пива и числом посетителей.

Мы интерпретировали коэффициент корреляции в терминах регрессии, однако корреляция и регрессия — две различные техники. Корреляция ус­танавливает силу связи между признаками, а регрессия — форму этой связи. В ряде случаев для анализа достаточно найти меру связи между признаками, без использования одного из них в каче­стве факторного признака для другого.

 

9.12. Доверительные интервалы для оценки неизвестного генерального значения `yген(m) и индивидуального значения `yi

Поскольку в основном для построения регрессионных моделей используются данные выборок, то зачастую интерпретация взаимоотношений между переменными в генеральной совокупности базируется на выборочных результатах.

Как было сказано выше, регрессионное уравнение используется для прогноза значений Y по заданному значению X. В нашем примере показано, что при 600 посетителях магазина сумма выручки могла бы быть 7,661 у. е. Однако это значение — только точечная оценка истинного среднего значе­ния. Мы знаем, что для оценки истинного значе­ния генерального параметра возможна интерваль­ная оценка.

Доверительный интервал для оценки неизвест­ного генерального значения `yген(m) имеет вид


где


Здесь `yx предсказанное значение Y

(`yx==b0+b1yi);

Syx стандартная ошибка оценки;

п — объем выборки;

хi заданное значение X.

Легко видеть, что длина доверительного интер­вала зависит от нескольких факторов. Для заданного уровня значимости a увеличение вариации вокруг линии регрессии, измеряемой стандартной ошибкой оценки, увеличивает длину интервала. Увеличение объема выборки уменьшит длину интервала. Более того, ширина интервала также ва­рьирует с различными значениями X. Когда оценивается `yx по значениям X, близким к `x, то ин­тервал тем уже, чем меньше абсолютное отклонение хi от `x (рис. 9.5).


Когда оценка осуществляется по значениям X, удаленным от среднего `x, то длина интервала возрастает.

Рассчитаем 95%-й доверительный интервал для среднего значения выручки во всех магазинах с числом посетителей, равным 600. По данным на­шего примера уравнение регрессии имеет вид

`yx = 2,423 + 0,00873x:

и для `xi  = 600 получим `yi; =7,661, а также


По таблице Стьюдента (приложение 5)

t18 = 2,10.

Отсюда, используя формулы (9.31) и (9.32), рас­считаем границы искомого доверительного интер­вала для myx


Итак, 7,369 £ myx £7,953.

Следовательно, наша оценка состоит в том, что средняя дневная выручка находится между 7,369 и 7,953 у. е. для всех магазинов с 600 посетителями.

Для построения доверительного интервала для индивидуальных значений Yx, лежащих на линии регрессии, используется доверительный интервал регрессии вида


 

где hi  ,`yi, , Syx    ,п и хi определяются, как и в формулах (9.31) и (9.32).

   Определим 95% -и доверительный интервал для оценки дневных продаж отдельного магазина с 600 посетителями


В результате вычислений получим


Итак, 6,577£ `yi £ 8,745.

Следовательно, с 95%-й уверенностью можно ут­верждать, что ежедневная выручка отдельного магазина, который посетили 600 покупателей, нахо­дится в пределах от 6,577 до 8,745 у. е. Длина это­го интервала больше чем длина интервала, полу­ченного ранее для оценки среднего значения Y.

 

9.13. Доверительные интервалы для оценки истинных значений неизвестного параметра уравнения регрессии  b1 и коэффициента регрессии р в генеральной совокупности

Построим доверительный интервал для истинно­го значения генерального параметра  b1. Для этого проверим гипотезу о равенстве нулю  b1. Если гипо­теза будет отклонена, то подтверждается существование линейной зависимости Y от X. Сформулиру­ем нулевую и альтернативную гипотезы:

Н0: b1 = 0 (линейной зависимости нет);

Н1: b1¹ 0 (линейная зависимость есть).

Для проверки гипотезы Н0 используется t-кри­терий (случайная величина t, имеющая распреде­ление Стьюдента с п - 2 степенями свободы):


где     



Убедимся, что полученный выборочный резуль­тат является достаточным для заключения о том, что зависимость объема выручки от числа посетите­лей магазина статистически существенна на 5%-м уровне значимости.


Следовательно,


 Найдем наблюдаемое значение критерия t


  tкрит(a=0,05;k=18)= 2,1 (по таблице распределения Стьюдента, приложение 5).

Так как 13,77 > 2,10, то нулевая гипотеза Н0 отвергается в пользу альтернативной гипотезы Н1, и можно говорить о наличии существенной линей­ной зависимости ежедневной выручки от числа посетителей магазина.

Второй, эквивалентный первому, метод для про­верки наличия или отсутствия линейной зависимо­сти переменной Y от Х состоит в построении дове­рительного интервала для оценки b1 и определении того, принадлежит ли значение b1 этому интервалу. Доверительный интервал для оценки b1 получают  по формуле


Найдем для нашего примера 95% -й. доверитель­ный интервал для оценки b1:


Итак,     0,0074 £ b1 £ 0,01006,

т. е. с 95%-й уверенностью можно считать, что ис­тинное значение коэффициента регрессии b1 находится в промежутке между числами 0,0074 и 0,01006. Так как эти значения больше нуля, то можно сделать вывод, что существует статистичес­ки значимая линейная зависимость выручки от числа посетителей. Если бы интервал включал ну­левое значение, то мы не смогли бы сделать этого вывода.

Третий метод проверки существования линейной связи между двумя переменными состоит в проверке выборочного коэффициента корреляции r.

Для этого выдвигается нулевая гипотеза Н0: ρ=0 (нет корреляции).

Альтернативная гипотеза Н1: ρ ¹0 (корреляция существует).

Для проверки нулевой гипотезы Н0 используем t-критерий (случайную величину t, имеющую распределение Стьюдента с п — 2 степенями свобо­ды) (9.11).


Наблюдаемое значение t составит


Полученный результат практически совпадает со значением, полученным по формуле (9.35). Следо­вательно, мы вновь подтверждаем наличие линей­ной связи между двумя переменными Y и X.

 

Задачи к теме 9

1. Туристическая компания предлагает места в гостиницах приморского курорта. Менеджера компании интересует, насколько возрастает привлека­тельность гостиницы в зависимости от ее расстояния до пляжа. С этой целью по 14 гостиницам горо­да была выяснена среднегодовая наполняемость но­меров и расстояние в километрах от пляжа.

Расстояние, км

0,1

0,1

0,2

0,3

0,4

0,4

0,5

0,6

0,7

0,7

0,8

0,8

0,9

0,9

Наполняемость,.

%

92

95

96

90

89

86

90

83

85

80

78

76

72

75

 

Постройте график исходных данных и определи­те по нему характер зависимости. Рассчитайте выборочный коэффициент линейной корреляции Пир­сона, проверьте его значимость при a = 0,05. Пост­ройте уравнение регрессии и дайте интерпретацию полученных результатов.

2. Компанию по прокату автомобилей интересу­ет зависимость между пробегом автомобилей (X) и стоимостью ежемесячного технического обслужива­ния (Y). Для выяснения характера этой связи было отобрано 15 автомобилей.

Х

6

7

8

9

10

11

12

13

14

15

16

17

18

19

20

Y

13

16

15

20

19

21

26

24

30

32

30

35

34

40

39

 

Постройте график исходных данных и определи­те по нему характер зависимости. Рассчитайте выборочный коэффициент линейной корреляции Пир­сона, проверьте его значимость при a = 0,05. Пост­ройте уравнение регрессии и дайте интерпретацию полученных результатов.

 

3. Врач-исследователь выясняет зависимость пло­щади пораженной части легких у людей, заболевших эмфиземой легких, от числа лет курения. Ста­тистические данные, собранные им в некоторой об­ласти, имеют следующий вид:

Число лет курения

25

36

22

15

48

39

42

31

28

33

Площадь пораженной части легкого, %

55

60

50

30

75

70

70

55

30

35

 

Постройте график исходных данных и определи­те по нему характер зависимости. Рассчитайте выборочный коэффициент линейной корреляции Пир­сона, проверьте его значимость при a = 0,05. Пост­ройте уравнение регрессии и дайте интерпретацию полученных результатов. Если человек курил 30 лет, то сделайте прогноз о степени поражения легких у случайно выбранного пациента, больного эмфиземой.

4. Компания, занимающаяся продажей радиоап­паратуры, установила на видеомагнитофон определенной модели цену, дифференцированную по ре­гионам. Следующие данные показывают цены на видеомагнитофон в 8 различных регионах и соот­ветствующее им число продаж.

Число продаж, шт.

420

380

350

400

440

380

450

420

Цена, тыс. руб.

5,5

6,0

6,5

6,0

5,0

6,5

4,5

5,0

Постройте график исходных данных и определи­те вид зависимости. Рассчитайте коэффициент линейной корреляции Пирсона, оцените его значи­мость при a = 0,01. Постройте уравнение регрессии и объясните смысл полученных результатов.

5. Опрос случайно выбранных 10 студентов, про­живающих в общежитии университета, позволяет выявить зависимость между средним баллом по ре­зультатам предыдущей сессии и числом часов в неделю, затраченных студентом на самостоятельную подготовку.

Средний балл

4,6

4,3

3,8

3,8

4,2

4,3

3,8

4,0

3,1

3,9

Число часов

25

22

9

15

15

30

20

30

10

17

Постройте график исходных данных и определи­те по нему характер зависимости. Рассчитайте выборочный коэффициент линейной корреляции Пир­сона, проверьте его значимость при α = 0,05. Постройте уравнение регрессии и дайте интерпретацию полученных результатов. Если студент занимается самостоятельно по 12 ч в неделю, то каков прогноз его успеваемости?

6. Некоторая компания недавно провела  рекламную кампанию в магазинах с демонстрацией антисептических качеств своего нового моющего средства. Через 10 недель компания решила проанализировать эффективность этого вида рекламы, сопоставив еженедельные объемы продаж с расходами на рекламу (тыс. руб.).

Объем продаж, тыс. руб.

72

76

78

70

68

80

82

65

62

90

Расходы на рекламу, тыс. руб.

5

8

6

5

3

9

12

4

3

10

 

Постройте график исходных данных и определи­те по нему характер зависимости. Рассчитайте выборочный коэффициент линейной корреляции Пир­сона, проверьте его значимость при α = 0,05. Пост­ройте уравнение регрессии и дайте интерпретацию полученных результатов.

7. Предположим, что мы имеем случайную вы­борку из 10 домохозяйств для изучения связи меж­ду числом холодильников в домохозяйстве и чис­лом членов домохозяйства. Х — число членов домохозяйства; Y — число холодильников.

Х

6

2

4

3

4

4

6

3

2

2

Y

4

1

3

2

2

3

4

1

2

2

 

Постройте график исходных данных и определи­те по нему характер зависимости. Рассчитайте выборочный коэффициент линейной корреляции Пир­сона, проверьте его значимость при a = 0,01. Пост­ройте уравнение регрессии и дайте интерпретацию полученных результатов.

8. Имеются выборочные данные о стаже работы (X, лет) и выработке одного рабочего за смену (Y, шт.).

Х

1

3

4

5

6

7

Y

14

15

18

20

22

25

 

Постройте график исходных данных и определи­те по нему характер зависимости. Рассчитайте выборочный коэффициент линейной корреляции Пир­сона, проверьте его значимость при a = 0,05. Пост­ройте уравнение регрессии и дайте интерпретацию Полученных результатов.

9. Изучается зависимость себестоимости едини­цы изделия (Y, тыс. руб.) от величины выпуска продукции (X, тыс. шт.) по группам предприятий за отчетный период. Экономист обследовал 5 предпри­ятий и получил следующие данные:

Х

2

3

4

5

6

Y

1,9

1,7

1,8

1,6

1,4

 

Полагая, что между Y и Х имеет место линейная зависимость, определите выборочное уравнение линейной регрессии и объясните смысл полученных коэффициентов. Каковы значимость коэффициента корреляции, направление и теснота связи между показателями Y и X, если уровень значимости при­нять равным 0,05?

10. Имеются выборочные данные о глубине вспашки полей под озимые культуры (X, см) и их урожайности (Y, ц/га):

Х

10

15

20

25

30

Y

5

10

16

20

24

 

При a = 0,05 установить значимость статисти­ческой связи между признаками Х и Y. Если при­знаки коррелируют, постройте уравнение регрессии и объясните его смысл. Сделайте прогноз урожай­ности пшеницы при глубине вспашки 22 см.

11. Из студентов 4-го курса одного из факульте­тов университета отобраны случайным образом 10 студентов и подсчитаны средние оценки, получен­ные ими на 1-м (X) и 4-м (Y) курсе. Получены следующие данные:

Х

3,5

4,0

3,8

4,6

3,9

3,0

3,5

3,9

4,5

4,1

Y

4,2

3,9

3,8

4,5

4,2

3,4

3,8

3,9

4,6

3,0

 

Полагая,что между Y и Х имеет место линейная зависимость, определите выборочное уравнение линейной регрессии и объясните смысл полученных коэффициентов. Каковы значимость коэффициента корреляции, направление и теснота связи между показателями Y и X, если уровень значимости при­нять равным 0,05?

12. Определите тесноту связи между возрастом самолета (X, лет) и стоимостью его эксплуатации (Y, млн руб.) по следующим данным:

Х

1

2

3

4

5

Y

2

4

5

8

10

 

Установите значимость коэффициента корреля­ции. Если он значим, то постройте уравнение регрессии и объясните его смысл. Каким будет про­гноз стоимости эксплуатации самолета, если его возраст 1,5 года, а уровень значимости принять рав­ным 0,05?

13. Определите тесноту связи объема выпуска про­дукции (X, тыс. шт.) и себестоимости единицы изделия (Y, тыс. руб.) на основе следующих данных:

Х

3

4

5

6

7

Y

10

8

7

5

2

 

Проверьте значимость выборочного коэффициента корреляции при α = 0,05. Постройте уравнение линейной регрессии и объясните его.

 

14. Определите тесноту связи общего веса неко­торого растения (X, г) и веса его семян (Y, г) на основе следующих выборочных данных:      

Х

40

50

60

70

80

90

100

Y

20

25

28

30

35

40

45

 

Проверьте значимость выборочного коэффициента корреляции при a =0,05. Постройте линейное урав­нение регрессии и объясните его.

15. При исследовании зависимости времени, зат­раченного на закрепление детали на токарном стан­ке, от веса детали, получены следующие результа­ты (X — вес детали, кг, Y — время закрепления детали, с):

Х

7

8

10

12

13

14

15

17

18

20

Y

2,2

2,3

2,4

2,5

2,6

2,7

2,8

3,0

3,1

3,2

 

Полагая, что между Y и Х имеет место линейная зависимость, определите выборочное уравнение линейной регрессии и объясните смысл полученных коэффициентов. Каковы значимость коэффициента корреляции, направление и теснота связи между показателями Х и Y, если уровень значимости при­нять равным 0,05?

16. Семь вновь принятых сотрудников брокер­ской компании проходят аттестацию в конце испытательного периода. Результаты их работы оцени­ваются путем сдачи теста на профессиональную при­годность и по отдаче с каждого инвестированного ими рубля. Результаты молодых специалистов были ранжированы следующим образом:

Молодые специалисты

А

В

С

D

E

F

G

Результат теста

3

2

6

4

1

7

5

Отдача с рубля

1

3

5

2

4

6

7

 

Вычислите коэффициент корреляции рангов Спирмена, оцените его значимость.

17. Следующие данные получены из случайной выборки по оборотам 8 годовых консолидирован­ных балансов. Цифры в таблице показывают объем продаж, тыс. шт., и цену единицы товара, руб.

Продажа

12,2

18,6

29,2

15,7

25,4

35,2

14,7

11,17

Цена

29,2

30,5

29,7

31,3

30,8

29,9

27,8

27,0

 

Рассчитайте выборочный коэффициент корреля­ции Пирсона между объемом продаж и ценой това­ра. Проверьте значимость коэффициента корреля­ции для a = 0,05.

18. Перед сдачей экзаменов в конце семестра в 20 группах студентов университета был проведен опрос о том, какую оценку по сдаваемым в сессию курсам они ожидают получить. После сессии сред­ние полученные оценки были сопоставлены со сред­ними ожидаемыми. Результаты приведены в таблице:

Ожидаемая

3,4

3,1

3,0

2,8

3,7

3,5

2,9

3,7

3,5

3,2

Полученная

4,1

3,4

3,3

3,0

4,7

4,6

3,0

4,6

4,6

3,6

Ожидаемая

3,0

3,5

3,3

3,1

3,3

3,9

2,9

3,2

3,4

3,4

Полученная

3,5

4,0

3,6

3,1

3,3

4,5

2,8

3,7

3,8

3,9

Рассчитайте линейный коэффициент корреляции Пирсона, оцените его значимость при α=0,05.

19. Организация стран-экспортеров нефти предпринимает попытки контроля над ценами на сырую нефть с 1973г. Цены на сырую нефть резко возрастали с середины 70-х до середина 80-х гг., что повлекло за собой некоторое повышение цен на бензин. Следующая таблица представляет средние цены на сырую нефть и бензин с 1975 по 1988г.

Год

 

Бензин, Y — центов за галлон

 

Сырая нефть, X — дол. за баррель

 

1975

 

57

 

7,67

 

1976

 

59

 

8,19

 

1977

 

62

 

8,57

 

1978

 

63

 

9,00

 

1979

 

86

 

12,64

 

1980

 

119

 

21,59

 

1981

 

133

 

31,77

 

1982

 

122

 

28,52

 

1983

 

116

 

26,19

 

1984

 

113

 

25,88

 

1985

 

112

 

24,09

 

1986

 

86

 

12,51

 

1987

 

90

 

15,40

 

1988

 

90

 

12,57

 

Постройте график и оцените характер взаимодействия между переменными. Рассчитайте параметры уравнения регрессии, оценивающего зависимость цен на галлон бензина от цен за баррель сырой нефти. Дайте интерпретацию полученных результатов.

  20. Имеются данные по 14 предприятиям о производительности труда (Y, шт.) и коэффициенте механизации работ (X, %)

X

 

32

 

30

 

36

 

40

 

41

 

47

 

56

 

54

 

60

 

55

 

61

 

67

 

69

 

76

 

Y

 

20

 

24

 

28

 

30

 

31

 

33

 

34

 

37

 

38

 

40

 

41

 

43

 

45

 

48

 

Проверьте значимость выборочного коэффициента корреляции при α = 0,05. Постройте уравнение линейной регрессии и объясните его.

 

ЛИТЕРАТУРА

Абезгауз Г. Г., Тронь А. П., Коненкин Ю. Н., Корови­на И. А. Справочник по вероятностным расче­там. М., 1970.

Белинский В. А., Калихман И. А., Майстров Л. Я., Митькин А. М. Высшая математика с основами математической статистики. М., 1965.

Вайнберг Дж., Шумекер Дж. Статистика. М., 1979.

Варден Ван-дер Б. Л. Математическая статистика. М., 1960.

Венецкий И. Г., Венецкая В. И. Основные математико-статистические понятия и формулы в эконо­мическом анализе. М., 1974.

Венецкий И. Г., Кильдишев Г. С. Теория вероятнос­тей и математическая статистика. М., 1975.

Вентцель Е. С. Теория вероятностей. М., 1964.

Вентцелъ Е. С., Овчаров Л. А. Теория вероятностей (задачи и упражнения). М., 1969.

Гершгорн А. С. Элементы теории вероятностей и математической статистики. Львов, 1961.

Гмурман В. Е. Руководство к решению задач по те­ории вероятностей и математической статисти­ке. М., 1975; 1979;1997.

Гмурман В. Е. Теория вероятностей и математичес­кая статистика. М. 1975; 1988.

Гнеденко Б. В., Хинчин А. Я. Элементарное введение в теорию вероятностей. М., 1970.

Гнеденко Б. В. Курс теории вероятностей. 6-е изд. М., 1988.

Гурский Е. И. Теория вероятностей с элементами математической статистики. М., 1971.

Дружинин Н. К. Математическая статистика в эко­номике. М.,1971.

Емельянов Г. В., Скитович В. П. Задачник по тео­рии вероятностей и математической статисти­ке. Л., 1967.

Иванова В. М., Калинина В. Н., Нешумова Л. А; Ре­шетникова И. О. Математическая статистика. М., 1981.

Ивашев-Мусатов О. С. Теория вероятностей и ма­тематическая статистика. М., 1979.

Карасев А. И. Теория вероятностей и математичес­кая статистика. М., 1971.

Карасев А. И., Аксютина 3. М., Савельева Т. И. Курс высшей математики для экономических вузов. Ч. II. Теория вероятностей и математическая статистика. М., 1982.

Козлова 3. А. Методические указания по изучению темы «Закон больших чисел». Ростов н/Д, 1979.

Коваленко И. Н., Вилиппова А. А. Теория вероятно­стей и математическая статистика. 2-е изд. М., 1982.

Колде Я. К. Практикум по теории вероятностей и математической статистике. М., 1991.

Колемаев В. А., Староверов О. В., Турундаевский В. Б. Теория вероятностей и математическая статистика. М., 1991.

Колемаев В. А., Калинина В. Н. Теория вероятно­стей и математическая статистика. М., 1997.

Лихолетов И. И., Мацкевич И. П. Руководство к решению задач по высшей математике с осно­вами математической статистики и теории ве­роятностей. Минск,1991.

Маринеску И., Мойнягу Ч., Никулеску Р., Ранку Н., Урсяну В. Основы математической статистики и ее применение. М., 1970.

Мостллер Ф., Рурке Р., Томас Дж. Вероятность. М., 1969.

Павловский З. Введение в математическую статис­тику. М.,1967.

Румшинский Л. З. Элементы теории вероятностей. М.,1970.

Сборник задач по теории вероятностей, математи­ческой статистике и теории случайных функ­ций/ Под ред. А. А.Свешникова. М., 1965.

Феллер. В. Введение в теорию вероятностей и ее приложения. М., 1952.

Четыркин Е. И., Калихман И. Л. Вероятность и ста­тистика. М., 1982.

Чистяков В. П. Курс теории вероятностей. 3-е изд. М., 1987.

Aczel A. Complete Business Statistics. 2nd ed./Richard D. Irwin, INC., 1993.

Canavos G. Applied Probability and Statistical Methods. Little, Brown... Company, USA, 1984.

Mendenhall W„ Wackerly D., Scheaffer R Mathematical statistics with Applications. PWS-KENT Publi­shing Company, USA, 1990.

 

 

Приложение 1


X

0

1

2

3

4

5

6

7

8

9

 

0,0

 

0,3989

 

0,3989

 

0,3989

 

0,3988

 

0,3986

 

0,3984

 

0,3982

 

0,3980

 

0,3977

 

0,3973

 

 

0,1

 

0,3970

 

0,3965

 

0,3961

 

0,3956

 

0,3951

 

0,3945

 

0,3939

 

0,3932

 

0,3925

 

0,3918

 

 

0,2

 

0,3910

 

0,3902

 

0,3894

 

0,3885

 

0,3876

 

0,3867

 

0,3857

 

0,3847

 

0,3836

 

0,3825

 

 

0,3

 

0,3814

 

0,3802

 

0,3790

 

0,3778

 

0,3765

 

0,3752

 

0,3739

 

0,3725

 

0,3712

 

0,3697

 

 

0,4

 

0,3683

 

0,3668

 

0,3653

 

0,3637

 

0,3621

 

0,3605

 

0,3589

 

0,3572

 

0,3555

 

0,3538

 

 

0,5

 

0,3521

 

0,3503

 

0,3485

 

0,3467

 

0,3448

 

0,3429

 

0,3410

 

0,3391

 

0,3372

 

0,3352

 

 

0,6

 

0,3332

 

0,3312

 

0,3292

 

0,3271

 

0,3251

 

0,3230

 

0,3209

 

0,3187

 

0,3166

 

0,3144

 

 

0,7

 

0,3123

 

0,3101

 

0,3079

 

0,3056

 

0,3034

 

0,3011

 

0,2989

 

0,2966

 

0,2943

 

0,2920

 

 

0,8

 

0,2897

 

0,2874

 

0,2850

 

0,2827

 

0,2803

 

0,2780

 

0,2756

 

0,2732

 

0,2709

 

0,2685

 

 

0,9

 

0,2661

 

0,2637

 

0,2613

 

0,2589

 

0,2565

 

0,2541

 

0,2516

 

0,2492

 

0,2468

 

0,2444

 

 

1,0

 

0,2420

 

0,2396

 

0,2371

 

0,2347

 

0,2323

 

0,2299

 

0,2275

 

0,2251

 

0,2227

 

0,2203

 

 

1,1

 

0,2179

 

0,2155

 

0.2131

 

0,2107

 

0,2083

 

0,2059

 

0,2036

 

0,2012

 

0,1989

 

0,1965

 

 

1,2

 

0,1942

 

0,1919

 

0,1895

 

0,1872

 

0,1849

 

0,1826

 

0,1804

 

0,1781

 

0,1758

 

0,1736

 

 

1,3

 

0,1714

 

0,1691

 

0,1669

 

0,1647

 

0,1626

 

0,1604

 

0,1582

 

0,1561

 

0,1539

 

0,1518

 

 

1,4

 

0,1497

 

0,1476

 

0,1456

 

0,1435

 

0,1415

 

0,1394

 

0,1374

 

0.1354

 

0,1334

 

0,1315

 

 

1,5

 

0,1295

 

0,1276

 

0,1257

 

0,1238

 

0,1219

 

0,1200

 

0,1182

 

0,1163

 

0,1145

 

0,1127

 

 

1,6

 

0,1109

 

0,1092

 

0,1074

 

0,1057

 

0,1040

 

0,1023

 

0,1006

 

0,0989

 

0,0973

 

0,0957

 

 

1,7

 

0,0940

 

0,0925

 

0,0909

 

0,0893

 

0,0878

 

0,0863

 

0,0848

 

0,0833

 

0,0818

 

0,0804

 

 

1,8

 

0,0790

 

0,0775

 

0,0761

 

0,0748

 

0,0734

 

0,0721

 

0,0707

 

0,0694

 

0,0681

 

0,0669

 

 

1,9

 

0,0656

 

0,0644

 

0,0632

 

0,0620

 

0,0608

 

0,0596

 

0,0584

 

0,0573

 

0,0562

 

0,0551

 

 

2,0

 

0,0540

 

0,0529

 

0,0519

 

0,0508

 

0,0498

 

0,0488

 

0,0478

 

0,0468

 

0,0459

 

0,0449

 

 

2,1

 

0,0440

 

0,0431

 

0,0422

 

0,0413

 

0,0404

 

0,0396

 

0,0387

 

0,0379

 

0,0371

 

0,0363

 

 

2,2

 

0,0355

 

0,0347

 

0,0339

 

0,0332

 

0,0325

 

0,0317

 

0,0310

 

0,0303

 

0,0297

 

0,0290

 

 

2,3

 

0,0283

 

0,0277

 

0,0270

 

0,0264

 

0,0258

 

0,0252

 

0,0246

 

0,0241

 

0,0235

 

0,0229

 

 

2,4

 

0,0224

 

0,0219

 

0,0213

 

0,0208

 

0,0203

 

0,0198

 

0,0194

 

0,0189

 

0,0184

 

0,0180

 

 

2,5

 

0,0175

 

0,0171

 

0,0167

 

0,0163

 

0,0158

 

0,0154

 

0,0151

 

0,0147

 

0,0143

 

0,0139

 

 

2,6

 

0,0136

 

0,0132

 

0,0129

 

0,0126

 

0,0122

 

0,0119

 

0,0116

 

0,0113

 

0,0110

 

0,0107

 

 

2,7

 

0,0104

 

0,0101

 

0,0099

 

0,0096

 

0,0093

 

0,0091

 

0,0088

 

0,0086

 

0,0084

 

0,0081

 

 

2,8

 

0,0079

 

0,0077

 

0,0075

 

0,0073

 

0,0071

 

0,0069

 

0,0067

 

0,0065

 

0,0063

 

0,0061

 

2,9

 

0,0060

 

0,0058

 

0,0056

 

0,0055

 

0,0053

 

0,0051

 

0,0050

 

0,0048

 

0,0047

 

0,0046

 

3,0

 

0,0044

 

0,0043

 

0,0042

 

0,0040

 

0,0039

 

0,0038

 

0,0037

 

0,0036

 

0,0035

 

0,0034

 

3,1

 

0,0033

 

0,0032

 

0,0031

 

0,0030

 

0,0029

 

0,0028

 

0,0027

 

0,0026

 

0,0025

 

0,0025

 

3,2

 

0,0024

 

0,0023

 

0,0022

 

0,0022

 

0,0021

 

0,0020

 

0,0020

 

0,0019

 

0,0018

 

0,0018

 

3,3

 

0,0017

 

0,0017

 

0,0016

 

0,0016

 

0,0015

 

0,0015

 

0,0014

 

0,0014

 

0,0013

 

0,0013

 

3,4

 

0,0012

 

0,0012

 

0,0012

 

0,0011

 

0,0011

 

0,0010

 

0,0010

 

0,0010

 

0,0009

 

0,0009

 

3,5

 

0,0009

 

0,0008

 

0,0008

 

0,0008

 

0,0008

 

0,0007

 

0,0007

 

0,0007

 

0,0007

 

0,0006

 

3,6

 

0,0006

 

0,0006

 

0,0006

 

0,0005

 

0,0005

 

0,0005

 

0,0005

 

0,0005

 

0,0005

 

0,0004

 

3,7

 

0,0004

 

0,0004

 

0,0004

 

0,0004

 

0,0004

 

0,0004

 

0,0003

 

0,0003

 

0,0003

 

0,0003

 

3,8

 

0,0003

 

0,0003

 

0,0003

 

0,0003

 

0,0003

 

0,0002

 

0,0002

 

0,0002

 

0,0002

 

0,0002

 

3,9

 

0,0002

 

0,0002

 

0,0002

 

0,0002

 

0,0002

 

0,0002

 

0,0002

 

0,0002

 

0,0001

 

0,0001

 

4,0

 

0,0001

 

0,0001

 

0,0001

 

0,0001

 

0,0001

 

0,0001

 

0,0001

 

0,0001

 

0,0001

 

0,0001

 

4,1

 

0,0001

 

0,0001

 

0,0001

 

0,0001

 

0,0001

 

0,0001

 

0,0001

 

0,0001

 

0,0001

 

0,0001

 

4,2

 

0,0001

 

0,0001

 

0,0001

 

0,0001

 

0,0000

 

0,0000

 

0,0000

 

0,0000

 

0,0000

 

0,0000

 

Приложение 2


z

 

0

 

1

 

2

 

3

 

4

 

5

 

6

 

7

 

8

 

9

 

 

0,0

 

0,00000

 

0,00399

 

0,00798

 

0,01197

 

0,01595

 

0,01994

 

0,02392

 

0,02790

 

0,03188

 

0,03586

 

 

0,1

 

0,03983

 

0,04380

 

0,04776

 

0,05172

 

0,05567

 

0,05962

 

0,06356

 

0,06749

 

0,07142

 

0,07535

 

 

0,2

 

0,07926

 

0,08317

 

0,08706

 

0,09095

 

0,09483

 

0,09871

 

0,10257

 

0,10642

 

0,11026

 

0,11409

 

 

0,3

 

0,11791

 

0,12172

 

0,12552

 

0,12930

 

0,13307

 

0,13683

 

0,14058

 

0,14431

 

0,14803

 

0,15173

 

 

0,4

 

0,15542

 

0,15910

 

0,16276

 

0,16640

 

0,17003

 

0,17364

 

0,17724

 

0,18082

 

0,18439

 

0,18793

 

 

0,5

 

0,19146

 

0,19497

 

0,19847

 

0,20194

 

0,20540

 

0,20884

 

0,21226

 

0,21566

 

0,21904

 

0,22240

 

 

0,6

 

0,22575

 

0,22907

 

0,23237

 

0,23565

 

0,23891

 

0,24215

 

0,24537

 

0,24857

 

0,25175

 

0,25490

 

 

0,7

 

0,25804

 

0,26115

 

0,26424

 

0,26730

 

0,27035

 

0,27337

 

0,27637

 

0,27935

 

0,28230

 

0,28524

 

 

0,8

 

0,28814

 

0,29103

 

0,29389

 

0,29673

 

0,29955

 

0,30234

 

0,30511

 

0,30785

 

0,31057

 

0,31327

 

 

0,9

 

0,31594

 

0,31859

 

0,32121

 

0,32381

 

0,32639

 

0,32894

 

0,33147

 

0,33398

 

0,33646

 

0,33891

 

 

1,0

 

0,34134

 

0,34375

 

0,34614

 

0,34849

 

0,35083

 

0,35314

 

0,35543

 

0,35769

 

0,35993

 

0,36214

 

 

1,1

 

0,36433

 

0,36650

 

0,36864

 

0,37076

 

0,37286

 

0,37493

 

0,37698

 

0,37900

 

0,38100

 

0,38298

 

 

1,2

0,38493

 

0,38686

 

0,38877

 

0,39065

 

0,39251

 

0,39435

 

0,39617

 

0,39796

 

0,39973

 

0,40147

 

 

1,3

 

0,40320

 

0,40490

 

0,40658

 

0,40824

 

0,40988

 

0,41149

 

0,41308

 

0,41466

 

0,41621

 

0,41774

 

1,4

 

0,41924

 

0,42073

 

0,42220

 

0,42364

 

0,42507

 

0,42647

 

0,42785

 

0,42922

 

0,43056

 

0,43189

 

1,5

 

0,43319

 

0,43448

 

0,43574

 

0,43699

 

0,43822

 

0,43943

 

0,44062

 

0,44179

 

0,44295

 

0,44408

 

1,6

 

0,44520

 

0,44630

 

0,44738

 

0,44845

 

0,44950

 

0,45053

 

0,45154

 

0,45254

 

0,45352

 

0,45449

 

1,7

 

0,45543

 

0,45637

 

0,45728

 

0,45818

 

0,45907

 

0,45994

 

0,46080

 

0,46164

 

0,46246

 

0,46327

 

1,8

 

0,46407

 

0,46485

 

0,46562

 

0,46638

 

0,46712

 

0,46784

 

0,46856

 

0,46926

 

0,46995

 

0,47062

 

1,9

 

0,47128

 

0,47193

 

0,47257

 

0,47320

 

0,47381

 

0,47441

 

0,47500

 

0,47558

 

0,47615

 

0,47670

 

2,0

 

0,47725

 

0,47778

 

0,47831

 

0,47882

 

0,47932

 

0,47982

 

0,48030

 

0,48077

 

0,48124

 

0,48169

 

2,1

 

0,48214

 

0,48257

 

0,48300

 

0,48341

 

0,48382

 

0,48422

 

0,48461

 

0,48500

 

0,48537

 

0,48574

 

2,2

 

0,48610

 

0,48645

 

0,48679

 

0,48713

 

0,48745

 

0,48778

 

0,48809

 

0,48840

 

0,48870

 

0,48899

 

2,3

 

0,48928

 

0,48956

 

0,48983

 

0,49010

 

0,49036

 

0,49061

 

0,49086

 

0,49111

 

0,49134

 

0,49158

 

2,4

 

0,49180

 

0,49202

 

0,49224

 

0,49245

 

0,49266

 

0,49286

 

0,49305

 

0,49324

 

0,49343

 

0,49361

 

2,5

 

0,49379

 

0,49396

 

0,49413

 

0,49430

 

0,49446

 

0,49461

 

0,49477

 

0,49492

 

0,49506

 

0,49520

 

2,6

 

0,49534

 

0,49547

 

0,49560

 

0,49573

 

0,49585

 

0,49598

 

0,49609

 

0,49621

 

0,49632

 

0,49643

 

2,7

 

0,49653

 

0,49664

 

0,49674

 

0,49683

 

0,49693

 

0,49702

 

0,49711

 

0,49720

 

0,49728

 

0,49736

 

2,8

 

0,49744

 

0,49752

 

0,49760

 

0,49767

 

0,49774

 

0,49781

 

0,49788

 

0,49795

 

0,49801

 

0,49807

 

 

2,9

 

0,49813

 

0,49819

 

0,49825

 

0,49831

 

0,49836

 

0,49841

 

0,49846

 

0,49851

 

0,49856

 

0,49861

 

 

3,0

 

0,49865

 

0,49869

 

0,49874

 

0,49878

 

0,49882

 

0,49886

 

0,49889

 

0,49893

 

0,49896

 

0,49900

 

 

3,1

 

0,49903

 

0,49906

 

0,49910

 

0,49913

 

0,49916

 

0,49918

 

0,49921

 

0,49924

 

0,49926

 

0,49929

 

 

3,2

 

0,49931

 

0,49934

 

0,49936

 

0,49938

 

0,49940

 

0,49942

 

0,49944

 

0,49946

 

0,49948

 

0,49950

 

 

3,3

 

0,49952

 

0,49953

 

0,49955

 

0,49957

 

0,49958

 

0,49960

 

0,49961

 

0,49962

 

0,49964

 

0,49965

 

 

3,4

 

0,49966

 

0,49968

 

0,49969

 

0,49970

 

0,49971

 

0,49972

 

0,49973

 

0,49974

 

0,49975

 

0,49976

 

 

3,5

 

0,49977

 

0,49978

 

0,49978

 

0,49979

 

0,49980

 

0,49981

 

0,49981

 

0,49982

 

0,49983

 

0,49983

 

 

3,6

 

0,49984

 

0,49985

 

0,49985

 

0,49986

 

0,49986

 

0,49987

 

0,49987

 

0,49988

 

0,49988

 

0,49989

 

 

3,7

 

0,49989

 

0,49990

 

0,49990

 

0,49990

 

0,49991

 

0,49991

 

0,49992

 

0,49992

 

0,49992

 

0,49992

 

 

3,8

 

0,49993

 

0,49993

 

0,49993

 

0,49994

 

0,49994

 

0,49994

 

0,49994

 

0,49995

 

0,49995

 

0,49995

 

 

3,9

 

0,49995

 

0,49995

 

0,49996

 

0,49996

 

0,49996

 

0,49996

 

0,49996

 

0,49996

 

0,49997

 

0,49997

 

 

4,0

 

0,499968

 

 

4,5

 

0,49997

 

 

5,0

 

0,4999997

 

 

Приложение 3

Таблица значений функции Пуассона:


т

l

0,1

0,2

0,3

0,4

0,5

0,6

0,7

0,8

0.9

0

0,9048

 

0,8187

 

0,7408

 

0,6703

 

0,6065

 

0,5488

 

0,4966

 

0,4493

 

0,4066

 

1

 

0,0905

 

0,1638

 

0,2222

 

0,2681

 

0,3033

 

0,3293

 

0,3476

 

0,3596

 

0,3696

 

2

 

0,0045

 

0,0164

 

0,0333

 

0,0536

 

0,0758

 

0,0988

 

0,1217

 

0,1438

 

0,1647

 

3

 

0,0002

 

0,0011

 

0,0033

 

0,0072

 

0,0126

 

0,0198

 

0,0284

 

0,0383

 

0,0494

 

4

-

 

-

 

0,0002

 

0,0007

 

0,0016

 

0,0030

 

0,0050

 

0,0077

 

0,0111

 

5

-

 

-

 

-

 

0,0001

 

0,0002

 

0,0004

 

0,0007

 

0,0012

 

0,0020

 

6

-

-

-

-

-

-

0,0001

0,0002

0,0003

 

 

 

т

 

l

 

1,0

2,0

3,0

4,0

5,0

6,0

7,0

8,0

9,0

0

0,3679

 

0,1353

 

0,0498

 

0,0183

 

0,0067

 

0,0025

 

0,0009

 

0,0003

 

0,0001

 

1

 

0,3679

 

0,2707

 

0,1494

 

0,0733

 

0,0337

 

0,0149

 

0,0064

 

0,0027

 

0,0011

 

2

 

0,1839

 

0,2707

 

0,2240

 

0,1465

 

0,0842

 

0,0446

 

0,0223

 

0,0107

 

0,0055

 

3

 

0,0313

 

0,1804

 

0,2240

 

0,1954

 

0,1404

 

0,0892

 

0.0521

 

0,0286

 

0,0150

 

4

0,0153

 

0,0902

 

0,1680

 

0,1954

 

0,1755

 

0,1339

 

0,0912

 

0,0572

 

0,0337

 

5

0,0081

 

0,0361

 

0,1008

 

0,1563

 

0,1755

 

0,1606

 

0,1277

 

0,0916

 

0,0607

 

 

 

т

l

1,0

 

2,0

 

3,0

 

4,0

 

5,0

 

6,0

 

7,0

 

8,0

 

9,0

 

6

0,0005

 

0,0120

 

0,0504

 

0,1042

 

0,1462

 

0,1606

 

0,1490

 

0,1221

 

0,0911

 

7

 

0,0001

 

0,0034

 

0,0216

 

0,0595

 

0,1044

 

0,1377

 

0,1490

 

0,1396

 

0,1318

 

8

 

-

 

0,0009

 

0,0081

 

0,0298

 

0,0655

 

0,1033

 

0,1304

 

0,1396

 

0,1318

 

9

 

-

 

0,0002

 

0,0027

 

0,0132

 

0,0363

 

0,0688

 

0,1014

 

0,1241

 

0,0318

 

10

 

-

 

-

 

0,0008

 

0,0053

 

0,0181

 

0,0413

 

0,0710

 

0,0993

 

0,1180

 

11

 

-

 

-

 

0,0002

 

0,0019

 

0,0082

 

0,0225

 

0,0452

 

0,0722

 

0,0970

 

12

 

-

 

-

 

0,0001

 

0,0006

 

0,0034

 

0,0113

 

0,0264

 

0,0481

 

0,0728

 

13

 

-

 

-

 

-

 

0,0002

 

0,0013

 

0,0052

 

0,0142

 

0,0296

 

0,0504

 

14

 

-

 

-

 

-

 

0,0001

 

0,0005

 

0,0022

 

0,0071

 

0,0169

 

0,0324

 

15

 

-

 

-

 

-

 

-

 

0,0002

 

0,0009

 

0,0033

 

0,0090

 

0,0194

 

16

 

-

 

-

 

-

 

-

 

-

 

0,0003

 

0,0014

 

0,0045

 

0,0109

 

17

 

-

 

-

 

-

 

-

 

-

 

0,0001

 

0,0006

 

0,0021

 

0,0058

 

18

 

-

 

-

 

-

 

-

 

-

 

-

 

0,0002

 

0,0009

 

0,0029

 

19

 

-

 

-

 

-

 

-

 

-

 

-

 

0,0001

 

0,0004

 

0,0014

 

20

 

-

 

-

 

-

 

-

 

-

 

-

 


 

0,0002

 

0,0006

 

21

 

-

 

-

 

-

 

-

 

-

 

-

 

-

 

0,0001

 

0,0003

 

22

 

-

 

-

 

-

 

-

 

-

 

-

 

-

 

-

 

0,0001

 

 

 

Приложение 4

Критические точки распределения c2

Число степеней свободы k

 

Уровень значимости α

 

0,01

 

0,025

 

0,05

 

0,95

 

0,975

 

0,99

 

1

 

6,6

 

5,0

 

3,8

 

0,0039

 

0,00098

 

0,00016

 

2

 

9,2

 

7,4

 

6,0

 

0,103

 

0,051

 

0,020

 

3

 

11,3

 

9,4

 

7,8

 

0,352

 

0,216

 

0,115

 

4

 

13,3

 

11,1

 

9,5

 

0,711

 

0,484

 

0,297

 

5

 

15,1

 

12,8

 

11,1

 

1,15

 

0,831

 

0,554

 

6

 

16,8

 

14,4

 

12,6

 

1,64

 

1,24

 

0,872

 

7

 

18,5

 

16,0

 

14,1

 

2,17

 

1,69

 

1,24

 

8

 

20,1

 

17,5

 

15,5

 

2,73

 

2,18

 

1,65

 

9

 

21,7

 

19,0

 

16,9

 

3,33

 

2,70

 

2,09

 

10

 

23,2

 

20,5

 

18,3

 

3,94

 

3,25

 

2,56

 

11

 

24,7

 

21,9

 

19,7

 

4,57

 

3,82

 

3,05

 

12

 

26,2

 

23,3

 

21,0

 

5,23

 

4,40

 

3,57

 

13

 

27,7

 

24,7

 

22,4

 

5,89

 

5,01

 

4,11

 

14

 

29,1

 

26,1

 

23,7

 

6,57

 

5,63

 

4,66

 

15

 

30,6

 

27,5

 

25,0

 

7,26

 

6,26

 

5,23

 

16

 

32,0

 

28,8

 

26,3

 

7,96

 

6,91

 

5,81

 

17

 

33,4

 

30,2

 

27,6

 

8,67

 

7,56

 

6,41

 

18

 

34,8

 

31,5

 

28,9

 

9,39

 

8,23

 

7,01

 

19

 

36,2

 

32,9

 

30,1

 

10,1

 

8,91

 

7,63

 

20

 

37,6

 

34,2

 

31,4

 

10,9

 

9,59

 

8,26

 

21

 

38,9

 

35,5

 

32,7

 

11,6

 

10,3

 

8,90

 

22

 

40,3

 

36,8

 

33,9

 

12,3

 

11,0

 

9,54

 

23

 

41,6

 

38,1

 

35,2

 

13,1

 

11,7

 

10,2

 

24

 

43,0

 

39,4

 

36,4

 

13,8

 

12,4

 

10,9

 

25

 

44,3

 

40,6

 

37,7

 

14,6

 

13,1

 

11,5

 

26

 

45,6

 

41,9

 

38,9

 

15,4

 

13,8

 

12,2

 

27

 

47,0

 

43,2

 

40,1

 

16,2

 

14,6

 

12,9

 

28

 

48,3

 

44,5

 

41,3

 

16,9

 

15,3

 

13,6

 

29

 

49,6

 

45,7

 

42,6

 

17,7

 

16,0

 

14,3

 

30

 

50,9

 

47,0

 

43,8

 

18,5

 

16,8

 

15,0

 

Приложение 5

Критические точки распределения Стьюдента

Число степеней свободы k

Уровень значимости α (двусторонняя критическая область)

0,10

0,05

0,02

0,01

0,002

0,001

1

 

6,31

 

12,7

 

31,82

 

63,7

 

318,3

 

637,0

 

2

 

2,92

 

4,30

 

6,97

 

9,92

 

22,33

 

31,6

 

3

 

2,35

 

3,18

 

4,54

 

5,84

 

10,22

 

12,9

 

4

 

2,13

 

2,78

 

3,75

 

4,00

 

7,17

 

8,61

 

5

 

2,01

 

2,57

 

3,37

 

4,03

 

5,89

 

6,86

 

6

 

1,94

 

2,45

 

3,14

 

3,71

 

5,21

 

5,96

 

7

 

1,89

 

2,36

 

3,00

 

3,50

 

4,79

 

5,40

 

8

 

1,86

 

2,31

 

2,90

 

3,36

 

4,50

 

5,04

 

9

 

1,83

 

2,26

 

2,82

 

3,25

 

4,30

 

4,70

 

10

 

1,81

 

2,23

 

2,76

 

3,17

 

4,14

 

4,59

 

11

 

1,80

 

2,28

 

2,72

 

3,11

 

4,03

 

4,44

 

12

 

1,78

 

2,18

 

2,68

 

3,05

 

3,93

 

4,32

 

13

 

1,77

 

2,16

 

2,65

 

3,01

 

3,85

 

4,22

 

14

 

1,76

 

2,14

 

2,62

 

2,98

 

3,79

 

4,14

 

15

 

1,75

 

2,13

 

2,60

 

2,95

 

3,73

 

4,07

 

16

 

1,75

 

2,12

 

2,58

 

2,92

 

3,69

 

4,01

 

17

 

1,74

 

2,11

 

2,57

 

2,90

 

3,65

 

3,96

 

18

 

1,73

 

2,10

 

2,55

 

2,88

 

3,61

 

3,92

 

19

 

1,73

 

2,09

 

2,54

 

2,86

 

3,58

 

3,88

 

20

 

1,73

 

2,09

 

2,53

 

2,85

 

3,55

 

3,85

 

21

 

1,72

 

2,08

 

2,52

 

2,83

 

3,53

 

3,82

 

22

 

1,72

 

2,07

 

2,51

 

2,82

 

3,51

 

3,79

 

23

 

1,71

 

2,07

 

2,50

 

2,81

 

3,49

 

3,77

 

24

 

1,71

 

2,06

 

2,49

 

2,80

 

3,47

 

3,74

 

Число степеней свободы k

 

0,05

 

0,025

 

0,01

 

0,005

 

0,001

 

0,0005

 

Уровень значимости α (односторонняя критическая область)

 

 

Число степеней свободы k

 

Уровень значимости α (двусторонняя критическая область)

 

0,10

 

0,05

 

0,02

 

0,01

 

0,002

 

0,001

 

25

 

1,71

 

2,06

 

2,49

 

2,79

 

3,45

 

3,72

 

26

 

1,71

 

2,06

 

2,48

 

2,78

 

3,44

 

3,71

 

27

 

1,71

 

2,05

 

2,47

 

2,77

 

3,42

 

3,69

 

28

 

1,70

 

2,05

 

2,46

 

2,76

 

3,40

 

3,66

 

29

 

1,70

 

2,05

 

2,46

 

2,76

 

3,40

 

3,66

 

30

 

1,70

 

2,04

 

2,46

 

2,75

 

3,39

 

3,65

 

40

 

1,68

 

2,02

 

2,42

 

2,70

 

3,31

 

3,55

 

60

 

1,07

 

2,00

 

2,39

 

2,66

 

3,23

 

3,46

 

120

 

1,66

 

1,98

 

2,36

 

2,62

 

3,17

 

3,37

 

Число степеней свободы k

0,05

0,025

0,01

0,005

0,001

0,0005

Уровень значимости α (односторонняя критическая область)

 

Приложение 6

Критические точки распределения Фишера-Снедекора (К1 — число степеней свободы большей дисперсии, К2 — число степеней свободы меньшей дисперсии)

 

 

Уровень значимости a = 0,01

 

К1

K2

1

2

3

4

5

6

7

8

9

10

11

12

1

 

4052

 

4999

 

5403

 

5625

 

5764

 

5889

 

5928

 

5981

 

6022

 

6056

 

6082

 

6106

 

2

 

3

 

98,49

 

34,12

 

99,01

 

38,81

 

90,17

 

29,46

 

99,25

 

28,71

 

99,33

 

28,24

 

99,30

 

27,91

 

99,34

 

27,67

 

99,36

 

27,49

 

99,36

 

27,34

 

99,40

 

27,23

 

99,41

 

27,13

 

99,42

 

27,05

 

4

 

21,20

 

18,00

 

16,69

 

15,98

 

15,52

 

15,21

 

14,96

 

14,80

 

14,66

 

14,54

 

14,45

 

14,37

 

5

 

16,26

 

13,27

 

12,06

 

11,39

 

10,97

 

10,67

 

10,45

 

10,27

 

10,15

 

10,05

 

9,96

 

9,89

 

6

 

13,74

 

10,92

 

9,78

 

9,15

 

8,75

 

8,47

 

8,26

 

8,10

 

7,98

 

7,87

 

7,79

 

7,72

 

7

 

12,25

 

9,55

 

8,45

 

7,85

 

7,46

 

7,19

 

7,00

 

6,84

 

6,71

 

6,62

 

6,54

 

6,47

 

8

 

11,26

 

8,65

 

7,59

 

7,01

 

6,63

 

6,37

 

6,19

 

6,03

 

5,91

 

5,82

 

5,74

 

5,67

 

9

 

10,56

 

8,02

 

6,99

 

6,42

 

6,06

 

5,80

 

5,62

 

5,47

 

5,35

 

5,26

 

5,18

 

5,11

 

10

 

10,04

 

7,56

 

6,55

 

5,99

 

5,64

 

5,39

 

5,21

 

5,06

 

4,95

 

4,85

 

4,78

 

4.71

 

11

 

9,86

 

7,20

 

6,22

 

5,67

 

5,32

 

5,07

 

4,88

 

4,72

 

4,63

 

4,54

 

4,46

 

4,40

 

12

 

9,33

 

6,93

 

5,95

 

5,41

 

5,06

 

4,82

 

4,65

 

4,50

 

4,39

 

4,30

 

4,22

 

4,16

 

13

 

9,07

 

6,70

 

5,74

 

5,20

 

4,86

 

4,62

 

4,44

 

4,30

 

4,19

 

4,10

 

4,02

 

3,96

 

14

 

8,86

 

6,51

 

5,56

 

5,03

 

4,69

 

4,46

 

4,28

 

4,14

 

4,03

 

3,94

 

3,86

 

3,80

 

15

 

8,68

 

6,36

 

5,42

 

4,89

 

4,56

 

4,32

 

4,14

 

4,00

 

3,89

 

3,80

 

3,73

 

3,67

 

16

 

8,53

 

6,23

 

5,29

 

4,77

 

4,44

 

4,20

 

4,03

 

3,89

 

3,78

 

3,69

 

3,61

 

3,55

 

17

 

8,40

 

6,11

 

5,18

 

4,67

 

4,44

 

4,10

 

3,93

 

3,79

 

3,68

 

3,59

 

3,52

 

3,45

 

 

 

 

 

Уровень значимости a = 0,05

 

K1

 

K2

 

1

 

2

 

3

 

4

 

5

 

6

 

7

 

8

 

9

 

10

 

11

 

12

 

1

 

161

 

200

 

216

 

225

 

230

 

234

 

237

 

239

 

241

 

242

 

243

 

244

 

2

 

18,51

 

19,00

 

19,16

 

19,25

 

19,30

 

19,33

 

19,36

 

19,37

 

19,38

 

19,39

 

19,40

 

19,41

 

3

 

10,13

 

9,55

 

9,28

 

9,12

 

9,01

 

8,94

 

8,88

 

8,84

 

8,81

 

8,78

 

8,76

 

8,74

 

4

 

7,71

 

6,94

 

6,59

 

6,39

 

6,26

 

6,16

 

6,09

 

6,04

 

6,00

 

5,96

 

5,93

 

5,91

 

5

 

6,61

 

5,79

 

5,41

 

5,19

 

5,05

 

4,95

 

4,88

 

4,82

 

4,78

 

4,74

 

4,70

 

4,68

 

6

 

5,99

 

5,14

 

4,76

 

4,53

 

4,39

 

4,28

 

4,21

 

4,15

 

4,10

 

4,06

 

4,03

 

4,00

 

7

 

8

 

5,59

 

5,32

 

4,74

 

4,46

 

4,35

 

4,07

 

4,12

 

3,84

 

3,97

 

3,69

 

3,87

 

3,58

 

3,79

 

3,50

 

3,73

 

3,44

 

3,68

 

3,39

 

3,63

 

3,34

 

3,60

 

3,31

 

3,57

 

3,28

 

9

 

5,12

 

4,26

 

3,86

 

3,63

 

3,48

 

3,37

 

3,29

 

3,23

 

3,18

 

3,13

 

3,10

 

3,07

 

10

 

4,96

 

4,10

 

3,71

 

3,48

 

3,33

 

3,22

 

3,14

 

3,07

 

3,02

 

2,97

 

2,94

 

2,91

 

11

 

4,84

 

3,98

 

3,59

 

3,36

 

3,20

 

3,09

 

3,01

 

2,95

 

2,90

 

2,86

 

2,82

 

2,79

 

12

 

4,75

 

3,88

 

3,49

 

3,26

 

3,11

 

3,00

 

2,92

 

2,85

 

2,80

 

2,76

 

2,72

 

2,69

 

13

 

4,67

 

3,80

 

3,41

 

3,18

 

3,02

 

2,92

 

2,84

 

2,77

 

2,72

 

2,67

 

2,63

 

2,60

 

14

 

4,60

 

3,74

 

3,34

 

3,11

 

2,96

 

2,85

 

2,77

 

2,70

 

2,65

 

2,60

 

2,56

 

2,53

 

15

 

4,54

 

3,68

 

3,29

 

3,06

 

2,90

 

2,79

 

2,70

 

2,64

 

2,59

 

2,55

 

2,51

 

2,48

 

16

 

4,49

 

3,63

 

3,24

 

3,01

 

2,85

 

2,74

 

2,66

 

2,59

 

2,54

 

2,49

 

2,45

 

2,42

 

17

 

4,45

 

3,59

 

3,20

 

2,96

 

2,81

 

2,70

 

2,62

 

2,55

 

2,50

 

2,45

 

2,41

 

2,38

 

 

Содержание

ПРЕДИСЛОВИЕ................................................................................................................................................................................................... 3

1. ЭЛЕМЕНТЫ КОМБИНАТОРИКИ................................................................................................................................................................... 3

1.1. Размещения................................................................................................................................................................................................... 3

1.2. Понятие факториала.................................................................................................................................................................................... 4

1.3. Размещения с повторениями.................................................................................................................................................................... 4

1.4. Сочетания....................................................................................................................................................................................................... 4

1.5. Сочетания с повторениями........................................................................................................................................................................ 5

1.6. Перестановки................................................................................................................................................................................................ 6

1.7. Перестановки с повторениями................................................................................................................................................................. 6

Задачи к теме 1..................................................................................................................................................................................................... 6

2. ЭЛЕМЕНТЫ ТЕОРИИ ВЕРОЯТНОСТЕЙ....................................................................................................................................................... 8

2.1. Определение вероятности и свойства, вытекающие из ее определения, классификация событий, диаграммы Венна...... 8

2.2. Правила сложения и умножения вероятностей. Зависимые и независимые события............................................................. 12

Задачи к теме 2................................................................................................................................................................................................... 18

3. ФОРМУЛЫ ПОЛНОЙ ВЕРОЯТНОСТИ И БАЙЕСА................................................................................................................................. 20

Задачи к теме 3................................................................................................................................................................................................... 25

4. ДИСКРЕТНЫЕ СЛУЧАЙНЫЕ ВЕЛИЧИНЫ................................................................................................................................................ 28

4.1. Определение дискретной случайной величины................................................................................................................................. 28

4.2. Математические операции над случайными величинами.............................................................................................................. 30

4.3. Распределения Бернулли и Пуассона.................................................................................................................................................... 31

4.4. Гипергеометрическое распределение.................................................................................................................................................. 33

Задачи к теме 4................................................................................................................................................................................................... 44

5. НЕПРЕРЫВНЫЕ СЛУЧАЙНЫЕ ВЕЛИЧИНЫ............................................................................................................................................. 47

5.1. Функция распределения и плотность распределения непрерывной случайной величины..................................................... 47

5.2. Нормальное распределение.................................................................................................................................................................... 48

Задачи к теме 5................................................................................................................................................................................................... 63

6. ВАРИАЦИОННЫЕ РЯДЫ И ИХ ХАРАКТЕРИСТИКИ............................................................................................................................ 65

6.1. Понятие вариационного ряда. Виды вариационных рядов.............................................................................................................. 65

6.2. Числовые характеристики вариационного ряда................................................................................................................................. 68

Задачи к теме 6................................................................................................................................................................................................... 75

7. ВЫБОРОЧНЫЙ МЕТОД И СТАТИСТИЧЕСКОЕ ОЦЕНИВАНИЕ......................................................................................................... 79

7.1. Основные понятия и определения выборочного метода................................................................................................................. 79

7.2. Статистическое оценивание.................................................................................................................................................................... 80

7.3. Ошибки выборки........................................................................................................................................................................................ 81

7.4. Определение численности (объема) выборки.................................................................................................................................... 82

7.5. Интервальное оценивание....................................................................................................................................................................... 83

Задачи к теме 7................................................................................................................................................................................................... 93

8. ПРОВЕРКА СТАТИСТИЧЕСКИХ ГИПОТЕЗ.............................................................................................................................................. 95

Задачи к теме 8................................................................................................................................................................................................. 110

9. СТАТИСТИЧЕСКОЕ ИЗУЧЕНИЕ СВЯЗЕЙ МЕЖДУ ЯВЛЕНИЯМИ И ИХ ИСПОЛЬЗОВАНИЕ ДЛЯ УПРАВЛЕНИЯ СОЦИАЛЬНО-ЭКОНОМИЧЕСКИМИ ПРОЦЕССАМИ.................................................................................................................................... 113

9.1. Виды и формы связей, различаемые в статистике........................................................................................................................... 113

9.2. Оценка достоверности коэффициента корреляции......................................................................................................................... 117

9.3. Эмпирическое и теоретическое корреляционные отношения..................................................................................................... 118

9.4. Ранговая корреляция............................................................................................................................................................................... 120

9.5. Корреляция альтернативных признаков............................................................................................................................................. 121

9.6. Оценка уравнения парной регрессии................................................................................................................................................. 122

9.7. Парная линейная зависимость.............................................................................................................................................................. 123

9.8. Коэффициент эластичности.................................................................................................................................................................. 124

9.9. Пример расчета коэффициента уравнения регрессии................................................................................................................... 125

9.10. Стандартная ошибка оценки уравнения регрессии....................................................................................................................... 128

9.11. Измерение вариации по уравнению регрессии............................................................................................................................. 130

9.12. Доверительные интервалы для оценки неизвестного генерального значения `yген(m) и индивидуального значения `yi 132

9.13. Доверительные интервалы для оценки истинных значений неизвестного параметра уравнения регрессии  b1 и коэффициента регрессии ρ в генеральной совокупности........................................................................................................................... 135

Задачи к теме 9................................................................................................................................................................................................. 137

ЛИТЕРАТУРА...................................................................................................................................................................................................... 141

Приложение 1................................................................................................................................................................................................... 143

Приложение 2................................................................................................................................................................................................... 145

Приложение 3................................................................................................................................................................................................... 146

Приложение 4................................................................................................................................................................................................... 148

Приложение 5................................................................................................................................................................................................... 149

Приложение 6................................................................................................................................................................................................... 151

 

 

Учебное издание

Ниворожкина Людмила Ивановна,
Морозова Зоя Андреевна,
Герасимова Ирина Алексеевна,
Житников Игорь Васильевич

Основы статистики с элементами теории вероятностей для экономистов

Руководство для решения задач

Редактор Е. Г. Гежа
Корректоры Е. Г. Екатеринини, Г. А. Бибикова

Обложка художника С. А. Каштанова

Компьютерный набор и верстка А. Ю. Алейниковой

Лицензия ЛР № 065194 от 02.06.97 г.

Сдано в набор 10.03.99. Подписано в печать 05.04.99.

Формат 84X108 1/32. Бумага газетная. Печать офсетная.
 Гарнитура Школьная.
Усл. печ. л. 16,8. Уч.-изд. л. 13,5.

Тираж 10 000 экз. Заказ № 168

Издательство «ФЕНИКС» 344007, г. Ростов-на-Дону, пер. Соборный, 17.

Отпечатано с готовых диапозитивов в ЗАО «Книга» 344019, г. Ростов-на-Дону, ул. Советская, 57.

 


Учебники «Феникса»

 


Учебники «Феникса»

П. П. Ниворожкина, 3. А. Морозова,
 П. А. Герасимова., П. В. Житников

ОСНОВЫ СТАТИСТИКИ С ЭЛЕМЕНТАМИ ТЕОРИИ ВЕРОЯТНОСТЕЙ ДЛЯ ЭКОНОМИСТОВ

Руководство для решения задач

Рекомендовано

Министерством общего

и профессионального образования

Российской Федерации

в качестве учебного пособия

для студентов

высших учебных заведений,

обучающихся по экономическим

специальностям и направлениям

Ростов-на-Дону «Феникс» 1999

 

УДК 311(075.8)
 ББК 606я73
 Н60


 

Рецензенты:

Заслуженный деятель науки РФ, доктор экономических наук, профессор В. С. Князевский

Кафедра высшей математики Московского государствен­ного института стали и сплавов

Учебно-методический совет по специальности «Статисти­ка» УМО при Московском государственном университете экономики, статистики и информатики

Ниворожкина Л. П., Морозова 3. А.,
 Герасимова И. А., Житников И. В.

   Основы статистики с элементами теории вероят­ностей для экономистов: Руководство для решения задач. — Ростов н/Д: Феникс, 1999. — 320 с. — (Учебники «Феникса»).

ISBN 5-222-00560-7

В пособии кратко и просто изложены основные понятия статисти­ки и теории вероятностей, даны методические указания по решению типовых задач. В конце каждой главы приведены 20 вариантов задач, условия которых приближены к практическим ситуациям в области маркетинга, аудита, финансов и др.

Предназначено для студентов и аспирантов экономических вузов, преподавателей колледжей, вузов, а также для практических работ­ников, желающих научиться использовать современные статистичес­кие методы и их практические приложения при планировании своей деятельности.

 

 

ISBN 5-222-00560-7

©Ниворожкина Л. И., Морозова 3. А.,
 Герасимова И. А., Житников И. В., 1999
 ©Оформление. Издательство «Фе­никс», 1999


ПРЕДИСЛОВИЕ

 

Рыночная экономика существенно повышает тре­бования к качеству подготовки конкурентоспособных выпускников экономических вузов. Для этого необходимо владеть современным инструментари­ем математико-статистического анализа данных. Предлагаемое учебное пособие знакомит читателя с рядом важнейших разделов статистики и теории вероятностей, формирует основы статистического мышления. В пособии переработан и переосмыслен ряд методических подходов, используемых при чте­нии курсов по прикладной статистике и элементар­ной теории вероятностей на экономических факуль­тетах в США и Европе.

В процессе экономического образования математико-статистические дисциплины традиционно считаются наиболее сложными для студентов. Предла­гаемое пособие ставит своей целью помочь тем, кто осваивает эти курсы, особенно в системе заочного образования, понять прикладной, практический смысл проблем, решаемых с помощью статистики, а также помочь самостоятельно выполнить домашние задания по представленным темам.

Каждая глава начинается с краткого изложения основных теоретических понятий и формул. Авто­ры стремились подать этот материал так, чтобы, избегая громоздких математических доказательств, на доступном уровне донести до читателя сложные понятия современной статистики.

Для всех основных типов задач, которые можно решить на базе изложенного теоретического материала, приведены методики их решения, которые не только дают «рецепты» для получения ответов, но, прежде всего, помогают читателю освоить основы ста­тистического вывода при решении различных задач из области практической деятельности. Если чита­тель поймет, для чего необходимо использовать тот или иной статистический метод, ему легче будет ос­воить и его формальный вычислительный алгоритм, увидеть, что полученный результат — не просто чис­ло, а сконцентрированное выражение того, что ис­ходные данные несут в себе об изучаемом явлении.

Для того чтобы процесс обучения носил актив­ный характер, тексты задач максимально прибли­жены к реальным ситуациям в различных облас­тях экономики, таких, как бухгалтерский учет и аудит, финансы, маркетинг и т. д. Решение их по­может понять универсальность статистического ана­лиза как инструмента решения проблем, связанных с риском и неопределенностью.

В книге приведены основные таблицы математи­ческой статистики, необходимые для решения за­дач (приложения 1-6), а также список рекомендуе­мой литературы.

 

 

 

1. ЭЛЕМЕНТЫ КОМБИНАТОРИКИ

Этот материал не относится непосредственно к теории вероятностей и математической статистике, однако необходим в дальнейшем при расчетах ве­роятностей.

Комбинаторика происходит от латинского слова «combinatio» — соединение.

Группы, составленные из каких-либо предме­тов (безразлично каких, например, букв, цветных шаров, кубиков, чисел и т. п.), называются соеди­нениями (комбинациями).

Предметы, из которых состоят соединения, называются элементами.

Различают три типа соединений: размещения, перестановки и сочетания.

1.1. Размещения

Размещениями из п элементов по т в каждом называются такие соединения, из которых каждое содержит т элементов, взятых из числа дан­ных n элементов, и которые отличаются друг от друга либо самими элементами (хотя бы одним), либо лишь порядком их расположения.

Число размещений из п элементов по т в каж­дом обычно обозначается символом Аnm и вычисля­ется по следующей формуле*:


* Выводы формул для числа размещений, а в последующем изложении — для числа сочетаний, опускаются. Их можно найти в курсе элементарной алгебры.

 

1.2. Понятие факториала

Произведение п натуральных чисел от 1 до n обо­значается сокращенно п!, т. е. 1·2·3·...·(n -1)·n= n! (читается: п факториал). Например:

5!=1·2·3·4·5=120.

 

Считается, что 0! = 1.

Используя понятие факториала, формулу (1.1) можно представить так:


где 0 т  n.

Очевидно, что Аn1= п (при m = 1) и Аn0=n (при m= 0).

Пример 1. Правление коммерческого банка вы­бирает из 10 кандидатов 3 человек на различные должности (все 10 кандидатов имеют равные шан­сы). Сколько всевозможных групп по 3 человека можно составить из 10 кандидатов?

Решение. В условии задачи речь идет о расчете числа комбинаций из 10 элементов по 3. Так как

группы по 3 человека могут отличаться и составом претендентов, и заполняемыми ими вакансиями, т. е. порядком, то для ответа необходимо рассчитать число размещений из 10 элементов по 3:

N=А310=10·9·8=720

 

Ответ. Можно составить 720 групп по 3 человека из 10.

1.3. Размещения с повторениями

Размещение с повторениями из n элементов по m(mn) элементов может содержать любой элемент сколько угодно раз от 1 до m включительно, или не содержать его совсем, т. е. каждое размещение с повторениями из n элементов по m элементов мо­жет состоять не только из различных элементов, но из m каких угодно и как угодно повторяющихся элементов.

Соединения, отличающиеся друг от друга хотя бы порядком расположения элементов, считаются различными размещениями.

Число размещений с повторениями из n элемен­тов по m элементов будем обозначать символом Аnm(c повт.) . Можно доказать, что оно равно nm:

 

Аnm(c повт.) =nm               (1.3)

Пример 2. Изменим условие примера 1. Правле­ние коммерческого банка выбирает из 10 кандидатов 3 человек на 3 различные должности. Предпо­ложим, что один и тот же отобранный из 10 претендентов кандидат может занять не только одну, но и 2, и даже все 3 различные вакантные должности. Сколько в данном  случае возможно комбинаций замещения 3 вакантных должностей?

Решение. Как и в предыдущей задаче, комби­нации замещения вакантных должностей могут отличаться и составом претендентов и заполняе­мыми ими вакансиями, т.е. порядком. Следовательно, и в этом случае для ответа на вопрос зада­чи необходимо рассчитать число размещений. Од­нако теперь вакантные должности могут замещать­ся одним и тем же претендентом, а значит, здесь речь идет о расчете числа размещений с повторе­ниями.

По условию задачи п = 10, т = 3. Следователь­но, Аnm=103=1000.

Ответ. Можно составить 1000 комбинаций.

1.4. Сочетания

Сочетаниями из п элементов по m в каждом называются такие соединения, из которых каж­дое содержит т элементов, взятых из числа дан­ных п элементов, и которые отличаются друг от друга по крайней мере одним элементом.

Число сочетаний из п элементов по m в каждом обозначается символом Cnm и вычисляется так:


или


Пример 3. Правление коммерческого банка вы­бирает из 10 кандидатов 3 человек на одинаковые должности (все 10 кандидатов имеют равные шан­сы). Сколько всевозможных групп по 3 человека можно составить из 10 кандидатов?

Решение. Состав различных групп должен отли­чаться по крайней мере хотя бы одним кандидатом и порядок выбора кандидата не имеет значения, сле­довательно, этот вид соединений представляет собой сочетания. По условию задачи п = 10, т = 3. Подставив данные в формулу (1.5), получаем


 

Ответ. Можно составить 120 групп из 3 человек по 10.


Замечание. Надо уметь различать сочетания от раз­мещений. Например: если в группе 25 студентов и 10 человек из них, выйдя из аудитории на перерыв, стоят вместе и беседуют, то порядок, в котором они стоят, несуществен. Число всех возможных групп из 25 человек по 10 в данном случае — сочетания. Если же студенты отправились на перерыве в буфет или в кассу за стипендией, то тогда существенно, в каком, порядке они стали, т. е. кто из них первый, второй и т. д. В этой ситуации при подсчете возможных групп из 25 человек по 10 необходимо состав­лять размещения.

1.5. Сочетания с повторениями

Сочетание с повторениями из n элементов по m (n Î m) элементов может содержать любой элемент сколько угодно раз от 1 до m включительно или не содержать его совсем, т. е. каждое сочетание из n элементов по m элементов может состоять не толь­ко из m различных элементов, но из m каких угод­но и как угодно повторяющихся элементов.

Следует отметить, что если, например, два со­единения по m элементов отличаются друг от друга только порядком расположения элементов, то они не считаются различными сочетаниями.

Число сочетаний с повторениями из n элементов по m будем обозначать символом (Cnm)c повт и вычислять по формуле


Замечание, т может быть и больше n.

Пример 4. Сколькими способами можно выбрать 6 пирожных в кондитерской, где есть 4 разных сорта пирожных?

Решение.


Ответ. Существует 84 различных способа выбора пирожных.

1.6. Перестановки

Перестановками из п элементов называются та­кие соединения, из которых каждое содержит все п элементов и которые отличаются друг от друга лишь порядком расположения элементов.

Число перестановок из п элементов обозначается символом Pn, это то же самое, что число размещений из п элементов по n в каждом, поэтому


Пример 5. Менеджер ежедневно просматривает 6 изданий экономического содержания. Если порядок просмотра изданий случаен, то сколько суще­ствует способов его осуществления?

Решение. Способы просмотра изданий различа­ются только порядком, так как число, а значит, и состав изданий при каждом способе неизменны. Сле­довательно, при решении этой задачи необходимо рассчитать число перестановок.

По условию задачи п = 6. Следовательно,

 

Рn  = 6! =1·2·3·4·5·6 = 720.

Ответ. Можно просмотреть издания 720 способами.

1.7. Перестановки с повторениями

Число перестановок с повторениями выражает­ся формулой


Пример 6. Сколькими способами можно разде­лить т + п + s предметов на 3 группы, чтобы в одной группе было т предметов, в другой n пред­метов, в третьей — s предметов?

Решение.


Задачи к теме 1

1. Во многих странах водительское удостовере­ние (автомобильные права) имеет шифр, состоящий из 3 букв и 3 цифр. Чему равно общее число воз­можных номеров водительских удостоверений, счи­тая, что число букв русского алфавита, используе­мых для составления шифра, — 26, а буквы занима­ют первые 3 позиции шифра? Если шифр состоит только из 6 цифр, то чему в этом случае равно об­щее число всех возможных номеров удостоверений, если: а) цифры в шифре не повторяются; б) повто­ряются?

2. Сколько существует способов составления в случайном порядке списка из 7 кандидатов для выбора на руководящую должность? Какова вероят­ность того, что кандидаты будут расставлены в спис­ке по возрасту (от меньшего к большему)?*

3. Руководство фирмы выделило отделу рекла­мы средства для помещения в печати объявлений о предлагаемых фирмой товарах и услугах. По рас­четам отдела рекламы выделенных средств хватит для того, чтобы поместить объявления только в 15 из 25 городских газет. Сколько существует спосо­бов случайного отбора газет для помещения объяв­лений? Какова вероятность того, что в число отобранных попадут 15 газет, имеющих наибольший ти­раж?*

4. Менеджер рассматривает кандидатуры 8 чело­век, подавших заявления о приеме на работу. Сколько существует способов приглашения кандидатов на собеседование в случайном порядке? Какова ве­роятность того, что они случайно будут приглаше­ны на собеседование в зависимости от времени их прихода в офис?*

5. На железнодорожной станции имеется 5 путей. Сколькими способами можно расставить на них 3 состава? Какова вероятность того, что составы слу­чайно будут расставлены на путях в порядке возрастания их номеров?*

6. Покупая карточку лотереи «Спортлото», иг­рок должен зачеркнуть 6 из 49 возможных чисел от 1 до 49. Если при розыгрыше тиража лотереи он угадает все 6 чисел, то имеет шанс выиграть значительную сумму денег. Сколько возможных комби­наций можно составить из 49 по 6, если порядок чисел безразличен? Чему равна вероятность угадать все 6 номеров?*

7. Четыре человека случайно отбираются из 10 согласившихся участвовать в интервью для выяснения их отношения к продукции фирмы по производ­ству продуктов питания. Эти 4 человека прикреп­ляются к 4 интервьюерам. Сколько существует раз­личных способов составления таких групп? Если выбор случаен, чему равна вероятность прикрепле­ния определенного человека к интервьюеру?*

8. Сколькими способами можно рассадить 5 гос­тей за круглым столом? Какова вероятность того, что гости случайно окажутся рассаженными по ро­сту?*

9. Девять запечатанных пакетов с предложения­ми цены на аренду участков для бурения нефтяных скважин поступили утром в специальное агентство утренней почтой. Сколько существует различных способов очередности вскрытия конвертов с пред­ложениями цены? Какова вероятность того, что конверты случайно окажутся вскрытыми в зависимос­ти от величины предлагаемой за аренду участков цены?*

10. Фирма нуждается в организации 4 новых складов. Ее сотрудники подобрали 8 подходящих одинаково удобных помещений. Сколько существу­ет способов отбора 4 помещений из 8 в случайном порядке? Какова вероятность того, что в число ото­бранных попадут 4 помещения, расположенные в многоэтажных зданиях?*

11. Для разгрузки поступивших товаров менедже­ру требуется выделить 6 из 20 имеющихся рабочих. Сколькими способами можно это сделать, осуще­ствляя отбор в случайном порядке? Какова вероят­ность того, что в число отобранных войдут самые высокие рабочие?*

12. Руководство фирмы может обратиться в 6 туристических агентств с просьбой об организации для своих сотрудников 3 различных туристичес­ких поездок. Сколько существует способов распре­деления 3 заявок между 6 агентствами, если каждое агентство может получить не более одной заявки? Какова вероятность того, что заявки получат агент­ства с наибольшим оборотом, причем, чем крупнее агентство, тем крупнее заявку оно получает?*

13. Для доступа в компьютерную сеть оператору необходимо набрать пароль из 4 цифр. Оператор забыл или не знает необходимого кода. Сколько все­возможных комбинаций он может составить для набора пароля: а) если цифры в коде не повторяют­ся; б) если повторяются? С какой вероятностью мож­но открыть замок с первой попытки?*

14. Сколько существует способов составления списка 20 деловых звонков случайным образом? Какова вероятность того, что список окажется со­ставленным в алфавитном порядке?*

15. На рынке представлено 8 различных пакетов программ для бухгалтерии с приблизительно равными возможностями. Для апробации в своих фи­лиалах фирма решила отобрать 3 из них. Сколько существует способов отбора 3 программ из 8, если отбор осуществлен в случайном порядке? Какова вероятность того, что среди отобранных случайно окажутся 3 программы, занимающие наименьший объем памяти?*

16. Выделены крупные суммы на выполнение 4 крупных правительственных программ, сулящих исполнителям высокую прибыль. Сколько существует способов случайного распределения этих 4 программ между 6 возможными исполнителями? Какова ве­роятность того, что средства на выполнение про­грамм при таком распределении получат 4 испол­нителя, имеющие наибольшую прибыль, причем ве­личина выделяемых средств зависит от величины прибыли исполнителей?*

17. Брокерская фирма предлагает акции различных компаний. Акции 10 из них продаются по наименьшей  среди имеющихся акций цене и обладают одинако­вой доходностью. Клиент собирается приобрести ак­ции 3 таких компаний — по 1 от каждой компании. Сколько существует способов выбора 3 таких ак­ций из 10, если выбор осуществляется в случайном порядке? Какова вероятность того, что в число слу­чайно отобранных попадут акции, рост цен на ко­торые будет наибольшим в следующем году?*

18. Фирмы Fl, F2, F3, F4, F5 предлагают свои условия по выполнению 3 различных контрактов Cl, C2 и СЗ. Любая фирма может получить только один контракт. Контракты различны, т. е. если фирма Fl получит контракт Cl, то это не то же самое, если она получит контракт C2. Сколько спо­собов получения контрактов имеют фирмы? Если предположить равновозможность заключения кон­трактов, чему равна вероятность того, что фирма F3 получит контракт?*

19. По сведениям геологоразведки 1 из 15 участ­ков земли по всей вероятности содержит нефть. Однако компания имеет средства для бурения только 8 скважин. Сколько способов отбора 8 различных скважин у компании? Какова вероятность того, что случайно отобранные для бурения участки окажутся, например, самыми северными?*

20. На 9 вакантных мест по определенной специ­альности претендуют 15 безработных, состоящих на учете в службе занятости. Сколько возможно ком­бинаций выбора 9 из 15 безработных?

* Для вычисления вероятностей здесь и далее ознакомьтесь с материалом гл. 2.

 

2. ЭЛЕМЕНТЫ ТЕОРИИ ВЕРОЯТНОСТЕЙ

2.1. Определение вероятности и свойства, вытекающие из ее определения, классификация событий, диаграммы Венна

Под вероятностью в широком смысле понимают количественную меру неопределенности или число, которое выражает степень уверенности в наступле­нии того или иного случайного события. Напри­мер, нас может интересовать вероятность того, что объем продаж некоторого продукта не упадет, если цены вырастут, или вероятность того, что строи­тельство нового дома завершится в срок.

Случайным называется событие, которое может произойти или не произойти в результате некото­рого испытания. В дальнейшем для простоты мы будем опускать термин «случайный».

Испытание (опыт, эксперимент) — это процесс, включающий определенные условия и приводящий к одному из нескольких возможных исходов. Исхо­дом опыта может быть результат наблюдения или измерения (табл. 2.1).

Единичный, отдельный исход испытания назы­вается элементарным событием.

Случайное событие может состоять из несколь­ких элементарных событий, подразделяющихся на достоверные, невозможные, совместные, несовместные, единственно возможные, равновозможные, противоположные.

Таблица 2.1

Испытание

Исход испытания

Подбрасывание монеты

Контроль качества деталей

Продажа квартиры

Результат футбольного матча

Цифра, герб

Годная, бракованная

Продана, не продана
Победа, проигрыш, ничья

 

Событие, которое обязательно произойдет в ре­зультате испытания, называется достоверным. На­пример, если в урне содержатся только белые шары, то извлечение из нее белого шара есть событие дос­товерное; другой пример, если мы подбросим вверх камень, то он обязательно упадет на землю в силу действия закона притяжения, т. е. результат этого опыта заведомо известен. Достоверные события ус­ловимся обозначать символом W.

Событие, которое не может произойти в резуль­тате данного опыта (испытания), называется не­возможным. Извлечение черного шара из урны с белыми шарами есть событие невозможное; выпадение выигрыша на все номера облигаций в каком-либо тираже выигрышного займа также невозможное событие. Невозможное событие обозначим ø.

Достоверные и невозможные события, вообще го­воря, не являются случайными.

Несколько событий называются совместными, если в результате эксперимента наступление од­ного из них не исключает появления других. Например, при бросании 3 монет выпадение цифры

на одной не исключает появления цифр на других монетах.

В магазин вошел покупатель. События «В мага­зин вошел покупатель старше 60 лет» и «В магазин вошла женщина» — совместные, так как в магазин может войти женщина старше 60 лет.

Несколько событий называются несовместны­ми в данном опыте, если появление одного из них исключает появление других. Например, выигрыш, ничейный исход и проигрыш при игре в шахматы (одной партии) — 3 несовместных события.

События называются единственно возможными, если в результате испытания хотя бы одно из них обязательно произойдет (или 1, или 2, или... или все события из рассматриваемой совокупности со­бытий произойдут; одно точно произойдет). Напри­мер, некая фирма рекламирует свой товар по радио и в газете. Обязательно произойдет одно и только одно из следующих событий: «Потребитель услы­шал о товаре по радио», «Потребитель прочитал о товаре в газете», «Потребитель получил информа­цию о товаре по радио и из газеты», «Потребитель не слышал о товаре по радио и не читал газеты». Эти 4 события единственно возможные.

Несколько событий называются равновозможными, если в результате испытания ни одно из них не имеет объективно большую возможность появления, чем другие. При бросании игральной

кости появление каждой из ее граней — события равновозможные.

Два единственно возможных и несовместных со­бытия называются противоположными. Купля и продажа определенного вида товара есть события противоположные.

Совокупность всех единственно возможных и не­совместных событий называется полной группой событий.

Различные события и действия с ними удобно рассматривать с помощью так называемых диаграмм Венна (по имени английского математика-логика Джона Венна).

Изобразим полную группу событий в виде квад­рата, тогда круг внутри квадрата будет обозначать некоторое событие, скажем. А, а точка - элемен­тарное событие - Е (рис. 2.1).


Рис. 2.1 демонстрирует два противоположных со­бытия А и не А, которые дополняют друг друга до полной группы событий. Противоположное событие обозначается Ā.

Пересечение А и В (обозначается как А Ç В) есть набор, содержащий все элементы, которые являются членами и А и В (рис. 2.2).

 


Рис. 2.2

Объединение А и В (обозначается A È В) есть набор, содержащий все элементы, которые являются членами или А, или В, или А и В вместе.

Полную группу можно определить так:


тогда {А1, А2, ..., Аn} — полная группа событий.

Вероятностью появления события А называют отношение числа исходов, благоприятствующих наступлению этого события, к общему числу всех единственно возможных и несовместных элемен­тарных исходов.

Обозначим число благоприятствующих событию А исходов через М, а число всех исходов — N:

P(A)=M/N,             (2.1)

где М — целое неотрицательное число, 0 £ М £  N.

Другой тип объективной вероятности определя­ется исходя из относительной частоты (частости) появления события. Например: если некоторая фирма в течение времени провела опрос 1 000 покупателей нового сорта напитка и 20 из них оценили его как вкусный, то мы можем оценить вероятность того, что потребителям понравится новый напиток как 20/1 000 = 0,02. В этом примере 20 — это час­тота наступления события, а 20/1 000 = 0,02 — это относительная частота.

Относительной частотой события называется от­ношение числа испытаний т, при которых собы­тие появилось, к общему числу проведенных ис­пытаний п.

 

W(A) == т/п            (2.2)

где т — целое неотрицательное число, 0 £ т£  п.

Статистической вероятностью события А назы­вается относительная частота (частость) этого со­бытия, вычисленная по результатам большого числа испытаний. Будем обозначать ее Р*(А). Сле­довательно,


При очень большом числе испытаний статисти­ческая вероятность приближенно равна классичес­кой вероятности, т. е.


Для определения вероятности выпадения 1 или 2 при подбрасывании кости нам необходимо только знать «модель игры», в данном случае — кость с 6 гранями. Мы можем определить наши шансы теоретически, без подбрасывания кости, это априорная (доопытная) вероятность. Во втором примере мы мо­жем определить вероятность только по результатам опыта, это — апостериорная (послеопытная) веро­ятность. То есть классическая вероятность — апри­орная, а статистическая — апостериорная.

Какой бы вид вероятности ни был выбран, для их вычисления и анализа используется один и тот же набор математических правил.

Свойства вероятности, вытекающие из классического определения.

1. Вероятность достоверного события равна 1, т. е. P(W) =1.

Действительно, если событие А = W, то М = N, значит,

Р(W) = N/N = 1.

2. Если событие невозможное, то его вероятность равна 0, т. е.

Р(Æ)= 0.

Если А = Æ, то оно не осуществится ни при од­ном испытании, т. е.

М = 0 и Р(Æ) = 0/N = 0.

3. Вероятность случайного события есть поло­жительное число, заключенное между 0 и 1.

В самом деле, так как 0£ M £ N, 0£ M/N £ 1, т. е. 0 £ Р(А) £ 1.

4. Сумма вероятностей противоположных собы­тий равна 1, т. е. Р(А) + Р(А) = 1. В самом деле,

Р(А) = (N - M)/N = 1 - M/N = 1 - P(A), следовательно,

Р(А)+Р(А)=1.             (2.3)

Например, если вероятность извлечения туза из колоды, состоящей из 52 карт, равна 4/52, то вероятность извлечения карты, не являющейся тузом, равна

1 - 4/52 = 48/52

Пример 1. Магазин в целях рекламы нового товара проводит лотерею, в которой 1 главный приз, 5 вторых, 100 — третьих и 1 000 — чет­вертых. В конце рекламного дня выяснилось, что лотерейные билеты получили 10 000 покупателей. По правилам розыгрыша после извлечения выигрышного билета он возвращается в урну, и поку­патель не может получить более одного выигрыша. Чему равна вероятность того, что покупатель, который приобрел рекламируемый товар: а) вы­играет 1-й приз; б) выиграет хотя бы 1 приз; в) не выиграет ни одного приза?

Решение, а) Определим событие А: «Покупатель выиграл 1-й приз». Согласно условию задачи, в лотерее участвовало 10 000 покупателей, отсюда общее число испытаний N = 10 000, а число исходов, благо­приятствующих событию А, М = 1. Все исходы явля­ются равновозможными, единственно возможными и несовместными элементарными событиями. Следо­вательно, по формуле классической вероятности:

б) определим событие В: «Покупатель выиграл хотя бы 1 приз». Для этого события число благоприятствующих исходов

М = 1 + 5 +100 + 1 000 = 1 106. P(B) = M/N = 1106/10 000 = 0,1106;

в) событие «Покупатель не выиграет ни одного при­за» — противоположное событию В: «Покупатель вы­играет хотя бы один приз», поэтому обозначим его как  . По формуле (2.3) найдем

Р(В) =1- Р(В) = 1 - 0,1106 = 0,8894 .

Ответ. Вероятность того, что покупатель выигра­ет 1-й приз равна 0,0001, один приз — 0,1106, не выиграет ни одного приза — 0,8894.

Пример 2. Структура занятых в региональном отделении крупного банка имеет следующий вид (табл. 2.2):

Таблица 2.2

Структура

Женщины

Мужчины

Администрация

25

15

Операционисты

35

25

 

Если один из служащих выбран случайным об­разом, то какова вероятность, что он: а) мужчина-администратор; б) женщина-операционист; в) муж­чина; г) операционист?

Решение.

а) В банке работают 100 человек, N = 100.

Из них 15 - мужчины-администраторы, М = 15. следовательно,

Р(мужчина-администратор) = 15/100 = 0,15.

б) 35 служащих в банке - женщины-операцио­нисты, следовательно,

P(женщина-операционист) == 35/100 = 0,35.

в) 40 служащих в банке - мужчины, следова­тельно,

Р(мужчина) = 40/100 = 0,40.

г) Из общего числа служащих в банке 60 - операционисты, следовательно,

P(операционист) = 60/100= 0,60.

 

2.2. Правила сложения и умножения вероятностей. Зависимые и независимые события

Вероятность суммы двух событий равна сумме вероятностей этих событий без вероятности их со­вместного наступления

Р(А + В) = Р(А) + Р(В) - Р(АВ),       

или                                                                     (2.4)

Р(А È В) - Р(А) + Р(В) - Р(А Ç В).

Для несовместных событий их совместное на­ступление есть невозможное событие, а вероятность его равна нулю, следовательно, вероятность сум­мы двух несовместных событий равна сумме вероятностей этих событий.


или                                                                  (2.5)

Р(А È В) = Р(А) + Р(В).

Правило сложения вероятностей справедливо и для конечного числа п попарно несовместных событий


В случае нескольких совместных событий необ­ходимо по аналогии с рассуждениями о пересечении двух совместных событий исключить повтор­ный учет областей пересечения событий. Рассмот­рим три совместных события (рис. 2.3).


Рис. 2.3

Для случая трех совместных событий можно записать

Р(А + В + С) = Р(А) + Р(В) + Р(С) - Р(АВ)-  Р(АС) - Р(ВС) + Р(АВС).

Сумма вероятностей событий А1, А2, А3 , ..., Аn, образующих полную группу, равна 1

Р(А1) + Р(А2) + Р(А3) + ... + Р(Аn) = 1.

или

 


Пример 3. Компания производит 40 000 холо­дильников в год, которые реализуются в различ­ных регионах России. Из них 10 000 экспортиру­ются в страны СНГ, 8 000 продаются в регионах Европейской части России, 7 000 продаются в стра­ны дальнего зарубежья, 6 000 в Западной Сибири, 5000 в Восточной Сибири, 4 000 в Дальневосточ­ном районе. Чему равна вероятность того, что определенный холодильник будет: а) произведен на эк­спорт; б) продан в России?

Решение. Обозначим события:

А - «Холодильник будет продан в странах СНГ»;

В - «Холодильник будет продан в Европейской части России»;

С - «Холодильник будет продан в страны даль­него зарубежья»;

D - «Холодильник будет продан в Западной Си­бири»;

Е — «Холодильник будет продан в Восточной Сибири»;

F «Холодильник будет продан в Дальневосточ­ном районе».

Соответственно, вероятность того, что холодиль­ник будет продан в странах СНГ:

Р(А) = 10000/40000 =0,25;

вероятность того, что холодильник будет продан в Европейской части России:

Р(В) = 8 000/40 000 = 0,20;

вероятность того, что холодильник будет продан в страны дальнего зарубежья:

Р(С) = 7 000/40 000 = 0,175;

вероятность того, что холодильник будет продан в Западной Сибири;

Р(D) = 6 000/40 000 = 0,15;

вероятность того, что холодильник будет продан в Восточной Сибири:

 

Р(Е) = 5 000/40 000 = 0,125;

вероятность того, что холодильник будет продан на Дальнем Востоке:

P(F) = 4 000/40 000 =0,10. События А, В, С, D, Е, F несовместные.

1) Событие, состоящее в том, что холодильник произведен на экспорт, означает, что холодильник будет продан или в страны СНГ, или в страны даль­него зарубежья. Отсюда по формуле (2.5) находим его вероятность:

Р(холодильник произведен на экспорт) = Р(А + В) = Р(А) + Р(В) = 0,25 + 0,175 = 0,425.

2) Событие, состоящее в том, что холодильник будет продан в России, означает, что холодильник будет продан или в Европейской части России, или в Западной Сибири, или в Восточной Сибири, или на Дальнем Востоке. Отсюда по формуле (2.6) нахо­дим его вероятность:

Р(холодильник будет продан в России)  = Р(А +D+E+ F) = Р(В) + P(D) + Р(Е) + P(F) = 0,20 + 0,15 + +0,125 + 0,10 = 0,575.

Этот же результат можно было получить рассуж­дая по-другому. События «Холодильник произве­ден на экспорт» и «Холодильник будет продан в России» — два взаимно противоположных события, отсюда по формуле (2.3):

Р(холодильник будет продан в России) = 1 - Р(холодильник произведен на экспорт)  = 1 - 0,425 = =0,575.

 

Пример 4. Опыт состоит в случайном извлече­нии карты из колоды в 52 карты. Чему равна вероятность того, что это будет или туз, или карта масти треф?

Решение. Определим события: А — «Извлече­ние туза», В — «Извлечение карты трефовой мас­ти». Вероятность извлечения туза из колоды карт Р(А) = 4/52; вероятность извлечения карты трефо­вой масти — Р(В) = 13/52; вероятность их пересече­ния — извлечение трефового туза - Р(АВ) = 1/52 (рис. 2.4).


События А и В — совместные, поскольку в коло­де есть трефовый туз.

Согласно условию задачи, нас интересует веро­ятность суммы совместных событий А и. В. По формуле (2.4) получим

     Р(А + В) = Р(А) + Р(В) - Р(АВ) = 4/52 + 13/52 - 1/52 = 16/52 = 1/2.

Пример 5. В урне 2 белых и 3 черных шара. Чему равна вероятность появления белого шара: а) при 1-м извлечении из урны; б) при 2-м извлечении из урны?

Решение. Здесь возможны 2 случая.

1-й случай. Схема возвращенного шара, т. е. шар после 1-го извлечения возвращается в урну.

Пусть событие А — «Появление белого шара при 1-м извлечении», так как N = 5, а М = 2, то Р(А) = 2/5.

Пусть событие В — «Появление белого шара при 2-м извлечении», так как шар после 1-го извлечения возвратился в урну, то N=5,а М=2 и Р(В) = 2/5.

Таким образом, вероятность каждого из событий не зависит от того, произошло или не произошло другое событие. События А и В в этом случае явля­ются независимыми.

Итак, события А и В называются независимы­ми, если вероятность каждого из них не зависит от того, произошло или нет другое событие.

Вероятности независимых событий называют­ся безусловными.

2-й случай. Схема невозвращенного шара, т. е. шар после 1-го извлечения в урну не возвращается.

Вероятность появления белого шара при 1-м извлечении Р(А) = 2/5. Белый шар в урну не возвращается, следовательно, в урне остались 1 бе­лый и 3 черных шара. Чему равна вероятность события В при условии, что событие А произошло? N = 4, М = 1.

Искомую вероятность обозначают Р(В/А) или Р(В)A или РA(В). Итак, Р(В/А) = 1/4 называют ус­ловной вероятностью, а события А, В — зависимыми. В предыдущем примере с картами Р(А) = 4/52;
Р(А/В) =
4/16.

Например, тот факт, что человек работает науч­ным сотрудником, не является независимым от наличия у него высшего образования; событие, состо­ящее в том, что станок может выйти из строя, не является независимым от срока его эксплуатации; событие, состоящее в том, что цена акций компа­нии пошла вверх, не является независимым от того с прибылью или с убытком сработала компания в прошлом периоде; и т. д.

Таким образом, события А и В называются за­висимыми, если вероятность каждого из них зависит от того произошло или нет другое событие. Вероятность события В, вычисленная в предполо­жении, что другое событие А уже осуществилось, называется условной вероятностью.

Вероятность произведения двух независимых со­бытий А и В равна произведению их вероятностей

Р(А В) = Р(А)Р(В),       

или                     (2.8)

Р(А Ç В) = Р(А)Р(В).

События А1, А2, ..., Аn (п > 2) называются неза­висимыми в совокупности, если вероятность каждого из них не зависит от того, произошли или нет любые события из числа остальных.

Распространим теоремы умножения на случаи п независимых и зависимых в совокупности событий.

 

 Вероятность совместного появления нескольких событий, независимых в совокупности, равна про­изведению вероятностей этих событий

Р(А1·А2·А3·...·Аn) = Р(А1)·Р(А2)·Р(А3)·...·Р(Аn).   (2.9)

 

Вероятность произведения двух зависимых со­бытий А и В равна произведению вероятности од­ного из них на условную вероятность другого


Вероятность события В при условии появления события А


Вероятность совместного наступления конечного числа n зависимых событий равна произведению вероятности одного из них на условные вероятно­сти всех остальных, причем условная вероятность каждого последующего события вычисляется в предположении, что все предыдущие уже наступили


Если события А1 , А2 ,..., Аn зависимые в со­вокупности, то вероятность наступления хотя бы одного из них равна


Вероятность появления хотя бы одного собы­тия из п независимых в совокупности равна разности между 1 и произведением вероятностей со­бытий, противоположных данным,


Пример 6. Консультационная фирма претендует на 2 заказа от 2 крупных корпораций. Эксперты фирмы считают, что вероятность получения кон­сультационной работы в корпорации А равна 0,45. Эксперты также полагают, что если фирма получит заказ у корпорации А, то вероятность того, что и корпорация В обратится к ним, равна 0,9. Какова вероятность того, что консультационная фирма получит оба заказа?

Решение. Обозначим события:

А — «Получение консультационной работы в кор­порации А»;

В — «Получение консультационной работы в кор­порации В».

События А и В — зависимые, так как событие В зависит от того, произойдет или нет событие А.

По условию мы имеем Р(А) = 0,45, а также зна­ем, что Р(В/А) = 0,9.

Необходимо найти вероятность того, что оба со­бытия (и событие А, и событие В) произойдут, т.е. Р(АВ). Для этого используем правило умножения вероятностей (2.10).

Отсюда получим

Р(АВ) = Р(А)Р( B/А) = 0,45 · 0,9 = 0,405.

Пример 7. В большой рекламной фирме 21% ра­ботников получают высокую заработную плату. Из­вестно также, что 40% работников фирмы — жен­щины, а 6,4% работников — женщины, получающие высокую заработную плату. Можем ли мы ут­верждать, что на фирме существует дискримина­ция женщин в оплате труда?

Решение. Сформулируем условие этой задачи в терминах теории вероятностей. Для ее решения не­обходимо ответить на вопрос: «Чему равняется ве­роятность того, что случайно выбранный работник будет женщиной, имеющей высокую заработную плату?» и сравнить ее с вероятностью того, что наудачу выбранный работник любого пола имеет вы­сокую зарплату.

Обозначим события:

А — «Случайно выбранный работник имеет вы­сокую зарплату»;

В — «Случайно выбранный работник — женщина». События А и В — зависимые. По условию

Р(АВ) = 0,064; Р(В) = 0,40; Р(А) = 0,21.

Нас интересует вероятность того, что наудачу выб­ранный работник имеет высокую зарплату при условии, что это женщина, т. е. — условная вероят­ность события А.

Тогда, используя теорему умножения вероятностей, получим

Р(А/В) = Р(АВ)/Р(В) = 0,064/0,40 = 0,16.

Поскольку Р(А/В) = 0,16 меньше, чем Р(А) = 0,21, то мы можем заключить, что женщины, работающие в рекламной фирме, имеют меньше шансов получить высокую заработную плату по сравнению с мужчинами.

Пример 8. Студент пришел на экзамен, изучив только 20 из 25 вопросов программы. Экзаменатор задал студенту 3 вопроса. Вычислить вероятность того, что студент ответит: а) на все 3 вопроса; б) хотя бы на 1 вопрос.

Решение. Обозначим события:

А — «Студент знает все 3 вопроса»;

А1 — «Студент знает 1-й вопрос»;

А2 «Студент знает 2-й вопрос»;

А3 — «Студент знает 3-й вопрос».

По условию

Р(А1) = 20/25; Р(А21) = 19/24; Р(А3,/А2A1) = 18/23.

1) Искомое событие А состоит в совместном на­ступлении событий А1, А2, А3.

События А1, А2, A3 — зависимые.

Для решения задачи используем правило умно­жения вероятностей конечного числа п зависимых событий (2.10):

Р(А) = (20/25)(19/24)(18/23) = 57/115 = 0,496.

Вероятность того, что студент ответит на все 3 вопроса, равна 0,496.

2) Обозначим событие:

В — «Студент ответит хотя бы на один вопрос». Событие В состоит в том, что произойдет или со­бытие А1, а события А2 и А3 — не произойдут, или произойдет событие А2, а события А1 и A3 — не произойдут, или произойдет событие А3 , а события А1 и А2 — не произойдут, или произойдут события А1 и А2 ,а событие A3 — не произойдет, или произойдут события А1 и А3, а событие А2 — не произойдет, или произойдут события А2 и А3 , а событие А1 — не про­изойдет, или произойдут все три ,события А1, А2, А3.

Для решения этой задачи можно было бы исполь­зовать правила сложения и умножения вероятностей. Однако здесь проще применить правило для вероятности наступления хотя бы одного из n зависимых событий (2.13).

Учитывая, что


получим

Р(В) = 1 - (5/25)(4/24)(3/23) = 229/230 = 0,9957.

Вероятность того, что студент ответит хотя бы на один вопрос, равна 0,9957.

Пример 9. Вероятность того, что потребитель уви­дит рекламу определенного продукта по телевиде­нию, равна 0,04. Вероятность того, что потребитель увидит рекламу того же продукта на рекламном стенде, равна 0,06. Предполагается, что оба собы­тия — независимы. Чему равна вероятность того, что потребитель увидит: а) обе рекламы; б) хотя бы одну рекламу?

Решение. Обозначим события:

А — «Потребитель увидит рекламу по телевиде­нию»;

    В — «Потребитель увидит рекламу на стенде»;

С — «Потребитель увидит хотя бы одну рекламу». Это значит, что потребитель увидит рекламу по

телевидению, или на стенде, или по телевидению и на стенде. По условию

Р(А) = 0,04; Р(В) = 0,06.

 

        События А и. В — совместные и независимые.

а) Поскольку вероятность искомого события есть вероятность совместного наступления независимых событий А и В (потребитель увидит рекламу и по телевидению и на стенде), т. е. их пересечения, для решения задачи используем правило умножения вероятностей для независимых событий.

Отсюда

Р(АВ) = Р(А) · Р(В) = 0,04 · 0,06 = 0,0024.

Вероятность того, что потребитель увидит обе рек­ламы, равна 0,0024.

б) Так как событие С состоит в совместном на­ступлении событий А и В, искомая вероятность может быть найдена с помощью правила сложения вероятностей.

Р(С) = Р(А + В) = Р(А) + Р(В) - Р(АВ) = = 0,04 + 0,06 - 0,0024 = 0,0976.

Вместе с тем, при решении этой задачи может быть использовано правило о вероятности наступ­ления хотя бы одного из п независимых событий.

Учитывая, что



Вычисление вероятностей событий такого типа характеризует эффективность рекламы, поскольку эта вероятность может означать долю (процент) на­селения, охватываемого ею, и отсюда следует оцен­ка рекламных усилий.

Задачи к теме 2

1. Анализ работы кредитного отдела банка выя­вил, что 12% фирм, бравших кредит в банке, обанкротились и не вернут кредиты по крайней мере в течение 5 лет. Также известно, что обанкротились 20% кредитовавшихся в банке фирм. Если один из клиентов банка обанкротился, то чему равна веро­ятность того, что он окажется не в состоянии вер­нуть долг банку?

2. Модельер, разрабатывающий новую коллек­цию одежды к весеннему сезону, создает модели в зеленой, черной и красной цветовой гамме. Вероят­ность того, что зеленый цвет будет в моде весной, модельер оценивает в 0,3, что черный — в 0,2, а вероятность того, что будет моден красный цвет — в 0,15. Предполагая, что цвета выбираются незави­симо друг от друга, оцените вероятность того, что цветовое решение коллекции будет удачным хотя бы по одному из выбранных цветов.

3. Вероятность того, что потребитель увидит рек­ламу определенного продукта по каждому из 3 центральных телевизионных каналов, равна 0,05. Пред­полагается, что эти события — независимы в сово­купности. Чему равна вероятность того, что потреби­тель увидит рекламу: а) по всем 3 каналам; б) хотя бы по 1 из этих каналов?

4. Торговый агент предлагает клиентам иллюс­трированную книгу. Из предыдущего опыта ему известно, что в среднем 1 из 65 клиентов, кото­рым он предлагает книгу, покупает ее. В течение некоторого промежутка времени он предложил кни­гу 20 клиентам. Чему равна вероятность того, что он продаст им хотя бы 1 книгу? Прокомментируйте предположения, которые вы использовали при решении задачи.

5. В налоговом управлении работает 120 сотруд­ников, занимающих различные должности.

Все

сотрудники

Руководители

Рядовые сотрудники

Итого

Мужчины

29

67

96

Женщины

4

20

24

Итого

33

87

120

 

На профсоюзном собрании женщины заявили о дискриминации при выдвижении на руководящие должности. Правы ли они?

6. В фирме 550 работников, 380 из них имеют высшее образование, а 412 — среднее специальное образование, у 357 высшее и среднее специальное образование. Чему равна вероятность того, что случайно выбранный работник имеет или среднее специ­альное, или высшее образование, или и то и другое?

7. Финансовый аналитик предполагает, что если норма (ставка) процента упадет за определенный период, то вероятность того, что рынок акций бу­дет расти в это же время, равна 0,80. Аналитик также считает, что норма процента может упасть за этот же период с вероятностью 0,40. Используя полученную информацию, определите вероятность того, что рынок акций будет расти, а норма процента падать в течение обсуждаемого периода.

8. Вероятность для компании, занимающейся строительством терминалов для аэропортов, полу­чить контракт в стране А равна 0,4, вероятность выиграть его в стране В равна 0,3. Вероятность того, что контракты будут заключены и в стране А, и в стране В, равна 0,12. Чему равна вероятность того, что компания получит контракт хотя бы в одной стране?

9. Город имеет 3 независимых резервных источ­ника электроэнергии для использования в случае аварийного отключения постоянного источника электроэнергии. Вероятность того, что любой из 3 резервных источников будет доступен при отклю­чении постоянного источника, составляет 0,8. Ка­кова вероятность того, что не произойдет аварий­ное отключение электроэнергии, если выйдет из строя постоянный источник?

10. Покупатель может приобрести акции 2 ком­паний А и В. Надежность 1-й оценивается экспер­тами на уровне 90%, а 2-й — 80%. Чему равна вероятность того, что: а) обе компании в течение года не станут банкротами; б) наступит хотя бы одно банк­ротство?

11. Стандарт заполнения счетов, установленный фирмой, предполагает, что не более 5% счетов будут заполняться с ошибками. Время от времени компа­ния проводит случайную выборку счетов для про­верки правильности их заполнения. Исходя из того, что допустимый уровень ошибок — 5% и 10 счетов отобраны в случайном порядке, чему равна вероят­ность того, что среди них нет ошибок?

12. На сахарном заводе один из цехов произво­дит рафинад. Контроль качества обнаружил, что 1 из 100 кусочков сахара разбит. Если вы случайным образом извлекаете 2 кусочка сахара, чему равна вероятность того, что, по крайней мере, 1 из них будет разбит? Предполагаем независимость событий, это предположение справедливо вследствие случай­ности отбора.

13. Эксперты торговой компании полагают, что покупатели, обладающие пластиковой карточкой этой компании, дающей право на скидку, с 90%-й вероятностью обратятся за покупкой определенного ассортимента товаров в ее магазины. Если это прои­зойдет, обладатель пластиковой карточки приобретет необходимый ему товар в магазинах этой компании с вероятностью 0,8. Какова вероятность того, что об­ладатель пластиковой карточки торговой компании приобретет необходимый ему товар в ее магазинах?

14. Аудиторская фирма размещает рекламу в жур­нале «Коммерсант». По оценкам фирмы 60% людей, читающих журнал, являются потенциальными клиентами фирмы. Выборочный опрос читателей журнала показал также, что 85% людей, которые читают журнал, помнят о рекламе фирмы, помещенной в конце журнала. Оцените, чему равен процент людей, которые являются потенциальными клиен­тами фирмы и могут вспомнить ее рекламу?

15. В городе 3 коммерческих банка, оценка на­дежности которых — 0,95, 0,90 и 0,85 соответственно. В связи с определением хозяйственных перс­пектив развития города администрацию интересу­ют ответы на следующие вопросы: а) какова веро­ятность того, что в течение года обанкротятся все 3 банка; б) что обанкротится хотя бы 1 банк?

16. О двух акциях А и В известно, что они выпу­щены одной и той же отраслью. Вероятность того, что акция А поднимется завтра в цене, равна 0,2. Вероятность того, что обе акции А и В поднимутся завтра в цене, равна 0,12. Предположим, что вы знаете, что акция А поднимется в цене завтра. Чему равна вероятность того, что и акция В завтра под­нимется в цене?

17. Инвестор предполагает, что в следующем пе­риоде вероятность роста цены акций компании N будет составлять 0,7, а компании М — 0,4. Вероят­ность того, что цены поднимутся на те и другие акции, равна 0,28. Вычислите вероятность их рос­та или компании N, или компании М, или обеих компаний вместе.

18. Крупная торговая компания занимается оп­товой продажей материалов для строительства и ремонта жилья и, имея список покупателей в 3 ре­гионах, основанный на ее собственной системе ко­дов, рассылает им по почте каталог товаров. Ме­неджер компании полагает, что вероятность того, что компания не получит откликов на разосланные предложения ни из одного региона, равна 0,25. Чему в этом случае равна вероятность того, что компа­ния получит ответ хотя бы из одного региона?

19. Секрет увеличения доли определенного това­ра на рынке состоит в привлечении новых потребителей и их сохранении. Сохранение потребителей то­вара («brand loyalty» — приверженность потребите­ля к данной марке или разновидности товара) — одна из наиболее ответственных областей рыночных ис­следований. Производители нового сорта духов зна­ют, что вероятность того, что потребители сразу примут новый продукт и создание «brand loyalty» потребует, по крайней мере, 6 месяцев, равна 0,02. Производитель также знает, что вероятность того, что случайно отобранный потребитель примет но­вый сорт, равна 0,05. Предположим, потребитель только что приобрел новый сорт духов (изменил марку товара). Чему равна вероятность того, что он сохранит свои предпочтения в течение 6 месяцев?

20. Вероятность того, что покупатель, собираю­щийся приобрести компьютер и пакет прикладных программ, приобретет только компьютер, равна 0,15, только пакет программ — 0,1. Вероятность того, что будет куплен и компьютер, и пакет программ, равна 0,05. Чему равна вероятность того, что будет куплен или компьютер, или пакет программ, или компьютер и пакет программ вместе?

 

3. ФОРМУЛЫ ПОЛНОЙ ВЕРОЯТНОСТИ И БАЙЕСА

Часто мы начинаем анализ вероятностей, имея предварительные, априорные значения вероятнос­тей интересующих нас событий. Затем из источни­ков информации, таких как выборка, отчет, опыт и т. д., мы получаем дополнительную информацию об интересующем нас событии. Имея эту новую информацию, мы можем уточнить, пересчитать зна­чения априорных вероятностей. Новые значения вероятностей для тех же интересующих нас собы­тий будут уже апостериорными (послеопытными) вероятностями. Теорема Байеса дает нам правило для вычисления таких вероятностей.

Последовательность процесса переоценки вероят­ностей можно схематично изобразить так:


Пусть событие А может осуществиться лишь вме­сте с одним из событий Н1, Н2, H3, ..., Hn, образующих полную группу. Пусть известны вероятности Р(Н1), Р(Н2), ..., Р(Нi), ..., Р(Нn). Так как события Нi образуют полную группу, то


а также известны и условные вероятности события А:


Так как заранее неизвестно, с каким из событий Нi произойдет событие А, то события Нi, называют гипотезами.

Необходимо определить вероятность события А и переоценить вероятности событий Нi с учетом полной информации о событии А.

Вероятность события А определяется как


Эта вероятность называется полной вероятностью. Если событие А может наступить только вмес­те с одним из событий Н123, ..., Нn, образую­щих полную группу несовместных событий и на­зываемых гипотезами, то вероятность события А равна сумме произведений вероятностей каждого из событий Н1, Н2, ..., Нn на соответствующую ус­ловную вероятность события А.              

Условные вероятности гипотез вычисляются по формуле


или


Это — формулы Байеса (по имени английского математика Т.Байеса, опубликовавшего их в 1764 г.), выражение в знаменателе — формула полной вероятности.

Пример 1. Предприятие, производящее компью­теры, получает одинаковые ЧИПы от 2 поставщиков. 1-й поставляет 65% ЧИПов, 2-й — 35%. Изве­стно, что качество поставляемых ЧИПов разное. На основании предыдущих данных о рейтингах каче­ства составлена табл. 3.1.

Таблица 3.1

Поставщик

 

% качественной продукции

 

% брака

 

1-й поставщик
2-й поставщик

 

98
95

 

2
5

 

 

Предприятие осуществляет гарантийный ремонт компьютеров. Имея данные о числе компьютеров, поступающих на гарантийный ремонт в связи с не­исправностью ЧИПов, переоцените вероятности того, что возвращенный для ремонта компьютер укомп­лектован ЧИПом: а) от 1-го поставщика; б) от 2-го поставщика.

Решение задач с использованием формул пол­ной вероятности и Байеса удобнее оформлять в виде табл. 3.2.

Таблица 3.2

Гипотезы

Нi

Вероятности

априорные Р(Нi)

условные Р(А/Нi)

совместные Р(Нi  Ç А)

апостериорные Р(Нi/А)

1

2

3

4

5

 

Шаг 1. В колонке 1 перечисляем события, кото­рые задают априорную информацию в контексте решаемой проблемы: Соб. Н1 ЧИП от 1-го постав­щика; Соб. Н2 — ЧИП от 2-го поставщика. Это — гипотезы и они образуют полную группу независи­мых и несовместных событий.

В колонке 2 записываем вероятности этих событий:

Р(Н1) = 0,65, Р(Н2) = 0,35.

В колонке 3 определим условные вероятности со­бытия А — «ЧИП бракованный» для каждой из

гипотез.

Шаг 2. В колонке 4 находим вероятности для со­бытий «ЧИП от 1-го поставщика и он бракованный» и «ЧИП от 2-го поставщика и он бракованный». Они определяются по правилу умножения вероятностей путем перемножения значений колонок 2 и 3. По­скольку сформулированные события являются ре­зультатом пересечения двух событий А и Нi, то их вероятности называют совместными:

Р(Нi Ç А) = Р(Нi)Р(А/Нi).

Шаг 3. Суммируем вероятности в колонке 4 для того, чтобы найти вероятность события А. В нашем примере 0,0130 — вероятность поставки некачествен­ного ЧИПа от 1-го поставщика, 0,0175 — вероятность поставки некачественного ЧИПа от 2-го постав­щика. Поскольку, как мы уже сказали выше, ЧИПы поступают только от 2 поставщиков, то сумма вероятностей 0,0130 и 0,0175 показывает, что 0,0305 есть вероятность бракованного ЧИПа в общей поставке, определяемая с помощью формулы (3.1)


Шаг 4. В колонке 5 вычисляем апостериорные вероятности, используя формулу (3.2):


Заметим, что совместные вероятности находятся в строках колонки 4, а вероятность события А как сумма колонки 4 (табл. 3.3).

Таблица 3.3

Гипотезы

Нi

 

Вероятности

априорные
Р(Нi)

 

Условные
 Р(А/Нi)

 

Совместные
Р(Нi Ç А)

 

апостериорные Р(Нi/А)

 

1

 

2

 

3

 

4

 

5

 

ЧИП от 1-го постав­щика

 

0,65

 

0,02

 

0,0130

 

0,426

 

ЧИП от 2-го постав­щика

0,35

0,05

0,0175

0,574

å

 

å=1

 

 

 

P(A)=0,0305

 

å=l

 

 

Пример 2. Экономист полагает, что вероятность роста стоимости акций некоторой компании в следующем году будет равна 0,75, если экономика стра­ны будет на подъеме; и эта же вероятность будет равна 0,30, если экономика страны не будет успеш­но развиваться. По его мнению, вероятность экономического подъема в новом году равна 0,80. Ис­пользуя предположения экономиста, оцените вероятность того, что акции компании поднимутся в цене в следующем году.

Решение. Определим события:

А — «Акции компании поднимутся в цене в бу­дущем году».

Событие А может произойти только вместе с од­ной из гипотез:

Н1 — «Экономика страны будет на подъеме»;

Н2 «Экономика страны не будет успешно развиваться».

По условию известны вероятности гипотез:

Р(Н1) = 0,80; Р(Н2) = 0,20 и условные вероятности события А:

Р(А/Н1)= 0,75; Р(А/Н2)= 0,30.

Гипотезы образуют полную группу, сумма их вероятностей равна 1. Рассмотрим событие А — это или Н1А, или Н2А. События Н1А и Н2А — несовместные попарно, так как события Н1 и Н2

несовместны.

События Н1 и А, Н2 и А — зависимые. Вышеизложенное позволяет применить для оп­ределения искомой вероятности события А форму­лу полной вероятности

 

Р(А) = Р(Н1)Р(А/Н1) + Р(Н2)Р(А/Н2) = == 0,80 · 0,75 + 0,20 · 0,30 = 0,66.

Решение оформим в виде табл. 3.4.

Таблица 3.4

Гипотезы Нi

Р(Нi)

Р(А/Нi)

Р(Нi)Р(А/Нi)

Н1 «подъем экономики»

0,80

0,75

0,60

Н2 «спад экономики»

0,20

0,30

0,06

å

1,00

 

0,66

 

Вероятность того, что акции компании поднимут­ся в цене в следующем году, составляет 0,66. Ответ. 0,66.

Пример 3. Экономист полагает, что в течение периода активного экономического роста американ­ский доллар будет расти в цене с вероятностью 0,70, в период умеренного экономического роста он по­дорожает с вероятностью 0,40 и при низких темпах экономического роста доллар подорожает с вероят­ностью 0,20. В течение любого периода времени ве­роятность активного экономического роста — 0,30;

умеренного экономического роста — 0,50 и низко­го роста — 0,20. Предположим, что доллар дорожа­ет в течение текущего периода. Чему равна вероят­ность того, что анализируемый период совпал с пери­одом активного экономического роста?

Решение. Определим события:

А — «Доллар дорожает». Оно может произойти только вместе с одной из гипотез:

Н1 — «Активный экономический рост»;

Н2 «Умеренный экономический рост»;

Н3 «Низкий экономический рост». По условию известны доопытные (априорные) ве­роятности гипотез и условные вероятности события А:

 

Р(Н1) = 0,30, Р(Н2) = 0,50, Р(Н3) = 0,20, Р(А/Н1) = 0,70, Р(А/Н2) = 0,40, Р(А/Н3) = 0,20.

Гипотезы образуют полную группу, сумма их ве­роятностей равна 1. Событие А — это или Н1А, или Н2А, или Н3А. События Н1А, Н2А. и Н3А. — не­совместные попарно, так как события Н1, Н2 и Н3 — несовместны. События Н1 и А, Н2 и А, Н3 и А — зависимые.

Требуется найти уточненную (послеопытную, апостериорную) вероятность первой гипотезы, т. е. необходимо найти вероятность активного экономи­ческого роста, при условии, что доллар дорожает (событие А уже произошло), т. е. Р(Н1/А).

Используя формулу Байеса (3.2) и подставляя заданные значения вероятностей, имеем


Мы можем получить тот же результат с помо­щью табл. 3.5.

Вероятность активного экономического роста, при условии, что доллар дорожает, составляет 0,467.

 

Таблица 3.5


Для более наглядного восприятия решения на­шей задачи мы можем также построить дерево ре­шений:


Пример 4. В каждой из двух урн содержится 6 чер­ных и 4 белых шара. Из 1-й урны во 2-ю наудачу переложен один шар.

а) Найти вероятность того, что шар, извлечен­ный из 2-й урны после перекладывания, окажется черным.

б) Предположим, что шар, извлеченный из 2-й урны после перекладывания, оказался черным. Какова тогда вероятность того, что из 1-й урны во 2-ю был переложен белый шар?

Решение. Определим события:

А — «Шар, извлеченный из 2-й урны, черный». Оно может произойти только вместе с одной из ги­потез:

Н1 — «Из 1-й урны во 2-ю урну переложили чер­ный шар» и Н2 — «Из 1-й урны во 2-ю переложили

белый шар».

Используя классическое определение вероятнос­ти, найдем вероятности гипотез

Р(Н1) = 6/10; Р(Н2) = 4/10

и условные вероятности события А.

После перекладывания во 2-й урне окажется 11 шаров. Если из 1-й урны во 2-ю переложили чер­ный шар, то во 2-й урне окажется 7 черных и 4 бе­лых шаров, тогда

Р(А/Н1) = 7/11.

Если из 1-й урны во 2-ю переложили белый шар, то во 2-й урне окажется 6 черных и 5 белых шаров, тогда

Р(А/Н2) = 6/11.

Гипотезы образуют полную группу, сумма их веро­ятностей равна 1. Рассмотрим событие А — это или Н1А, или Н2А. События Н1А и Н2А — несовместные попарно, так как события Н1 и Н2 несовместны. События Н1 и А, Н2 и А — зависимые.

1. Вышеизложенное позволяет применить для определения вероятности события А и ответа на 1-й вопрос формулу полной вероятности (3.1)

Р(А) = Р(Н1) Р(А/Н1) + Р(Н2) Р(А/Н2)= = 6/10 · 7/11 + 4/10 · 6/11 = 0,6.

Это же решение можно оформить в виде табл. 3.6.

Таблица 3.6

Гипотезы Нi

Р(Нi)

Р(А/Нi)

Р(Нi)Р(А/Нi)

Н1 «из 1-й урны во 2-ю переложили черный шар»

6/10

7/11

42/110

Н2— «из 1-й урны во 2-ю переложили белый шар»

4/10

6/11

24/110

å

1,00

0,6

 

 

Вероятность того, что шар, извлеченный из 2-й урны после перекладывания, окажется черным, составляет 0,6.

2. Во 2-й части задачи предполагается, что собы­тие А уже произошло, т. е. шар, извлеченный из 2-й урны, оказался черным. Требуется найти уточненную (послеопытную, апостериорную) вероятность 2-й гипотезы, т. е. необходимо определить вероятность того, что из 1-й урны во 2-ю был переложен белый шар при условии, что шар, извлеченный из 2-й урны после перекладывания, оказался черным:

Р(Н2/А).

Для определения искомой вероятности восполь­зуемся формулой Байеса (3.2)


Мы можем получить тот же результат с помо­щью табл. 3.7.

Таблица 3.7


Вероятность того, что из 1-й урны во 2-ю был переложен белый шар при условии, что шар, извлеченный из 2-й урны после перекладывания, ока­зался черным, составляет 0,3636.

Ответ. а) 0,6; б) 0,3636.

Задачи к теме 3

1. Директор компании имеет 2 списка с фамили­ями претендентов на работу. В 1-м списке — фамилии 6 женщин и 3 мужчин. Во 2-м списке оказа­лись 4 женщины и 7 мужчин. Фамилия одного из претендентов случайно переносится из 1-го списка во 2-й. Затем фамилия одного из претендентов случайно выбирается из 2-го списка. Если предполо­жить, что эта фамилия принадлежит мужчине, чему равна вероятность того, что из 1-го списка была пе­ренесена фамилия женщины?

2. Агент по недвижимости пытается продать уча­сток земли под застройку. Он полагает, что участок будет продан в течение ближайших 6 месяцев с ве­роятностью 0,9, если экономическая ситуация в регионе не будет ухудшаться. Если же экономичес­кая ситуация будет ухудшаться, то вероятность продать участок составит 0,5. Экономист, консуль­тирующий агента, полагает, что с вероятностью, равной 0,7, экономическая ситуация в регионе в течение следующих 6 месяцев будет ухудшаться. Чему равна вероятность того, что участок будет продан в течение ближайших 6 месяцев?

3. Судоходная компания организует средиземно­морские круизы в течение летнего времени и проводит несколько круизов в сезон. Поскольку в этом виде бизнеса очень высокая конкуренция, то важ­но, чтобы все каюты зафрахтованного под круизы корабля были полностью заняты туристами, тогда компания получит прибыль. Эксперт по туризму, нанятый компанией, предсказывает, что вероятность того, что корабль будет полон в течение сезона, бу­дет равна 0,92, если доллар не подорожает по отно­шению к рублю, и с вероятностью — 0,75, если дол­лар подорожает. По оценкам экономистов, вероят­ность того, что в течение сезона доллар подорожает по отношению к рублю, равна 0,23. Чему равна ве­роятность того, что билеты на все круизы будут проданы?

4. В корпорации обсуждается маркетинг нового продукта, выпускаемого на рынок. Исполнительный директор корпорации желал бы, чтобы новый товар превосходил по своим характеристикам соответству­ющие товары конкурирующих фирм. Основываясь на предварительных оценках экспертов, он опреде­ляет вероятность того, что новый товар более высо­кого качества по сравнению с аналогичными в 0,5, такого же качества — в 0,3, хуже по качеству — в 0,2. Опрос рынка показал, что новый товар конку­рентоспособен. Из предыдущего опыта проведения опросов следует, что если товар действительно кон­курентоспособный, то предсказание такого же выво­да имеет вероятность, равную 0,7. Если товар такой же, как и аналогичные, то вероятность того, что оп­рос укажет на его превосходство, равна 0,4. И если товар более низкого качества, то вероятность того, что опрос укажет на его конкурентоспособность, рав­на 0,2. С учетом результата опроса оцените вероят­ность того, что товар действительно более высокого качества и, следовательно, обладает более высокой конкурентоспособностью, чем аналогичные.

5. Сотрудники отдела маркетинга полагают, что в ближайшее время ожидается рост спроса на продукцию фирмы. Вероятность этого они оценивают  в 80%. Консультационная фирма, занимающаяся

прогнозом рыночной ситуации, подтвердила пред­положение о росте спроса. Положительные прогно­зы консультационной фирмы сбываются с вероят­ностью 95%, а отрицательные — с вероятностью 99%. Какова вероятность того, что рост спроса дей­ствительно произойдет?

6. Исследователь рынка заинтересован в прове­дении интервью с супружескими парами для выяснения их предпочтений к некоторым видам това­ров. Он приходит по выбранному адресу, попадает в трехквартирный дом и по надписям на почтовых ящиках выясняет, что в 1-й квартире живут 2 мужчин, во 2-й — супружеская пара, в 3-й — 2 женщи­ны. Когда исследователь поднимается по лестнице, то выясняется, что на дверях квартир нет никаких указателей. Исследователь звонит в случайно выб­ранную дверь и на его звонок выходит женщина. Предположим, что если бы он позвонил в дверь квартиры, где живут 2 мужчин, то к двери мог по­дойти только мужчина; если бы он позвонил в дверь квартиры, где живут только женщины, то к двери подошла бы только женщина; если бы он позвонил в дверь супружеской пары, то мужчина или жен­щина имели бы равные шансы подойти к двери. Имея эту информацию, оцените вероятность того, что исследователь выбрал нужную ему дверь.

7. Среди студентов института — 30% первокурс­ники, 35% студентов учатся на 2-м курсе, на 3-м и 4-м курсе их 20% и 15% соответственно. По дан­ным деканатов известно, что на первом курсе 20% студентов сдали сессию только на отличные оцен­ки, на 2-м — 30%, на 3-м — 35%, на 4-м — 40% отличников. Наудачу вызванный студент оказался отличником. Чему равна вероятность того, что он (или она) — третьекурсник?

8. Отдел менеджмента одного из супермаркетов разрабатывает новую кредитную политику с целью снижения числа тех покупателей, которые, полу­чая кредит, не выполняют своих платежных обязательств. Менеджер по кредитам предлагает в буду­щем отказывать в кредитной поддержке тем поку­пателям, которые на 2 недели и более задерживают очередной взнос, тем более что примерно 90% та­ких покупателей задерживают платежи, по край­ней мере, на 2 месяца.

Дополнительные исследования показали, что 2% всех покупателей товаров в кредит не только задерживают очередной взнос, но и вообще не выполня­ют своих обязательств, а 45% тех, кто уже имеют 2-месячную задолженность по кредиту, уплатил оче­редной взнос в данный момент. Учитывая все это, найти вероятность того, что покупатель, имеющий 2-месячную задолженность, в действительности не выполнит своих платежных обязательств по креди­ту. Проанализировав полученные вероятности, кри­тически оцените новую кредитную политику, раз­работанную отделом менеджмента.

9. Из числа авиалиний некоторого аэропорта 60% — местные, 30% — по СНГ и 10% — международные. Среди пассажиров местных авиалиний 50% путешествуют по делам, связанным с бизнесом, на линиях СНГ таких пассажиров 60%, на междуна­родных — 90%. Из прибывших в аэропорт пасса­жиров случайно выбирается 1. Чему равна вероят­ность того, что он: а) бизнесмен; б) прибыл из стран СНГ по делам бизнеса; в) прилетел местным рейсом по делам бизнеса; г) прибывший международным рейсом бизнесмен?

10. Нефтеразведочная экспедиция проводит ис­следования для определения вероятности наличия нефти на месте предполагаемого бурения скважи­ны. Исходя из результатов предыдущих исследова­ний, нефтеразведчики считают, что вероятность наличия нефти на проверяемом участке равна 0,4. На завершающем этапе разведки проводится сейс­мический тест, который имеет определенную сте­пень надежности: если на проверяемом участке есть нефть, то тест укажет на ее наличие в 85% случаев; если нефти нет, то в 10% случаев тест может оши­бочно указать на это. Сейсмический тест указал на присутствие нефти. Чему равна вероятность того, что запасы нефти на данном участке существуют реально?

11. Экспортно-импортная фирма собирается зак­лючить контракт на поставку сельскохозяйствен­ного оборудования в одну из развивающихся стран. Если основной конкурент фирмы не станет одновременно претендовать на заключение контракта, то вероятность получения контракта оценивается в 0,45; в противном случае — в 0,25. По оценкам экспертов компании вероятность того, что конку­рент выдвинет свои предложения по заключению контракта, равна 0,40. Чему равна вероятность заключения контракта?

12. Транснациональная компания обсуждает воз­можности инвестиций в некоторое государство с неустойчивой политической ситуацией. Менедже­ры компании считают, что успех предполагаемых инвестиций зависит, в частности, и от политичес­кого климата в стране, в которую предполагается вливание инвестиционных средств. Менеджеры оце­нивают вероятность успеха (в терминах годового дохода от субсидий в течение 1-го года работы) в 0,55, если преобладающая политическая ситуация будет благоприятной; в 0,30, если политическая си­туация будет нейтральной; в 0,10, если политичес­кая ситуация в течение года будет неблагоприят­ной. Менеджеры компании также полагают, что вероятности благоприятной, нейтральной и небла­гоприятной политических ситуаций соответствен­но равны: 0,60, 0,20 и 0,20. Чему равна вероят­ность успеха инвестиций?

13. Экономист-аналитик условно подразделяет экономическую ситуацию в стране на «хорошую», «посредственную» и «плохую» и оценивает их ве­роятности для данного момента времени в 0,15; 0,70 и 0,15 соответственно. Некоторый индекс экономи­ческого состояния возрастает с вероятностью 0,60, когда ситуация «хорошая»; с вероятностью 0,30, когда ситуация «посредственная», и с вероятнос­тью 0,10, когда ситуация «плохая». Пусть в насто­ящий момент индекс экономического состояния воз­рос. Чему равна вероятность того, что экономика страны на подъеме?

14. При слиянии акционерного капитала 2 фирм аналитики фирмы, получающей контрольный па­кет акций, полагают, что сделка принесет успех с вероятностью, равной 0,65, если председатель сове­та директоров поглощаемой фирмы выйдет в отстав­ку; если он откажется, то вероятность успеха будет равна 0,30. Предполагается, что вероятность ухода в отставку председателя составляет 0,70. Чему рав­на вероятность успеха сделки?

15. На химическом заводе установлена система аварийной сигнализации. Когда возникает аварий­ная ситуация, звуковой сигнал срабатывает с веро­ятностью 0,950. Звуковой сигнал может сработать случайно и без аварийной ситуации с вероятностью 0,02. Реальная вероятность аварийной ситуации равна 0,004. Предположим, что звуковой сигнал сработал. Чему равна вероятность реальной аварий­ной ситуации?

16. Вероятность того, что клиент банка не вер­нет заем в период экономического роста, равна 0,04, а в период экономического кризиса — 0,13. Пред­положим, что вероятность того, что начнется пери­од экономического роста, равна 0,65. Чему равна вероятность того, что случайно выбранный клиент банка не вернет полученный кредит?

17. Перед тем, как начать маркетинг нового това­ра по всей стране, компании-производители часто проверяют спрос на него по отзывам случайно выб­ранных потенциальных покупателей. Методы про­ведения выборочных процедур уже проверены и имеют определенную степень надежности. Для опре­деленного товара известно, что вероятность его воз­можного успеха на рынке составит 0,75, если товар действительно удачный, и 0,15, если он неудачен. Из прошлого опыта известно, что новый товар мо­жет иметь успех на рынке с вероятностью 0,60. Если новый товар прошел выборочную проверку, и ее ре­зультаты указали на возможный его успех, то чему равна вероятность того, что это действительно так?


18. 2 автомата производят одинаковые детали, которые поступают на общий конвейер. Производительность 1-го автомата вдвое больше производи­тельности 2-го. 1-й автомат производит в среднем 60% деталей отличного качества, а 2-й — 84% де­талей отличного качества. Наудачу взятая с кон­вейера деталь оказалась отличного качества. Найти вероятность того, что эта деталь изготовлена: а) 1-м автоматом; б) 2-м автоматом.

19. Исследованиями психологов установлено, что мужчины и женщины по-разному реагируют на некоторые жизненные обстоятельства. Результаты исследований показали, что 70% женщин позитив­но реагируют на изучаемый круг ситуаций, в то время как 40% мужчин реагируют на них негатив­но. 15 женщин и 5 мужчин заполнили анкету, в которой отразили свое отношение к предлагаемым ситуациям. Случайно извлеченная анкета содержит негативную реакцию. Чему равна вероятность того, что ее заполнял мужчина?

20. Вероятность того, что новый товар будет пользоваться спросом на рынке, если конкурент не выпустит в продажу аналогичный продукт, равна 0,67. Вероятность того, что товар будет пользовать­ся спросом при наличии на рынке конкурирующе­го товара, равна 0,42. Вероятность того, что конкурирующая фирма выпустит аналогичный товар на рынок в течение интересующего нас периода, рав­на 0,35. Чему равна вероятность того, что товар будет иметь успех?

 

4. ДИСКРЕТНЫЕ СЛУЧАЙНЫЕ ВЕЛИЧИНЫ

4.1. Определение дискретной случайной величины

Величина, которая в результате испытания мо­жет принять то или иное значение, заранее неизвестно, какое именно, считается случайной.

Дискретной случайной величиной называется такая переменная величина, которая может при­нимать конечную или бесконечную совокупность значений, причем принятие ею каждого из значе­ний есть случайное событие с определенной веро­ятностью.

Соотношение, устанавливающее связь между от­дельными возможными значениями случайной ве­личины и соответствующими им вероятностями, называется законом распределения дискретной случайной величины. Если обозначить возмож­ные числовые значения случайной величины Х че­рез x1, x2, ..., xn..., а через pi = Р(Х = хi) вероят­ность появления значения xi, то дискретная слу­чайная величина полностью определяется табл. 4.1.

Таблица 4.1

xi

 

x1

 

x2

 

...

 

xn

 

pi

 

p1

 

p2

 

...

 

pn

 

 

Здесь значения x1, x2, ..., xn записываются, как правило, в порядке возрастания. Таблица называет­ся законом (рядом) распределения дискретной слу­чайной величины X. Поскольку в его верхней строч­ке записаны все значения случайной величины X, то нижняя обладает следующим свойством:


Ряд распределения можно изобразить графически (рис. 4.1).


Рис. 4.1

Если на рис. 4.1 по оси абсцисс отложить значе­ния случайной величины, по оси ординат — вероятности значений, полученные точки соединить от­резками прямой, то получим многоугольник рас­пределения вероятностей (полигон распределения).

Дискретная случайная величина может быть за­дана функцией распределения.

Функцией распределения случайной величины Х называется функция F(x), выражающая вероят­ность того, что Х примет значение, меньшее чем х:


Здесь для каждого значения х суммируются ве­роятности тех значений xi, которые лежат левее точ­ки х.

Функция F(x) есть неубывающая функция. Для дискретных случайных величин функция распределения F(x) есть разрывная ступенчатая функция, непрерывная слева (рис. 4.2).


Вероятность попадания случайной величины Х в промежуток от  a до b (включая a) выражается формулой

Р(a £ Х < b) = F(b) - F(a).        (4.3)

Одной из важных числовых характеристик слу­чайной величины Х является математическое ожидание

М(Х) = x1p1, + x2p2 +...+ x3p3.      (4.4)

В случае бесконечного множества значений xi в правой части (4.4) находится ряд, и мы будем рассматривать только те значения Х, для которых он абсолютно сходится.

М(Х) представляет собой среднее ожидаемое зна­чение случайной величины. Оно обладает следующими свойствами:

1) М(С) = С, где С = const;

2) М(СХ) = СМ(Х);                   

3) М(Х + Y) = М(Х) + М(Y), для любых Х и Y;

4) М(ХУ) = М(Х)М(У), если Х и Y  независимы.

(4.5)

Для оценки степени рассеяния значений случай­ной величины около ее среднего значения М(Х) = а вводятся понятия дисперсии D(X) и среднего квадратического (стандартного) отклонения s(х). Дисперсией называется математическое ожидание квадрата разности (Ха),


где а = М(Х); s (х) определяется как квадратный корень из дисперсии, т. е.


Для вычисления дисперсии пользуются форму­лой

D(X) = М(Х2) - М2(Х).        (4.6)

Свойства дисперсии и среднего квадратического отклонения:

1) D(C) = 0, где С = const;

 


если Х и У независимы.

Размерность величин М(Х) и s(Х) совпадает с размерностью самой случайной величины X, а размерность D(X) равна квадрату размерности случай­ной величины X.

 

4.2. Математические операции над случайными величинами

Пусть случайная величина Х принимает значе­ния хi с вероятностями Р(Х = xi) =pi(i= 1, 2, ..., п), а случайная величина Y — значения уj с вероятно­стями Р(Y = у) =pj(j = 1, 2, ..., m). Произведение КХ случайной величины Х на постоянную величи­ну K — это новая случайная величина, которая с теми же вероятностями, что и случайная величина X, принимает значения, равные произведениям на К значений случайной величины X. Следователь­но, закон ее распределения имеет вид табл. 4.2.

Таблица 4.2

kxi

 

kx1

 

kx2

 

...

 

kxn

 

pi

 

p1

 

p2

 

...

 

pn

 

 

Квадрат случайной величины (X 2) — это новая случайная величина, которая с теми же вероятностями, что и случайная величина X, принимает зна­чения, равные квадратам ее значений.

Сумма случайных величин Х и Y — это новая случайная величина, принимающая все значения вида xi + уj, (i = 1, 2, .... п; j = 1, 2, ..., т) с вероят­ностями рij, выражающими вероятность того, что случайная величина Х примет значение xi ,a Yзначение yj, т. е.

рij = Р(Х = xi; У = уj) = Р(Х = xiX=xi(Y = уi). (4.8) Если случайные величины Х и Y независимы, то


Аналогично определяются разность и произведе­ние случайных величин Х и Y. .

Разность случайных величин Х и Y — это новая случайная величина, которая принимает все значе­ния вида хi – уj, а произведение — все значения вида хiуj с вероятностями, определяемыми по формуле (4.8), а если случайные величины Х и Y неза­висимы, то по (4.9).

 

4.3. Распределения Бернулли и Пуассона

Рассмотрим последовательность п идентичных повторных испытаний, удовлетворяющих следующим условиям:

1) каждое испытание имеет 2 исхода, называе­мые успех и неуспех; это — взаимно несовместные и противоположные события;

2) вероятность успеха — р — остается постоян­ной от испытания к испытанию. Вероятность неуспеха — q;

3) все п испытаний — независимы. Это значит, что вероятность наступления события в любом из п повторных испытаний не зависит от результатов других испытаний.

Вероятность того, что в п независимых повтор­ных испытаниях, в каждом из которых вероятность появления события равна р(0 < р < 1), событие наступит ровно т раз (в любой последовательно­сти), равна


где q = 1— р.

Выражение (4.10) называется формулой Бернулли.

Вероятности того, что событие наступит: а) ме­нее т раз; б) более т раз; в) не менее т раз; г) не более т раз — находятся по формулам:


Биномиальным называют закон распределения дискретной случайной величины Х — числа появлений события в n независимых испытаниях, в каждом из которых вероятность наступления события равна р; вероятности возможных значений Х = О, 1, 2, ..., т, ..., п вычисляются по формуле Бернулли (табл.4.3).

Таблица 4.3


Так как правая часть формулы (4.10) представля­ет общий член биномиального разложения (q + р)n, то этот закон распределения называют биномиаль­ным. Для случайной величины X, распределенной по биномиальному закону, имеем

М(Х) = np;    (4.11)

D(X) = npq.  (4.12)

Если число испытаний велико, а вероятность появления события р в каждом испытании очень мала, то вместо формулы (4.10) пользуются при­ближенной формулой


где т — число появлений события в п независи­мых испытаниях; l = пр ( среднее число появлений события в п испытаниях).

Выражение (4.13) называется формулой Пуассо­на. Придавая т целые неотрицательные значения т = 0, 1, 2, ..., п, можно записать ряд распределе­ния вероятностей, вычисленных по формуле (4.13), который называется законом распределения Пуас­сона (табл. 4.4).

Таблица 4.4


Распределение Пуассона (приложение 3) часто ис­пользуется, когда мы имеем дело с числом событий, появляющихся в промежутке времени или про­странства, например: число машин, прибывших на автомойку в течение часа; число дефектов на новом отрезке шоссе длиной в 10 км; число мест утечки воды на 100 км водопровода; число остановок стан­ков в неделю; число дорожных происшествий.

Если распределение Пуассона применяется вме­сто биномиального, то п должно иметь порядок не менее нескольких десятков, лучше нескольких со­тен, а пр < 10.

Математическое ожидание и дисперсия случай­ной величины, распределенной по закону Пуассо­на, совпадают и равны параметру l, который опре­деляет этот закон, т. е.

М(Х) = D(X) = l.         (4.14)

4.4. Гипергеометрическое распределение

Пусть имеется множество N элементов, из кото­рых М элементов обладают некоторым признаком А. Извлекается случайным образом без возвраще­ния п элементов. Требуется найти вероятность того, что из них т элементов обладают признаком А. Искомая вероятность (зависящая от N, М, п, т) определяется по формуле


Полученный с помощью формулы (4.15) ряд рас­пределения называется гипергеометрическим законом распределения (табл. 4.5).

Таблица 4.5


Математическое ожидание и дисперсия случай­ной величины т, распределенной по гипергеометрическому закону, определяются формулами:


Пример 1. Известно, что в определенном городе 20% горожан предпочитают добираться на работу личным автотранспортом. Случайно выбраны 4 че­ловека.

1) Составьте ряд распределения числа людей в выборке, предпочитающих добираться на работу личным автотранспортом, и постройте его график.

2) Найдите числовые характеристики этого рас­пределения.

3) Напишите функцию распределения числа лю­дей в выборке, предпочитающих добираться на работу личным автотранспортом, и постройте ее гра­фик.

4) Чему равна вероятность того, что среди 4 слу­чайно отобранных человек: а) не будет ни одного человека, предпочитающего добираться на работу лич­ным автотранспортом; б) окажется хотя бы 1 чело­век, предпочитающий добираться на работу личным автотранспортом; в) будет не больше 2, предпочи­тающих добираться на работу личным автотранс­портом?

Решение. В качестве случайной величины в дан­ной задаче выступает число людей в выборке, предпо­читающих добираться на работу личным автотранс­портом. Обозначим ее через X. Перечислим все возмо­жные значения случайной величины X: 0, 1, 2, 3, 4.

Вероятность того, что каждый из отобранных людей предпочитает добираться на работу личным автотранспортом, постоянна и равна 0,2 (р = 0,2). Вероятность противоположного события, т. е. того, что каждый из отобранных людей предпочитает добираться на работу не личным автотранспортом, а как-то иначе, также постоянна и составляет 0,8 (q= 1 - p= 10,2=0,8).

Все 4 испытания — независимы, т. е. вероятность того, что каждый из отобранных людей предпочитает добираться на работу личным автотранспор­том, не зависит от того, каким способом предпочи­тает добираться на работу любой другой человек из числа случайно отобранных.

Очевидно, что случайная величина Х подчиня­ется биномиальному закону распределения вероятностей с параметрами n=4 и р = 0,2.

Итак, по условию задачи:

n = 4; р = 0,2; q = 0,8; X = т.

1) Чтобы построить ряд распределения, необхо­димо вычислить вероятности того, что случайная величина примет каждое из своих возможных зна­чений, и записать полученные результаты в таблицу.

Расчет искомых вероятностей осуществляется по формуле Бернулли


 

Поставим в эту формулу данные задачи.

 



Получим ряд распределения числа людей в вы­борке, предпочитающих добираться на работу лич­ным автотранспортом (табл. 4.6).

Таблица 4.6

X

 

0

 

1

 

2

 

3

 

4

 

P

 

0,4096

 

0,4096

 

0,1536

 

0,0256

 

0,0016

 

 

Так как все возможные значения случайной ве­личины образуют полную группу событий, то сум­ма их вероятностей должна быть равна 1.

Проверка: 0,4096 + 0,4096 + 0,1536 + 0,0256 + + 0,0016 = 1.

Вместо ряда распределения дискретная случай­ная величина может быть задана графически многоугольником (полигоном) распределения (рис. 4.3).


Рис. 4.3

2) Найдем основные числовые характеристики распределения данной случайной величины: математическое ожидание, дисперсию и среднее квадратическое (стандартное) отклонение.

Математическое ожидание любой дискретной случайной величины может быть рассчитано по формуле (4.4)


Но, ввиду того, что в данном случае речь идет о математическом ожидании частоты, для его расче­та можно воспользоваться более простой формулой (4.11)

М(Х = т) = = 4 · 0,2 = 0,8 (чел.).

Рассчитаем дисперсию числа человек, предпочи­тающих добираться на работу личным автотранспортом, среди 4 отобранных. Дисперсия любой дискретной случайной величины может быть рассчи­тана по формуле


В данном случае речь идет о дисперсии частоты, а ее можно найти по формуле (4.12)

D(X = т) = npq = 4 · 0,2 · 0,8 = 0,64 (чел.2).

Рассчитаем среднее квадратическое отклонение числа людей в выборке, предпочитающих добираться на работу личным автотранспортом. Среднее квад­ратическое отклонение рассчитывается по формуле


3) Дискретную случайную величину можно за­дать функцией распределения


где для каждого значения х суммируются вероятно­сти тех значений хi, которые лежат левее точки х.

Зададим функцию распределения дискретной случайной величины применительно к условию дан­ной задачи


Для построения графика функции распределения вероятностей дискретной случайной величины необходимо рассчитать кумулятивные (накопленные) вероятности, соответствующие значениям случай­ной величины. Алгоритм их расчета вытекает из смысла функции распределения

F(Xi) = Р(Х1) + Р(Х2) + ... + Р(Хi-2) + Р(Хi-1).

Эта формула справедлива для всех F(Xi), кроме F(X0). Так как функция распределения определяет вероятность того, что случайная величина примет значение, меньшее заданного, понятно, что вероятность того, что случайная величина примет значе­ние, не более минимального, равна 0, т. е. F(X0) = 0.

Рассчитаем значения F(x)


Эти данные можно представить и в виде табл. 4.7.

Таблица 4.7

Х

х £ 0

0 < х £1

1 < x £2

2< x £3

3 < x £ 4

х > 4

F(x)

0

0,4096

0,8192

0,9728

0,9984

1

 

График функции распределения вероятностей дискретной случайной величины имеет ступенчатый вид. Скачки равны вероятностям, с которыми случайная величина принимает возможные значе­ния (рис. 4.4).


4) Определим вероятность того, что среди 4 слу­чайно отобранных человек:

а) Не будет ни одного человека, предпочитающе­го добираться на работу личным автотранспортом.

Р(Х = 0) = 0,4096.

Вероятность того, что среди четырех случайно отобранных человек не будет ни одного, предпочи­тающего добираться на работу личным автотранс­портом, составляет 0,4096.

б) Будет хотя бы 1 человек, предпочитающий до­бираться на работу личным автотранспортом.

«Хотя бы 1» — «как минимум 1» — «1 или боль­ше». Другими словами, «хотя бы 1» — это «или 1, или 2, или 3, или 4».

Исходя из этого, для определения вероятности того, что среди 4 случайно отобранных человек бу­дет хотя бы 1, предпочитающий добираться на ра­боту личным автотранспортом, можно использовать теорему сложения вероятностей несовместных со­бытий:

Р(Х  ³ 1) = Р(Х = 1) + Р(Х = 2) + Р(Х = 3) + Р(Х = 4);

Р(Х  ³ 1) = 0,4096 + 0,1536 + 0,0256 + 0,0016 = 0,5904.

С другой стороны, все возможные значения слу­чайной величины образуют полную группу собы­тий, а сумма их вероятностей равна 1. По отноше­нию к событию (X ³ 1) до полной группы событий не хватает события (X = 0), которое является про­тивоположным событию (X £ 1). Поэтому искомую вероятность того, среди 4 случайно отобранных че­ловек будет хотя бы 1 человек, предпочитающий добираться на работу личным автотранспортом, про­ще найти следующим образом:

Р(Х  ³ 1) + Р(Х < 1) = 1, откуда Р(Х  ³ 1)=1 - Р(Х = 0) = 1 - 0,4096 = 0,5904.

Вероятность того, что среди 4 случайно отобран­ных человек будет хотя бы 1 человек, предпочитающий добираться на работу личным автотранспор­том, составляет 0,5904.

в) Будет не больше 2, предпочитающих добирать­ся на работу личным автотранспортом.

«Не больше 2» — «2 или меньше», т. е. «или 0, или 1, или 2».

Используем теорему сложения вероятностей не­совместных событий

Р(Х £ 2) = Р(Х = 0) + Р(Х = 1) + Р(Х = 2);

Р(Х £ 2) = 0,4096 + 0,4096 + 0,1536 = 0,9728.

Вероятность того, что среди 4 случайно отобран­ных человек будет не больше 2, предпочитающих добираться на работу личным автотранспортом, со­ставляет 0,9728.

Пример 2. Среднее число инкассаторов, прибы­вающих утром на автомобиле в банк в 15-минут­ный интервал, равно 2. Прибытие инкассаторов происходит случайно и независимо друг от друга.

1) Составьте ряд распределения числа инкасса­торов, прибывающих утром на автомобиле в банк в течение 15 мин.

2) Найдите числовые характеристики этого рас­пределения.

3) Напишите функцию распределения числа ин­кассаторов, прибывающих утром на автомобиле в банк в течение 15 мин, и постройте ее график.

4) Определите, чему равна вероятность того, что в течение 15 мин в банк прибудут на автомобиле хотя бы 2 инкассатора.

5) Определите вероятность того, что в течение 15 мин число прибывших инкассаторов окажется меньше 3.

Решение. Пусть случайная величина Х — число инкассаторов, прибывающих утром на автомобиле в банк в течение 15 мин. Перечислим все возмож­ные значения случайной величины X: 0, 1, 2, 3, 4, 5, ..., п.

Это — дискретная случайная величина, так как ее возможные значения отличаются друг от друга не менее чем на 1, и множество ее возможных зна­чений является счетным.

По условию, прибытие инкассаторов происходит случайно и независимо друг от друга. Следовательно, мы имеем дело с независимыми испытаниями.

Если мы предположим, что вероятность прибы­тия инкассаторов на автомобиле одинакова в лю­бые 2 периода времени равной длины и что прибы­тие или неприбытие автомобиля в любой период времени не зависит от прибытия или неприбытия в любой другой период времени, то последовательность прибытия инкассаторов в банк может быть описана распределением Пуассона.

Итак, случайная величина Х — число инкасса­торов, прибывающих утром на автомобиле в тече­ние 15 мин, подчиняется распределению Пуассона. По условию задачи: l = пр = 2; Х = т.

1) Составим ряд распределения.

Вычислим вероятности того, что случайная ве­личина примет каждое из своих возможных значе­ний, и запишем полученные результаты в таблицу.

Так как данная случайная величина Х подчинена распределению Пуассона, расчет искомых вероятно­стей осуществляется по формуле Пуассона (4.13).

Найдем по этой формуле вероятность того, что в течение 15 мин утром на автомобиле прибудет 0 ин­кассаторов;


Однако расчет вероятностей распределения Пу­ассона легче осуществлять, пользуясь специальными таблицами вероятностей распределения Пуассо­на. В этих таблицах содержатся значения вероят­ностей при заданных m и  l (приложение 6). По условию l = 2, а т изменяется от 0 до n. Воспользовавшись таблицей распределения Пу­ассона (приложение 3), получим:

Р(Х = 0) = 0,1353; Р(Х = 1) = 0,2707;

Р(Х = 2) = 0,2707; Р(Х = 3) = 0,1804;

Р(Х = 4) = 0,0902; Р(Х = 5) == 0,0361;

Р(Х = 6) = 0,0120; Р(Х = 7) = 0,0034;

Р(Х = 8) = 0,0009; Р(Х = 9) = 0,0002.

Данных для l=2 и m ³ 10в таблице нет, что указывает на то, что эти вероятности составляют менее 0,0001, т. е.

Р(Х = 10) » 0.

Понятно, что Р(Х =11) еще меньше отличается от 0.

Занесем полученные результаты в табл. 4.8.

Таблица 4.8

Р

 

Р(Х)

 

0

 

0,1353

 

1

 

0,2707

 

2

 

0,2707

 

3

 

0,1804

 

4

 

0,0902

 

5

 

0,0361

 

6

 

0,0120

 

7

 

0,0034

 

8

 

0,0009

 

9

 

0,0002

 

10

 

0,0000

 

 

Так как все возможные значения случайной ве­личины образуют полную группу событий, сумма их вероятностей должна быть равна 1.

Проверим:

-0,1353 + 0,2707 + 0,2707 + 0,1804 + 0,0902 + 0,0361 + + 0,0120 + 0,0034 + 0.0009 + 0,0002 = 0,9999 »1.

График полученного ряда распределения дискретной случайной величины Х - полигон распределения вероятностей (рис. 4.5).


Рис. 4.5

2) Найдем основные числовые характеристики полученного распределения случайной величины X.

Можно рассчитать математическое ожидание, дисперсию и среднее квадратическое отклонение по общим для любой дискретной случайной величины формулам.

Математическое ожидание случайной величины, подчиняющейся распределению Пуассона, может быть рассчитано и по формуле

М(Х = т) = пр = l, М(Х = т) = l = 2 (инкассатора).

Для выполнения дисперсии случайной величи­ны, подчиняющейся распределению Пуассона, мож­но применить формулу

D(X = т) = l.

Итак, дисперсия числа инкассаторов, прибыва­ющих утром на автомобиле в течение 15 мин,

D(X = т) = l = 2 (инкассатора2).

Среднее квадратическое отклонение числа инкас­саторов, прибывающих утром на автомобиле в течение 15 мин,


3) Зададим теперь дискретную случайную вели­чину в виде функции распределения


График функции вероятностей дискретной слу­чайной величины — полигон распределения вероятностей (рис. 4.6).

Рассчитаем значения F(x):




Эти данные можно представить и в виде табл. 4.9.

Таблица 4.9

Х

 

Р(Х)

 

х £ 0

 

0

 

0<х£1

 

0,1353

 

1<х£2

 

0,4060

 

2<х£3

 

0,6767

 

3<х£4

 

0,8571

 

4.<х£5

 

0,9473

 

5<x£6

 

0,9834

 

6<х£7

 

0,9954

 

7 <x£8

 

0,9988

 

8<х£9

 

0,9997

 

х>9

 

1

 

 

4) Определим вероятность того, что в течение 15 мин в банк прибудут хотя бы 2 инкассатора.

«Хотя бы 2» — «как минимум 2» — «2 или боль­ше». Другими словами, «хотя бы 2» — это «или 2, или 3, или 4, или ...».

Исходя из этого, для определения вероятности того, что в течение 15 мин в банк прибудут хотя бы 2 инкассатора, можно использовать теорему сложе­ния вероятностей несовместных событий:

Р(Х ³ 2) = Р(Х=2) + Р(Х=3) + Р(Х=4) + ... + Р(Х=n).

С другой стороны, все возможные значения слу­чайной величины образуют полную группу собы­тий, а сумма их вероятностей равна 1. По отноше­нию к событию (X ³ 2) до полной группы событий не хватает события (X < 2), т. е. (х £ 1), которое является противоположным событию (X ³ 2). Поэто­му искомую вероятность того, что в течение 15 мин в банк прибудут на автомобиле хотя бы 2 инкасса­тора, проще найти следующим образом:

Р(Х ³ 2) = 1 - Р(Х £ 1) = 1 - (Р(Х = 0) + Р(Х = 1)) = = 1 - (0,1353 + 0,2707) = 1 - 0,406 = 0,594.

Вероятность того, что в течение 15 мин в банк прибудут на автомобиле хотя бы 2 инкассатора, составляет 0,594.

5) Определим вероятность того, что в течение 15 мин число прибывших инкассаторов окажется меньше 3.

«Меньше 3» — это «или 0, или 1, или 2». Из теоремы сложения вероятностей несовмест­ных событий следует:

Р(Х < 3) = Р(Х = 0) + Р(Х = 1) + Р(Х = 2);


Р(Х < 3) = 0,1353 + 0,2707 + 0,2707 – 0,6767.

Вероятность того, что в течение 15 мин в банк прибудут меньше 3 инкассаторов, составляет 0,6767.

Пример 3. Из 20 лотерейных билетов выигрыш­ными являются 4. Наудачу извлекаются 4 билета.

1) Составьте ряд распределения числа выигрыш­ных билетов среди отобранных.

2) Найдите числовые характеристики этого рас­пределения.

3) Напишите функцию распределения числа вы­игрышных билетов среди отобранных и постройте

ее график.

4) Определите вероятность того, что среди ото­бранных 4 билетов окажется: а) не меньше 3 выигрышных билетов; б) не больше 1-го выигрышного билета.

Решение. В качестве случайной величины в дан­ной задаче выступает число выигрышных билетов среди отобранных. Обозначим ее через X.

Перечислим все возможные значения случайной величины X: 0, 1, 2, 3, 4.

Это — дискретная случайная величина, так как ее возможные значения отличаются друг от друга не менее, чем на 1, и множество ее возможных зна­чений является счетным.

 Очевидно, что отбор лотерейных билетов — бес­повторный. Следовательно, испытания — зависимые.

Вышеперечисленные признаки указывают на то, что рассматриваемая случайная величина — чис­ло выигрышных билетов среди отобранных — под­чиняется гипергеометрическому закону распреде­ления.

Изобразим ситуацию на схеме (рис. 4.7).


Случайная величина, интересующая нас, Х = т — число выигрышных билетов в выборке объемом в п билетов. Число всех возможных случаев отбора п билетов из общего числа N билетов равно числу сочетаний из N по п (СnN ), а число случаев отбора т выигрышных билетов из общего числа М выигрышных билетов (и значит, (n-m) проигрышных из общего числа (N — М) проигрышных) равно произведению СmM · Сn-mN-M (отбор каждого из т вы­игрышных билетов может сочетаться с отбором любого из (n-m) проигрышных). Событие, вероятность которого мы хотим определить, состоит в том, что в выборке из n лотерейных билетов окажется ров­но m выигрышных. По формуле для расчета вероятности события в классической модели веро­ятность получения в выборке m выигрышных би­летов (т. е. вероятность того, что случайная вели­чина Х примет значение m) равна


где СnN общее число всех единственно возмож­ных, равновозможных и несовместных исходов;

СnM · Сn-mN-M число исходов, благоприятствующих наступлению интересующего нас события;

m £ n, если n £ M и m £ M, если М < п.

Если по этой формуле вычислить вероятности для всех возможных значений m и поместить их в таблицу, то получим ряд распределения.

1) Составим ряд распределения.

Вычислим вероятности того, что случайная величина примет каждое из своих возможных значений, и запишем полученные результаты в таблицу.

По условию задачи N = 20; М = 4; n = 4; m = 0, 1, 2, 3, 4.


Занесем полученные результаты в табл. 4.10.

Таблица 4.10

Х

 

0

 

1

 

2

 

3

 

4

 

Р(Х)

 

0,37564

 

0,46233

 

0,14861

 

0,01321

 

0,00021

 

 

Произведем проверку. Так как все возможные значения случайной величины образуют полную группу событий, сумма их вероятностей должна быть равна 1.

Проверка:

0,37564 + 0,46233 + 0,14861 + 0,01321 + 0,00021 = 1.

График полученного распределения вероятностей дискретной случайной величины — полигон распределения вероятностей (рис. 4.8).


Рис. 4.8

2) Найдем основные числовые характеристики распределения данной случайной величины.

Можно рассчитать математическое ожидание, дисперсию и среднее квадратическое отклонение по


общим для любой дискретной случайной величины формулам.

Но математическое ожидание случайной величи­ны, подчиняющейся гипергеометрическому распределению, может быть рассчитано по более простой формуле


Рассчитаем математическое ожидание числа вы­игрышных билетов среди отобранных:


Дисперсию случайной величины, подчиняющей­ся распределению, также можно рассчитать по бо­лее простой формуле


Вычислим дисперсию числа выигрышных биле­тов среди отобранных:


Рассчитаем среднее квадратическое отклонение числа выигрышных билетов среди отобранных:


3) Зададим дискретную случайную величину в виде функции распределения


Рассчитаем значения F(x):


Эти данные можно представить в виде графика функции распределения (рис. 4.9) и табл. 4.11.


 

Таблица 4.11

Х

 

х £ 0

 

0 <х £ 1

 

1 £ 2

 

2 £ 3

 

3 £4

 

х > 4

 

F(x)

 

0

 

0,37564

 

0,83797

 

0,98658

 

0,99979

 

1

 

4) Определим вероятность того, что среди 4 ото­бранных билетов окажется:

а) не меньше 3 выигрышных.

«Не меньше 3» — «как минимум 3» — «3 или больше». Другими словами, «не меньше 3» — это «или 3, или 4».

Исходя из этого, для определения вероятности то­го, что среди отобранных 4 билетов окажется не мень­ше 3 выигрышных билетов, можно применить тео­рему сложения вероятностей несовместных событий:

Р(Х ³ 3) = Р(Х = 3) + Р(Х = 4) == 0,01321 + 0,00021 = 0,01342.

Вероятность того, что среди отобранных окажет­ся не меньше 3 выигрышных билетов, составляет 0,01342.     .

б) не больше 1 выигрышного билета. «Не боль­ше 1» — это «1 или меньше», «или 0, или 1».

Следовательно, для определения вероятности того, что среди отобранных окажется не больше одного выигрышного билета, также применяем теорему сло­жения вероятностей для несовместных событий

Р(Х  £ 1) = Р(Х = 0) + Р(Х = 1) = 0,37564 + 0,46233 = 0,83797.

 

Задачи к теме 4

1. В городе 10 коммерческих банков. У каждого риск банкротства в течение года составляет 10%. Составьте ряд распределения числа банков, кото­рые могут обанкротиться в течение следующего года; постройте его график. Найдите числовые ха­рактеристики этого распределения. Запишите в общем виде функцию распределения вероятностей и постройте ее график. Чему равна вероятность того, что в течение года обанкротятся не больше одного банка?

2. В лотерее на 100 билетов разыгрываются две вещи, стоимости которых 210 и 60 у. е. Составьте ряд распределения суммы выигрыша для лица, имеющего: а) один билет; б) два билета. Стоимость билета — 3 у. е. Найдите числовые характеристи­ки этих распределений. Запишите в общем виде функции распределений вероятностей и постройте их графики.

3. Нефтеразведывательная компания получила финансирование для проведения 6 нефтеразработок. Вероятность успешной нефтеразведки 0,05. Пред­положим, что нефтеразведку осуществляют независимые друг от друга разведывательные партии. Со­ставьте ряд распределения числа успешных нефтеразведок. Найдите числовые характеристики этого распределения. Запишите в общем виде функцию распределения вероятностей и постройте ее график. Чему равна вероятность того, что как минимум 2 нефтеразведки принесут успех?

 4. Под руководством бригадира производствен­ного участка работают 3 мужчин и 4 женщины. Бригадиру необходимо выбрать двух рабочих для специальной работы. Не желая оказывать кому-либо предпочтения, он решил выбрать двух рабочих слу­чайно. Составьте ряд распределения числа женщин в выборке. Найдите числовые характеристики это­го распределения. Запишите в общем виде функ­цию распределения вероятностей и постройте ее график. Какова вероятность того, что будет выбра­но не более одной женщины?

5. Некоторый ресторан славится хорошей кух­ней. Управляющий ресторана хвастает, что в суб­ботний вечер в течение получаса подходит до 9 групп посетителей. Составьте ряд распределения возмож­ного числа групп посетителей ресторана в течение получаса; постройте его график. Найдите число­вые характеристики этого распределения. Запиши­те в общем виде функцию распределения вероят­ностей и постройте ее график. Чему равна вероят­ность того, что 3 или более групп посетителей при­будут в ресторан в течение 10-минутного проме­жутка времени?

6. Хорошим считается руководитель, принима­ющий не менее 70% правильных решений. Тако­му управляющему банком предстоит принять ре­шения по 4 важным вопросам банковской полити­ки. Считая вероятность принятия правильного ре­шения постоянной, составьте ряд распределения возможного числа правильных решений управля­ющего; постройте его график. Найдите числовые характеристики этого распределения. Запишите в общем виде функцию распределения вероятностей и постройте ее график. Чему равна вероятность того, что управляющий примет менее 3 правиль­ных решений?

7. В банк поступило 30 авизо. Подозревают, что среди них 5 фальшивых. Тщательной проверке подвергается 15 случайно выбранных авизо. Составьте ряд распределения числа фальшивых авизо, кото­рые могут быть выявлены в ходе проверки; пост­ройте его график. Найдите числовые характеристики этого распределения. Запишите в общем виде функцию распределения вероятностей и постройте ее график. Чему равна вероятность того, что в ходе проверки обнаружится менее 2 фальшивок?

8. В течение семестра преподаватели проводят консультации по вопросам, которые остались неясными для студентов. Преподаватель, проводящий консультации по статистике, заметил, что в сред­нем 8 студентов посещают его за час консультаци­онного времени, хотя точное число студентов, посе­щающих консультацию в определенный день, в на­значенный час, — случайная величина. Составьте ряд распределения числа студентов, посещающих консультации преподавателя по статистике в тече­ние часа. Найдите числовые характеристики этого распределения. Запишите в общем виде функцию распределения вероятностей и постройте ее график. Чему равна вероятность того, что 3 студента придут на консультацию в течение определенного по­лучаса?

9. В ходе аудиторской проверки строительной компании аудитор случайным образом отбирает 5

счетов. При условии, что 3% счетов содержат ошиб­ки, составьте ряд распределения правильных сче­тов. Найдите числовые характеристики этого рас­пределения. Запишите в общем виде функцию распределения вероятностей и постройте ее график. Чему равна вероятность того, что хотя бы 1 счет будет с ошибкой?

10. Записи страховой компании показали, что 30% держателей страховых полисов старше 50 лет потребовали возмещения страховых сумм. Для про­верки в случайном порядке было отобрано 15 человек старше 50 лет, имеющих полисы. Составьте ряд распределения числа предъявленных претензий. Найдите числовые характеристики этого распреде­ления. Запишите в общем виде функцию распределе­ния вероятностей и постройте ее график. Чему рав­на вероятность того, что, по крайней мере, 10 чело­век потребуют возмещения страховых сумм?

11. Экзаменационный тест содержит 15 вопро­сов, каждый из которых имеет 5 возможных отве­тов и только 1 из них верный. Предположим, что студент, который сдает экзамен, знает ответы не на все вопросы. Составьте ряд распределения числа пра­вильных ответов студента на вопросы теста и постройте его график. Найдите числовые характерис­тики этого распределения. Запишите функцию рас­пределения вероятностей и постройте ее график. Чему равна вероятность того, что студент правильно ответит, по крайней мере, на 10 вопросов?

12. Для того чтобы проверить точность своих финансовых счетов, компания регулярно пользуется услугами аудиторов для проверки бухгалтерских проводок счетов. Предположим, что служащие компании при обработке входящих счетов допускают примерно 5% ошибок. Предположим, аудитор слу­чайно отбирает 3 входящих документа. Составьте ряд распределения числа ошибок, выявленных ауди­тором. Найдите числовые характеристики этого распределения. Запишите функцию распределения вероятностей и постройте ее график. Определите ве­роятность того, что аудитор обнаружит более чем 1 ошибку.

13. В городе 10 машиностроительных предприя­тий, из которых 6 — рентабельных и 4 — убыточ­ных. Программой приватизации намечено прива­тизировать 5 предприятий. При условии проведе­ния приватизации в случайном порядке составьте ряд распределения рентабельных предприятий, по­павших в число приватизируемых; постройте его график. Найдите числовые характеристики этого распределения. Запишите функцию распределения вероятностей и постройте ее график. Чему равна вероятность того, что будет приватизировано не менее 4 рентабельных предприятий?

14. В международном аэропорту время прибы­тия самолетов различных рейсов высвечивается на электронном табло. Появление информации о раз­личных рейсах происходит случайно и независи­мо друг от друга. В среднем в аэропорт прибывает 10 рейсов в час. Составьте ряд распределения чис­ла сообщений о прибытии самолетов в течение часа. Найдите числовые характеристики этого распределения. Запишите функцию распределения вероятностей и постройте ее график. Чему равна веро­ятность того, что в течение часа прибудут не менее 3 самолетов? Чему равна вероятность того, что в течение четверти часа не прибудет ни один само­лет?

15. Телевизионный канал рекламирует новый вид детского питания. Вероятность того, что телезритель увидит эту рекламу, оценивается в 0,2. В случайном порядке выбраны 10 телезрителей. Составьте ряд распределения числа лиц, видевших рекламу. Найдите числовые характеристики этого распределения. Запишите функцию распределения вероятностей и постройте ее график. Чему равна вероятность того, что, по крайней мере, 2 телезри­теля этого канала видели рекламу нового детского питания?

16. В часы пик для общественного транспорта города происходит в среднем 2 дорожных происшествия в час. Утренний пик длится 1,5 ч, а ве­черний — 2ч. Составьте ряды распределения чис­ла дорожных происшествий в утренние и вечер­ние часы пик и постройте их графики. Найдите числовые характеристики этих распределений. Запишите функции распределений вероятностей и постройте их графики. Чему равна вероятность того, что в определенный день во время и утренне­го, и вечернего пика не произойдет ни одного до­рожного происшествия?

17. В магазине имеется 15 автомобилей опреде­ленной марки. Среди них — 7 черного цвета, 6 — серого и 2 — белого. Представители фирмы обратились в магазин с предложением о продаже им 3 автомобилей этой марки, безразлично какого цве­та. Составьте ряд распределения числа проданных автомобилей черного цвета при условии, что автомобили отбирались случайно, и постройте его гра­фик. Найдите числовые характеристики этого рас­пределения. Напишите функцию распределения вероятностей и постройте ее график. Какова вероят­ность того, что среди проданных фирме автомоби­лей окажется, по крайней мере, 2 автомобиля чер­ного цвета?

18. На предприятии 1000 единиц оборудования определенного вида. Вероятность отказа единицы оборудования в течение часа составляет 0,001. Со­ставьте ряд распределения числа отказов оборудо­вания в течение часа. Найдите числовые характе­ристики этого распределения. Запишите в общем виде функцию распределения вероятностей и пост­ройте ее график. Чему равна вероятность того, что в течение часа откажут как минимум 2 единицы обо­рудования?

19. Торговый агент в среднем контактирует с 8 по­тенциальными покупателями в день. Из опыта ему известно, что вероятность того, что потенциальный покупатель совершит покупку, равна 0,1. Составь­те ряд распределения ежедневного числа продаж для агента и постройте его график. Найдите числовые характеристики этого распределения. Запиши­те в общем виде функцию распределения вероятно­стей и постройте ее график. Чему равна вероятность того, что у агента будут хотя бы 2 продажи в тече­ние дня?

 

20. Прибытие посетителей в банк подчиняется одному из теоретических законов распределения. Предполагая, что в среднем в банк каждые 3 мину­ты входит 1 посетитель, составьте ряд распределе­ния возможного числа посетителей банка в течение 15 мин. Найдите числовые характеристики этого распределения. Запишите в общем виде функцию распределения вероятностей и постройте ее график. Определите вероятность того, что, по крайней мере, 3 посетителя войдут в банк в течение 1 минуты?

 

5. НЕПРЕРЫВНЫЕ СЛУЧАЙНЫЕ ВЕЛИЧИНЫ

5.1. Функция распределения и плотность распределения непрерывной случайной величины

Нам уже известно, что такое функция распреде­ления дискретной случайной величины. Эта форма задания закона распределения случайной величи­ны является универсальной и используется для непрерывных случайных величин.

Случайная величина Х называется непрерыв­ной, если ее функция распределения непрерывна и имеет производную.

Рассмотрим свойства функ­ции распределения.

1. Вероятность попадания случайной величины в промежуток от a до b равна приращению функ­ции распределения на концах этого промежутка

P(a<X<b)=F(b)-F(a),        (5.1)

так как вероятность любого отдельного значения случайной величины равна нулю, если функция распределения непрерывна при этом значении

Р(Х = х1) = 0, когда F(x) непрерывна в точке х = х1.

 

2. Функция распределения удовлетворяет условиям

F(-¥)= 0, F(+¥) = 1.          (5.2)

Плотностью распределения (дифференциальной функцией) непрерывной случайной величины на­зывается функция

f(x) = F'(x).                 (5.3)

Плотность распределения любой случайной ве­личины неотрицательна f(x) ≥ 0.

Несобственный интеграл от дифференциальной функции в пределах от -¥ до +¥ равен 1:


График функции у = f(x) называется кривой распределения или графиком плотности распределения. Кривая у = f(x) располагается над осью абсцисс.

Вероятность попадания случайной величины в промежуток от a доb может быть вычислена по формуле

 


Подынтегральное выражение f(x)dx называет­ся элементом вероятности. Оно выражает вероятность попадания случайной точки в промежуток между точками х и х + Dх, где Dх — бесконечно

малая величина.

Функция распределения F(x), выражаемая через плотность f(x), имеет вид


Математическое ожидание непрерывной случай­ной величины Х вычисляется по формуле


5.2. Нормальное распределение

Если плотность распределения (дифференциаль­ная функция) случайной переменной определяется

как


то говорят, что Х имеет нормальное распределение с параметрами а и s2. Вероятностный смысл параметров

а = М(Х), а s2 = D(X),

где    Х ~ N(а; s2).

Если задать параметры нормального распределе­ния, взяв а=0 и s=1,то получим так называемое нормированное (стандартное) нормальное распреде­ление. Плотность нормированного нормального распределения описывается функцией


Значения этой функции табулированы (приложение 1).

Для расчета вероятности попадания нормально распределенной случайной величины Х в промежу­ток от a до b используется формула


где   - интеграл Лапласа.

Формула (5.10) иногда в литературе называется интегральной теоремой Лапласа.

Функция Ф0(х) обладает свойствами:

 


Функция Ф0(х) табулирована. В частности для симметричного относительно а промежутка (а - Δ;

а + D) имеем


Формула (5.11) применима и к частоте т, по­скольку ее закон распределения при достаточно большом числе испытаний практически совпадает с нормальным. Применительно к случайной вели­чине т с учетом ее числовых характеристик

М(т) = пр и s2(m) = npq      (5.12)

формула (5.11) примет вид


Формула (5.11) может быть применена и к отно­сительной частоте т/п с числовыми характеристиками


С вероятностью, очень близкой к единице (рав­ной 2Ф0(3) = 0,9973), нормально распределенная случайная величина Х удовлетворяет неравенству

а- Зs<Х< а + Зs.        (5.16)

В этом состоит правило 3 сигм: если случайная величина распределена по нормальному закону, то ее отклонение от математического ожидания прак­тически не превышает ±3s.

Локальная теорема Муавра — Лапласа. При р¹0 и p¹1 и достаточно большом п биномиальное распределение близко к нормальному закону (при­чем их математические ожидания и дисперсии совпадают), т. е. имеет место равенство:


тогда


для достаточно больших п.

Здесь j(х) (приложение 1) — плотность веро­ятностей стандартной нормальной случайной вели­чины


Пример 1. На рынок поступила крупная партия говядины. Предполагается, что вес туш — случай­ная величина, подчиняющаяся нормальному за­кону распределения с математическим ожидани­ем а = 950 кг и средним квадратическим отклоне­нием σ = 150 кг.

1) Определите вероятность того, что вес случай­но отобранной туши: а) окажется больше 1 250 кг;

б) окажется меньше 850 кг; в) будет находиться между 800 и 1 300 кг; г) отклонится от математи­ческого ожидания меньше, чем на 50 кг; д) откло­нится от математического ожидания больше, чем на 50 кг.

2) Найдите границы, в которых отклонение веса случайно отобранной туши от своего математического ожидания не превысит утроенного среднего квадратического отклонения (проиллюстрируйте правило 3 сигм).

3) С вероятностью 0,899 определите границы, в которых будет находиться вес случайно отобранной туши. Какова при этом условии максимальная ве­личина отклонения веса случайно отобранной туши от своего математического ожидания?

Решение. 1а) Вероятность того, что вес случайно отобранной туши окажется больше 1 250 кг, можно понимать как вероятность того, что вес случайно отобранной туши окажется в интервале от 1 250 кг до +¥..

Формула расчета вероятности попадания в задан­ный интервал нормально распределенной случай­ной величины Х имеет вид


где Ф0(z) — функция Лапласа


Функция Ф0(z) является нечетной функцией, т. е.

Ф0(-z) = 0(z).

Найдем вероятность того, что вес случайно ото­бранной туши окажется больше 1 250 кг. По усло­вию a = 1 250, b = +¥, а = 950, s = 150.

Используем формулу расчета вероятности попа­дания в заданный интервал нормально распределенной случайной величины Х


Найдем по таблице функции Лапласа (приложение 2) значения Ф0(z)

Значения Ф0(+¥) в таблице нет. Однако извест­но, что Ф0(z)→ 0,5 при z +¥. Уже при z=5           Ф0 (z =5) = 0,49999997 » 0,5. Очевидно, что Ф0(+¥)— величина, бесконечно близкая к 0,5 , Ф0(-¥.) — величина, бесконечно близкая к -0,5.

По таблице функции Лапласа Ф0(2) = 0,47725.

Отсюда

Р(Х > 1 250) = 0,5 - 0,47725 = 0,02275.

Итак, вероятность того, что вес случайно отобран­ной туши окажется больше 1 250 кг, составляет

0,02275.

Проиллюстрируем решение задачи графически (рис. 5.1).


Итак, нам задана нормально распределенная слу­чайная величина Х с математическим ожиданием а = 950 кг и средним квадратическим отклонением s= 150 кг, т. е. Х ~ N (950; 1502). Мы хотим найти вероятность того, что Х больше 1 250, т. е. определить Р(Х > 1 250). Преобразуем X в Z, и тогда иско­мая вероятность определится по таблице стандарт­ного нормального распределения (приложение 2)


Точка z=0 соответствует математическому ожи­данию, т. е. а = 950 кг.

1б) Вероятность того, что вес случайно отобранной туши окажется меньше 850 кг — это то же самое, что и вероятность того, что вес случайно отобранной туши окажется в интервале от -¥ до 850 кг. По условию α = -¥, b = 850, а = 950, s= 150.

Для расчета искомой вероятности используем формулу расчета вероятности попадания в задан­ный интервал нормально распределенной случай­ной величины Х


Согласно свойству функции Лапласа,


Найдем по таблице функции Лапласа (приложе­ние 2) значения Ф0(z).

 

Ф0(+¥) » 0,5; Ф0(0,67) = 0,24857.

 

Отсюда

Р(Х < 850) = 0,5 - 0,24857 = 0,25143.

Вероятность того, что вес случайно отобранной туши окажется меньше 850 кг составляет 0,25143.

Проиллюстрируем решение задачи графически (рис. 5.2).


По условию данной задачи точка на оси абсцисс (z = -0,67) соответствует х = 850, т.е. весу, равно­му 850 кг. Заштрихованная на рис. 5.2 площадь представляет вероятность того, что вес наудачу выб­ранной туши окажется меньше 850 кг, т. е. в ин­тервале от -¥ до 850 кг.

1в) Найдем вероятность того, что вес случайно отобранной туши окажется в интервале от 800 до 1 300 кг.

По условию a = 800, b=1 300, а = 950, s = 150. Для расчета искомой вероятности используем формулу расчета вероятности попадания в задан­ный интервал нормально распределенной случай­ной величины Х


Согласно свойству функции Лапласа,

0(-1) = Ф0(1).

Найдем по таблице функции Лапласа (приложение 2) значения Ф0(z)

Ф0(2,33) = 0,49010; Ф0(1) = 0,34134.

Отсюда

Р(800 < Х < 1 300) = 0,49010 + 0,34134 = 0,83144.

Вероятность того, что вес случайно отобранной туши окажется в интервале от 800 до 1300 кг, составляет 0,83144.

Проиллюстрируем решение задачи графически (рис. 5.3).

По условию данной задачи точка на оси абсцисс (z = -1) соответствует х = 800, т. е. весу, равному 800 кг, а точка (z = 2,33) — х = 1300, т. е. весу, равному 1 300 кг. Заштрихованная на рис. 5.3 пло­щадь представляет собой вероятность того, что вес наудачу выбранной туши окажется в интервале от 800 до 1 300 кг.


На рис. 5.3 видно, что искомую вероятность того, что вес наудачу выбранной туши окажется в интер­вале от 800 до 1 300 кг, можно было найти другим способом. Для этого необходимо было найти вероят­ность того, что вес наудачу выбранной туши окажет­ся меньше 800 кг, а также больше 1 300 кг. Полу­ченные вероятности сложить и вычесть из 1.

Итак, вероятность того, что вес наудачу выбран­ной туши окажется меньше 800 кг, — это вероятность того, что вес случайно отобранной туши ока­жется в интервале от —¥ до 850 кг.


Вероятность того, что вес случайно отобранной туши окажется больше 1 300 кг — это вероятность того, что вес случайно отобранной туши окажется в интервале от 1 300 кг до +¥.


Отсюда искомая вероятность того, что вес науда­чу выбранной туши окажется в интервале от 800 до 1300 кг:

Р(800 < Х < 1 300) = 1 - (Р(Х < 800) + Р(Х > 1 300)) =  1 - (0,15866 + 0,0099) = 1 - 0,16856 = 0,83144.

1г) Найдем вероятность того, что вес случайно отобранной туши отклонится от математического ожидания меньше, чем на 50 кг, т. е.

Р(|Х - 950| < 50) = ?

Что значит |Х - 950| < 50 ?

Это неравенство можно заменить двойным нера­венством

-50 < Х - 950 < 50,

или

950 - 50 < X < 950 + 50, 900 < X < 1 000.

Следовательно,

Р(|Х - 950| < 50) = Р(900 < X < 1 000).

А это вероятность попадания в заданный интервал нормально распределенной случайной величины X. Отсюда


Согласно свойству функции Лапласа,

0(-0,33) = Ф0(0,33).

Найдем по таблице функции Лапласа (приложение 2) значения Ф0(z)

Ф0(0,33) = 0,1293.

Следовательно,

Р(|Х - 950| < 50) = Р(900 < Х < 1 000) =  2·0,1293 = 0,2586.

Вероятность того, что вес случайно отобранной туши отклонится от математического ожидания меньше, чем на 50 кг, составляет 0,2586.

Эту задачу легче решить, используя формулу расчета вероятности заданного отклонения нормаль­но распределенной случайной величины Х от свое­го математического ожидания


где Δ — величина отклонения случайной величины Х от математического ожидания.

По условию D = 50; а = 950, s= 150. Используя эту формулу, сразу получим

Р(|Х — 950| < 50) = 2Ф0(50/150) = 2Ф0(0,33) = 2 · 0,1293 = 0,2586.

Проиллюстрируем решение задачи графически (рис. 5.4).


По условию данной задачи точка на оси абсцисс (z = -0,33) соответствует х = 900, т. е. весу, равно­му 900 кг, а точка (z = 0,33) соответствует х = 1000, т. е. весу, равному 1 000 кг. Заштрихованная на рис. 5.4 площадь представляет собой вероятность того, что вес наудачу выбранной туши окажется в интервале от 900 до 1 000 кг, т. е. отклонится от математического ожидания меньше, чем на 50 кг.

1д) Найдем вероятность того, что вес случайно отобранной туши отклонится от математического ожидания больше, чем на 50 кг, т. е.

Р(|Х - 950| > 50) = ?

Это вероятность события, противоположного по отношению к событию, — вес случайно отобранной туши отклонится от математического ожидания меньше, чем на 50 кг,


Следовательно,


Вероятность того, что вес случайно отобранной туши отклонится от математического ожидания больше, чем на 50 кг, составляет 0,7414.

Можно использовать другой алгоритм решения.  Вероятность того, что вес случайно отобранной туши отклонится от математического ожидания больше, чем на 50 кг, — это вероятность того, что вес случайно отобранной туши будет или меньше (950 - 50 = 900) кг, или больше (950 + 50 = 1 000) кг.

По теореме сложения вероятностей несовместных событий имеем

 


Отсюда


2) Найдем границы, в которых отклонение веса случайно отобранной туши от своего математического ожидания не превысит утроенного среднего квадратического отклонения.

В этом задании студентам предлагается проил­люстрировать правило 3 сигм, которое можно сформулировать следующим образом:

Если случайная величина распределена по нор­мальному закону, то ее отклонение от математического ожидания практически не превышает ±3s.

Р(|Х - а| < 3s) = 2Ф0(3) = 0,9973.

Вероятность того, что отклонение нормально рас­пределенной случайной величины Х от своего математического ожидания будет меньше 3s или, дру­гими словами, вероятность того, что нормально рас­пределенная случайная величина Х попадет в ин­тервал (а - 3s; а + 3s), равна 0,9973.

Следовательно, вероятность того, что отклонение случайной величины от своего математического ожи­дания по абсолютной величине превысит утроенное среднее квадратическое отклонение, очень мала и равна 0,0027. Другими словами, лишь в 27 случа­ях из 10 000 случайная величина Х в результате испытания может оказаться вне интервала (а - 3s;а + 3s). Такие события считаются практически невозможными.

Формулу, описывающую правило 3 сигм, неслож­но получить из формулы вероятности заданного отклонения нормально распределенной случайной ве­личины Х от своего математического ожидания:


Если взять D = 3s, то получим D/s = 3.

Отсюда

Р(|Х - а|< 3s) = 2Ф0(3) = 0,9973.

По условию задачи а = 950; s = 150.

Правило 3 сигм можно представить так:

Р(а - 3s < Х < а + 3s) = 2Ф0(3) = 0,9973.

Интересующие нас границы — это границы интервала (а - 3s; а + 3s), т. е.


Учитывая, что вес отобранной туши — нормаль­но распределенная случайная величина, можно быть практически уверенным, что вес случайно отобран­ной туши не выйдет за пределы от 500 до 1 400 кг.

3) Определим границы, в которых с вероятностью 0,899 будет находиться вес случайно отобранной туши.  Формулу вероятности заданного отклонения нормально распределенной случайной величины Х от своего математического ожидания можно представить следующим образом:


или


где g — вероятность того, что отклонение нормаль­но распределенной случайной величины Х от своего математического ожидания не превысит задан­ной величины Δ.

По условию задачи а = 950; s = 150. Используя последнюю формулу, получим:


Из соотношения 2Ф0(D/150) = 0,899 найдем Δ :


По таблице функции Лапласа (приложение 2) най­дем, при каком z = D/150 функция Ф0(2) = 0,4495.

z = 1,64, т.е. Ф0(1,64) = 0,4495.

Отсюда

D/150 = 1,64, D = 1,64 · 150 = 246.

С вероятностью 0,899 можно ожидать, что откло­нение веса случайно отобранной туши от своего математического ожидания не превысит 246 кг.

Найдем границы интересующего нас интервала:

а-D<Х<а+D,

950 - 246 < X < 950 + 246,

704 < X < 1196.

С вероятностью 0,899 можно ожидать, что вес случайно отобранной туши будет находиться в пределах от 704 до 1 196 кг.

Ответ. 1. а) 0,02275, б) 0,25143, в) 0,83144, г) 0,2586, д) 0,7414; 2. (500, 1 400);

3. 246 (704, 1196).


Пример 2. Изменим условие предыдущей задачи.

На рынок поступила крупная партия говядины. Предполагается, что вес туш — случайная величина, подчиняющаяся нормальному закону распределе­ния с неизвестным математическим ожиданием и средним квадратическим отклонением s= 150 кг. Известно, что 37,07% туш имеют вес более 1 000 кг. Определите ожидаемый вес случайно отобранной туши.

Решение. По условию задачи s= 150; а = 1 000; β = +¥; Р(Х > 1 000) = 0,3707.

Ожидаемый вес случайно отобранной туши — это среднеожидаемый вес (математическое ожидание), т. е. а = ?

Используем формулу (5.10) расчета вероятности попадания в заданный интервал нормально распределенной случайной величины Х


По таблице функции Лапласа (приложение 2) найдем, при каком z = (100 - а)/150 функция Ф0(z) = 0,1293.

z = 0,33, т.е. Ф0(0,33) = 0,1293.

Отсюда


1 000 - а = 0,33 · 150 = 50,

а = 1 000 - 50 = 950.

Ответ. Среднеожидаемый вес случайно отобран­ной туши составляет 950 кг.

Пример 3. Вновь изменим условие задачи.

На рынок поступила крупная партия говядины. Предполагается, что вес туш — случайная величи­на, подчиняющаяся нормальному закону распреде­ления с математическим ожиданием а = 950 кг и неизвестным средним квадратическим отклонением. Известно, что 15,87% туш имеют вес менее 800 кг. Определите среднее квадратическое (стандартное) отклонение веса туш.

Решение. По условию задачи: а = 950; a = ; b= 800; Р(Х < 800) = 0,1587; s = ?

Используем формулу (5.10) расчета вероятности попадания в заданный интервал нормально распределенной случайной величины Х


 


 

 По таблице функции Лапласа (приложение 2) най­дем, при каком z = 150/ σ функция Ф0(z) = 0,3413.

z = 1, т. е. Ф0(1) = 0.3413.

Отсюда


 

Ответ. Среднее квадратическое отклонение веса туш составляет 150 кг.

Пример 4. Еще раз изменим условие задачи. На рынок поступила крупная партия говядины.  Предполагается, что вес туш — случайная величи­на, подчиняющаяся нормальному закону распределения с неизвестными математическим ожиданием и средним квадратическим отклонением. Известно, что 15,87% туш имеют вес менее 800 кг и 37,07% туш — более 1 000 кг. Определите средний ожидае­мый вес и среднее квадратическое (стандартное) отклонение веса туш.

 

Решение. По условию задачи α = -¥; b = 800; Р(Х < 800) = 0,1587; Р(Х > 1000) = 0,3707; а = ?; s= ?

Используем формулу (5.10) расчета вероятности попадания в заданный интервал нормально распределенной случайной величины Х


 


По таблице функции Лапласа (приложение 2) най­дем, при каком z = (а - 800)/s функция Ф0(z) =  =0,3413.

z=1,т. e. Ф0(1) = 0,3413.

Отсюда


С другой стороны,


По таблице функции Лапласа (приложение 2) най­дем, при каком


 

Отсюда


Решим систему линейных уравнений:


Среднеожидаемый вес случайно отобранной туши составляет 950 кг. Среднее квадратическое отклонение веса туш — 150 кг.

Ответ. а = 950; s= 150.

Пример 5. В очередной раз изменим условие задачи. На рынок поступила крупная партия говядины. Предполагается, что вес туш — случайная величина, подчиняющаяся нормальному закону распределения, с математическим ожиданием а = 950 кг и неизвестным средним квадратическим отклонени­ем. Каким должно быть среднее квадратическое (стандартное) отклонение, чтобы с вероятностью 0,81648 можно было утверждать, что абсолютное отклонение веса случайно отобранной туши от ма­тематического ожидания не превысит 200 кг?

Решение. По условию задачи а = 950; Δ = 200; Р(|Х - 950| < 200) = 0,81648; σ =?

Используем формулу (5.11) расчета вероятности заданного отклонения нормально распределенной случайной величины Х от своего математического ожидания.

Тогда получим


По таблице функции Лапласа (приложение 2) най­дем, при каком z = 200/s функция Ф0(z) = 0,40824.

z = 1,33, т. е. Ф0(1.33) = 0,40824.

Отсюда


s=200/1,33=150.

Чтобы с вероятностью 0,81648 можно было ут­верждать, что абсолютное отклонение веса случай­но отобранной туши от математического ожидания не превысит 200 кг, среднее квадратическое отклонение веса туш должно составлять 150 кг.

Ответ. 150.

 

Пример 6. Фирма собирается приобрести партию из 100 000 единиц некоторого товара. Из прошлого опыта известно, что 1 % товаров данного типа име­ют дефекты. Какова вероятность того, что в данной партии окажется от 950 до 1 050 дефектных еди­ниц товара?

Решение. В качестве случайной величины в дан­ной задаче выступает число дефектных единиц товара в общей партии из 100 000 единиц. Обозначим ее через X.

Перечислим все возможные значения случайной величины X: 0, 1, 2, ..., 99 999, 100 000.

Это — дискретная случайная величина, так как ее возможные значения отличаются друг от друга не менее чем на 1, и множество ее возможных зна­чений является счетным.

По условию вероятность того, что единица това­ра окажется дефектной, — постоянна и составляет 0,01 (р = 0,01). Вероятность противоположного со­бытия, т. е. того, что единица товара не имеет дефекта, также постоянна и составляет 0,99:

q= 1 -p= 1 -0,01 =0,99.

Все 100 000 испытаний — независимы, т. е. веро­ятность того, что каждая единица товара окажется дефектной, не зависит от того, окажется дефектной или нет любая другая единица товара.

Значения случайной величины Х — это, в об­щем виде, число появлений интересующего нас со­бытия в 100 000 независимых испытаниях. Поэто­му можно сделать вывод о том, что случайная ве­личина Х — число дефектных единиц товара в об­щей партии из 100 000 единиц — подчиняется би­номиальному закону распределения вероятностей с параметрами п = 100 000 и р = 0,01.

Итак, по условию задачи n = 100 000; р = 0,01; q = 0,99; X = т.

Необходимо найти вероятность того, что число дефектных единиц товара окажется в пределах от    т1 = 950 до т2 =1 050, т. е. вероятность того, что случайная величина Х = т попадет в интервал от 950 до 1050:

Р(т1 < т < т2) = ?

Так как мы имеем дело со случайной величиной, подчиняющейся биномиальному распределению, вероятность появления события т раз в п незави­симых испытаниях необходимо вычислять по фор­муле Бернулли (4.10).

В данном случае для определения искомой вероят­ности нам необходимо с помощью формулы Бернулли найти P100000, 950       Р100000, 951 , РР100000, 952   ...,  РР100000,1049

РР100000,1050 ,а затем сложить их, используя теорему сложения вероятностей несовместных событий.

Очевидно, что такой способ определения иско­мой вероятности связан с громоздкими вычислени­ями. Так,


Можно значительно облегчить расчеты, если ап­проксимировать биномиальное распределение нор­мальным, т. е. выразить функции биномиального распределения через функции нормального.

Когда п — число испытаний в биномиальном эксперименте — возрастает, дискретное биномиаль­ное распределение стремится к непрерывному нор­мальному распределению. Это означает, что для больших п мы можем аппроксимировать биноми­альные вероятности вероятностями, полученными для нормально распределенной случайной величины, имеющей такое же математическое ожидание и такое же среднее квадратическое отклонение.

Подставим параметры биномиального распреде­ления (5.15) в формулу (5.10) и получим формулу для приближенного расчета вероятности появления события от т1 до т2 раз в п независимых испыта­ниях Р(т1 < т < т2):


где Ф0(z) — функция Лапласа


Формулу для вычисления вероятности появле­ния события от т1 до т2 раз в п независимых испытаниях Рn(m1 < т < т2) называют интегральной теоремой Лапласа.

Использование локальной и интегральной теорем Лапласа дает приближенные значения искомых вероятностей. Погрешность будет невелика при ус­ловии, что npq > 9.

Для решения данной задачи воспользуемся ин­тегральной теоремой Лапласа:


 


По таблице функции Лапласа (приложение 2) найдем Ф0(1,59).

Ф0(1,59) = 0,44408.

P100000 (950< т < 1 050) » 2 · 0,44408 = 0,88816.

Вероятность того, что в партии из 100 000 еди­ниц окажется от 950 до 1 050 дефектных единиц товара, составляет 0,88816.

Данную конкретную задачу можно было решить еще более просто.

Математическое ожидание числа дефектных еди­ниц товара равно 1 000 единиц:

М(т) = пр= 100 000 · 0,01 = 1 000.

Абсолютное отклонение нижней и верхней гра­ниц интервала 1, т2) от математического ожида­ния М(т) = пр составляет 50 единиц:

|m1 - пр| = |950 - 100 000 · 0,0l| = 50;

|m2 - np| = 1 050 - 100 000 · 0,0l| = 50.

Следовательно, искомую вероятность можно рас­сматривать как вероятность заданного отклонения частоты от своего математического ожидания:

Р(|т – пр| < Δ).

Подставив параметры биномиального распреде­ления в формулу расчета вероятности заданного отклонения нормально распределенной случайной величины от своего математического ожидания, получим формулу для приближенного расчета ве­роятности заданного отклонения частоты от своего математического ожидания:


При использовании этой формулы для решения задачи сразу получим


Ответ. 0,88816.

Пример 7. Подлежат исследованию 400 проб руды. Вероятность промышленного содержания металла в каждой пробе для всех проб одинакова и равна 0,8. Найти вероятность того, что доля проб с промышленным содержанием металла отклонится от вероятности промышленного содержания метал­ла в каждой пробе не более, чем на 0,05.

Решение. В отличие от предыдущей задачи, в данном случае речь идет о расчете вероятности заданного отклонения частости (относительной час­тоты) появления события от вероятности его появления в отдельном независимом испытании, т. е.


При возрастании числа независимых испытаний распределение частости стремится к нормальному распределению точно так же, как и распределение частоты. Это означает, что при больших п мы мо­жем аппроксимировать распределение частости нор­мальным распределением случайной величины, имеющей такое же математическое ожидание и та­кое же среднее квадратическое отклонение.

Подставив параметры распределения частости в формулу расчета вероятности заданного отклонения нормально распределенной случайной величины от своего математического ожидания, получим формулу для приближенного расчета вероятности задан­ного отклонения частости от своего математическо­го ожидания (вероятности).

Параметры распределения частости:


Используя эти формулы, получим


Применим данную формулу для решения задачи.

По условию: n = 400; р = 0,8; q = 1 - 0,8 = 0,2;



Вероятность того, что доля проб с промышлен­ным содержанием металла отклонится от вероятности промышленного содержания металла в каждой пробе не более, чем на 0,05, составляет 0,98758.

Ответ. 0,98758.

Задачи к теме 5

1. Дневная добыча угля в некоторой шахте рас­пределена по нормальному закону с математиче­ским ожиданием 785 т и стандартным отклонени­ем 60 т. Найдите вероятность того, что в опреде­ленный день будут добыты, по крайней мере, 800 т угля. Определите долю рабочих дней, в которые бу­дет добыто от 750 до 850 т угля. Найдите вероят­ность того, что в данный день добыча угля окажет­ся ниже 665 т.

2. Кандидат на выборах считает, что 20% изби­рателей в определенной области поддерживают его избирательную платформу. Если 64 избирателя слу­чайно отобраны из числа избирателей данной области, найдите вероятность того, что отобранная доля избирателей, поддерживающих кандидата, не бу­дет отличаться по абсолютной величине от истин­ной доли более, чем на 0,07.

3. Авиакомпания знает, что в среднем 5% лю­дей, делающих предварительный заказ на опреде­ленный рейс, не будет его использовать. Если авиа­компания продала 160 билетов на самолет, в кото­ром лишь 155 мест, чему равна вероятность того, что место будет доступно для любого пассажира, имеющего заказ и планирующего улететь?

4. Вес тропического грейпфрута, выращенного в Краснодарском крае, — нормально распределен­ная случайная величина с неизвестным математи­ческим ожиданием и дисперсией, равной 0,04. Агрономы знают, что 65% фруктов весят меньше, чем 0,5 кг. Найдите ожидаемый вес случайно выб­ранного грейпфрута.

5. Один из методов, позволяющих добиться ус­пешных экономических прогнозов, состоит в применении согласованных подходов к решению конк­ретной проблемы. Обычно прогнозом занимается большое число аналитиков. Средний результат та­ких индивидуальных прогнозов представляет собой общий согласованный прогноз. Пусть этот прогноз относительно величины банковской процентной ставки в текущем году подчиняется нормальному закону со средним значением а = 9% и стандарт­ным отклонением α= 2,6%. Из группы аналитиков случайным образом отбирается один человек. Най­дите вероятность того, что согласно прогнозу этого аналитика уровень процентной ставки: а) превысит 11%; б) окажется менее 14%; в) будет в пределах от 12 до 15%.

6. Предположим, что в течение года цена на ак­ции некоторой компании есть случайная величина, распределенная по нормальному закону с матема­тическим ожиданием, равным 48 у. е., и стандарт­ным отклонением, равным 6. Определите вероят­ность того, что в случайно выбранный день обсужда­емого периода цена за акцию была: а) более 60 у. е.; б) ниже 60 за акцию; в) выше 40 за акцию; г) между 40 и 50 у. е. за акцию.

7. Для поступления в некоторый университет необходимо успешно сдать вступительные экзаме­ны. В среднем их выдерживают лишь 25% абиту­риентов. Предположим, что в приемную комиссию поступило 1 889 заявлений. Чему равна вероятность того, что хотя бы 500 поступающих сдадут все экзамены (наберут проходной балл)?

8. Средний срок службы коробки передач до ка­питального ремонта у автомобиля определенной марки составляет 56 мес. со стандартным отклоне­нием σ = 16 мес. Привлекая покупателей, производитель хочет дать гарантию на этот узел, обещая сделать бесплатно любое число ремонтов коробки передач нового автомобиля в случае ее поломки до определенного срока. Пусть срок службы коробки передач подчиняется нормальному закону. На сколь­ко месяцев в таком случае производитель должен дать гарантию для этой детали, чтобы число бес­платных ремонтов не превышало 2,275% продан­ных автомобилей?

9. При производстве безалкогольных напитков специальный аппарат разливает определенное чис­ло унций (1 унция == 28,3 г) напитка в стандартную емкость. Число разлитых унций подчиняется нормальному закону с математическим ожиданием, зависящим от настройки аппарата. Количество унций напитка, разлитых отдельным аппаратом, имеет стандартное отклонение s = 0,4 унции. Пусть емкости объемом в 8 унций наполняются кока-колой. Сколько унций напитка должен в среднем разливать аппарат, чтобы не более 5% емкостей оказа­лось переполненными?

10. Фирма, занимающаяся продажей товаров по каталогу, ежемесячно получает по почте заказы. Число этих заказов есть нормально распределен­ная случайная величина со средним квадратическим отклонением s = 560 и неизвестным математическим ожиданием. В 90% случаев число ежемесячных заказов превышает 12 439. Найдите ожидаемое среднее число заказов, получаемых фирмой за месяц.

11. Еженедельный выпуск продукции на заводе приблизительно распределен по нормальному закону со средним значением, равным 134 786 ед. продук­ции в неделю, и стандартным отклонением —     13000 ед. Найдите вероятность того, что еженедель­ный выпуск продукции: а) превысит 150000 ед.; б) окажется ниже 100 000 ед. в данную неделю; в) предположим, что возникли трудовые споры, и недельный выпуск продукции стал ниже 80 000 ед. Менеджеры обвиняют профсоюз в беспрецедентном падении выпуска продукции, а профсоюз утверждает, что выпуск продукции находится в пределах принятого уровня (±3s). Можно ли доверять проф­союзу?

12. Почтовое отделение быстро оценивает объем переводов в рублях, взвешивая почту, полученную утром каждого текущего рабочего дня. Установле­но, что если вес почтовых отправлений составляет N кг, то объем переводов в рублях есть случайная величина, распределенная по нормальному закону со средним значением 160N и стандартным откло­нением 20N кг. Найдите вероятность того, что в день, когда вес почтовых отправлений составит 150 кг, объем переводов в рублях будет находиться в пределах: а) от 21 000 до 27 000 руб.; б) более 28 500 руб.; в) менее 22 000 руб.

 

13. Менеджер ресторана по опыту знает, что 70% людей, сделавших заказ на вечер, придут в ресторан поужинать. В один из вечеров менеджер ре­шил принять 20 заказов, хотя в ресторане было лишь 15 свободных столиков. Чему равна вероят­ность того, что более 15 посетителей придут на заказанные места?

14. Процент протеина в пакете с сухим кормом для собак — нормально распределенная случайная величина с математическим ожиданием 11,2% и стандартным отклонением 0,6%. Производителям корма необходимо, чтобы в 99% продаваемого кор­ма доля протеина составляла не меньше х1 %, но не более х2%. Найдите х1 и х2.

15. Вес товаров, помещаемых в контейнер опре­деленного размера, — нормально распределенная случайная величина. Известно, что 65% контейне­ров имеют чистый вес больше чем 4,9 т и 25% — имеют вес меньше чем 4,2 т. Найдите ожидаемый средний вес и среднее квадратическое отклонение чистого веса контейнера.

16. Отклонение стрелки компаса из-за влияния магнитного поля в определенной области Заполя­рья есть случайная величина Х ~ (0; 12). Чему рав­на вероятность того, что абсолютная величина от­клонения в определенный момент времени будет больше чем 2,4?

17. Компания А покупает у компании В детали к контрольным приборам. Каждая деталь имеет точ­но установленное значение размера. Деталь, размер которой отличается от установленного размера бо­лее чем на ±0,25 мм, считается дефектной. Компа­ния А требует от компании В, чтобы доля брака не превышала 1% деталей. Если компания В выпол­няет требование компании А, то каким должно быть допустимое максимальное стандартное отклонение размеров деталей? Учесть, что размер деталей есть случайная величина, распределенная по нормаль­ному закону.

18. Компьютерная система содержит 45 одина­ковых микроэлементов. Вероятность того, что лю­бой микроэлемент будет работать в заданное время, равна 0,80. Для выполнения некоторой опера­ции требуется, чтобы по крайней мере 30 микро­элементов было в рабочем состоянии. Чему равна вероятность того, что операция будет выполнена успешно?

19. Технический отдел компании, производящей автопокрышки, планирует выпустить несколько экспериментальных партий покрышек и проверить степень их износа на тестирующем оборудовании. С этой целью предполагается увеличивать количе­ство каучука в покрышках каждой последующей партии до тех пор, пока срок службы покрышек окажется приемлемым. Эксперимент показал, что стандартное отклонение срока службы покрышек фактически остается постоянным от партии к партии и составляет 2 500 миль ( s = 2 500). Если компания хочет, чтобы 80% выпускаемых автопок­рышек имели срок службы не менее 25 000 миль, то какой наименьший средний срок службы авто­покрышек должен быть заложен в расчетах технического отдела? Считать срок службы автопокрышек нормально распределенным.

20. Менеджер торгово-посреднической фирмы получает жалобы от некоторых клиентов на то, что служащие фирмы затрачивают слишком много вре­мени на выполнение их заказов. Собрав и проанализировав соответствующую информацию, он вы­яснил, что среднее время выполнения заказа состав­ляет 6,6 дн., однако для выполнения 20% заказов потребовалось 15 дн. и более. Учитывая, что время выполнения заказа есть случайная величина, рас­пределенная по нормальному закону, определите фактическое стандартное отклонение времени об­служивания клиентов.

 

6. ВАРИАЦИОННЫЕ РЯДЫ И ИХ ХАРАКТЕРИСТИКИ

 

6.1. Понятие вариационного ряда. Виды вариационных рядов

 

Прежде чем приступить к рассмотрению вариационных рядов дадим определение другим поняти­ям, используемым в статистике. Так, совокупность предметов или явлений, объединенных каким-либо общим признаком или свойством качественного или количественного характера, называется объек­том наблюдения.

Всякий объект статистического наблюдения состо­ит из отдельных элементов — единиц наблюдения.

Результаты статистического наблюдения пред­ставляют собой числовую информацию — данные. Статистические данные — это сведения о том, какие значения принял интересующий исследова­теля признак в статистической совокупности. При­знаки бывают количественными и качественными.

Количественным называется признак, значения которого выражаются числами.

Качественным называется признак, характери­зующийся некоторым свойством или состоянием элементов совокупности.

Статистическая совокупность называется гене­ральной, если исследованию подлежат все элемен­ты совокупности (сплошное наблюдение).

Часть элементов генеральной совокупности, под­лежащая исследованию, называется выборочной совокупностью (выборкой). Она извлекается из ге­неральной совокупности случайно, так чтобы каж­дый из п элементов выборки имел равные шансы быть отобранным.

Значения признака, которые при переходе от од­ного элемента совокупности к другому изменяют­ся (варьируют), называются вариантами и обычно обозначаются малыми латинскими буквами х, у,z.

Порядковый номер варианта (значения призна­ка) называется рангом: х1 1-й вариант (1-е значе­ние признака), х2 2-й вариант (2-е значение при­знака), хi i-й вариант (i-e значение признака).

Ряд значений признака (вариантов), располо­женных в порядке возрастания или убывания с соответствующими им весами, называется вариа­ционным рядом (рядом распределения).

В качестве весов выступают частоты или частости.

Частота (т) показывает, сколько раз встреча­ется тот или иной вариант (значение признака) в статистической совокупности.

Частость или относительная частота (ωi) по­казывает, какая часть единиц совокупности имеет тот или иной вариант. Частость рассчитывается как отношение частоты того или иного варианта к сумме всех частот ряда


Сумма всех частостей равна 1


Вариационные ряды бывают дискретными и ин­тервальными.

Дискретные вариационные ряды строят обычно в том случае, .если значения изучаемого признака могут отличаться друг от друга не менее чем на некоторую конечную величину. В дискретных вариационных рядах задаются точечные значения признака. Общий вид дискретного вариационного ряда показан в табл. 6.1, где i = 1, 2, ..., k.

Таблица 6.1

Значения признака (xi)

x1

x2

 

xk

Частоты i)

т1

m2

 

mk

 

Интервальные вариационные ряды строят обыч­но в том случае, если значения изучаемого при­знака могут отличаться друг от друга на сколь угод­но малую величину. Значения признака в них за­даются в виде интервалов. Общий вид интерваль­ного вариационного ряда показан в табл. 6.2, где i= 1, 2, ..., l.

Таблица 6.2

Значения признака (xi)

а1-а2

a2-a3

...

ai-1-ai

Частоты i)

m1

т2

...

ml

 

В интервальных вариационных рядах в каждом интервале выделяют верхнюю и нижнюю границы. Разность между верхней и нижней границами интервала называется интервальной разностью или длиной (величиной) интервала.

Величина 1-го интервала k1 определяется по фор­муле k1 = a2 - а1; 2-го — k2= а3-  a2 последнего:

k1=ai-ai-1

В общем виде интервальную разность ki пред­ставим как

 

ki=xi(max)-xi(min)                         (6.3)

Если интервал имеет обе границы, то его назы­вают закрытым.

Первый и последний интервалы могут быть от­крытыми, т. е. иметь только одну границу. Напри­мер, 1-й интервал может быть задан как «до 100», 2-й — «100-110», .... предпоследний — «190-200», последний — «200 и более». Очевидно, что 1-й ин­тервал не имеет нижней границы, а последний — верхней, оба они — открытые.

Часто открытые интервалы приходится условно закрывать. Обычно для этого величину 1-го интервала принимают равной величине 2-го, а величину последнего — величине предпоследнего. В нашем примере величина 2-го интервала равна 110 - 100 = 10, следовательно, нижняя граница 1-го условно соста­вит 100 - 10 = 90; величина предпоследнего равна 200 - 190 = 10, значит, верхняя граница последне­го условно составит 200 + 10 = 210.

Кроме этого в интервальном вариационном ряде могут встречаться интервалы разной длины. Если ин­тервалы в вариационном ряде имеют одинаковую длину (интервальную разность), их называют равно­великими, в противном случае — неравновеликими.

При построении интервального вариационного ряда часто встает проблема выбора величины интервалов (интервальной разности). Для определения оптимальной величины интервалов (в том случае,если строится ряд с равными интервалами) приме­няют формулу Стэрджесса


где п — число единиц совокупности; хmax  и xmin наибольшее и наименьшее значения вариантов ряда.

Для характеристики вариационного ряда наря­ду с частотами и частостями используются накопленные частоты и частости. Накопленные частоты (частости) показывают, сколько единиц совокупно­сти (какая их часть) не превышают заданного зна­чения (варианта) х.

Их можно рассчитать по данным дискретного ряда, пользуясь формулой

vi = тi + тi-1 +...+ т1.          (6.5)

Для интервального вариационного ряда — это сумма частот (частостей) всех интервалов, не превышающих данный.

Дискретный вариационный ряд графически мож­но представить с помощью полигона распределения частот или частостей (рис.6.1).


Интервальные вариационные ряды графически можно представить с помощью гистограммы, т. е, столбчатой диаграммы (рис. 6.2).


При ее построении по оси абсцисс откладыва­ются значения изучаемого признака (границы интервалов). В том случае, если интервалы одинако­вой величины, по оси ординат можно откладывать частоты или частости. Если же интервалы имеют разную величину, по оси ординат необходимо откладывать значения абсолютной или относитель­ной плотности распределения. Абсолютная плотность — отношение частости интервала к его ве­личине:


где f(a)i абсолютная плотность i-го интервала;

mi — его частота;

ki величина (интервальная разность).

Абсолютная плотность показывает, сколько еди­ниц совокупности приходится на единицу интервала.

Относительная плотность — отношение частости интервала к его величине:


где f(0). — относительная плотность i-го интервала;

wi его частость.

Относительная плотность показывает, какая часть единиц совокупности приходится на единицу ин­тервала.

И дискретные, и интервальные вариационные ряды графически можно представить в виде кумуляты и огивы. При построении первой по данным дискретного ряда по оси абсцисс откладываются значения признака (варианты), а по оси ординат — накопленные частоты или частости. На пересече­нии значений признака (вариантов) и соответству­ющих им накопленных частот (частостей) строят­ся точки, которые в свою очередь соединяются от­резками или кривой. Получающаяся таким обра­зом ломаная (кривая) называется кумулятой (ку­мулятивной кривой). Абсциссами ее точек явля­ются верхние границы интервалов. Ординаты об­разуют накопленные частоты (частости) соответ­ствующих интервалов. Часто добавляют еще одну точку, абсциссой которой является нижняя гра­ница первого интервала, а ордината равна нулю. Соединяя точки отрезками или кривой, получаем кумуляту.

Огива строится аналогично кумуляте с той лишь разницей, что на оси абсцисс наносятся точки, соответствующие накопленным частотам (частостям), а по оси ординат — значения признака (варианты).

 

6.2. Числовые характеристики вариационного ряда

Одной из основных числовых характеристик ряда распределения (вариационного ряда) является сред­няя арифметическая.

Существует две формулы расчета средней ариф­метической: простая и взвешенная. Простую среднюю арифметическую обычно используют, когда данные наблюдения не сведены в вариационный ряд либо все частоты равны единице или одинаковы


где хii-e значение признака; п — объем ряда (чис­ло наблюдений; число значений признака).

Если частоты отличны друг от друга, расчет про­изводится по формуле средней арифметической взве­шенной


где хii-e значение признака; тi частота i-го значе­ния признака; k число его значений (вариантов).

При расчете средней арифметической в качестве весов могут выступать и частости, тогда формула расчета средней арифметической взвешенной при­мет следующий вид:


где хi — i-e значение признака; ωi частость i-го значения признака; k — число его значений (вари­антов).

Колеблемость изучаемого признака можно оха­рактеризовать с помощью различных показателей вариации. К числу основных показателей вариации относятся: дисперсия, среднее квадратическое отклонение, коэффициент вариации.

Дисперсию можно рассчитать по простой и взвешенной формулам, имеющим вид


Среднее квадратическое отклонение рассчитыва­ется по формуле


Коэффициент вариации определяется формулой


Пример 1. При обследовании 50 членов семей рабочих и служащих установлено следующее количество членов семьи: 5;3;2;1;4;6;3;7;9;1;3;2;5; 6; 8; 2; 5; 2; 3; 6; 8; 3; 4; 4; 5; 6; 5; 4; 7; 5; 6; 4; 8; 7;

4; 5; 7; 8; 6; 5; 7; 5; 6; 6; 7; 3; 4; 6; 5; 4.

1)      Составьте вариационный ряд распределения частот.

2) Постройте полигон распределения частот, кумуляту.

3) Определите средний размер (среднее число членов) семьи.

4) Охарактеризуйте колеблемость размера семьи с помощью показателей вариации (дисперсии, среднего квадратического отклонения, коэффициента вариации).

Объясните полученные результаты, сделайте вы­воды.

Решение. 1) В данной задаче изучаемый признак является дискретно варьирующим, так как размер семей не может отличаться друг от друга менее чем на одного человека. Следовательно, необходимо по­строить дискретный вариационный ряд. Чтобы сде­лать это, необходимо подсчитать, сколько раз встре­чаются те или иные значения признака, и располо­жить их в порядке возрастания или убывания. Зна­чения изучаемого признака — размер семьи — обо­значим xi, частоты — тi.

Произведем упомянутые расчеты и запишем их результаты в табл. 6.3.

Таблица 6.3

хi

 

1

 

2

 

3

 

4

 

5

 

6

 

7

 

8

 

9

 

mi

 

2

 

4

 

6

 

8

 

10

 

9

 

6

 

4

 

1

 

 

2) Дискретный вариационный ряд можно пред­ставить графически, построив полигон распределе­ния частот или частостей (рис. 6.3).

Для того чтобы построить кумуляту, необходимо рассчитать накопленные частоты или частости. Накопленная частота 1-го варианта 1 = 1) равна самой частоте этого варианта, т. е. v1 = 2. Накопленная частота 2-го варианта (х2 = 2) равна сумме частот 1-го и 2-го вариантов, т.е. v2 = 2 + 4 = 6. Далее, аналогично v3 = 12; v4 = 20; v5 = 30; v6 = 39; v7= 45; v8 = 49;  v9 =50.


Построим кумуляту (рис. 6.4).


3) Рассчитаем средний размер (среднее число членов) семьи. Так как частоты отличны друг от друга, расчет средней арифметической произведем по формуле (6.9)


Средний размер семьи — 5,06 чел.

4) Так как частоты неодинаковы, для расчета дисперсии размера семьи используем формулу (6.12)


Дисперсия размера семьи — 3,6964 чел2. Найдем среднее квадратическое отклонение раз­мера семьи по формуле (6.13)


Среднее квадратическое отклонение размера се­мьи — 1,9226 чел.

Найдем коэффициент вариации размера семьи по формуле (6.14)


Коэффициент вариации составляет 38%. Так как коэффициент вариации больше 35%, можно сделать вывод о том, что изучаемая совокупность семей яв­ляется неоднородной, чем и объясняется высокая колеблемость размера семьи в данной совокупности.

Ввиду неоднородности семей, попавших в выбор­ку, использование средней арифметической для характеристики наиболее типичного уровня разме­ра семьи не вполне оправданно — средняя арифметическая нетипична для изучаемой совокупности, в качестве характеристики наиболее типичного уров­ня размера семьи в данной совокупности лучше использовать моду или медиану.

Пример 2. Имеются данные о годовой мощности предприятий цементной промышленности в 1996 г.

Предприятия с годовой мощностью, тыс. т

 

Количество предприятий

 

До 500

 

27

 

500 - 1 000

 

11

 

1 000 - 2 000

 

8

 

2 000 - 3 000

 

8

 

Свыше 3 000

 

2

 

 

1) Постройте гистограмму, кумуляту.

2) Рассчитайте среднюю мощность предприятий.

3) Найдите дисперсию, среднее квадратическое отклонение, коэффициент вариации.

Объясните полученные результаты, сделайте вы­воды.

Решение. 1) Данные о годовой мощности пред­приятий цементной промышленности представле­ны в виде интервального вариационного ряда — значения признака заданы в виде интервалов. При этом первый и последний интервалы — открытые: оба интервала не имеют одной из границ. Наконец, данный интервальный вариационный ряд — с нерав­ными интервалами: интервальные разности (раз­ность между верхней и нижней границами) интер­валов неодинаковы. Условно закроем границы от­крытых интервалов.

Интервальная разность 2-го интервала

1 000 - 500 = 500.

Следовательно, нижняя граница 1-го интервала

500 - 500 = 0.

Интервальная разность предпоследнего интервала

3 000 - 2 000 = 1 000.

Следовательно, верхняя граница последнего ин­тервала

3 000 + 1 000 = 4 000.

В результате, получим следующий вариационный ряд (табл. 6.4):

Таблица 6.4

xi

 

mi

 

0-500

 

27

 

500 - 1 000

 

11

 

1 000 - 2 000

 

8

 

2 000 - 3 000

 

8

 

3 000 - 4 000

 

2

 

 

Учитывая неодинаковую величину интервалов, для построения гистограммы рассчитаем абсолют­ные плотности распределения по формуле (6.6)




Построим гистограмму (рис. 6.5).


Для того чтобы построить кумуляту, необходимо рассчитать накопленные частоты или частости.

Накопленная частота нижней границы 1-го варианта х = 0 равна нулю. Накопленная частота верхней границы 1-го интервала равна его частоте, т. е. 27.

Накопленная частота верхней границы 2-го интервала равна сумме частот 1-го и 2-го интервалов, т.е.27 + 11 = 38.

Далее, аналогично 38 + 8 =46; 46 + 8 = 54; 54 + 2 = 56.

Построим кумуляту (рис. 6.6).


2) Рассчитаем среднюю мощность предприятий цементной промышленности в 1996 г. Так как частоты интервалов разные, используем для расчета средней арифметической формулу (6.9). При расчете числовых характеристик интервального вариа­ционного ряда в качестве значений признака принимаются середины интервалов, найдем их.


Теперь расчет средней арифметической примет вид


Средняя мощность предприятий цементной про­мышленности в 1996 г. составляла 964,29 тыс. т.

Следует отметить, что использование с той или иной целью средней арифметической, рассчитанной по данным интервального ряда с открытыми ин­тервалами, может привести к серьезным ошибкам. Это связано с тем, что открытые интервалы закры­ваются условно, в действительности значения при­знака у объектов, попадающих в открытые интер­валы, могут выходить далеко за их условные гра­ницы.

В связи с этим для оценки наиболее типичного уровня изучаемого признака по данным интерваль­ного ряда с открытыми интервалами лучше исполь­зовать моду или медиану.

3) Оценим колеблемость мощности предприятий цементной промышленности в 1996 г.

Так как частоты неодинаковы, для расчета дис­персии используем формулу (6.12)


Дисперсия мощности предприятий — 862 563,78 (тыс. т)2.

Найдем среднее квадратическое отклонение мощности предприятий по формуле (6.13)


Среднее квадратическое отклонение мощности предприятий — 928,74 тыс. т.


Найдем коэффициент вариации по формуле (6.14)


Коэффициент вариации годовой мощности пред­приятий цементной промышленности составляет 96,31%. Поскольку он больше 35%, можно сделать вывод о том, что изучаемая совокупность предприятий является неоднородной, в ее состав вошли и крупные и мелкие предприятия, что и обусловило высокую колеблемость годовой мощности.

Следовательно, использование средней арифме­тической для характеристики наиболее типичного уровня годовой мощности предприятий цементной промышленности неверно — средняя арифметическая нетипична для изучаемой совокупности. Это еще раз подтверждает необходимость использования моды или медианы для характеристики наиболее типичного уровня годовой мощности данной сово­купности предприятий цементной промышленности.

 

Задачи к теме 6

1. По данным выборочного обследования получе­но следующее распределение семей по среднедушевому доходу

Среднедушевой доход семьи в месяц, у. е.

до 25

25-50

50-75

75-100

100-125

125-150

150 и

выше

Количество обследованных семей

46

236

250

176

102

78

12

 

Постройте гистограмму распределения частот. Найдите cреднедушевой доход семьи в выборке, дисперсию, среднее квадратическое отклонение, коэффи­циент вариации. Объясните полученные результаты.

2. Постройте гистограмму частот, найдите сред­нюю заработную работников одного из цехов промышленного предприятия.

Заработная плата, у. е.

50-75

75-100

125-150

150-175

175-200

200-225

Число работников

12

23

37

19

15

9

 

Рассчитайте среднюю арифметическую, среднее квадратическое отклонение, коэффициент вариации заработной платы.

3. Ниже представлена группировка отраслей и под­отраслей промышленности по темпам роста цен на изготавливаемую продукцию за период с начала года.

Сентябрь 1996 г., % к декабрю 1995 г.

 

92,1-100,0

100,1-108,0

108,1-116,0

116,1-124,0

124,1-132,0

132,1-140,0

Число отраслей и подотраслей, единиц

 

4

15

21

31

19

18

 

Найдите среднюю арифметическую, дисперсию, среднее квадратическое отклонение, коэффициент ва­риации. Постройте гистограмму. Сделайте выводы.

4. По результатам выборочного обследования тор­говых киосков города получены следующие данные о дневной выручке частного бизнеса.

Выручка от продажи товара, тыс. у. е.

 

до 1

 

1-1,2

 

1,2-1,4

 

1,4-1,6

 

1,6-1,8

 

1,8-2,0

 

2,0 и выше

 

Число торговых киосков

 

10

 

12

 

22

 

26

 

18

 

7

 

5

 

 

Постройте гистограмму распределения частот. Найдите среднедневную выручку от продажи товаров, дисперсию, среднее квадратическое отклонение, коэффициент вариации. Объясните полученные результаты.

5. Имеются данные о денежной эмиссии, осуще­ствлявшейся ЦБ РФ в период 1991-1994 гг.

Годы

1991

1992

1993

1994

Размер эмиссии, млрд руб.

89,3

1 513,0

10 904,8

23169,9

 

Найдите среднегодовой размер эмиссии за ука­занный период. Охарактеризуйте колеблемость размера эмиссии с помощью различных показателей вариации.

6. Для оценки состояния деловой активности промышленных предприятий различных форм собственности были проведены выборочные бизнес-об­следования и получены следующие результаты:

Интервалы значений показателя деловой активности, бал.

0-8

8-16

16-24

24-32

Число предприятий (акционерные общества открытого типа)

10

15

8

5

 

Постройте гистограмму распределения частот. Найдите среднее значение показателя деловой активности, дисперсию, среднее квадратическое от­клонение, коэффициент вариации. Объясните полученные результаты.

7. Продажа акций на аукционе акционерными обществами города характеризуется следующими данными:

Продажа акций, % от уставного капитала

9-15

15-21

21-27

27-33

Число акционерных обществ открытого типа

3

5

4

 

2

 

Постройте гистограмму распределения частот. Найдите средний процент продажи акций. Охарактеризуйте колеблемость процента продажи акций с помощью соответствующих показателей.

8. Имеются выборочные данные о числе сделок, заключенных брокерскими фирмами и конторами города в течение месяца.

Число заключенных сделок

 

10-30

30-50

50-70

70-90

Число брокерских фирм и контор

 

20

18

12

5

 

Постройте гистограмму распределения частот. Найдите среднее число заключенных сделок, дисперсию, среднее квадратическое отклонение, коэф­фициент вариации, размах вариации. Объясните полученные результаты.

9. Имеются выборочные данные о стоимости по­требительской корзины из 19 основных продуктов по городам Ростовской области (на начало апреля 1996 г.).

Стоимость  потребительской корзины, тыс. руб.

196

208

216

222

227

240

Число городов области

2

3

4

4

5

7

 

Постройте полигон распределения частот. Най­дите среднюю стоимость потребительской корзины в выборке, дисперсию, среднее квадратическое от­клонение, коэффициент вариации. Объясните полученные результаты.

10. Кредиты ЦБ РФ предприятиям России за 7 ме­сяцев 1992 г. (с апреля по октябрь) характеризуют­ся следующими данными:

Месяц

Апрель

Май

Июнь

Июль

Август

Сентябрь

Октябрь

Размер кредитов, млрд руб.

918,1

1 025,3

1041,8

1 393,0

1 860,0

2 153,2

2 731,0

 

Найдите среднемесячный размер кредита за ука­занный период. Охарактеризуйте колеблемость размеров кредита с помощью соответствующих пока­зателей.

11. Предположим, что на некотором предприя­тии собраны данные о числе дней, пропущенных работниками по болезни.

Число дней, пропущенных в текущем месяце

0

1

2

3

4

5

Число работников

10

17

25

28

30

27

 

Постройте полигон распределения частот. Най­дите среднее число пропущенных дней, стандарт­ное отклонение, коэффициент вариации. Является ли распределение симметричным?

 

12. Постройте гистограмму частот, найдите сред­нюю арифметическую, среднее квадратическое отклонение и коэффициент вариации для данных о дневной выручке в магазине электроники.

Выручка, у. е.

0-200

200-300

300-400

400-500

500-600

600-700

Число дн.

3

5

9

14

8

3

13. Имеются данные о числе тонн грузов, пере­возимых еженедельно паромом некоторого морско­го порта в период навигации: 398, 412, 560, 474, 544, 690, 587, 600, 613, 457, 504, 477, 530, 641, 359, 566, 452, 633, 474, 499, 580, 606, 344, 455, 505, 396, 347, 441, 390, 632, 400, 582.

Составьте вариационный ряд. Найдите среднюю арифметическую. Рассчитайте показатели вариации ряда. Сделайте анализ полученных результатов.

14. Предположим, у вас есть следующая информация об акциях А и В:

Экономическое состояние в следующем году

Вероятность того, что произойдет

Возврат по акции В в следующем году, %

Возврат по

акции А в следующем году, %

Снижение деловой активности

0,3

9,8

10

Умеренный рост

0,4

11,2

11

Подъем деловой активности

0,3

13

12

 

Рассчитайте среднюю арифметическую, диспер­сию и коэффициент вариации для акций А и В. Если вы решили купить одну акцию, какую из двух вы выберете? Почему?

15. Проанализируйте данные годовых уровней прибыли трех компаний.

Год

Cherry Computers

 

Lemon Motors

 

Orange Electronics

 

1983

14,2

-6,2

37,5

1984

12,3

13,3

-10,6

1985

-16,2

-8,4

40,3

1986

15,4

27,3

5,4

1987

17,2

28,2

6,2

1988

10,3

14,5

10,2

1989

-6,3

-2,4

13,8

1990

-7,8

-3,1

11,5

1991

3,4

15,6

-6,2

1992

12,2

18,2

27,5

 

Найдите среднее значение и стандартное откло­нение прибыли для каждой из компаний. Сравните результаты их деятельности за 10 лет. Деятельность какой из компаний, по вашему мнению, более успешна?

16. Таблица, приведенная ниже, содержит дан­ные о стоимости акций Charleston Corporation в различных экономических ситуациях.

Экономическое состояние в следующем году

Вероятность того, что произойдет

Цена за акцию, дол. США

Кризис

0,25

65

Снижение деловой активности

0,25

80

Умеренный рост

0,3

95

Подъем деловой активности

0,2

100

 

Рассчитайте среднюю стоимость акций, диспер­сию и коэффициент вариации. Проанализируйте полученные результаты.

17. Администрацию универсама интересует оп­тимальный уровень запасов продуктов в торговом зале, а также среднемесячный объем покупок това­ров, не являющихся предметом ежедневного потребления в семье (таких, например, как сода). Для вы­яснения этого вопроса менеджер универсама в те­чение января регистрировал частоту покупок сто­граммовых пакетиков с содой и собрал следующие данные (хi): 8, 4, 4, 9, 3, 3, 1, 2, 0, 4, 2, 3, 5, 7, 10, 6,5,7,3,2,9,8,1,4,6,5,4,2,1, 0,8.

Постройте вариационный ряд, определите его числовые характеристики. Какие рекомендации вы дали бы администрации универсама?

18. Ниже приводятся данные о возрастном со­ставе безработных по Российской Федерации, зарегистрированных в службе занятости по сведениям на последнюю неделю марта 1996 г., %.

Возраст, лет

16-20

20-24

25-29

30-49

50-54

55-59

60-65

Мужчины

7,7

17,0

11,9

50,9

4,2

5,7

2,6

Женщины

11,2

18,5

11,7

49,5

4,0

3,8

1,3

 

Найдите средний возраст безработных мужчин и женщин, дисперсию, среднее квадратическое отклонение и коэффициент вариации. Оцените различия показателей возрастного состава безработных муж­чин и женщин. Сделайте выводы.

19. Число пассажиров компании «Донские авиа­линии» одного из рейсов на рейсах между Ростовом и Москвой за 30 дней между апрелем и маем текущего года составило: 128, 121, 134, 118, 123, 109,120,116,125,128,121,129,130,131, 127, 119, 114, 124, 110, 126, 134, 125, 128, 123, 128, 133, 132,136,134,129.

Составьте вариационный ряд. Чему равно сред­нее число пассажиров в рейсе? Рассчитайте показатели вариации. Сделайте анализ полученных резуль­татов.

20. Имеются данные о группировке коммерчес­ких банков РФ по величине объявленного уставно­го фонда (на 1 марта 1995 г.).

Объявленный уставной фонд, руб.

До 100 млн

100-500 млн

500 млн-1 млрд

Свыше 1 млрд

Число коммерческих банков

87

1075

377

1004

 

Постройте гистограмму распределения частот. Найдите средний размер объявленного уставного фонда коммерческих банков РФ. Охарактеризуйте колеблемость размера объявленного уставного фон­да коммерческих банков с помощью соответствую­щих показателей.

 

7. ВЫБОРОЧНЫЙ МЕТОД И СТАТИСТИЧЕСКОЕ ОЦЕНИВАНИЕ

7.1. Основные понятия и определения выборочного метода

По одному из популярных определений, статис­тика — это наука, позволяющая распространять выводы, сделанные на основе изучения части со­вокупности (случайной выборки), на всю совокуп­ность (генеральную совокупность). В этом опреде­лении заключена сущность выборочного метода и его ведущая роль в статистике.

Все единицы совокупности, обладающие интере­сующими исследователя признаками, составляют генеральную совокупность.

Часть совокупности, случайным образом отобран­ная из генеральной совокупности, — выборочная совокупность — выборка.

Число единиц (элементов) статистической со­вокупности называется ее объемом*. Объем генеральной совокупности обозначается N, а объем вы­борочной совокупности — п. Если объем совокупно­сти велик, то его полагают равным бесконечности.

* В учебниках по математической статистике вместо терми­на «статистическая совокупность» используется термин «набор данных», а вместо термина «единица совокупности» ис­пользуется термин «элемент выборки».

 

Случайная выборка из п элементов — это такой отбор, при котором элементы извлекаются по одному из всей генеральной совокупности и каждый из них имеет равный шанс быть отобранным. Требо­вание случайности обеспечивается отбором по таб­лицам случайных чисел или по жребию. Такая выборка называется собственно-случайной. Одним из примеров использования собственно-случайной выборки является проведение тиражей выигрышей денежно-вещевых лотерей, при которых обеспечивается равная возможность попадания в тираж лю­бого номера лотерейного билета.

По способу отбора элементов различают два типа случайных выборок: собственно-случайная повтор­ная (схема возвращенного шара); собственно-случай­ная бесповторная (схема невозвращенного шара).

Выбор схемы отбора зависит от характера изучае­мого объекта. Напомним, что при повторном отборе единица наблюдения после извлечения из генераль­ной совокупности регистрируется и вновь возвращается в генеральную совокупность, откуда опять мо­жет быть извлечена случайным образом. При бес­повторном отборе элемент в выборку не возвращает­ся. Следует отметить, что независимо от способа орга­низации выборки она должна представлять собой уменьшенную копию генеральной совокупности, т. е. быть представительной (репрезентативной).

 

7.2. Статистическое оценивание

Пусть из генеральной совокупности извлекается вы­борка объемом n, причем значение признака х1 наблю­дается т1 раз, x2  т2 раз,..., хk наблюдается тk раз,


Мы можем сопоставить каждому значению хi от­носительную частоту mi/n.

Статистическим распределением выборки назы­вается перечень возможных значений признака хi и соответствующих ему частот или относитель­ных частот (частостей) mi i).

Числовые характеристики генеральной совокупности, как правило, неизвестные (средняя, дисперсия и др.), называются параметрами генеральной совокупности (обозначают, например, `X или  Xген , s2ген). Доля единиц, обладающих тем или иным признаком в генеральной совокупности, называется генеральной долей и обозначается р.

По данным выборки рассчитывают числовые характеристики, которые называют cтатистиками (обозначают X̃, или X/ ген ,s2ген, выборочная доля обозначается ω). Статистики, получаемые по раз­личным выборкам, как правило, отличаются друг от друга. Поэтому статистика, полученная из вы­борки, является только оценкой неизвестного пара­метра генеральной совокупности. Оценка парамет­ра — определенная числовая характеристика, по­лученная из выборки. Когда оценка определяется одним числом, ее называют точечной оценкой.

В качестве точечных оценок параметров генеральной совокупности используются соответствующие выборочные характеристики. Теоретическое обосно­вание возможности использования этих выборочных оценок для суждений о характеристиках и свойствах генеральной совокупности дают закон больших чи­сел и центральная предельная теорема Ляпунова.

Выборочная средняя является точечной оценкой генеральной средней, т. е.

 


Генеральная дисперсия имеет 2 точечные оцен­ки: s2выб — выборочная дисперсия; S2 исправлен­ная выборочная дисперсия*. s2выб исчисляется при п > 30, a S2 — при n < 30. Причем в математичес­кой статистике доказывается, что


При больших объемах выборки s2выб и S2 практи­чески совпадают.

Генеральное среднее квадратическое отклонение sген также имеет 2 точечные оценки: sвыб — выбо­рочное среднее квадратическое отклонение и S — исправленное выборочное среднее квадратическое отклонение. sвыб используется для оценивания sген при п > 30, а S для оценивания (sген при п < 30; при этом


7.3. Ошибки выборки

Поскольку выборочная совокупность представля­ет собой лишь часть генеральной совокупности, то вполне естественно, что выборочные характеристи­ки не будут точно совпадать с соответствующими генеральными. Ошибка репрезентативности может быть представлена как разность между генеральными и выборочными характеристиками изучаемой совокупности: e =  X/ -`X  , либо е= р –ω.

 

 Применительно к выборочному методу из теоре­мы Чебышева следует, что с вероятностью, сколь угодно близкой к единице, можно утверждать, что при достаточно большом объеме выборки и ограниченной дисперсии генеральной совокупности разность между выборочной средней и генеральной средней будет сколь угодно мала.

 


где Х̃ средняя по совокупности выбранных единиц; `X  средняя по генеральной совокупности.

sген — среднее квадратическое отклонение в гене­ральной совокупности.

Запись показывает, что о величине расхождения между параметром и статистикой


можно судить лишь с определенной вероятностью, от которой зависит величина t.

Формула (7.2) устанавливает связь между преде­лом ошибки, гарантируемым с некоторой вероят­ностью Р, величиной t и средней ошибкой выборки


Согласно центральной предельной теореме Ляпуно­ва, выборочные распределения статистик (при      пV 30) будут иметь нормальное распределение независимо от того, какое распределение имеет генеральная со­вокупность. Следовательно,


где Ф0(t) — функция Лапласа.

Значения вероятностей, соответствующие раз­личным t, содержатся в специальных таблицах:

при п > 30 — в таблице значений Ф0(t), а при n < 30 в таблице распределения t-Стьюдента. Неизвест­ное значение  sген при расчете ошибки выборки за­меняется sвыб.

В зависимости от способа отбора средняя ошиб­ка выборки определяется по-разному (табл. 7.1).

Таблица 7.1

Формулы расчета ошибки выборки для собственно-случайного отбора


Здесь s2 — выборочная дисперсия значений при­знака; ω (1 - ω ) выборочная дисперсия доли значений признака; n — объем выборки; N — объем генеральной совокупности; n/N доля обследован­ной совокупности; (1- n/N) — поправка на конеч­ность совокупности (в литературе (1 - n/N) иногда называется «поправкой на бесповторность отбора»).

7.4. Определение численности (объема) выборки

Одной из важнейших проблем выборочного метода является определение необходимого объема выборки (табл. 7.2). От объема выборки зависит размер средней ошибки (m) и экономичность проводимого выборочного наблюдения, так как чем больше объем выборки, тем больше затраты на изучение элементов выборки, но тем меньше при этом ошибка выборки. Из формулы предельной ошибки D = tm. и фор­мул средних ошибок выборки определяются фор­мулы необходимой численности выборки для различных способов отбора.

Таблица 7.2

Формулы, расчета необходимой численности выборки для собственно-случайного отбора


 

7.5. Интервальное оценивание

Пусть  ε = X- - X . Если D представляет собой пре­дел, которым ограничена сверху абсолютная величина |e| < D, то |  Х -X | < D. Следовательно,


Мы получили интервальную оценку генеральной средней. Из теоремы Чебышева следует, что


Интервальной оценкой называют оценку, кото­рая определяется 2 числами — концами интерва­ла, который с определенной вероятностью накры­вает неизвестный параметр генеральной совокуп­ности. Интервал, содержащий оцениваемый пара­метр генеральной совокупности, называют дове­рительным интервалом. Для его определения вы­числяется предельная ошибка выборки D, позволя­ющая установить предельные границы, в которых с заданной вероятностью (надежностью) должен на­ходиться параметр генеральной совокупности.

Предельная ошибка выборки равна t-кратному числу средних ошибок выборки. Коэффициент t позволяет установить, насколько надежно выска­зывание о том, что заданный интервал содержит параметр генеральной совокупности. Если мы вы­берем коэффициент таким, что высказывание в 95% случаев окажется правильным и только в 5% — неправильным, то мы говорим: со статистичес­кой надежностью в 95% доверительный интервал выборочной статистики содержит параметр генеральной совокупности. Статистической надежности в 95% соответствует доверительная вероятность — 0,95. В 5% случаев утверждение «параметр принадлежит доверительному интервалу» будет неверным, т. е. 5% задает уровень значимости (a) или 0,05 вероятность ошибки. Обычно в статистике уровень значимости выбирают таким, чтобы он не превы­сил 5% (a < 0,05). Доверительная вероятность и уровень значимости дополняют друг друга до 1 (или 100%) и определяют надежность статистического высказывания.

С помощью доверительного интервала можно оце­нить не только генеральную среднюю, но и другие неизвестные параметры генеральной совокупности.

Для оценки математического ожидания а (ге­неральной средней)* нормально распределенного количественного признака Х по выборочной средней X- при известном среднем квадратическом отклоне­нии s генеральной совокупности (на практике — при большом объеме выборки, т. е. при п ≥ 30) и собственно-случайном повторном отборе формула (7.5) примет вид


где t определяется по таблицам функции Лапласа (приложение 2) из соотношения 2Ф0(t) = γ; s сред­нее квадратическое отклонение; п — объем выбор­ки (число обследованных единиц).


* Для нормально распределенной случайной величины М(X-) = а »`X.  Поэтому справедливо Р(X-- а| < D) »`X.

 

Для оценки математического ожидания а (гене­ральной средней) нормально распределенного количественного признака Х по выборочной средней X- при известном среднем квадратическом отклонении s генеральной совокупности (при большом объе­ме выборки, т. е. при п ≥ 30) и собственно-случай­ном бесповторном отборе формула (7.6) примет вид


Для оценки математического ожидания а (гене­ральной средней) нормально распределенного количественного признака Х по выборочной средней Х- при неизвестном среднем квадратическом отклонении (σ генеральной совокупности (на практике — при малом объеме выборки, т. е. при п < 30) и соб­ственно-случайном повторном отборе формула (7.6) будет иметь вид


где t определяется по таблицам Стьюдента (прило­жение 5), по уровню значимости α = 1 — g и числу степеней свободы k = п — 1; s — исправленное вы­борочное среднее квадратическое отклонение; п — объем выборки.


Для оценки математического ожидания а (гене­ральной средней) нормально распределенного количественного признака Х по выборочной средней X- при неизвестном среднем квадратическом отклонении σ- генеральной совокупности (при малом объе­ме выборки, т. е. при п < 30) и собственно-случай­ном бесповторном отборе формула (7.8) примет вид


Для оценки генеральной доли р нормально рас­пределенного количественного признака по выборочной доле ω= т/п (при большом объеме выбор­ки, т. е. при п ³ 30) и собственно-случайном повторном отборе формула (7.5) будет иметь вид


где t определяется по таблицам функции Лапласа (приложение 2) из соотношения 2Ф0(t) = g; ω  выборочная доля; п — объем выборки (число обсле­дованных единиц);


Для оценки генеральной доли р нормально рас­пределенного количественного признака по выбо­рочной доле ω = т/п (при большом объеме выборки, т. е. при п ³ 30) и собственно-случайном бесповторном отборе формула (7.10) примет вид


Для оценки генеральной доли р нормально рас­пределенного количественного признака по выборочной доле ω = т/п (при малом объеме выборки, т. е. при п < 30) и собственно-случайном повторном отборе формула (7.10) примет вид


где t определяется по таблицам Стьюдента (прило­жение 5), по уровню значимости α = 1 - γ и числу степеней свободы k = п - 1.


Для оценки генеральной доли р нормально рас­пределенного количественного признака по выборочной доле ω = т/п (при малом объеме выборки, т. е. при п < 30) и собственно-случайном беспоторном отборе формула (7.12) будет иметь вид


Пример 1. С помощью собственно-случайного повторного отбора руководство фирмы провело выборочное обследование 900 своих служащих. Сред­ний стаж их работы в фирме равен 8,70 года, а сред­нее квадратическое (стандартное) отклонение — 2,70 года. Среди обследованных оказалось 270 женщин. Считая стаж работы служащих фирмы распреде­ленным по нормальному закону, определите: а) с вероятностью 0,95 доверительный интервал, в ко­тором окажется средний стаж работы всех служащих фирмы; б) с вероятностью 0,90 доверительный интервал, накрывающий неизвестную долю женщин во всем коллективе фирмы.

Решение. По условию задачи выборочное обсле­дование проведено с помощью собственно-случайного повторного отбора. Объем выборки п = 900 единиц, т. е. выборка большая.

а) Найдем границы доверительного интервала среднего стажа работы всего коллектива фирмы, т. е. границы доверительного интервала для генераль­ной средней.

По условию X- = 8,70; s= 2,70; п = 900; g= 0,95. Используем формулу


Найдем t из соотношения 2Ф0(t) = g: 2Ф0(t) = 0,95; Ф0(t) = 0,95/2 = 0.475.

По таблице функции Лапласа (приложение 2) найдем, при каком t Ф0(t) = 0,475. Ф0(1,96) = 0,475.

Следовательно, t = 1,96.

Найдем предельную ошибку выборки


С вероятностью 0,95 можно ожидать, что сред­ний стаж работы всего коллектива фирмы находит­ся в интервале от 8,5236 до 8,8764 года.

б) Теперь оценим истинное значение доли жен­щин во всем коллективе фирмы.

По условию т = 270; п = 900; γ= 0,90.

Выборочная доля ω = 270/900 = 0,30.

Используем формулу


 

Найдем t из соотношения 2Ф0(t) = γ 2Ф0(t) = 0,90; Ф0(t) = 0,90/2 = 0,45.

По таблице функции Лапласа (приложение 2) определим, при каком t Ф0(t) = 0,45. Ф0(1,64) = 0,45.

Следовательно, t = 1,64.

Предельная ошибка выборки определяется по формуле


Итак, с вероятностью 0,90 можно ожидать, что доля женщин во всем коллективе фирмы находит­ся в интервале от 0,2749 до 0,3251.

Ответ. Можно ожидать, что с вероятностью 0,95 средний стаж работы всех служащих фирмы находится в интервале от 8,5236 до 8,8764 года. С веро­ятностью 0,90 можно гарантировать, что доля жен­щин во всем коллективе фирмы находится в интер­вале от 0,2749 до 0,3251.

Пример 2. Изменим условие примера 1.

1) С помощью собственно-случайного повторного отбора определяется средний стаж работы служа­щих фирмы. Предполагается, что он подчиняется нормальному закону. Каким должен быть объем выборки, чтобы с доверительной вероятностью 0,95 можно было утверждать, что, принимая полученный средний стаж работы за истинный, совершается погрешность, не превышающая 0,50 года, если стан­дартное отклонение σ равно 2,70 года?

2) Каким должен быть объем собственно-случай­ной повторной выборки, чтобы с надежностью 0,90 можно было утверждать, что максимальное откло­нение выборочной доли женщин в выборке от доли женщин во всем коллективе фирмы не превышало 0,05, если в прошлом аналогичном обследовании выборочная доля женщин оказалась равной 0,30?

Решение. В данной задаче нужно найти необхо­димую численность выборки. Ее расчет дает ответ на вопрос: «Сколько нужно обследовать единиц со­вокупности, чтобы с заранее заданной вероятнос­тью не превысить заранее заданную ошибку?»

1) Дано: D = 0,50; s= 2,70; g= 0,95.

По условию задачи требуется найти необходимую численность выборки для средней при повторном отборе. Воспользуемся формулой расчета необходи­мой численности выборки для средней при собствен­но-случайном повторном отборе: п = t2s2/D2.

Неизвестное значение t найдем из соотношения 2Ф0(t) = g0(t) = 0,95; Ф0(t)= 0,95/2 = 0,475.

По таблице функции Лапласа (приложение 2) найдем, при каком t Ф0(t) = 0,475. Ф0(1,96) = 0,475.

Следовательно, t = 1,96.

Рассчитаем необходимую численность выборки


Так как п — целое число, округлим полученный результат до большего целого, учитывая, что необходимо не превышать заданную ошибку.

Следовательно, надо обследовать не менее 113 слу­жащих.

Ответ. Чтобы с вероятностью 0,95 и D = 0,50 года с помощью собственно-случайного повторного отбо­ра определить средний стаж работы в фирме, необ­ходимо обследовать не менее 113 служащих.

2) Дано: D = 0,05; ω = 0,30; g= 0,90.

По условию задачи требуется найти необходимую численность выборки для доли при собственно-слу­чайном повторном отборе.

Воспользуемся формулой расчета необходимой численности выборки для доли при собственно-случайном повторном отборе:


Найдем t из соотношения 2Ф0(t) = g. 2Ф0(t) = 0,90; Ф0(t) = 0,90/2 = 0,45.

По таблице функции Лапласа (приложение 2) най­дем, при каком t Ф0(t) = 0,45. Ф0(1,64) = 0,45. Следовательно, t = 1,64.

Рассчитаем необходимую численность выборки:


Так как п — целое число, округлим полученный результат до большего целого, учитывая, что необходимо не превышать заданную ошибку.

Следовательно, п 226.

Ответ. Чтобы с вероятностью 0,90 и ошибкой D=0,05 с помощью собственно-случайного повтор­ного отбора определить долю женщин во всем кол­лективе фирмы, необходимо обследовать не менее 226 служащих.

Пример 3. Владелец автостоянки опасается об­мана со стороны своих служащих (охраны автостоянки). В течение года (365 дней) владельцем авто­стоянки проведено 40 проверок. По данным прове­рок среднее число автомобилей, оставляемых на ночь на охрану, составило 400 единиц, а среднее квадратическое (стандартное) отклонение их числа — 10 автомобилей. Считая отбор собственно-случай­ным, с вероятностью 0,99 оцените с помощью дове­рительного интервала истинное среднее число авто­мобилей, оставляемых на ночь на охрану. Обосно­ваны ли опасения владельца автостоянки, если по отчетности охранников среднее число автомобилей, оставляемых на ночь на охрану, составляет 395 автомобилей?

Решение. По условию задачи выборочное обсле­дование проведено с помощью собственно-случайного отбора. Очевидно, что отбор — бесповторный, так как не имеет смысла производить проверку бо­лее 1 раза в сутки. Объем выборки n = 40, что боль­ше 30 единиц, т. е. выборка большая. Объем гене­ральной совокупности N = 365.

Найдем границы доверительного интервала для оценки среднего числа автомобилей, оставляемых на ночь на охрану, т.е. границы доверительного интервала для генеральной средней.

По условию

Х-= 400; s = 10; п = 40; g= 0,99; N=365. Используем формулу


Найдем t из соотношения 2Ф (t) = g. 2Ф0(t) = 0,99; Ф0(t) = 0,99/2 = 0,495.

По таблице функции Лапласа (приложение 2) найдем, при каком t Ф0(t) = 0,495. Ф0(2,58) = 0,495.

Следовательно, t = 2,58.

Найдем предельную ошибку выборки:


Ответ. С уверенностью в 99% можно ожидать, что среднее число автомобилей, оставляемых на ночь на охрану, находится в интервале от 396 до 404. Таким образом, можно утверждать, что служащие автостоянки обманывают ее владельца.

Пример 4. В 24 из 40 проверок число автомоби­лей на автостоянке не превышало 400 единиц. С вероятностью 0,98 найдите доверительный интер­вал для оценки истинной доли дней в течение года, когда число оставляемых на стоянке автомобилей не превышало 400 единиц.

Решение. Определим границы доверительного интервала для доли дней в течение года, когда чис­ло оставляемых на стоянке автомобилей не превы­шало 400 единиц.

По условию т = 24; п = 40; g =.0,98.

Выборочная доля ω = 24/40 = 0,60. Так как


то найдем t из соотношения 2Ф0(t) = g. 2Ф0(t) = 0,98; Ф0(t) = 0,98/2 = 0,49.

По таблице функции Лапласа (приложение 2) найдем, при каком t Ф0(t) = 0,49. Ф0(2,33) = 0,49.

Следовательно, t = 2,33.

Найдем предельную ошибку выборки:


Ответ. С вероятностью 0,98 можно ожидать, что доля дней в течение года, когда число оставляемых на стоянке автомобилей не превышало 400 единиц, находится в интервале от 0,4297 до 0,7703.

Пример 5. Изменим условие примера 3.

С помощью собственно-случайного бесповторно­го отбора определяется среднее число автомобилей, оставляемых на ночь на охрану. Предполагается, что оно подчиняется нормальному закону. Каким должен быть объем выборки, чтобы с вероятностью 0,95 можно было утверждать, что когда принимается полученное среднее число автомобилей по вы­борке за истинное, совершается погрешность, не пре­вышающая 3 автомобилей, если среднее квадратическое отклонение s равно 10 автомобилям?

Решение. Дано: D= 3; σ = 10; g= 0,95; N=365. Воспользуемся формулой расчета необходимой численности выборки для средней при собственно-случайном бесповторном отборе;


Найдем t из соотношения 2Ф0(t) = g. 2Ф0(t) = 0,95; Ф0(t) = 0,95/2 = 0,475.

По таблице функции Лапласа (приложение 2) найдем, при каком t Ф0(t) = 0,475. Ф0(1,96) = 0,475.

Следовательно, t = 1,96.

Рассчитаем объем выборки:


Так как п — целое число, округлим полученный результат до большего целого, учитывая, что необходимо не превышать заданную ошибку.

Следовательно, необходимо провести не менее 39 проверок.

Ответ. Для определения среднего числа автомо­билей, оставляемых на ночь на охрану с вероятностью 0,95 и D = 3, необходимо провести не менее 39 проверок.

Пример 6. Изменим условие примера 4.

Каким должен быть объем собственно-случайной бесповторной выборки, чтобы с вероятностью 0,90 можно было утверждать, что максимальное откло­нение выборочной доли дней от доли дней в тече­ние года (когда среднее число оставляемых на ох­рану автомобилей не превышало 400 единиц) не превышало 0,10, если по данным прошлых прове­рок выборочная доля таких дней составляла 0,60?

Решение. Дано: Δ = 0,10; ω = 0,60; g= 0,90; N=365. Воспользуемся формулой расчета необходимой численности выборки для доли при собственно-слу­чайном бесповторном отборе


Найдем t из соотношения 2Ф0(t) = у. 2Ф0(t) = 0,90; Ф0(t) = 0,90/2 = 0,45.

По таблице функции Лапласа (приложение 2) найдем, при каком t Ф0(t) = 0,45. Ф0(1,64) = 0,45.

Следовательно, t = 1,64.

Рассчитаем необходимую численность выборки:


Так как п — целое число, округлим полученный результат до большего целого, учитывая, что необходимо не превышать заданную ошибку.

Следовательно, n » 55.

Ответ. Для того чтобы с вероятностью 0,90 и пре­дельной ошибкой 0,10 с помощью собственно-случайного бесповторного отбора определить искомую долю дней в течение года, необходимо провести не менее 55 проверок.

Пример 7. Служба контроля энергосбыта прове­ла выборочную проверку расхода электроэнергии жителями одного из многоквартирных домов. С помо­щью собственно-случайного отбора выбрано 10 квар­тир и определен расход электроэнергии в течение одного из летних месяцев (кВт · ч): 125; 78; 102;

140; 90; 45; 50;125; 115;112.

С вероятностью 0,95 определите доверительный интервал для оценки среднего расхода электроэнергии на 1 квартиру во всем доме при условии, что в доме 70 квартир, а отбор был: а) повторным; б) бес­повторным.

Решение. По условию задачи выборочное обсле­дование проведено с помощью собственно-случайного отбора. Объем выборки n = 10 единиц, т. е. выборка малая.

а) Считая отбор повторным, найдем доверитель­ный интервал для оценки среднего расхода электроэнергии на 1 квартиру во всем доме, т. е. грани­цы доверительного интервала для оценки генераль­ной средней.

Для этого используем формулы:


Для определения границ доверительного интер­вала необходимо рассчитать выборочные среднюю и среднее квадратическое (стандартное) отклонение.

Рассчитаем выборочную среднюю арифметическую:


Найдем исправленную выборочную дисперсию:


Найдем исправленное выборочное среднее квадратическое отклонение


Итак, дано: Х. = 98,2; s= 32,1448; п = 10; у= 0,95. По таблице Стьюдента (приложение 5) найдем t по уровню значимости α и числу степеней свободы k.

α = 1 - γ= 1 - 0,95 = 0,05;

k=n-1=10-1=9;

ta=0,05;k=9=2,26

Найдем предельную ошибку выборки



Ответ. При условии, что отбор квартир был по­вторным, с вероятностью 0,95 можно ожидать, что средний расход электроэнергии на 1 квартиру во всем доме находится в интервале от 75,2269 до

121,1731 кВт.ч.

б) Найдем границы доверительного интервала для оценки среднего расхода электроэнергии на 1 квар­тиру во всем доме, считая отбор бесповторным.

Для этого используем формулы:


По условию Х. = 98,2; s = 32,1448;п = 10; g= 0,95;ta=0,05;k=9= 2,26; N = 70.

Найдем предельную ошибку выборки:


76,9311 <`X<119,4689.

Ответ. При условии, что отбор квартир был бес­повторным, с вероятностью 0,95 можно ожидать, что средний расход электроэнергии на 1 квартиру во всем доме находится в интервале от 76,9311 до 119,4689 кВт ч.

 

Задачи к теме 7

1. С целью изучения размеров дневной выручки в сфере мелкого частного бизнеса была произведена 10%-я случайная бесповторная выборка из 1 000 торговых киосков города. В результате были полу­чены данные о средней дневной выручке, которая составила 500 у.е. В каких пределах с доверитель­ной вероятностью 0,95 может находиться средняя дневная выручка всех торговых точек изучаемой совокупности, если среднее квадратическое откло­нение составило 150 у. е.?

2. Фирма, торгующая автомобилями в неболь­шом городе, собирает информацию о состоянии местного автомобильного рынка в текущем году. С этой целью из 8 746 лиц в возрасте 18 лет и старше, про­живающих в этом городе, отобрано 500 человек. Среди них оказалось 29 человек, планирующих приобрести новый автомобиль в текущем году. Оце­ните долю лиц в генеральной совокупности в возрасте 18 лет и старше, планирующих приобрести но­вый автомобиль в текущем году, если a = 0,05.

3. Для оценки числа безработных среди рабочих одного из районов города в порядке случайной повторной выборки отобраны 400 человек рабочих спе­циальностей. 25 из них оказались безработными. Используя 95%-й доверительный интервал, оцени­те истинные размеры безработицы среди рабочих этого района.

4. Туристическое бюро, рекламируя отдых на одном из морских курортов, утверждает, что для этого курорта характерна идеальная погода со среднегодовой температурой +20° С. Пусть случай­но отобраны 35 дней в году. Какова в этом случае вероятность того, что отклонение средней темпера­туры за отобранные дни от среднегодовой темпера­туры не превысит по абсолютной величине 2° С, если температура воздуха распределена по нормальному закону, а стандартное отклонение дневной температуры составляет 4° С ?

5. Выборочные обследования малых предприя­тий города показали, что 95% малых предприятий в выборке относятся к негосударственной форме собственности. Приняв доверительную вероятность равной 0,954, определите, в каких границах нахо­дится доля негосударственных малых предприятий в генеральной совокупности, если в выборку попа­ло 100 предприятий?

6. В целях изучения среднедушевого дохода се­мей города в 1995 г. была произведена 1% -я повторная выборка из 30 тыс. семей. По результатам об­следования среднедушевой доход семьи в месяц со­ставил 200 тыс. руб. со средним квадратическим от­клонением, равным 150 тыс. руб. С вероятностью 0,95 найдите доверительный интервал, в котором на­ходится величина среднедушевого дохода всех семей города, считая среднедушевой доход случайной ве­личиной, распределенной по нормальному закону.

7. Для изучения различных демографических характеристик населения выборочно обследовано 300 семей города. Оказалось, что среди обследован­ных семей 15% состоят из 2 человек. В каких пре­делах находится в генеральной совокупности доля семей, состоящих из 2 человек, если принять доверительную вероятность равной 0,95?

8. По данным выборочных обследований в 1995 г. прожиточный минимум населения Северо-Кавказ­ского района составил в среднем на душу населе­ния 87 тыс. руб. в месяц. Каким должен был быть минимально необходимый объем выборки, чтобы с вероятностью 0,997 можно было утверждать, что этот показатель уровня жизни населения в выбор­ке отличается от своего значения в генеральной совокупности не более чем на 10 тыс. руб., если сред­нее квадратическое отклонение принять равным 30 тыс. руб.?

9. В 1995 г. выборочное обследование распреде­ления населения города по среднедушевому денежному доходу показало, что 40% обследованных в выборке имеют среднедушевой денежный доход не более 200 тыс. руб. В каких пределах находится доля населения, имеющего такой среднедушевой доход, во всей генеральной совокупности, если объем генеральной совокупности составляет 1 000 000 единиц, выборка не превышает 10% объе­ма генеральной совокупности и осуществляется по методу собственно-случайного бесповторного отбо­ра, а доверительная вероятность принимается рав­ной 0,954?

10. Аудиторская фирма хочет проконтролиро­вать состояние счетов одного из коммерческих бан­ков. Для этого случайно отбираются 50 счетов. По 20 счетам из 50. отобранных имело место движе­ние денежных средств в течение месяца. Построй­те 99%-й доверительный интервал, оценивающий долю счетов в генеральной совокупности, по кото­рым имело место движение денежных средств в течение месяца.

11. Строительная компания хочет оценить воз­можности успешного бизнеса на рынке ремонтностроительных работ. Эта оценка базируется на слу­чайной бесповторной выборке, в соответствии с ко­торой из 1 000 домовладельцев, собирающихся ре­монтировать или перестраивать свои дома, отобра­ны 600 человек. По этой выборке определено, что средняя стоимость строительных работ, которую предполагает оплатить отдельный домовладелец, составляет 5 000 у. е. С какой вероятностью можно гарантировать, что эта стоимость будет отличаться от средней стоимости строительных работ в гене­ральной совокупности по абсолютной величине не более, чем на 100 у. е., если стандартное отклоне­ние стоимости строительных работ в выборке со­ставило 500 у. е.?

12. Менеджер компании, занимающейся прока­том автомобилей, хочет оценить среднюю величину пробега одного автомобиля в течение месяца. Из 280 автомобилей, принадлежащих компании, методом случайной бесповторной выборки отобрано 30. По данным этой выборки установлено, что средний пробег автомобиля в течение месяца составляет 1 342 км со стандартным отклонением 227 км. Считая про­бег автомобиля случайной величиной, распределен­ной по нормальному закону, найдите 95%-й доверительный интервал, оценивающий средний про­бег автомобилей всего парка в течение месяца.

13. Среднемесячный бюджет студентов в коллед­жах одного из штатов США оценивается по случайной выборке. С вероятностью 0,954 найдите наи­меньший объем выборки, необходимый для такой оценки, если среднее квадратическое отклонение предполагается равным 100 у. е., а предельная ошибка средней не должна превышать 20 у. е.

14. Коммерческий банк, изучая возможности предоставления долгосрочных кредитов населению, опрашивает своих клиентов для определения сред­него размера такого кредита. Из 9 706 клиентов бан­ка опрошено 1 000 человек. Среднее значение необ­ходимого кредита в выборке составило 6 750 у. е. со стандартным отклонением 1 460 у. е. Найдите границы 95%-го доверительного интервала для оцен­ки неизвестного среднего значения кредита в гене­ральной совокупности.

15. Выборочные обследования показали, что доля покупателей, предпочитающих новую модификацию товара А, составляет 60% от общего числа покупа­телей данного товара. Каким должен быть объем выборки, чтобы можно было получить оценку гене­ральной доли с точностью не менее 0,05 при дове­рительной вероятности 0,90?

16. С помощью случайной выборки оценивается среднее время ежедневного просмотра телепередач абонентами кабельного телевидения в период с 18 до 22 ч. Каким должен быть объем выборки в этом случае, если в предыдущих выборочных обследова­ниях стандартное отклонение времени просмотра передач составило 40 мин, а отклонение выбороч­ной средней от генеральной средней по абсолютной величине не должно превышать 5 мин с вероятнос­тью 0,99?

17. При выборочном опросе 1200 телезрителей оказалось, что 456 из них регулярно смотрят программы телеканала НТВ. Постройте 99%-й доверительный интервал, оценивающий долю всех телезрителей, предпочитающих программы телеканала НТВ.

18. Для оценки остаточных знаний по общеэконо­мическим предметам были протестированы 25 студентов 2-го курса факультета. Получены следую­щие результаты в баллах: 107, 90, 114, 88, 117, 110, 103, 120, 96, 122, 93, 100, 121, 110, 135, 85, 120, 89, 100, 126, 90, 94, 99, 116, 111. По этим данным найдите 95%-й доверительный интервал для оценки среднего балла тестирования всех студен­тов 2-го курса факультета.

19. Для изучения размера среднемесячной зара­ботной платы занятого населения региона производится случайная повторная выборка. Каким дол­жен быть объем этой выборки, чтобы с доверитель­ной вероятностью 0,997 можно было утверждать, что среднемесячная заработная плата в выборке отличается от среднемесячной заработной платы работников во всем регионе по абсолютной величи­не не более чем на 25%, если среднемесячная зара­ботная плата в выборке составила 220 у. е. со сред­ним квадратическим отклонением 120 у. е.?

20. Выборочное исследование деятельности ком­мерческих банков региона показало, что в среднем каждый банк имеет 10 филиалов в регионе (со стан­дартным отклонением, равным 5). Найдите объем выборки, позволивший сделать такую оценку, если предельная ошибка выборочной средней находится в пределах 20% от ее фактического значения, а до­верительная вероятность составляет 0,95.

 

8. ПРОВЕРКА СТАТИСТИЧЕСКИХ ГИПОТЕЗ

В процессе статистического анализа иногда быва­ет необходимо сформулировать и проверить предпо­ложения (гипотезы) относительно величины незави­симых параметров или закона распределения изуча­емой генеральной совокупности (совокупностей). На­пример, исследователь выдвигает гипотезу о том, что «выборка извлечена из нормальной генеральной со­вокупности» или «генеральные средние двух анали­зируемых совокупностей равны». Такие предполо­жения называются статистическими гипотезами.

Сопоставление высказанной гипотезы относи­тельно генеральной совокупности с имеющимися выборочными данными, сопровождаемое количе­ственной оценкой степени достоверности получа­емого вывода и осуществляемое с помощью того или иного статистического критерия, называется проверкой статистических гипотез.

Выдвинутая гипотеза называется нулевой (ос­новной). Ее принято обозначать Н0.

По отношению к высказанной (основной) гипо­тезе всегда можно сформулировать альтернатив­ную (конкурирующую), противоречащую ей. Аль­тернативную (конкурирующую) гипотезу принято обозначать Н1 .

Цель статистической проверки гипотез состо­ит в том, чтобы на основании выборочных данных принять решение о справедливости основной гипо­тезы Н0

Если выдвигаемая гипотеза сводится к утверж­дению о том, что значение некоторого неизвестно­го параметра генеральной совокупности в точнос­ти равно заданной величине, то эта гипотеза на­зывается простой, например: «Среднедушевой сово­купный доход населения России составляет 650 руб. в месяц»; «Уровень безработицы (доля безработных в численности экономически активного населения) в России равен 9%». В других случаях гипотеза называется сложной.

В качестве нулевой гипотезы Н0 принято выдви­гать простую гипотезу, так как обычно бывает удобнее проверять более строгое утверждение.

По своему содержанию статистические гипотезы можно подразделить на несколько основных типов*:

— гипотезы о виде закона распределения иссле­дуемой случайной величины;

— гипотезы о числовых значениях параметров исследуемой генеральной совокупности**;

— гипотезы об однородности двух или несколь­ких выборок или некоторых характеристик анали­зируемых совокупностей;

                       гипотезы об общем виде модели, описываю­щей статистическую зависимость между признака­ми; и др.

* В этой работе рассматриваются первые два типа гипотез.

** Эти гипотезы часто называют параметрическими, тогда как все остальные — непараметрическими.

 

Так как проверка статистических гипотез осу­ществляется на основании выборочных данных, т. е. ограниченного ряда наблюдений, решения относительно нулевой гипотезы Н0 имеют вероятностный характер. Другими словами, такое решение неиз­бежно сопровождается некоторой, хотя возможно и очень малой, вероятностью ошибочного заключения как в ту, так и в другую сторону.

Так, в какой-то небольшой доле случаев α нуле­вая гипотеза Н0 может оказаться отвергнутой, в то время как в действительности в генеральной сово­купности она является справедливой. Такую ошиб­ку называют ошибкой 1-го рода, а ее вероятность — 1 уровнем значимости и обозначают α.

Наоборот, в какой-то небольшой доле случаев b нулевая гипотеза Н0 принимается, в то время как на самом деле в генеральной совокупности она ошибоч­на, а справедлива альтернативная гипотеза Н1. Такую ошибку называют ошибкой 2-го рода. Вероят­ность ошибки 2-го рода обозначается как b. Вероятность 1 - b называют мощностью критерия.

При фиксированном объеме выборки можно выб­рать по своему усмотрению величину вероятности только одной из ошибок α или b. Увеличение веро­ятности одной из них приводит к снижению дру­гой. Принято задавать вероятность ошибки 1-го рода a уровень значимости. Как правило, пользуются некоторыми стандартными значениями уровня зна­чимости a: 0,1; 0,05; 0,025; 0,01; 0,005; 0,001. Тог­да, очевидно, из двух критериев, характеризующих­ся одной и той же вероятностью a (отклонить правильную в действительности гипотезу Н0), следует принять тот, которому соответствует меньшая ошиб­ка 2-го рода b, т.е. большая мощность. Снижения вероятностей обеих ошибок a и b можно добиться путем увеличения объема выборки.

Правильное решение относительно нулевой ги­потезы Н0 также может быть двух видов:

— будет принята нулевая гипотеза Н0, когда в генеральной совокупности верна нулевая гипотеза Н0 ; вероятность такого решения 1 - a;

нулевая гипотеза Н0 будет отклонена в пользу альтернативной Н1, когда в генеральной совокупности нулевая гипотеза Н0 отклоняется в пользу альтер­нативной Н1, вероятность такого решения 1 - bмощность критерия.

Результаты решения относительно нулевой гипо­тезы можно проиллюстрировать с помощью табл. 8.1.

Таблица 8.1

Нулевая гипотеза Н0

 

Результаты решения относительно нулевой гипотезы Н0

 

Отклонена

 

Принята

 

Верна

Ошибка 1-го рода, ее вероятность

Р(Н10) = a

Правильное решение, его вероятность Р(Н0/Н0) = 1 - a

Неверна

Правильное решение, его вероятность Р(Н11) = 1 -  b

Ошибка 2-го рода, ее вероятность

Р(Н0/Н0) =  b

 

Проверка статистических гипотез осуществляет­ся с помощью статистического критерия (назо­вем его в общем виде К), являющего функцией от результатов наблюдения.

Статистический критерий — это правило (фор­мула), по которому определяется мера расхожде­ния результатов выборочного наблюдения с выс­казанной гипотезой Н0.

Статистический критерий, как и всякая функ­ция от результатов наблюдения, является случайной величиной и в предположении справедливости нулевой гипотезы Н0 подчинен некоторому хорошо изученному (и затабулированному) теоретическому закону распределения с плотностью распределения

f(k).

Выбор критерия для проверки статистических гипотез может быть осуществлен на основании различных принципов. Чаще всего для этого пользу­ются принципом отношения правдоподобия, который позволяет построить критерий, наиболее мощ­ный среди всех возможных критериев. Суть его сво­дится к выбору такого критерия К с известной фун­кцией плотности f(k) при условии справедливости гипотезы Н0, чтобы при заданном уровне значимос­ти α можно было бы найти критическую точку К распределения f(k), которая разделила бы область значений критерия на две части: область допусти­мых значений, в которой результаты выборочного наблюдения выглядят наиболее правдоподобными, и критическую область, в которой результаты вы­борочного наблюдения выглядят менее правдоподобными в отношении нулевой гипотезы Н0.

Если такой критерий К выбран, и известна плот­ность его распределения, то задача проверки статистической гипотезы сводится к тому, чтобы при заданном уровне значимости α рассчитать по выбо­рочным данным наблюдаемое значение критерия Kнабл определить, является ли оно наиболее или наименее правдоподобным в отношении нулевой ги­потезы Н0.

Проверка каждого типа статистических гипотез осуществляется с помощью соответствующего критерия, являющегося наиболее мощным в каждом конкретном случае. Например, проверка гипотезы о виде закона распределения случайной величины может быть осуществлена с помощью критерия согласия Пирсона x2; проверка гипотезы о равенстве неизвестных значений дисперсий двух генеральных совокупностей — с помощью критерия Фише­ра F; ряд гипотез о неизвестных значениях пара­метров генеральных совокупностей проверяется с помощью критерия Z нормальной распределен­ной случайной величины и критерия t-Стьюдента и т. д.

Значение критерия, рассчитываемое по специ­альным правилам на основании выборочных дан­ных, называется наблюдаемым значением критерия(Kнабл).

Значения критерия, разделяющие совокупность значений критерия на область допустимых значе­ний (наиболее правдоподобных в отношении нуле­вой гипотезы Н0) и критическую область (область значений, менее правдоподобных в отношении ну­левой гипотезы Н0), определяемые на заданном уровне значимости α  по таблицам распределения случайной величины К, выбранной в качестве критерия, называются критическими точками кр ).

Областью допустимых значений (областью при­нятия нулевой гипотезы Н0) называют совокуп­ность значений критерия К, при которых нулевая гипотеза Н0 не отклоняется.

Критической областью называют совокупность значений критерия К, при которых нулевая гипо­теза Н0 отклоняется в пользу конкурирующей Н1.

Различают одностороннюю (правостороннюю или левостороннюю) и двустороннюю критические об­ласти.

Если конкурирующая гипотеза — правосторон­няя, например, Н1: а > a0, то и критическая область — правосторонняя (рис. 8.1). При правосто­ронней конкурирующей гипотезе критическая точка кр.п) принимает положительные значения.


Если конкурирующая гипотеза — левосторонняя, например, Н1 : а < а0, то и критическая область — левосторонняя (рис. 8.2). При левосторонней кон­курирующей гипотезе критическая точка принимает отрицательные значения кр.л).


Если конкурирующая гипотеза — двусторонняя, например. Н1: а ¹ а0 , то и критическая область — двусторонняя (рис. 8.3). При двусторонней конку­рирующей гипотезе определяются 2 критические точки кр.л  и K кр..п)


Основной принцип проверки статистических гипотез состоит в следующем:

— если наблюдаемое значение критерия набл) принадлежит критической области, то нулевая ги­потеза Н0 отклоняется в пользу конкурирующей H1;

— если наблюдаемое значение критерия набл) принадлежит области допустимых значений, то нулевую гипотезу Н0 нельзя отклонить.

Можно принять решение относительно нулевой гипотезы Н0 путем сравнения наблюдаемого набл) и критического значений критерия кр. ).

При правосторонней конкурирующей гипотезе:

если Кнабл£Ккр. , то нулевую гипотезу Н0нельзя отклонить;

— если Кнабл > Kкр , то нулевая гипотеза Н0 откло­няется в пользу конкурирующей Н1.

При левосторонней конкурирующей гипотезе:

если Кнабл³кр, то нулевую гипотезу Н0  нельзя отклонить;

— если Кнабл < -Ккр , то нулевая гипотеза Н0 от­клоняется в пользу конкурирующей Н1.

При двусторонней конкурирующей гипотезе:

     если кр £ Кнабл£ Ккр, то нулевую гипотезу Н0 нельзя отклонить;

— если Кнабл > Ккр или Кнабл < -Ккр, то нулевая гипотеза Н0  отклоняется в пользу конкурирующей Н1.

 

Алгоритм проверки статистических гипотез сводится к следующему:

1) сформулировать нулевую Н0  и альтернатив­ную Н1 гипотезы;

2) выбрать уровень значимости α;

3) в соответствии с видом выдвигаемой нулевой гипотезы Н0 выбрать статистический критерий для ее проверки, т.е. — специально подобранную слу­чайную величину К, точное или приближенное распределение которой заранее известно;

4) по таблицам распределения случайной вели­чины К, выбранной в качестве статистического критерия, найти критическое значение Ккр (критиче­скую точку или точки);

5) на основании выборочных данных по специ­альному алгоритму вычислить наблюдаемое значе­ние критерия Кнабл;

6) по виду конкурирующей гипотезы Н1 опреде­лить тип критической области;

7) определить, в какую область (допустимых зна­чений или критическую) попадает наблюдаемое значение критерия Кнабл ,  и в зависимости от этого — принять решение относительно нулевой гипотезы

Н0

           Следует заметить, что даже в том случае, если нулевую гипотезу Н0 , нельзя отклонить, это не означает, что высказанное предположение о генераль­ной совокупности является единственно подходя­щим: просто ему не противоречат имеющиеся вы­борочные данные, однако таким же свойством на­ряду с высказанной могут обладать и другие гипо­тезы.

Можно интерпретировать результаты проверки нулевой гипотезы следующим образом:

— если в результате проверки нулевую гипотезу Н0 нельзя отклонить, то это означает, что имеющиеся выборочные данные не позволяют с достаточ­ной уверенностью отклонить нулевую гипотезу Н0, вероятность нулевой гипотезы Н0 больше a, а кон­курирующей Н1 меньше 1 - a;

если в результате проверки нулевая гипотеза Н0 отклоняется в пользу конкурирующей Н1, то имеющиеся выборочные данные не позволяют с до­статочной уверенностью принять нулевую гипотезу Н0, вероятность нулевой гипотезы Н0 меньше a, а конкурирующей Н1 больше 1 - a.

Пример 1. В 7 случаях из 10 фирма-конкурент компании «А» действовала на рынке так, как будто ей заранее были известны решения, принимаемые фирмой «А». На уровне значимости 0,05 определи­те, случайно ли это, или в фирме «А» работает ос­ведомитель фирмы-конкурента?

Решение. Для того чтобы ответить на поставлен­ный вопрос, необходимо проверить статистическую гипотезу о том, совпадает ли данное эмпирическое распределение числа действий фирмы-конкурента с равномерным теоретическим распределением?

Если ходы, предпринимаемые конкурентом, вы­бираются случайно, т. е. в фирме «А» — нет осведомителя (инсайдера), то число «правильных» и «не­правильных» ее действий должно распределиться поровну, т. е. по 5 (10/2), а это и есть отличитель­ная особенность равномерного распределения.

Этот вид статистических гипотез относится к гипотезам о виде закона распределения генераль­ной совокупности.

Сформулируем нулевую и конкурирующую ги­потезы согласно условию задачи.

Н0 : Х ~ R(a; b) — случайная величина Х подчи­няется равномерному распределению с параметра­ми (a; b) (в контексте задачи — «В фирме «А» — нет осведомителя (инсайдера)»; «Распределение чис­ла удачных ходов фирмы-конкурента — случайно»);

Н1 : случайная величина Х не подчиняется рав­номерному распределению (в контексте задачи — «В фирме «А» — есть осведомитель (инсайдер)»;

«Распределение числа удачных ходов фирмы-кон­курента — неслучайно»).

В качестве критерия для проверки статистичес­ких гипотез о неизвестном законе распределения генеральной совокупности используется случайная величина c2 . Этот критерий называют критерием Пирсона.

Его наблюдаемое значение (c2набл) рассчитывает­ся по формуле


где m(эмп)i — эмпирическая частота i-й группы вы­борки; т(теор)i,  теоретическая частота i-й группы выборки.

Составим таблицу распределения эмпирических и теоретических частот (табл. 8.2).

Таблица 8.2

m(эмп)i

 

7

 

3

 

т(тeop)i

 

5

 

5

 

 

Найдем наблюдаемое значение c2набл


Критическое значение (c2кр.) следует определять с помощью таблиц распределения c2 (приложение 4) по уровню значимости α и числу степеней свободы k.

По условию a = 0,05, а число степеней свободы рассчитывается по формуле

k = п - l - 1,

где k — число степеней свободы; п — число групп выборки; l число неизвестных параметров предполагаемой модели, оцениваемых по данным вы­борки (если все параметры предполагаемого закона известны точно, то l = 0).

По условию задачи, число групп выборки (п) рав­но 2, так как могут быть только 2 варианта дей­ствий фирмы-конкурента: «удачные» и «неудач­ные», а число неизвестных параметров равномер­ного распределения (l) равно 0.

Отсюда k=2-0-l=l.

Найдем  c2кр. по уровню значимости a = 0,05 и числу степеней свободы k = 1:

c2кр(a =0,05 ;k=1). =3.8

c2набл. < c2кр.следовательно, на данном уровне зна­чимости нулевую гипотезу нельзя отклонить, расхождения эмпирических и теоретических час­тот — незначимые. Данные наблюдений согласуют­ся с гипотезой о равномерном распределении гене­ральной совокупности.

Это означает, что для утверждения о том, что действия фирмы-конкурента на рынке неслучайны, нет оснований и на уровне значимости a = 0,05 можно утверждать, что в фирме «А» нет платного осведомителя фирмы-конкурента.

Ответ. На уровне значимости a = 0,05 можно ут­верждать, что в фирме «А» нет платного осведомителя фирмы-конкурента.

Пример 2. На уровне значимости a = 0,025 про­верить гипотезу о нормальном распределении генеральной совокупности, если известны эмпиричес­кие и теоретические частоты (табл. 8.3):

Таблица 8.3

m(эмп)i

 

5

 

10

 

20

 

25

 

14

 

3

 

т(теор)i

 

6

 

14

 

28

 

18

 

8

 

3

 

 

Решение. Сформулируем нулевую и конкуриру­ющую гипотезы согласно условию задачи.

Нγ: Х ~ N(a; s2) — случайная величина Х подчи­няется нормальному закону распределения с параметрами а и s2.

Н1. случайная величина Х не подчиняется нор­мальному закону распределения с параметрами а и s2.

В качестве критерия для проверки нулевой ги­потезы используем критерий Пирсона c2 .

Найдем наблюдаемое значение (c2 набл):


Найдем критическое значение критерия (c2кр ) по таблице распределения c2 (приложение 4) по уровню значимости α и числу степеней свободы k.

По условию α  = 0,025; число степеней свободы найдем по формуле

k = пI - 1,

где k — число степеней свободы;

п — число групп выборки;

I число неизвестных параметров предполагае­мой модели, оцениваемых по данным выборки.

По условию задачи число групп выборки (п) рав­но 6, а число параметров нормального неизвестных распределения (I) равно 2.

Отсюда k=6-2-1=3.

Найдем c2кр по уровню значимости a = 0,025 и числу степеней свободы k = 3:

c2кр(a=0,025;k=3) =9,4

 

c2набл > c2кр  следовательно, на данном уровне зна­чимости нулевая гипотеза отклоняется в пользу конкурирующей, расхождения эмпирических и те­оретических частот — значимые. Данные наблюде­ний не согласуются с гипотезой о нормальном рас­пределении генеральной совокупности.

Ответ. На уровне значимости a = 0,025 данные наблюдений не согласуются с гипотезой о нормальном распределении генеральной совокупности.

Пример 3. Техническая норма предусматривает в среднем 40 с на выполнение определенной технологической операции на конвейере по производству часов. От работающих на этой операции поступили жалобы, что они в действительности затрачивают на нее больше времени. Для проверки данной жалобы произведены хронометрические измерения вре­мени выполнения этой технологической операции у 16 работниц, занятых на ней, и получено среднее время выполнения операции `X = 42 с. Можно ли по имеющимся хронометрическим данным на уров­не значимости a = 0,01 отклонить гипотезу о том, что среднее время выполнения этой операции со­ответствует норме, если: а) исправленное выбороч­ное среднее квадратическое отклонение s3,5 с; б) выборочное среднее квадратическое отклонение s 3,5 с?

Решение. а) Для решения данной задачи необхо­димо проверить гипотезу о том, что неизвестная генеральная средняя нормальной совокупности точ­но равна определенному числу, когда дисперсия генеральной совокупности неизвестна (выборка мала, так как n = 16 меньше 30).

Сформулируем нулевую и конкурирующую ги­потезы согласно условию задачи.

H0: а = a0 = 40 — неизвестное математическое ожидание а (нормально распределенной генераль­ной совокупности с неизвестной дисперсией) равно гипотетически предполагаемому числовому значению a0 (применительно к условию данной задачи — вре­мя выполнения технологической операции соответствует норме).

H1: а > 40 — неизвестное математическое ожи­дание а (нормально распределенной генеральной совокупности с неизвестной дисперсией) больше числового значения a0 (применительно к условию данной задачи — время выполнения технологичес­кой операции больше установленной нормы).

Так как конкурирующая гипотеза — правосторон­няя, то и критическая область — правосторонняя.

В качестве критерия для сравнения неизвестно­го математического ожидания а (нормально распределенной генеральной совокупности с неизвестной дисперсией) с гипотетическим числовым значени­ем a0 используется случайная величина t-критерий Стьюдента.

Его наблюдаемое значение (tнабл) рассчитывается по формуле


где X. — выборочная средняя; a0 числовое значе­ние генеральной средней; s — исправленное среднее квадратическое отклонение; п — объем выборки. Найдем наблюдаемое значение tнабл


Критическое значение (tкр) следует находить с помощью таблиц распределения Стьюдента (приложение 5) по уровню значимости α и числу степеней свободы k.

По условию a = 0,01; число степеней свободы найдем по формуле k = п - 1,

где k — число степеней свободы; п — объем выборки.

k = 16 - 1 = 15.

Найдем tкр по уровню значимости a = 0,01 (для односторонней критической области) и числу степеней свободы k = 15:

tкр(α=0,01;k=1)=2,6

Заметим, что при левосторонней конкурирующей гипотезе Н1 : а < 40 tкр следует находить по таблицам распределения Стьюдента (приложение 5) по уровню значимости α (для односторонней критичес­кой области) и числу степеней свободы k = п - 1 и присваивать ему знак «минус».

При двусторонней конкурирующей гипотезе Н1 : а ¹ 40 tкр следует находить по таблицам распределения Стьюдента (приложение 5) по уровню значимо­сти a (для двусторонней критической области) и числу степеней свободы k = п - 1.

tнабл < tкр , следовательно, на данном уровне значи­мости нет оснований отклонить нулевую гипотезу.

Ответ. По имеющимся хронометрическим дан­ным на уровне значимости α = 0,01 нельзя откло­нить гипотезу о том, что среднее время выполне­ния этой операции соответствует норме. Следова­тельно, жалобы работниц — необоснованны.

Наблюдаемое значение критерия попадает в об­ласть допустимых значений (рис. 8.4), следователь­но, нет оснований отклонить нулевую гипотезу.


б) Для решения данной задачи необходимо проверить гипотезу о том, что неизвестная генеральная средняя нормальной совокупности точно равна определенному числу, когда дисперсия генеральной совокупности неизвестна.

Алгоритм решения задачи будет тот же, что и в первом случае. Однако наблюдаемое значение tнабл рассчитывается по формуле


где X0— выборочная средняя; а0 числовое значе­ние генеральной средней; sвыб  — выборочное среднее квадратическое отклонение; л — объем выборки. Найдем наблюдаемое значение (tнабл)


Критическое значение (tкр) следует находить по таблице распределения Стьюдента (приложение 5) по уровню значимости α и числу степеней свободы k.

tнабл   < tкр , следовательно, на данном уровне зна­чимости нет оснований отвергнуть нулевую гипотезу, жалобы работниц — необоснованны.

Ответ. По имеющимся хронометрическим дан­ным на уровне значимости  a = 0,01 нельзя откло­нить гипотезу о том, что среднее время выполне­ния этой операции соответствует норме, жалобы работниц — необоснованны.

Пример 4. Изменим условие предыдущей зада­чи. Техническая норма предусматривает в среднем 40 с на выполнение определенной технологичес­кой операции на конвейере по производству ча­сов. От работающих поступили жалобы, что они в действительности затрачивают на эту операцию больше времени. Для проверки данной жалобы про­изведены хронометрические измерения времени ее выполнения у 36 работниц, занятых на этой опе­рации, и получено среднее время выполнения операции X0 = 42 с. Можно ли (предполагая время выполнения технологической операции случайной величиной, подчиняющейся нормальному закону) по имеющимся хронометрическим данным на уров­не значимости a = 0,01 отклонить гипотезу о том, что среднее время выполнения этой операции со­ответствует норме, если известно, что среднее квад­ратическое отклонение генеральной совокупности s составляет 3,5 с?

Решение. Для решения данной задачи необходи­мо проверить гипотезу о том, что неизвестная генеральная средняя нормальной совокупности точно равна числовому значению, когда дисперсия генеральной совокупности известна (большая выбор­ка, так как п = 36 больше 30).

Сформулируем нулевую и конкурирующую ги­потезы согласно условию задачи.

Н0 : а = a0 = 40 — неизвестная генеральная сред­няя нормально распределенной совокупности с известной дисперсией равна числовому значению (при­менительно к условию данной задачи — время вы­полнения технологической операции соответствует норме).

Н1: а > 40 — неизвестная генеральная средняя нормально распределенной совокупности с извест­ной дисперсией больше числового значения (при­менительно к условию данной задачи — время вы­полнения технологической операции больше уста­новленной нормы).

 Так как конкурирующая гипотеза — правосторонняя, то и критическая область — правосторонняя.

В качестве критерия для сравнения выборочной бедней с гипотетической генеральной средней нормальной совокупности, когда дисперсия генеральной совокупности известна, используется случайная величина U.                           

Его наблюдаемое значение (uнабл) рассчитывается по формуле


где X.— выборочная средняя; а0 числовое значе­ние генеральной средней; sген выборочное среднее квадратическое отклонение; п — объем выборки. Найдем наблюдаемое значение (инабл):


Так как конкурирующая гипотеза — правосто­ронняя, критическое значение и следует находить по таблице функции Лапласа (приложение 2) из равенства

ф0(икр) = (1 - 2a)/2.

По условию a = 0,01.

Отсюда

Ф0(икр) = (1 - 2·0,01)/2 = 0,49.

По таблице функции Лапласа (приложение 2) найдем, при каком икр  Ф0кр) = 0,49.

Ф0(2,33) = 0,49.

Следовательно, икр = 2,33.

Заметим, что при левосторонней конкурирующей гипотезе Н1 : а < 40 uкр следует находить по таблице функции Лапласа (приложение 2) из равенства Ф0(uкр ) = (1 - 2a)/2 и присваивать ему знак «минус».

При двусторонней конкурирующей гипотезе Н1 : а ¹ 40 икр следует находить по таблице функции Лапласа (приложение 2) из равенства


инабл  >uкр , следовательно, на данном уровне зна­чимости нулевая гипотеза отвергается в пользу конкурирующей. По имеющимся хронометрическим данным с более чем 99%-й надежностью можно ут­верждать, что среднее время выполнения этой опе­рации превышает норму. Следовательно, жалобы работниц — обоснованны.

Наблюдаемое значение критерия попадает в кри­тическую область (рис. 8.5), следовательно, нуле­вая гипотеза отвергается в пользу конкурирующей.


Ответ. По имеющимся хронометрическим дан­ным на уровне значимости a = 0,01 можно утверждать, что среднее время выполнения этой опера­ции превышает норму, жалобы работниц — обо­снованны.

Пример 5. Экономический анализ производитель­ности труда предприятий отрасли позволил выдвинуть гипотезу о наличии 2 типов предприятий с раз­личной средней величиной показателя производительности труда. Выборочное обследование 42 пред­приятий 1-й группы дало следующие результаты: средняя производительность труда  X.— 119 деталей. По данным выборочного обследования, на 35 предприятиях 2-й группы средняя производительность труда— 107 деталей. Генеральные дисперсии из­вестны: D(X) = 126,91 (дет.2); D(Y) = 136,1 (дет.2). Считая, что выборки извлечены из нормально распределенных генеральных совокупностей Х и Y, на уровне значимости 0,05, проверьте, случайно ли по­лученное различие средних показателей произво­дительности труда в группах или же имеются 2 ти­па предприятий с различной средней величиной про­изводительности труда.

Решение. Для решения данной задачи необходи­мо сравнить 2 средние нормально распределенных генеральных совокупностей, генеральные дисперсии которых известны (большие независимые выбор­ки). В данной задаче речь идет о больших выборках, так как пx = 42 и пy =35 больше 30. Выборки — независимые, так как из контекста задачи видно, что они извлечены из непересекающихся генераль­ных совокупностей.

Сформулируем нулевую и конкурирующую ги­потезы согласно условию задачи.

Н0: `X = `Y — генеральные средние 2 нормально распределенных совокупностей с известными дисперсиями равны (применительно к условию данной задачи — предприятия 2 групп относятся к одному типу предприятий: средняя производительность труда в 2 группах — одинакова).

Н1: `X ¹`Y — генеральные средние 2 нормально распределенных совокупностей с известными дисперсиями неравны (применительно к условию дан­ной задачи — предприятия 2 групп относятся к разному типу предприятий: средняя производитель­ность труда в 2 группах — неодинакова).

Выдвигаем двустороннюю конкурирующую ги­потезу, так как из условия задачи не следует, что необходимо выяснить больше или меньше произво­дительность труда в одной из групп предприятий по сравнению с другой.

Поскольку конкурирующая гипотеза — двусто­ронняя, то и критическая область — двусторонняя.

В качестве критерия для сравнения 2 средних генеральных совокупностей, дисперсии которых известны (большие независимые выборки), исполь­зуется случайная величина Z.

Его наблюдаемое значение (zнабл) рассчитывается по формуле


где X.— выборочная средняя для X; — выбороч­ная средняя для Y; D(X) — генеральная дисперсия для X; D(Y) — генеральная дисперсия для Y; пxобъем выборки для X; пy объем выборки для Y. Найдем наблюдаемое значение (zнабл):


Так как конкурирующая гипотеза — двусторонняя, критическое значение (zкр ) следует находить по таблице функции Лапласа (приложение 2) из ра­венства

Ф0(zкр) = (1 - a)/2.

По условию a= 0,05.

Отсюда

Ф0(zкр)=(1-0,05)/2=0,475.

По таблице функции Лапласа (приложение 2) найдем, при каком zкрФ0(zкр) = 0,475.

Ф0(1,96) = 0,475.

Учитывая, что конкурирующая гипотеза — дву­сторонняя, находим две критические точки:


Заметим, что при левосторонней конкурирующей гипотезе Н1:`X < `Y zкр  следует находить по табли­це функции Лапласа (приложение 2) из равенства Ф0(zкр ) = (1 - 2a)/2 и присваивать ему знак «минус».

При правосторонней конкурирующей гипотезе Н1: `X > `Y zкр находим по таблице функции Лапла­са (приложение 2) из равенства Ф0(zкр)= (1- 2a)/2.

zнабл> zкрследовательно, на данном уровне зна­чимости нулевая гипотеза отвергается в пользу конкурирующей. На уровне значимости a= 0,05 мож­но утверждать, что полученное различие средних показателей производительности труда в группах неслучайно, имеются 2 типа предприятий с раз­личной средней величиной производительности труда.

Наблюдаемое значение критерия попадает в кри­тическую область (рис. 8.6), следовательно, нуле­вая гипотеза отклоняется в пользу конкурирующей.

Ответ. На уровне значимости a = 0,05 можно ут­верждать, что полученное различие средних показателей производительности труда в группах не­ случайно, имеются 2 типа предприятий с различ­ной средней величиной производительности труда.


Пример 6. Предполагается, что применение но­вого типа резца сократит время обработки некото­рой детали. Хронометраж времени обработки 9 де­талей, обработанных старым типом резцов, дал следующие результаты: среднее время обработки детали X.— 57 мин, исправленная выборочная дисперсия s2x  = 186,2 (мин2). Среднее время обработки 15 дета­лей, обработанных новым типом резцов, - Ỹ по данным хронометражных измерений — 52 мин, а ис­правленная выборочная дисперсия s2y = 166,4 (мин2). На уровне значимости α = 0,01 ответьте на вопрос, позволило ли использование нового типа резцов со­кратить время обработки детали?

Решение. Для решения данной задачи необходи­мо сравнить 2 средние нормально распределенных генеральных совокупностей, генеральные дисперсии которых неизвестны, но предполагаются одинаковыми (малые независимые выборки). В этой задаче речь идет о малых выборках, так как пx = 9 и ny = 15 меньше 30. Выборки — независимые, поскольку из контекста задачи видно, что они извле­чены из непересекающихся генеральных совокупностей.

Сформулируем нулевую и конкурирующую ги­потезы, согласно условию задачи.

Н0: `X = `Y генеральные средние 2 нормально распределенных совокупностей с неизвестными дис­персиями (но предполагаемыми одинаковыми) рав­ны (применительно к условию данной задачи — среднее время, затрачиваемое на обработку детали резцами нового и старого типа, — одинаково, т. е. использование нового типа резца не позволяет сни­зить время на обработку детали).

Н1:  `X > `Y — генеральная средняя для Х боль­ше, чем генеральная средняя для Y (применитель­но к условию данной задачи — среднее время, зат­рачиваемое на обработку детали резцами старого типа, больше, чем — нового, т. е. использование но­вого типа резца позволяет снизить время на обра­ботку детали).

Так как конкурирующая гипотеза — правосторон­няя, то и критическая область — правосторонняя.

Приступать к проверке гипотезы о равенстве ге­неральных средних 2 нормально распределенных совокупностей с неизвестными дисперсиями мож­но лишь в том случае, если генеральные дисперсии равны. В противном случае, данная задача в тео­рии неразрешима.

Поэтому, прежде чем проверять эту гипотезу, проверим гипотезу о равенстве генеральных диспер­сий нормальных совокупностей.

Сформулируем нулевую и конкурирующую ги­потезы, согласно условию задачи.

Н0: D(X) = D(Y) — генеральные дисперсии 2 нор­мально распределенных совокупностей равны.

Н1: D(X) > D(Y) — генеральная дисперсия для Х больше генеральной дисперсии для Y. Выдвигаем правостороннюю конкурирующую гипотезу, так как исправленная выборочная дисперсия для Х значительно больше, чем исправленная выборочная дис­персия для Y.

Так как конкурирующая гипотеза — правосторон­няя, то и критическая область — правосторонняя.

В качестве критерия для сравнения 2 дисперсий нормальных генеральных совокупностей используется случайная величина F критерий Фишера-Снедекора (приложение 6).

Его наблюдаемое значение (fнабл) рассчитывается по формуле


где s2б — большая (по величине) исправленная вы­борочная дисперсия; s2м меньшая (по величине) исправленная выборочная дисперсия.

Найдем fнабл


Критическое значение (fкр)следует находить с помощью таблицы распределения Фишера-Снедекора (приложение 6) по уровню значимости a и числу степеней свободы k1 и k2.

По условию a = 0,01; число степеней свободы найдем по формуле

k1= n1 - 1; k2 = n2 - 1,

где k1 число степеней свободы большей (по вели­чине) исправленной дисперсии; k2 число степе­ней свободы меньшей (по величине) исправленной дисперсии; п1 объем выборки большей (по величине) исправленной дисперсии; n2 объем выбор­ки меньшей (по величине) исправленной дисперсии. Найдем k1 и k2

k1 = 10 - 1 = 9;

k2=15 - 1 = 14.

Определяем fкр по уровню значимости a = 0,01 и числу степеней свободы k1 =9 и k2=14 :


fнабл< fкр следовательно, на данном уровне зна­чимости нет оснований отвергнуть нулевую гипоте­зу о равенстве генеральных дисперсий нормальных совокупностей.

Следовательно, можно приступить к проверке гипотезы о равенстве генеральных средних двух нормально распределенных совокупностей.

В качестве критерия для проверки этой гипоте­зы используется случайная величина t-критерий Стьюдента.

Его наблюдаемое значение (tнабл ) рассчитывается по формуле


где X.— выборочная средняя для X;Ỹ— выбороч­ная средняя для Y; s2x — «неправленная» выбороч­ная дисперсия для X; s2y «неправленная» выбо­рочная дисперсия для Y; пx — объем выборки, из­влеченной из генеральной совокупности X; пy — объем выборки, извлеченной из генеральной сово­купностиY. Найдем tнабл,


Критическое значение (tкр ) следует находить по таблице распределения Стьюдента (приложение 5) по уровню значимости a и числу степеней свободы k.

По условию a = 0,01; число степеней свободы найдем по формуле

k = пx + ny - 2,

где k — число степеней свободы; пx объем выбор­ки для X; пy объем выборки для Y.

k = 9 + 15 - 2 = 22.

Найдем t кр по уровню значимости a = 0,01 (для односторонней критической области) и числу степеней свободы k = 22


Заметим, что при левосторонней конкурирующей гипотезе `X < `Y tкр следует находить по таблицам распределения Стьюдента (приложение 5) по уров­ню значимости α  (для односторонней критической области) и числу степеней свободы k = пx + пy — 2 и присваивать ему знак «минус».             

При двусторонней конкурирующей гипотезе `X ¹`Y tкр находим по таблицам распределения Стьюдента приложение 5) по уровню значимости α (для двусторонней критической области) и числу степеней свободы k= пx+ пy - 2.

tнабл < tкр , следовательно, на этом уровне значимости нет оснований отвергнуть нулевую гипотезу. По имеющимся хронометрическим данным на уров­не значимости a = 0,01 нельзя отклонить гипотезу о том, что генеральные средние равны, т. е. среднее время, затрачиваемое на обработку детали старым и новым типом резцов, отличается незначимо, рас­хождения между средними — случайны, использо­вание нового типа резцов не позволяет снизить вре­мя обработки детали.

Наблюдаемое значение критерия попадает в об­ласть допустимых значений (рис. 8.7), следователь­но, нулевую гипотезу нельзя отклонить.


Ответ. На уровне значимости a = 0,01 нельзя утверждать, что использование нового типа резцов позволило сократить время обработки детали.

Пример 7. Партия изделий принимается в том случае, если вероятность того, что изделие окажет­ся соответствующим стандарту, составляет не ме­нее 0,97. Среди случайно отобранных 200 изделий проверяемой партии оказалось 193 соответствующих стандарту. Можно ли на уровне значимости          a = 0,02 принять партию?

Решение. Для решения данной задачи необходи­мо проверить гипотезу о том, что неизвестная гене­ральная доля точно равна определенному числу.

Сформулируем нулевую и конкурирующую ги­потезы согласно условию задачи.

Н1: р =р0 = 0,97 — неизвестная генеральная доля р равна р0 (применительно к условию этой задачи — вероятность того, что деталь из проверяемой партии окажется соответствующей стандарту, равна 0,97, т. е. партию изделий можно принять).

Н1: р < 0,97 — неизвестная вероятность р мень­ше гипотетической вероятности p0 (применительно к условию данной задачи — вероятность того, что деталь из проверяемой партии окажется соответствующей стандарту, меньше 0,97, т. е. партию из­делий нельзя принять).

Так как конкурирующая гипотеза — левосторон­няя, то и критическая область — левосторонняя.

В качестве критерия для сравнения наблюдае­мой относительной частоты с гипотетической вероятностью появления события используется случай­ная величина U.

Его наблюдаемое значение (uнабл) рассчитывается по формуле


где т/п — относительная частота (частость) появ­ления события;p0 гипотетическая вероятность появления события; q0 гипотетическая вероят­ность непоявления события; п — объем выборки.

По условию т = 193; п = 200; р0 = 0,97; q0 = 1 - р0= 0,03; a = 0,02.

Найдем наблюдаемое значение (uнабл )


Так как конкурирующая гипотеза — левосторон­няя, то критическое значение кр ) следует находить по таблице функции Лапласа (приложение 2) из равенства

Ф0кр)= (1 - 2а)/2.

По условию a= 0,02.

Отсюда

Ф0(икр)=(1-2·0,02)/2=0,48.

По таблице функции Лапласа (приложение 2) найдем, при каком икрФ0(икр ) = 0,48.

Ф0(2,05)= 0,48.

Учитывая, что конкурирующая гипотеза — ле­восторонняя, критическому значению необходимо присвоить знак «минус».

Следовательно, -икр= -2,05.

Заметим, что при правосторонней конкурирую­щей гипотезе Н1: р > 0,97 икр следует находить по таблице функции Лапласа (приложение 2) из ра­венства Ф0кр ) == (1 - 2a)/2.

При двусторонней конкурирующей гипотезе Н1: р ¹ 0,97 икр находим по таблице функции Лапласа (приложение 2) из равенства Ф0(икр) = (1 - a)/2.

инаблкр , следовательно, на данном уровне зна­чимости нет оснований отклонить нулевую гипо­тезу. По имеющимся данным на уровне значимос­ти a = 0,02 нельзя отклонить гипотезу о том, что вероятность того, что изделие окажется соответ­ствующим стандарту, составляет 0,97. Следователь­но, партию изделий принять можно.

Наблюдаемое значение критерия попадает в об­ласть допустимых значений (рис. 8.8), следователь­но, нет оснований отклонить нулевую гипотезу.


Ответ. На уровне значимости a = 0,02 партию изделий принять можно.

Пример 8. Два завода изготавливают однотип­ные детали. Для оценки их качества сделаны вы­борки из продукции этих заводов и получены сле­дующие результаты (табл. 8.4):

Таблица 8.4

Выборки

 

Завод №1

 

Завод №2

 

Объем выборки

 

n1

 

n2

 

Число бракованных деталей

 

m1

 

m2

 

 

На уровне значимости a = 0,025 определите, име­ется ли существенное различие в качестве изготавливаемых этими заводами деталей?

Решение. Для решения данной задачи необходи­мо сравнить 2 вероятности биномиальных распределений.

Сформулируем нулевую и конкурирующую ги­потезы согласно условию задачи.

Н0: р1= р2 вероятности появления события в 2 генеральных совокупностях, имеющих биномиальное распределение, равны (применительно к ус­ловию данной задачи — вероятность того, что де­таль, изготовленная на заводе №1, окажется брако­ванной, равна вероятности того, что деталь, изготовленная на заводе №2, окажется бракованной).

Н1: р1 ¹ р2 вероятности появления события в 2 генеральных совокупностях, имеющих биномиальное распределение, не равны (применительно к усло­вию этой задачи — вероятность того, что деталь, из­готовленная на заводе №1, окажется бракованной, не равна вероятности того, что деталь, изготовлен­ная на заводе №2, окажется бракованной; заводы изготавливают детали разного качества). Так как по условию задачи не требуется проверить, на каком заводе качество изготавливаемых деталей выше, выд­вигаем двустороннюю конкурирующую гипотезу.

Поскольку конкурирующая гипотеза — двусто­ронняя, то и критическая область — двусторонняя.

В качестве критерия для сравнения 2 вероятно­стей биномиальных распределений используется случайная величина U.

Его наблюдаемое значение uнабл рассчитывается по формуле


где т1/n1- — относительная частота (частость) появ­ления события в 1-й выборке; т2/п2 относитель­ная частота (частость) появления события во 2-й выборке;    -средняя частость появления события


` средняя частость непоявления события


=1-`

п1 объем 1-й выборки; п2 объем 2-й выборки.

По условию т1=20; n1=200; m2=15; n2=300; a= 0,025.

Найдем среднюю частость появления события


Найдем среднюю частость непоявления события

` = 1 - ` = 1 — 0,07 = 0,93.

Найдем инабл


Так как конкурирующая гипотеза — двусторон­няя, критическое значение кр)следует находить по таблице функции Лапласа (приложение 2) из равенства

Ф0(икр)= (1 - a)/2.

По условию α = 0,025. Отсюда

Ф0(икр) = (1 - 0,025)/2 = 0,4875.

По таблице функции Лапласа (приложение 2) найдем, при каком икрФ0кр ) = 0,4875.

Ф0(2,24) = 0,4875.

Учитывая, что конкурирующая гипотеза — дву­сторонняя, находим две критические точки

uкр.п.=2,24; кр.л.= -2,24.

Заметим, что при правосторонней конкурирую­щей гипотезе Н1: р1 > р2икр следует находить по таблице функции Лапласа (приложение 2) из ра­венства Ф0кр ) = (1 - 2a)/2.

При левосторонней конкурирующей гипотезе Н1. p 1 < p2 uкр следует находить по таблице функции Лапласа (приложение 2) из равенства Ф0кр) = (1 - 2a)/2 и присваивать ему знак «минус».

кр < инабл < икр , следовательно, на данном уров­не значимости нет оснований отвергнуть нулевую гипотезу. По имеющимся данным на уровне значи­мости a = 0,025 нет оснований отклонить нулевую гипотезу. Следовательно, заводы изготавливают де­тали одинакового качества.

Наблюдаемое значение критерия попадает в область допустимых значений (рис. 8.9), следовательно, нет оснований отклонить нулевую гипотезу.


Ответ. Нет оснований отклонить нулевую гипо­тезу, т. е. имеющееся различие в качестве изготав­ливаемых этими заводами деталей — случайно, незначимо.

 

Задачи к теме 8

1. Компания, производящая средства для потери веса, утверждает, что прием таблеток в сочетании со специальной диетой позволяет сбросить в сред­нем в неделю 400 г веса. Случайным образом отобраны 25 человек, использующих эту терапию, и обнаружено, что в среднем еженедельная потеря в весе составила 430 г со средним квадратическим отклонением 110 г. Проверьте гипотезу о том, что средняя потеря в весе составляет 400 г. Уровень значимости a = 0,05.

2. Поступление страховых взносов в 130 филиа­лов страховых организаций в регионе А составило 26·104 у. е., в регионе В на 100 филиалов пришлось 18·104 у. е. Дисперсия величины страховых взно­сов в регионе А равна 39·108 (у. е.)2, в регионе В — 25·108 (у. е.)2. На уровне значимости a= 0,05 опре­делите, существенно ли различается средняя ве­личина поступления страховых взносов в регионах А и В из расчета на 1 филиал.

3. Компания утверждает, что новый вид зубной пасты для детей лучше предохраняет зубы от кариеса, чем зубные пасты, производимые другими фир­мами. Для проверки эффекта в случайном порядке была отобрана группа из 400 детей, которые пользо­вались новым видом зубной пасты. Другая группа из 300 детей, также случайно выбранных, в это же время пользовалась другими видами зубной пасты. После окончания эксперимента было выяснено, что у 30 детей, использующих новую пасту, и 25 детей из контрольной группы появились новые признаки кариеса. Имеются ли у компании достаточные ос­нования для утверждения о том, что новый сорт зубной пасты эффективнее предотвращает кариес, чем другие виды зубной пасты? Принять уровень значимости a = 0,05.

4. В 1995 г. число договоров добровольного стра­хования, заключенных государственными страховыми организациями, составило в Ростовской об­ласти 1 858·103 на сумму 7 461·106 руб. Негосудар­ственные страховые организации заключили 1 250·104 договоров добровольного страхования на сумму 34 884·106 руб. Предположительно диспер­сия страховой суммы договоров, заключенных государственными страховыми организациями, равна 1016 руб.2, а договоров, заключенных негосударствен­ными страховыми организациями, — 8·1017 руб.2. Имеются ли существенные различия в средних раз­мерах страховых сумм договоров добровольного страхования, заключаемых государственными и не­государственными страховыми организациями? Уровень значимости a принять равным 0,01.

5. Крупный коммерческий банк заказал марке­тинговое исследование по выявлению эффекта «премирования» (калькулятор, набор ручек и др.) как стимула для открытия счета в банке. Для проверки случайным образом было отобрано 200 «премиро­ванных» посетителей и 200 «непремированных». В результате выяснилось, что 89% посетителей, ко­торым предлагалась премия, и 79% посетителей, которым не предлагалась премия, открыли счет в банке в течение 6 мес. Используя эти данные, про­верьте гипотезу о том, что доля «премированных» посетителей, открывших счет в банке, статистичес­ки существенно отличается от удельного веса «не­премированных» посетителей, открывших счет в банке. Принять уровень значимости a = 0,05.

6. Инженер по контролю качества проверяет сред­нее время горения нового вида электроламп. Для проверки в порядке случайной выборки было ото­брано 100 ламп, среднее время горения которых со­ставило 1 075 ч. Предположим, что среднее квадратическое отклонение времени горения для генераль­ной совокупности известно и составляет 100 ч. Ис­пользуя уровень значимости a= 0,05, проверьте ги­потезу о том, что среднее время горения ламп — более 1 000 ч.

Предположим, что инженер по контролю каче­ства не имеет информации о генеральной диспер­сии и использует выборочное среднее квадратическое отклонение. Изменится ли ответ задачи?

7. Компания, выпускающая в продажу новый сорт растворимого кофе, провела проверку вкусов поку­пателей по случайной выборке из 400 человек и вы­яснила, что 220 из них предпочли новый сорт всем остальным. Проверьте на уровне значимости a = 0,01 гипотезу о том, что, по крайней мере, 52% потреби­телей предпочтут новый сорт кофе.

8. Страховая компания изучает вероятность до­рожных происшествий для подростков, имеющих мотоциклы. За прошедший год проведена случай­ная выборка 2 000 страховых полисов подростков-мотоциклистов и выявлено, что 15 из них попада­ли в дорожные происшествия и предъявили компа­нии требование о компенсации за ущерб. Может ли аналитик компании отклонить гипотезу о том, что менее 1% всех подростков-мотоциклистов, имею­щих страховые полисы, попадали в дорожные происшествия в прошлом году? Принять уровень зна­чимости a = 0,05.

 

9. Новое лекарство, изобретенное для лечения атеросклероза, должно пройти экспериментальную проверку для выяснения возможных побочных эф­фектов. В ходе эксперимента лекарство принимали 4 тыс. мужчин и 5 тыс. женщин. Результаты выя­вили, что 60 мужчин и 100 женщин испытывали побочные эффекты при приеме нового медикамен­та. Можем ли мы на основании эксперимента ут­верждать, что побочные эффекты нового лекарства у женщин проявляются в большей степени, чем у мужчин? Принять уровень значимости a = 0,05.

10. В 1995 г. в Ростовской области обследовано 12 промышленных предприятий и 14 строительных (подрядных) организаций. Средняя балансовая при­быль промышленных предприятий оказалась равной 25·107pyб., а строительных организаций - 12·108 руб. Исправленная выборочная дисперсия прибыли про­мышленных предприятий составила 64·1016 руб.2, строительных организаций — 16·1016 руб.2. На уров­не значимости a = 0,01 определите, являются ли различия в результатах финансовой деятельности промышленных предприятий и строительных орга­низаций случайными.

11. На 1 января 1996 г. численность беженцев в Ростовской области составляла 32 412 чел. при об­щей численности наличного населения 4 425 400 чел. В Краснодарском крае на 5 043 900 чел. на­личного населения приходилось 30 423 беженца. На уровне значимости α = 0,05 ответьте на вопрос: «Объясняется ли более высокий удельный вес бе­женцев в общей численности населения в Ростовской области в сравнении с Краснодарским краем случайными факторами или имеет смысл поиск факторов, обусловивших это явление?».

12. Компания по производству безалкогольных напитков предполагает выпустить на рынок новую модификацию популярного напитка, в котором са­хар заменен сукразитом. Компания хотела бы быть уверенной в том, что не менее 70% ее потребителей предпочтут новую модификацию напитка. Новый напиток был предложен на пробу 2 тыс. чел., и 1 422 из них сказали, что он вкуснее старого. Может ли компания отклонить предположение о том, что толь­ко 70% всех ее потребителей предпочтут новую модификацию напитка старой? Принять уровень зна­чимости a = 0,05.

13. Производители нового типа аспирина утвер­ждают, что он снимает головную боль за 30 мин. Случайная выборка 100 чел., страдающих голов­ными болями, показала, что новый тип аспирина снимает головную боль за 28,6 мин при среднем квадратическом отклонении 4,2 мин. Проверьте на уровне значимости a= 0,05 справедливость утверж­дения производителей аспирина о том, что это лекарство излечивает головную боль за 30 мин.

14. Доля убыточных предприятий в промышлен­ности в целом по России в 1995 г. составила 26%, а в Ростовской области — 27%. В 1995 г. в Ростов­ской области насчитывалось 7 579 промышленных предприятий. На уровне значимости a = 0,05 опре­делите, являются ли различия в удельном весе убы­точных промышленных предприятий в России и в Ростовской области случайными или в Ростовской области действует комплекс экономических усло­вий, обусловливающих повышенную долю вила 2,3% от общего числа промышленных пред­приятий. Среди 2 236 машиностроительных и ­ нерентабельных предприятий?

 

15. В 1995 г. доля предприятий государственной формы собственности в Ростовской области метаталлообрабатывающих предприятий она оказалась равной 2,1%. На уровне значимости α = 0,01 опре­делите, существенно ли меньше удельный вес госу­дарственных предприятий в машиностроении и ме­таллообработке, чем в целом в промышленности области?

16. В 1996 г. годовой оборот 4 бирж в регионе А составил 12·104 у. е.; в регионе В годовой оборот 5 бирж — 125·103 у. е. Исправленная выборочная дисперсия оборота в регионе А оказалась равной 3·104(у.е.)2, в регионе В — 2·104 (у.е.)2. Можно ли на уровне значимости a = 0,05 утверждать, что средний оборот бирж в регионе А больше, чем в регионе B?

17. Компания, занимающаяся консультировани­ем в области инвестиций, заявляет, что среднего­довой процент по акциям определенной отрасли промышленности составляет 11,5%. Инвестор, желая проверить истинность этого утверждения, на основе случайной выборки 50 акций выявил, что среднегодовой процент по ним составил 10,8% с исправленным средним квадратическим отклоне­нием s = 3,4%. На основе имеющейся информации определите, имеет ли инвестор достаточно основа­ний, чтобы опровергнуть заявление компании? При­нять уровень значимости a = 0,05.

18. Производитель некоторого вида продукции утверждает, что 95% выпускаемой продукции не имеют дефектов. Случайная выборка 100 изделий показала, что только 92 из них свободны от дефек­тов. Проверьте справедливость утверждения произ­водителя продукции на уровне значимости a = 0,05.

19. Главный бухгалтер большой корпорации про­вел обследование по данным прошедшего года с целью выяснения доли некорректных счетов. Из 2000 выбранных счетов в 25 оказались некоррект­ные проводки. Для уменьшения доли ошибок он внедрил новую систему. Год спустя он решил про­верить, как работает новая система, и выбрал для проверки в порядке случайного отбора 3 000 счетов компании. Среди них оказалось 30 некорректных. Можем ли мы утверждать, что новая система позволила уменьшить долю некорректных проводок в счетах? Принять уровень значимости a = 0,05.

20. Владелец фирмы считает, что добиться более высоких финансовых результатов ему помешала неравномерность поставок комплектующих по месяцам года, несмотря на то, что поставщик в пол­ном объеме выполнил свои обязательства за год. Поставщик утверждает, что поставки были не так уж неравномерны. Распределение поставок по ме­сяцам года имеет следующий вид:

Месяц

1

2

3

4

5

6

7

8

9

10

11

12

Объем поставок, ед.

19

23

26

18

20

20

20

20

32

27

35

40

 

На уровне значимости a = 0,05 определите, кто прав: владелец фирмы или поставщик? Изменится ли ответ на поставленный вопрос, если уровень значимости принять равным 0,01? Объясните результаты.

 

9. СТАТИСТИЧЕСКОЕ ИЗУЧЕНИЕ СВЯЗЕЙ МЕЖДУ ЯВЛЕНИЯМИ И ИХ ИСПОЛЬЗОВАНИЕ ДЛЯ УПРАВЛЕНИЯ СОЦИАЛЬНО-ЭКОНОМИЧЕСКИМИ ПРОЦЕССАМИ

9.1. Виды и формы связей, различаемые в статистике

Современная наука об обществе объясняет суть явлений через изучение взаимосвязей явлений. Объем продукции предприятия связан с численностью работников, стоимостью основных фондов и т. д.

Различают два типа взаимосвязей между различ­ными явлениями и их признаками: функциональ­ную или жестко детерминированную и статистичес­кую или стохастически детерминированную.

Функциональная связь — это вид причинной зависимости, при которой определенному значению факторного признака соответствует одно или несколько точно заданных значений результатив­ного признака. Например, при у = Öx— связь между у и х является строго функциональной, но значению х = 4 соответствует не одно, а два значе­ния y1 = +2; y2= -2.

Стохастическая связь — это вид причинной за­висимости, проявляющейся не в каждом отдельном случае, а в общем, в среднем, при большом числе наблюдений. Например, изучается зависи­мость роста детей от роста родителей. В семьях, где родители более высокого роста, дети в среднем ниже, чем родители. И, наоборот, в семьях, где родители ниже ростом, дети в среднем выше, чем родители. Еще один пример: потребление продуктов питания пенсионеров зависит от душевого дохода: чем выше доход, тем больше потребление. Однако такого рода зависимости проявляются лишь при большом чис­ле наблюдений.

Корреляционная связь — это зависимость сред­него значения результативного признака от изме­нения факторного признака; в то время как каж­дому отдельному значению факторного признака Х может соответствовать множество различных зна­чений результативного (Y).

Задачами корреляционного анализа являются:

1) изучение степени тесноты связи 2 и более яв­лений;

2) отбор факторов, оказывающих наиболее суще­ственное влияние на результативный признак;

3) выявление неизвестных причинных связей. Исследование корреляционных зависимостей включает ряд этапов:

1) предварительный анализ свойств совокупности;

2) установление факта наличия связи, определе­ние ее направления и формы;

3) измерение степени тесноты связи между при­знаками;

4) построение регрессионной модели, т. е. нахож­дение аналитического выражения связи;

5) оценку адекватности модели, ее экономическую интерпретацию и практическое использование.

Корреляционная связь между признаками может возникать различными путями. Важнейший путь-причинная зависимость результативного признака (его вариации) от вариации факторного признака. Например, Х — балл оценки плодородия почв, Y — урожайность сельскохозяйственной культуры. Здесь ясно, какой признак выступает как независимая переменная (фактор), а какой как зависимая пере­менная (результат).

Очень важно понимать суть изучаемой связи, по­скольку корреляционная связь может возникнуть между двумя следствиями общей причины. Здесь можно привести множество примеров. Так, классическим является пример, приведенный известным статистиком начала XX в. А.А.Чупровым. Если в качестве признака Х взять число пожарных команд в городе, а за признак Y — сумму убытков в городе от пожаров, то между признаками Х и Y в городах обнаружится значительная прямая корреляция. В среднем, чем больше пожарников в городе, тем боль­ше убытков от пожаров. В чем же дело? Данную корреляцию нельзя интерпретировать как связь причины и следствия, оба признака - следствия общей причины - размера города. В крупных горо­дах больше пожарных частей, но больше и пожа­ров, и убытков от них за год, чем в мелких.

Современный пример. Сразу после 17 августа 1998 г. резко возросли цена валюты и объем покуп­ки валюты частными лицами. Здесь также нельзя рассматривать эти два явления как причину и след­ствие. Общая причина - обострение финансового кризиса, приведшее к росту курсовой стоимости валюты и стремлению населения сохранить свои накопления в твердой валюте. Такого рода корре­ляцию называют ложной корреляцией.

Корреляция возникает и в случае, когда каждый из признаков и причина, и следствие. Например, при сдельной оплате труда существует корреляция между производительностью труда и заработком. С одной стороны, чем выше производительность тру­да, тем выше заработок. С другой — высокий заработок сам по себе является стимулирующим факто­ром, заставляющим работника трудиться более ин­тенсивно.

По направлению выделяют связь прямую и об­ратную, по аналитическому выражению — прямолинейную и нелинейную.

В начальной стадии анализа статистических дан­ных не всегда требуются количественные оценки, достаточно лишь определить направление и харак­тер связи, выявить форму воздействия одних фак­торов на другие. Для этих целей применяются ме­тоды приведения параллельных данных, аналити­ческих группировок и графический.

Метод приведения параллельных данных осно­ван на сопоставлении 2 или нескольких рядов ста­тистических величин. Такое сопоставление позво­ляет установить наличие связи и получить пред­ставление о ее характере. Сравним изменения двух величин (табл. 9.1).

Таблица 9.1

Х

1

2

3

4

5

6

7

8

9

Y

5

9

6

10

12

17

15

20

23

 

С увеличением Х возрастает и Y, поэтому связь между ними можно описать уравнением прямой.

Метод аналитических группировок характеризует влияние качественного признака на относительные средние величины, на показатели вариации коли­чественных признаков. В качестве группировочного признака выбирается факторный. В таблице раз­мещают средние значения одного или нескольких результативных признаков. Изменения факторно­го признака при переходе от одной группы к дру­гой вызывают соответствующие изменения резуль­тативного признака (табл. 9.2).

Оборачиваемость в днях - факторный признак, обозначаемый обычно X, а прибыль - результатив­ный - Y. Табл. 9.2 ясно демонстрирует присутствие связи между признаками, это - отрицательная связь. Судить о том, линейная она или нет, по этим данным сложно.

Таблица 9.2

Характеристика зависимости прибыли малых предприятий от оборачиваемости оборотных средств на 1998 г.

Продолжительность оборота средств, дн.(Х)

Число малых предприятий

Средняя прибыль, млн. руб. (Y)

40-50

6

14,57

51-70

8

12,95

71-101

6

7,40

Итого

20

11,77

 

Графический метод используется для наглядно­го изображения формы связи между изучаемыми признаками. Для этого в прямоугольных осях ко­ординат строят график, по оси ординат которого откладывают индивидуальные значения результа­тивного признака, а по оси абсцисс - индивидуаль­ные значения факторного признака. Совокупность точек результативного и факторного признаков называется полем корреляции (рис. 9.1).



Оценка тесноты связи между признаками пред­полагает определение меры соответствия вариации результативного признака от одного (при изучении парных зависимостей) или нескольких (множественных) факторов.

Большинство методов измерения тесноты связи заключается в сопоставлении отклонений абсолютных значений величин от их средних. Они основа­ны на предположении, что при полной независимо­сти переменных отклонения значений факторного признака от средней (X )носят случайный ха­рактер и должны случайно сочетаться с различны­ми отклонениями значений результативного при­знака (Y - `Y). При наличии значительного переве­са совпадений или несовпадений знаков отклонений делается предположение о наличии связи между Х и Y. Одну из первых попыток установления тесноты связи между переменными сделал Г. Фехнер, пред­ложивший простейший показатель тесноты связи:


Показатель Фехнера изменяется в промежутке [-1; 1]. При значении, равном 1, он указывает на положительную функциональную связь, при зна­чении -1 — на отрицательную функциональную связь, при i = 0 связь отсутствует. Промежуточные значения i характеризуют степень близости связи к функциональной (табл. 9.3).

Таблица 9.3

Х

1

2

3

4

5

6

7

8

9

Y

5

9

6

10

12

17

15

20

23

Х-`Х

-4

-5

-2

-1

0

1

2

3

4

Y-`Y

-8

-4

-7

-3

-1

4

2

7

10

 

Например, для данных табл. 9.1.

Получим `Х = 5; `Y = 13; sx, = 3,2; sy = 5,85;

i = (9 - 1)/9 = 0,89.

Недостаток показателя Фехнера состоит в том, что разные по абсолютной величине отклонения имеют одинаковый вес. Более совершенный изме­ритель тесноты связи между признаками — ли­нейный коэффициент корреляции Пирсона (назван по имени английского статистика К. Пирсона) ха­рактеризует тесноту и направление связи между двумя коррелируемыми признаками в случае на­личия между ними линейной зависимости.

Смысл линейного коэффициента корреляции Пирсона более понятен, если его расчет производить с использованием коэффициента ковариации. Это — мера совместной вариации признаков. Ко­эффициент ковариации рассчитывается с помощью формулы


С помощью коэффициента ковариации можно определить наличие и направление связи. Однако его нельзя использовать для определения степени тесноты связи, так как он имеет смешанную раз­мерность (Х•Y). Коэффициент ковариации — не нормирован, следовательно, нельзя сравнивать ко­эффициенты ковариации разных пар переменных. Для преодоления этого недостатка можно выраже­ние (9.2) разделить на средние квадратические от­клонения по х и по у. Полученный показатель ин­тенсивности линейной связи называется коэффи­циентом корреляции:


Это — безразмерная величина, которая изменя­ется в интервале от -1 до +1, -1 £ r £ 1.

Путем ряда преобразований можно получить сле­дующие аналитические выражения для коэффициента корреляции:


Производя расчет по итоговым значениям исход­ных переменных, линейный коэффициент корреляции можно вычислить по формуле


Линейный коэффициент корреляции имеет боль­шое значение при исследовании социально-экономических явлений и процессов, распределения ко­торых близки к нормальным.

 

9.2. Оценка достоверности коэффициента корреляции

Коэффициент парной корреляции, исчисленный по выборочным данным, является случайной величиной. С уменьшением числа наблюдений надеж­ность коэффициента корреляции падает. С увеличением числа наблюдений (свыше 500) распределе­ние коэффициента корреляции r (не превышающее 0,9) стремится к нормальному.

Полученный из выборки коэффициент корреля­ции r является оценкой коэффициента корреляции ρ в генеральной совокупности.

Определим доверительный интервал для оценки истинного значения коэффициента корреляции в генеральной совокупности (ρ )


где σr . — среднеквадратическая ошибка выборочного коэффициента парной корреляции;


t распределение Стьюдента с числом степеней свободы k = п - 2 и уровнем значимости a.

Если коэффициент корреляции меньше 0,9 или выборка мала, среднеквадратическая ошибка выборочного коэффициента корреляции sr рассчиты­вается по формуле


Значимость коэффициента корреляции можно проверить с помощью статистики t, имеющей распределение Стьюдента с п - 2 степенями свободы.

Наблюдаемое значение t (tнабл) вычисляется как


Критическое значение (tкр) определяется по табли­це распределения Стьюдента (приложение 5) по уров­ню значимости a и числу степеней свободы k = п - 2.

По общему правилу проверки статистических гипотез:

— если tнабл £ tкр, нулевую гипотезу о том, что между Х и Y отсутствует корреляционная связь
0: r = 0), нельзя отклонить на заданном уровне значимости а;

— если  tнабл< tкр , нулевая гипотеза отклоняется в пользу альтернативной о том, что коэффициент корреляции значимо отличается от нуля 1: r¹0), т. е. о наличии линейной корреляционной зависимости между Х и Y.

Критерий tрасч подчиняется закону распределения Стьюдента с п - 2 степенями свободы.


При малом числе наблюдений в выборке и вы­соком коэффициенте корреляции (распределение r отличается от нормального) для проверки гипо­тезы о наличии корреляционной связи, а также при построения доверительного интервала приме­няется z-преобразование Фишера.

Для этого применяется статистика


Распределение z асимптотически приближается к нормальному. Вариация z выражается формулой


9.3. Эмпирическое и теоретическое корреляционные отношения

При выявлении статистической зависимости по данным аналитической группировки в качестве меры степени тесноты связи может быть использо­вано эмпирическое корреляционное отношение (hэмп)



где


межгрупповая дисперсия зависимой переменной Y;


общая дисперсия зависимой переменной Y;

`уj — средняя арифметическая j-й группы, где j= 1..., k;

`у — общая средняя арифметическая;

тj объем j-й группы;

п — объем выборки;

у — наблюдаемые значения Y.

Значения hэмп распределены на отрезке [0; 1]


 Чем ближе hэмп к 1, тем теснее связь между пере­менными Х и Y, тем больше колеблемость Y объясняется колеблемостью X.

Квадрат эмпирического корреляционного отно­шения (h2эмп ) называют коэффициентом детерми­нации. Он показывает, какая часть Y колеблемости объясняется колеблемостью X.


Степень тесноты связи между переменными в случае не только линейной, но и нелинейной регрессионной зависимости можно оценить с помощью теоретического корреляционного отношения (hтеор). Поэтому ηтеор   часто называют «индексом корреля­ции». Теоретическое корреляционное отношение рассчитывается по формуле


где SR сумма квадратов вследствие регрессии;

ST общая сумма квадратов.

Ниже (п. 9.11) приведены формулы расчета SR (9.29) и ST (9.27).

Легко увидеть, что в случае линейной регресси­онной зависимости r = hтеор . Если связь — нелинейная, h < hтеор . Это позволяет использовать hтеор   в качестве меры линейности связи между переменны­ми X и Y. Если линейный коэффициент корреляции Пирсона (r) мало отличается от теоретического кор­реляционного отношения (hтеор), т.е. r » hтеор , то за­висимость между переменными близка к линей­ной. В противном случае имеет, место нелинейная зависимость между X и Y.

Проверка значимости и эмпирического (hэмп), и теоретического (hтеор) корреляционного отношения осуществляется с помощью критерия Фишера — F. Его наблюдаемое значение рассчитывается по формуле


где n — число наблюдений (объем выборки); т — число групп (если проверяется значимость эмпири­ческого корреляционного отношения hэмп ) или чис­ло параметров в уравнении регрессии (если прове­ряется значимость теоретического корреляционно­го отношения hтеор).

Ясно, что в уравнении парной регрессии — 2 па­раметра: b0 и b1, т. е. т = 2.

Критическое значение F определяется по табли­цам распределения Фишера (приложение 6) по уро­ню значимости α и числу степеней свободы.


Наблюдаемое значение (Fнабл) необходимо срав­нить с критическим (Fкр). По общему правилу проверки статистических гипотез:

— если Fнабл £ Fкр , нулевую гипотезу (H1:h = 0) о том, что h незначим, нельзя отклонить;

— если Fнабл > Fкр нулевая гипотеза отклоняется в пользу альтернативной (H1:h ¹ 0) о том, что h значимо отличается от нуля.

9.4. Ранговая корреляция

Если п объектов какой-либо совокупности N про­нумерованы в соответствии с возрастанием или убыванием какого-либо признака X, то говорят, что объекты ранжированы по этому признаку. Ранг xi, указывает место, которое занимает i-й объект среди других n объектов, расположенных в соот­ветствии с признаком Х (i= 1,2,.... п). Например, при исследовании рынка мы можем задать вопрос с целью выяснения предпочтений потребителей при выборе товара (при покупке акций, мороженого, водки и т. п.) таким образом, чтобы они распреде­лили товар в порядке возрастания (или убывания) своих потребительских предпочтений. Если мы имеем 2 набора ранжированных данных, то мож­но попытаться установить степень линейной зави­симости между ними. Предположим, имеется 5 про­дуктов, расположенных по порядку предпочтений от 1 до 5 в соответствии с двумя характеристика­ми А и В (табл.9.4).

Таблица 9.4

Характеристики для ранжирования

Продукт

V

W

X

Y

Z

А

 

2

 

5

 

1

 

3

 

4

 

B

1

3

2

4

5

 

Для определения наличия взаимосвязи между ранговыми оценками используется коэффициент ранговой корреляции Спирмена. Его расчет осно­ван на различии между рангами:

D = Ранг А - Ранг В.

Коэффициент корреляции рангов Спирмена ρ рассчитывается по формуле


где п - число пар ранжированных наблюдений.

В нашем примере мы имеем 5 пар рангов, следо­вательно, п = 5.



т. е. между признаками есть достаточно сильная линейная связь. Этот коэффициент изменяется в промежутке от [-1; 1] и интерпретируется так же, как и коэффициент Пирсона. Разница лишь в том, что он применяется для ранжированных данных.

Значимость коэффициента Спирмена проверяет­ся на основе t критерия Стьюдента по формуле


Значение коэффициента считается существен­ным, если tнабл > tкрит (a ;k = п — 2).

 

9.5. Корреляция альтернативных признаков

Альтернативные признаки — это признаки, при­нимающие только два возможных значения. Ис­следование их корреляции основано на показате­лях, построенных на четырехклеточных таблицах, в которых сводятся значения признаков:

а

в

с

d

 

Например, требуется измерить связь между прививками от гриппа и пониженной заболеваемостью от гриппа в группе случайно отобранных студентов (табл. 9.5).

Таблица 9.5

 

Заболели

Не заболели

Итого

Привитые

30

20

50

Непривитые

15

5

20

Всего

45

25

70

 

Для измерения тесноты взаимосвязи признаков производится расчет коэффициента контингенции по формуле


Коэффициент контингенции принимает значение в промежутке [-1; 1]. Его интерпретация аналогич­на интерпретации коэффициента корреляции. Мы получили слабую отрицательную связь -0,14.

Другой метод измерения связи основан на расче­те коэффициента ассоциации


Минус перед коэффициентом говорит об обрат­ном направлении связи, т. е. чем больше прививок, тем меньше заболеваний.

9.6. Оценка уравнения парной регрессии

В начале этой главы было установлено, каким об­разом можно провести предварительный анализ наличия связи, определить ее направление и форму c помощью метода приведения параллельных данных, аналитических группировок, графического метода.

Изучение степени тесноты взаимосвязи между признаками было проведено с помощью корреляционного анализа (расчета различных мер связи).

Уточнение формы связи, нахождение ее анали­тического выражения производится путем построе­ния уравнения связи (уравнения регрессии).

Регрессия — это односторонняя статистичес­кая зависимость.

Уравнение регрессии позволяет определить, ка­ким в среднем будет значение результативного признака (Y) при том или ином значении факторного признака (X), если остальные факторы, влияющие на Y и не связанные с X, рассматривались неиз­менными (т. е. мы абстрагировались от них).

К задачам регрессионного анализа относятся:

1) установление формы зависимости;

2) определение функции регрессии;

3) оценка неизвестных значений зависимой пе­ременной.

По аналитическому выражению различают пря­молинейную и криволинейную связи.

Прямолинейная связь имеет место, когда с воз­растанием (или убыванием) значений Х значения Y увеличиваются (или уменьшаются) более или менее равномерно.

В этом случае уравнение связи записывается так:

`yх  = b0 + b1х.

Криволинейная форма связи может выражаться различными кривыми, из которых простейшими являются:

1) парабола второго порядка

`yх = b0 + b1х +b2х2;

 

2) гипербола

`yx =b0+b1 /x;

3) показательная

`yx = b0b1x;

либо в логарифмическом виде

ln`yx = lnb0 + xlnb1.

После определения формы связи, т. е. вида урав­нения регрессии, по эмпирическим данным определяют параметры искомого уравнения.

При этом отыскиваемые параметры должны быть такими, чтобы рассчитанные по уравнению теоретические значения результативного признака мак­симально приближались к эмпирическим данным.

Чаще всего определение параметров уравнения регрессии осуществляется с помощью метода наименьших квадратов, в котором предполагается, что сумма квадратов отклонений теоретических значе­ний от эмпирических должна быть минимальной,

В зависимости от формы связи в каждом конк­ретном случае определяется своя система уравне­ний, удовлетворяющая принципу минимизации.

 

9.7. Парная линейная зависимость

Предположение о парной линейной зависимости между Х и Y можно описать функцией

Y = b0 + b1Х + и,

где b0, b1 — истинные значения параметров урав­нения регрессии в генеральной совокупности; и — случайная составляющая.

Существует несколько причин возникновения случайной составляющей:

1) невключение объясняющих переменных в урав­нение регрессии;

2) агрегирование объясняющих переменных, включенных в уравнение регрессии;

3) неправильное описание структуры модели, т. е. неверный выбор объясняющих переменных;

4) неправильная функциональная спецификация модели. Например, для моделирования использо­вана линейная функция, в то время как зависи­мость между переменными — нелинейная;

5) ошибки наблюдения (ошибки данных).

По выборочным данным определяются оценки истинных (в случае правильной спецификации модели) параметров уравнения регрессии и случайной составляющей

`yx=b0+b1х+e

где b0,b1, е — оценки неизвестных b0 , b1, и. В случае парной линейной зависимости вида

`yx=b0+b1х

 условие минимума суммы квадратов отклонений теоретических значений от эмпирических (ST) имеет вид


Условие 1-го порядка для минимума




Отсюда получаем систему нормальных уравнений


где n — число рассматриваемых пар взаимозависи­мых величин;

Sx — сумма значений факторного признака;

Sy — сумма значений результативного признака. Вычислив по эмпирическим данным все записанные выше суммы и подставив их в систему уравне­ний, находим оценки параметров искомой прямой:

b0 и b1

В настоящее время необходимость в ручных рас­четах отпала, так как существует множество компьютерных программ, реализующих методы регрес­сионного анализа. Важно понимать смысл параметров и уметь их адекватно интерпретировать.

Из системы нормальных уравнений можно вы­вести формулы для расчета b0 и b1


 

b0=`y-b1·`x.             (9.23)

Здесь  b1 это коэффициент регрессии, характе­ризующий влияние, которое оказывает изменение X на Y. Он показывает, на сколько единиц изме­нится в среднем Y при изменении Х на 1 единицу. Если    b1 > 0, то наблюдаем положительную связь. Если b1 < 0, то связь — отрицательная.

Параметр b1 обладает размерностью отношения у к х.

Параметр b0 постоянная величина в уравне­нии регрессии (свободный член уравнения). Его интерпретация зависит от того, какой смысл име­ют изучаемые признаки.

 

9.8. Коэффициент эластичности

На основе уравнений регрессии часто рассчиты­вают коэффициенты эластичности результативного признака относительно факторного.

Коэффициент эластичности (Э) показывает, на сколько процентов в среднем изменится результативный признак Y при изменении факторного при­знака Х на 1%. Он рассчитывается по формуле


или для практических расчетов



где

 — 1-я производная уравнения регрессии у по х.

 

9.9. Пример расчета коэффициента уравнения регрессии

Рассмотрим методы регрессионного и корреля­ционного анализов. Предположим, что нас интере­сует выручка от продажи баночного пива в магази­нах города в течение дня. Мы провели исследова­ние в 20 случайно выбранных магазинах и получи­ли следующие данные (табл. 9.6):

Таблица 9.6

Номер магазина

Число посетителей

Выручка, у.е.

1

907

11,20

2

926

11,05

3

506

6,84

4

741

9,21

5

789

9,42

6

889

10,08

7

874

9,45

8

510

6,73

9

529

7,24

10

420

6,12

11

679

7,63

12

872

9,43

13

924

9,46

14

607

7,64

15

452

6,92

16

729

8,95

17

794

9,33

18

844

10,23

19

1010

11,77

20

621

7,41

Итого

14,623

176,11

 

Для прогноза объемов продаж применим про­стую модель парной регрессии, в которой используется только одна факторная переменная — Х (чис­ло посетителей магазина). Данные, приведенные в табл. 9.6, можно представить в виде точечной диаг­раммы (диаграммы рассеивания) (рис. 9.2).


Диаграмма (рис. 9.2) наглядно показывает на­личие линейной зависимости выручки от продажи пива от числа посетителей магазина. С увеличени­ем числа посетителей растет выручка от продажи. Рассчитаем параметры уравнения регрессии:

`yx =b0+b1x

Для облегчения расчетов воспользуемся табл. 9.7.

Таблица 9.7

Магазин

Число покупателей X

Выручка Y

X2

Y2

XY

1

907

11,20

822 649

 

125,4400

 

 

10 158,40

 

2

 

926

 

 

11,05

 

857 476

 

122,1025

 

 

10 232,30

 

3

 

506

 

 

6,84

 

256,036

 

46,7856

 

 

3461,04

 

4

 

741

 

 

9,21

 

549 081

 

84,8241

 

 

6 824,61

 

5

 

789

 

 

9,42

 

622 521

 

88,7364

 

 

7 432,38

 

6

 

889

 

 

10,08

 

 

790 321

 

 

101,6064

 

 

8961,12

 

7

874

 

9,45

 

763 876

 

89,3025

 

8 259,30

 

8

510

 

6,73

 

260 100

 

45,2929

 

3 432,30

 

9

529

 

7,24

 

279 841

 

52,4176

 

3 829,96

 

10

420

 

6,12

 

176 400

 

37,4544

 

2 570,40

 

11

679

 

7,63

 

461 041

 

58,2169

 

5 180,77

 

12

872

 

9,43

 

760 384

 

88,9249

 

8 222,96

 

13

924

 

9,46

 

853 776

 

89,4916

 

8 741,04

 

14

607

 

7,64

 

368 449

 

58,3696

 

4 637,48

 

15

452

 

6,92

 

204304

 

47,8864

 

3 127,84

 

16

729

 

8,95

 

531 441

 

80,1025

 

6 254,55

 

17

794

 

9,33

 

630 436

 

87,0489

 

7 408,02

 

18

844 ;

 

10,23

 

712 336

 

104,6529

 

8634,12

 

19

1010

 

11,77

 

1 020 100

 

138,5329

 

11 887,70

 

20

621

 

7,41

 

385 641

 

54,9081

 

4 601,61

 

Итого

 

14623

 

 

176,11

 

 

11 306 209

 

 

1 602,0971

 

 

134 127,90

 

 

Используя формулу (9.22), получим


или соответственно:


Для наших данных уравнение регрессии имеет вид

`yx =2,423 +0,0873x.

 

Коэффициент b1 характеризует наклон линии регрессии. b1 = 0,00873. Это означает, что при увеличении Х на единицу ожидаемое значение Y воз­растет на 0,00873. То есть регрессионная модель указывает на то, что каждый новый посетитель ма­газина в среднем увеличивает недельную выручку магазина на 0,00873 у. е. (или можно сказать, что ожидаемый прирост ежедневной выручки составит 8,73 у. е. при привлечении в магазин 100 дополни­тельных посетителей). Отсюда b1 может быть интерпретирован как прирост ежедневной выручки, который варьирует в зависимости от числа посетителей магазина.

Свободный член уравнения b0 = +2,423 у. е., это — эначение Y при X, равном нулю. Поскольку маловероятно число посетителей магазина, равное нулю, то можно интерпретировать b0 как меру влияния на величину ежедневной выручки других факторов, не включенных в уравнение регрессии.

Регрессионная модель может быть использована для прогноза объема ежедневной выручки. Например, мы хотим использовать модель для предсказа­ния средней ежедневной выручки магазина, кото­рый посетят 600 покупателей.

Для того чтобы определить прогнозируемое зна­чение, следует Х = 600 подставить в наше регрессионное уравнение:

 


Отсюда прогнозируемая дневная выручка для магазина с 600 посетителями в день равна 7,661 у. е.

Когда мы используем регрессионные модели для прогноза, важно помнить, что обсуждаются только значения независимых переменных, находящиеся в пределах от наименьшего до наибольшего значе­ний факторного признака, используемые при созда­нии модели. Отсюда, когда мы предсказываем Y по заданным значениям X, мы можем интерполиро­вать значения в пределах заданных рангов Х , но мы не можем экстраполировать вне рангов X. На­пример, когда используется число посетителей для прогноза дневной выручки магазина, то мы знаем из данных примера, что их число находится в преде­лах от 420 до 1010. Следовательно, предсказание недельной выручки может быть сделано только для магазинов с числом покупателей от 420 до 1010 чел. Коэффициент эластичности для модели


т. е. при увеличении среднего числа посетителей магазина на 1% еженедельная выручка в среднем вырастет на 0,7%.

 

9.10. Стандартная ошибка оценки уравнения регрессии

Хотя метод наименьших квадратов дает нам ли­нию регрессии, которая обеспечивает минимум вариа­ции, регрессионное уравнение не является идеальным в смысле предсказания, поскольку не все значения зависимого признака Y удовлетворяют уравнению ре­грессии. Нам необходима статистическая мера вари­ации фактических значений Y от предсказанных зна­чений Y. Эта мера в то же время является средней вариацией каждого значения относительно среднего значения Y. Мера вариации относительно линии регрессии называется стандартной ошибкой оценки.

Колеблемость фактических значений признака Y относительно линии регрессии показана на рис. 9.3.

Из диаграммы видно, что хотя теоретическая линия регрессии проходит относительно близко от фактических значений Y, часть этих точек лежит выше или ниже линии регрессии. При этом


Стандартная ошибка оценки определяется как


где   уi - фактические значения Y;

`yx предсказанные значения Y для заданного х.


Для вычисления более удобна следующая фор­мула:


Нам уже известны




Тогда


Итак, для нашего примера: Syx = 0,497. Эта стандартная ошибка характеризует меру вариа­ции фактических данных относительно линии ре­грессии. Интерпретация этой меры аналогична интерпретации среднего квадратического отклоне­ния. Если среднее квадратическое отклонение — это мера вариации относительно средней, то стан­дартная ошибка - это оценка меры вариации отно­сительно линии регрессии. Однако стандартная ошибка оценки может быть использована для вы­водов о значении `yx и выяснения, является ли статистически значимой взаимосвязь между дву­мя переменными.

 

9.11. Измерение вариации по уравнению регрессии

Для проверки того, насколько хорошо независи­мая переменная предсказывает зависимую переменную в нашей модели, необходим расчет ряда мер вариации. Первая из них — общая (полная) сумма квадратов отклонений результативного признака от средней — есть мера вариации значений Y относи­тельно их среднего `Y . В регрессионном анализе об­щая сумма квадратов может быть разложена на объясняемую вариацию или сумму квадратов от­клонений за счет регрессии и необъясняемую вариацию или остаточную сумму квадратов отклонений (рис. 9.4).


Сумма квадратов отклонений вследствие регрес­сии это — сумма квадратов разностей между `y


(средним значением Y) и `yx (значением Y, предска­занным по уравнению регрессии). Сумма квадратов отклонений, не объясняемая регрессией (остаточ­ная сумма квадратов), — это сумма квадратов раз­ностей y и `yx . Эти меры вариации могут быть пред­ставлены следующим образом (табл. 9.8):

Таблица 9.8

Общая сумма квадратов

(ST)

=

Сумма квадратов за счет регрессии

(SR)

+

Остаточная сумма квадратов

(SE)

 


Легко увидеть, что остаточная сумма квадратов S(y-`yx)2 — это выражение, стоящее под знаком корня в формуле (9.25) (стандартной ошибки оцен­ки). Тем не менее в процессе вычислений стандартной ошибки мы всегда вначале вычисляем сумму квадратов ошибки.

Остаточная сумма квадратов может быть пред­ставлена следующим образом:



Объясняемая сумма квадратов выразится так:


В самом деле

51,3605 = 46,9145 + 4,4460.

Из этого соотношения определяется коэффициент детерминации:


Отсюда коэффициент детерминации — доля ва­риации Y, которая объясняется независимыми переменными в регрессионной модели. Для нашего примера rг= 46,9145/51,3605 = 0,913.

Следовательно, 91,3% вариации еженедельной выручки магазинов могут быть объяснены числом покупателей, варьирующим от магазина к магази­ну. Только 8,7% вариации можно объяснить ины­ми факторами, не включенными в уравнение рег­рессии.

В случае парной регрессии коэффициент детер­минации равен квадратному корню из квадрата коэффициента линейной корреляции Пирсона


В простой линейной регрессии г имеет тот же знак, что и b1, Если b1 > 0, то r > 0; если b1 < 0, то r < 0, если b1 = 0, то r = 0.

В нашем примере r2 = 0,913 и b1 > 0, коэффици­ент корреляции r = 0,956. Близость коэффициента корреляции к 1 свидетельствует о тесной положи­тельной связи между выручкой магазина от прода­жи пива и числом посетителей.

Мы интерпретировали коэффициент корреляции в терминах регрессии, однако корреляция и регрессия — две различные техники. Корреляция ус­танавливает силу связи между признаками, а регрессия — форму этой связи. В ряде случаев для анализа достаточно найти меру связи между признаками, без использования одного из них в каче­стве факторного признака для другого.

 

9.12. Доверительные интервалы для оценки неизвестного генерального значения `yген(m) и индивидуального значения `yi

Поскольку в основном для построения регрессионных моделей используются данные выборок, то зачастую интерпретация взаимоотношений между переменными в генеральной совокупности базируется на выборочных результатах.

Как было сказано выше, регрессионное уравнение используется для прогноза значений Y по заданному значению X. В нашем примере показано, что при 600 посетителях магазина сумма выручки могла бы быть 7,661 у. е. Однако это значение — только точечная оценка истинного среднего значе­ния. Мы знаем, что для оценки истинного значе­ния генерального параметра возможна интерваль­ная оценка.

Доверительный интервал для оценки неизвест­ного генерального значения `yген(m) имеет вид


где


Здесь `yx предсказанное значение Y

(`yx==b0+b1yi);

Syx стандартная ошибка оценки;

п — объем выборки;

хi заданное значение X.

Легко видеть, что длина доверительного интер­вала зависит от нескольких факторов. Для заданного уровня значимости a увеличение вариации вокруг линии регрессии, измеряемой стандартной ошибкой оценки, увеличивает длину интервала. Увеличение объема выборки уменьшит длину интервала. Более того, ширина интервала также ва­рьирует с различными значениями X. Когда оценивается `yx по значениям X, близким к `x, то ин­тервал тем уже, чем меньше абсолютное отклонение хi от `x (рис. 9.5).


Когда оценка осуществляется по значениям X, удаленным от среднего `x, то длина интервала возрастает.

Рассчитаем 95%-й доверительный интервал для среднего значения выручки во всех магазинах с числом посетителей, равным 600. По данным на­шего примера уравнение регрессии имеет вид

`yx = 2,423 + 0,00873x:

и для `xi  = 600 получим `yi; =7,661, а также


По таблице Стьюдента (приложение 5)

t18 = 2,10.

Отсюда, используя формулы (9.31) и (9.32), рас­считаем границы искомого доверительного интер­вала для myx


Итак, 7,369 £ myx £7,953.

Следовательно, наша оценка состоит в том, что средняя дневная выручка находится между 7,369 и 7,953 у. е. для всех магазинов с 600 посетителями.

Для построения доверительного интервала для индивидуальных значений Yx, лежащих на линии регрессии, используется доверительный интервал регрессии вида


 

где hi  ,`yi, , Syx    ,п и хi определяются, как и в формулах (9.31) и (9.32).

   Определим 95% -и доверительный интервал для оценки дневных продаж отдельного магазина с 600 посетителями


В результате вычислений получим


Итак, 6,577£ `yi £ 8,745.

Следовательно, с 95%-й уверенностью можно ут­верждать, что ежедневная выручка отдельного магазина, который посетили 600 покупателей, нахо­дится в пределах от 6,577 до 8,745 у. е. Длина это­го интервала больше чем длина интервала, полу­ченного ранее для оценки среднего значения Y.

 

9.13. Доверительные интервалы для оценки истинных значений неизвестного параметра уравнения регрессии  b1 и коэффициента регрессии р в генеральной совокупности

Построим доверительный интервал для истинно­го значения генерального параметра  b1. Для этого проверим гипотезу о равенстве нулю  b1. Если гипо­теза будет отклонена, то подтверждается существование линейной зависимости Y от X. Сформулиру­ем нулевую и альтернативную гипотезы:

Н0: b1 = 0 (линейной зависимости нет);

Н1: b1¹ 0 (линейная зависимость есть).

Для проверки гипотезы Н0 используется t-кри­терий (случайная величина t, имеющая распреде­ление Стьюдента с п - 2 степенями свободы):


где     



Убедимся, что полученный выборочный резуль­тат является достаточным для заключения о том, что зависимость объема выручки от числа посетите­лей магазина статистически существенна на 5%-м уровне значимости.


Следовательно,


 Найдем наблюдаемое значение критерия t


  tкрит(a=0,05;k=18)= 2,1 (по таблице распределения Стьюдента, приложение 5).

Так как 13,77 > 2,10, то нулевая гипотеза Н0 отвергается в пользу альтернативной гипотезы Н1, и можно говорить о наличии существенной линей­ной зависимости ежедневной выручки от числа посетителей магазина.

Второй, эквивалентный первому, метод для про­верки наличия или отсутствия линейной зависимо­сти переменной Y от Х состоит в построении дове­рительного интервала для оценки b1 и определении того, принадлежит ли значение b1 этому интервалу. Доверительный интервал для оценки b1 получают  по формуле


Найдем для нашего примера 95% -й. доверитель­ный интервал для оценки b1:


Итак,     0,0074 £ b1 £ 0,01006,

т. е. с 95%-й уверенностью можно считать, что ис­тинное значение коэффициента регрессии b1 находится в промежутке между числами 0,0074 и 0,01006. Так как эти значения больше нуля, то можно сделать вывод, что существует статистичес­ки значимая линейная зависимость выручки от числа посетителей. Если бы интервал включал ну­левое значение, то мы не смогли бы сделать этого вывода.

Третий метод проверки существования линейной связи между двумя переменными состоит в проверке выборочного коэффициента корреляции r.

Для этого выдвигается нулевая гипотеза Н0: ρ=0 (нет корреляции).

Альтернативная гипотеза Н1: ρ ¹0 (корреляция существует).

Для проверки нулевой гипотезы Н0 используем t-критерий (случайную величину t, имеющую распределение Стьюдента с п — 2 степенями свобо­ды) (9.11).


Наблюдаемое значение t составит


Полученный результат практически совпадает со значением, полученным по формуле (9.35). Следо­вательно, мы вновь подтверждаем наличие линей­ной связи между двумя переменными Y и X.

 

Задачи к теме 9

1. Туристическая компания предлагает места в гостиницах приморского курорта. Менеджера компании интересует, насколько возрастает привлека­тельность гостиницы в зависимости от ее расстояния до пляжа. С этой целью по 14 гостиницам горо­да была выяснена среднегодовая наполняемость но­меров и расстояние в километрах от пляжа.

Расстояние, км

0,1

0,1

0,2

0,3

0,4

0,4

0,5

0,6

0,7

0,7

0,8

0,8

0,9

0,9

Наполняемость,.

%

92

95

96

90

89

86

90

83

85

80

78

76

72

75

 

Постройте график исходных данных и определи­те по нему характер зависимости. Рассчитайте выборочный коэффициент линейной корреляции Пир­сона, проверьте его значимость при a = 0,05. Пост­ройте уравнение регрессии и дайте интерпретацию полученных результатов.

2. Компанию по прокату автомобилей интересу­ет зависимость между пробегом автомобилей (X) и стоимостью ежемесячного технического обслужива­ния (Y). Для выяснения характера этой связи было отобрано 15 автомобилей.

Х

6

7

8

9

10

11

12

13

14

15

16

17

18

19

20

Y

13

16

15

20

19

21

26

24

30

32

30

35

34

40

39

 

Постройте график исходных данных и определи­те по нему характер зависимости. Рассчитайте выборочный коэффициент линейной корреляции Пир­сона, проверьте его значимость при a = 0,05. Пост­ройте уравнение регрессии и дайте интерпретацию полученных результатов.

 

3. Врач-исследователь выясняет зависимость пло­щади пораженной части легких у людей, заболевших эмфиземой легких, от числа лет курения. Ста­тистические данные, собранные им в некоторой об­ласти, имеют следующий вид:

Число лет курения

25

36

22

15

48

39

42

31

28

33

Площадь пораженной части легкого, %

55

60

50

30

75

70

70

55

30

35

 

Постройте график исходных данных и определи­те по нему характер зависимости. Рассчитайте выборочный коэффициент линейной корреляции Пир­сона, проверьте его значимость при a = 0,05. Пост­ройте уравнение регрессии и дайте интерпретацию полученных результатов. Если человек курил 30 лет, то сделайте прогноз о степени поражения легких у случайно выбранного пациента, больного эмфиземой.

4. Компания, занимающаяся продажей радиоап­паратуры, установила на видеомагнитофон определенной модели цену, дифференцированную по ре­гионам. Следующие данные показывают цены на видеомагнитофон в 8 различных регионах и соот­ветствующее им число продаж.

Число продаж, шт.

420

380

350

400

440

380

450

420

Цена, тыс. руб.

5,5

6,0

6,5

6,0

5,0

6,5

4,5

5,0

Постройте график исходных данных и определи­те вид зависимости. Рассчитайте коэффициент линейной корреляции Пирсона, оцените его значи­мость при a = 0,01. Постройте уравнение регрессии и объясните смысл полученных результатов.

5. Опрос случайно выбранных 10 студентов, про­живающих в общежитии университета, позволяет выявить зависимость между средним баллом по ре­зультатам предыдущей сессии и числом часов в неделю, затраченных студентом на самостоятельную подготовку.

Средний балл

4,6

4,3

3,8

3,8

4,2

4,3

3,8

4,0

3,1

3,9

Число часов

25

22

9

15

15

30

20

30

10

17

Постройте график исходных данных и определи­те по нему характер зависимости. Рассчитайте выборочный коэффициент линейной корреляции Пир­сона, проверьте его значимость при α = 0,05. Постройте уравнение регрессии и дайте интерпретацию полученных результатов. Если студент занимается самостоятельно по 12 ч в неделю, то каков прогноз его успеваемости?

6. Некоторая компания недавно провела  рекламную кампанию в магазинах с демонстрацией антисептических качеств своего нового моющего средства. Через 10 недель компания решила проанализировать эффективность этого вида рекламы, сопоставив еженедельные объемы продаж с расходами на рекламу (тыс. руб.).

Объем продаж, тыс. руб.

72

76

78

70

68

80

82

65

62

90

Расходы на рекламу, тыс. руб.

5

8

6

5

3

9

12

4

3

10

 

Постройте график исходных данных и определи­те по нему характер зависимости. Рассчитайте выборочный коэффициент линейной корреляции Пир­сона, проверьте его значимость при α = 0,05. Пост­ройте уравнение регрессии и дайте интерпретацию полученных результатов.

7. Предположим, что мы имеем случайную вы­борку из 10 домохозяйств для изучения связи меж­ду числом холодильников в домохозяйстве и чис­лом членов домохозяйства. Х — число членов домохозяйства; Y — число холодильников.

Х

6

2

4

3

4

4

6

3

2

2

Y

4

1

3

2

2

3

4

1

2

2

 

Постройте график исходных данных и определи­те по нему характер зависимости. Рассчитайте выборочный коэффициент линейной корреляции Пир­сона, проверьте его значимость при a = 0,01. Пост­ройте уравнение регрессии и дайте интерпретацию полученных результатов.

8. Имеются выборочные данные о стаже работы (X, лет) и выработке одного рабочего за смену (Y, шт.).

Х

1

3

4

5

6

7

Y

14

15

18

20

22

25

 

Постройте график исходных данных и определи­те по нему характер зависимости. Рассчитайте выборочный коэффициент линейной корреляции Пир­сона, проверьте его значимость при a = 0,05. Пост­ройте уравнение регрессии и дайте интерпретацию Полученных результатов.

9. Изучается зависимость себестоимости едини­цы изделия (Y, тыс. руб.) от величины выпуска продукции (X, тыс. шт.) по группам предприятий за отчетный период. Экономист обследовал 5 предпри­ятий и получил следующие данные:

Х

2

3

4

5

6

Y

1,9

1,7

1,8

1,6

1,4

 

Полагая, что между Y и Х имеет место линейная зависимость, определите выборочное уравнение линейной регрессии и объясните смысл полученных коэффициентов. Каковы значимость коэффициента корреляции, направление и теснота связи между показателями Y и X, если уровень значимости при­нять равным 0,05?

10. Имеются выборочные данные о глубине вспашки полей под озимые культуры (X, см) и их урожайности (Y, ц/га):

Х

10

15

20

25

30

Y

5

10

16

20

24

 

При a = 0,05 установить значимость статисти­ческой связи между признаками Х и Y. Если при­знаки коррелируют, постройте уравнение регрессии и объясните его смысл. Сделайте прогноз урожай­ности пшеницы при глубине вспашки 22 см.

11. Из студентов 4-го курса одного из факульте­тов университета отобраны случайным образом 10 студентов и подсчитаны средние оценки, получен­ные ими на 1-м (X) и 4-м (Y) курсе. Получены следующие данные:

Х

3,5

4,0

3,8

4,6

3,9

3,0

3,5

3,9

4,5

4,1

Y

4,2

3,9

3,8

4,5

4,2

3,4

3,8

3,9

4,6

3,0

 

Полагая,что между Y и Х имеет место линейная зависимость, определите выборочное уравнение линейной регрессии и объясните смысл полученных коэффициентов. Каковы значимость коэффициента корреляции, направление и теснота связи между показателями Y и X, если уровень значимости при­нять равным 0,05?

12. Определите тесноту связи между возрастом самолета (X, лет) и стоимостью его эксплуатации (Y, млн руб.) по следующим данным:

Х

1

2

3

4

5

Y

2

4

5

8

10

 

Установите значимость коэффициента корреля­ции. Если он значим, то постройте уравнение регрессии и объясните его смысл. Каким будет про­гноз стоимости эксплуатации самолета, если его возраст 1,5 года, а уровень значимости принять рав­ным 0,05?

13. Определите тесноту связи объема выпуска про­дукции (X, тыс. шт.) и себестоимости единицы изделия (Y, тыс. руб.) на основе следующих данных:

Х

3

4

5

6

7

Y

10

8

7

5

2

 

Проверьте значимость выборочного коэффициента корреляции при α = 0,05. Постройте уравнение линейной регрессии и объясните его.

 

14. Определите тесноту связи общего веса неко­торого растения (X, г) и веса его семян (Y, г) на основе следующих выборочных данных:      

Х

40

50

60

70

80

90

100

Y

20

25

28

30

35

40

45

 

Проверьте значимость выборочного коэффициента корреляции при a =0,05. Постройте линейное урав­нение регрессии и объясните его.

15. При исследовании зависимости времени, зат­раченного на закрепление детали на токарном стан­ке, от веса детали, получены следующие результа­ты (X — вес детали, кг, Y — время закрепления детали, с):

Х

7

8

10

12

13

14

15

17

18

20

Y

2,2

2,3

2,4

2,5

2,6

2,7

2,8

3,0

3,1

3,2

 

Полагая, что между Y и Х имеет место линейная зависимость, определите выборочное уравнение линейной регрессии и объясните смысл полученных коэффициентов. Каковы значимость коэффициента корреляции, направление и теснота связи между показателями Х и Y, если уровень значимости при­нять равным 0,05?

16. Семь вновь принятых сотрудников брокер­ской компании проходят аттестацию в конце испытательного периода. Результаты их работы оцени­ваются путем сдачи теста на профессиональную при­годность и по отдаче с каждого инвестированного ими рубля. Результаты молодых специалистов были ранжированы следующим образом:

Молодые специалисты

А

В

С

D

E

F

G

Результат теста

3

2

6

4

1

7

5

Отдача с рубля

1

3

5

2

4

6

7

 

Вычислите коэффициент корреляции рангов Спирмена, оцените его значимость.

17. Следующие данные получены из случайной выборки по оборотам 8 годовых консолидирован­ных балансов. Цифры в таблице показывают объем продаж, тыс. шт., и цену единицы товара, руб.

Продажа

12,2

18,6

29,2

15,7

25,4

35,2

14,7

11,17

Цена

29,2

30,5

29,7

31,3

30,8

29,9

27,8

27,0

 

Рассчитайте выборочный коэффициент корреля­ции Пирсона между объемом продаж и ценой това­ра. Проверьте значимость коэффициента корреля­ции для a = 0,05.

18. Перед сдачей экзаменов в конце семестра в 20 группах студентов университета был проведен опрос о том, какую оценку по сдаваемым в сессию курсам они ожидают получить. После сессии сред­ние полученные оценки были сопоставлены со сред­ними ожидаемыми. Результаты приведены в таблице:

Ожидаемая

3,4

3,1

3,0

2,8

3,7

3,5

2,9

3,7

3,5

3,2

Полученная

4,1

3,4

3,3

3,0

4,7

4,6

3,0

4,6

4,6

3,6

Ожидаемая

3,0

3,5

3,3

3,1

3,3

3,9

2,9

3,2

3,4

3,4

Полученная

3,5

4,0

3,6

3,1

3,3

4,5

2,8

3,7

3,8

3,9

Рассчитайте линейный коэффициент корреляции Пирсона, оцените его значимость при α=0,05.

19. Организация стран-экспортеров нефти предпринимает попытки контроля над ценами на сырую нефть с 1973г. Цены на сырую нефть резко возрастали с середины 70-х до середина 80-х гг., что повлекло за собой некоторое повышение цен на бензин. Следующая таблица представляет средние цены на сырую нефть и бензин с 1975 по 1988г.

Год

 

Бензин, Y — центов за галлон

 

Сырая нефть, X — дол. за баррель

 

1975

 

57

 

7,67

 

1976

 

59

 

8,19

 

1977

 

62

 

8,57

 

1978

 

63

 

9,00

 

1979

 

86

 

12,64

 

1980

 

119

 

21,59

 

1981

 

133

 

31,77

 

1982

 

122

 

28,52

 

1983

 

116

 

26,19

 

1984

 

113

 

25,88

 

1985

 

112

 

24,09

 

1986

 

86

 

12,51

 

1987

 

90

 

15,40

 

1988

 

90

 

12,57

 

Постройте график и оцените характер взаимодействия между переменными. Рассчитайте параметры уравнения регрессии, оценивающего зависимость цен на галлон бензина от цен за баррель сырой нефти. Дайте интерпретацию полученных результатов.

  20. Имеются данные по 14 предприятиям о производительности труда (Y, шт.) и коэффициенте механизации работ (X, %)

X

 

32

 

30

 

36

 

40

 

41

 

47

 

56

 

54

 

60

 

55

 

61

 

67

 

69

 

76

 

Y

 

20

 

24

 

28

 

30

 

31

 

33

 

34

 

37

 

38

 

40

 

41

 

43

 

45

 

48

 

Проверьте значимость выборочного коэффициента корреляции при α = 0,05. Постройте уравнение линейной регрессии и объясните его.

 

ЛИТЕРАТУРА

Абезгауз Г. Г., Тронь А. П., Коненкин Ю. Н., Корови­на И. А. Справочник по вероятностным расче­там. М., 1970.

Белинский В. А., Калихман И. А., Майстров Л. Я., Митькин А. М. Высшая математика с основами математической статистики. М., 1965.

Вайнберг Дж., Шумекер Дж. Статистика. М., 1979.

Варден Ван-дер Б. Л. Математическая статистика. М., 1960.

Венецкий И. Г., Венецкая В. И. Основные математико-статистические понятия и формулы в эконо­мическом анализе. М., 1974.

Венецкий И. Г., Кильдишев Г. С. Теория вероятнос­тей и математическая статистика. М., 1975.

Вентцель Е. С. Теория вероятностей. М., 1964.

Вентцелъ Е. С., Овчаров Л. А. Теория вероятностей (задачи и упражнения). М., 1969.

Гершгорн А. С. Элементы теории вероятностей и математической статистики. Львов, 1961.

Гмурман В. Е. Руководство к решению задач по те­ории вероятностей и математической статисти­ке. М., 1975; 1979;1997.

Гмурман В. Е. Теория вероятностей и математичес­кая статистика. М. 1975; 1988.

Гнеденко Б. В., Хинчин А. Я. Элементарное введение в теорию вероятностей. М., 1970.

Гнеденко Б. В. Курс теории вероятностей. 6-е изд. М., 1988.

Гурский Е. И. Теория вероятностей с элементами математической статистики. М., 1971.

Дружинин Н. К. Математическая статистика в эко­номике. М.,1971.

Емельянов Г. В., Скитович В. П. Задачник по тео­рии вероятностей и математической статисти­ке. Л., 1967.

Иванова В. М., Калинина В. Н., Нешумова Л. А; Ре­шетникова И. О. Математическая статистика. М., 1981.

Ивашев-Мусатов О. С. Теория вероятностей и ма­тематическая статистика. М., 1979.

Карасев А. И. Теория вероятностей и математичес­кая статистика. М., 1971.

Карасев А. И., Аксютина 3. М., Савельева Т. И. Курс высшей математики для экономических вузов. Ч. II. Теория вероятностей и математическая статистика. М., 1982.

Козлова 3. А. Методические указания по изучению темы «Закон больших чисел». Ростов н/Д, 1979.

Коваленко И. Н., Вилиппова А. А. Теория вероятно­стей и математическая статистика. 2-е изд. М., 1982.

Колде Я. К. Практикум по теории вероятностей и математической статистике. М., 1991.

Колемаев В. А., Староверов О. В., Турундаевский В. Б. Теория вероятностей и математическая статистика. М., 1991.

Колемаев В. А., Калинина В. Н. Теория вероятно­стей и математическая статистика. М., 1997.

Лихолетов И. И., Мацкевич И. П. Руководство к решению задач по высшей математике с осно­вами математической статистики и теории ве­роятностей. Минск,1991.

Маринеску И., Мойнягу Ч., Никулеску Р., Ранку Н., Урсяну В. Основы математической статистики и ее применение. М., 1970.

Мостллер Ф., Рурке Р., Томас Дж. Вероятность. М., 1969.

Павловский З. Введение в математическую статис­тику. М.,1967.

Румшинский Л. З. Элементы теории вероятностей. М.,1970.

Сборник задач по теории вероятностей, математи­ческой статистике и теории случайных функ­ций/ Под ред. А. А.Свешникова. М., 1965.

Феллер. В. Введение в теорию вероятностей и ее приложения. М., 1952.

Четыркин Е. И., Калихман И. Л. Вероятность и ста­тистика. М., 1982.

Чистяков В. П. Курс теории вероятностей. 3-е изд. М., 1987.

Aczel A. Complete Business Statistics. 2nd ed./Richard D. Irwin, INC., 1993.

Canavos G. Applied Probability and Statistical Methods. Little, Brown... Company, USA, 1984.

Mendenhall W„ Wackerly D., Scheaffer R Mathematical statistics with Applications. PWS-KENT Publi­shing Company, USA, 1990.

 

 

Приложение 1


X

0

1

2

3

4

5

6

7

8

9

 

0,0

 

0,3989

 

0,3989

 

0,3989

 

0,3988

 

0,3986

 

0,3984

 

0,3982

 

0,3980

 

0,3977

 

0,3973

 

 

0,1

 

0,3970

 

0,3965

 

0,3961

 

0,3956

 

0,3951

 

0,3945

 

0,3939

 

0,3932

 

0,3925

 

0,3918

 

 

0,2

 

0,3910

 

0,3902

 

0,3894

 

0,3885

 

0,3876

 

0,3867

 

0,3857

 

0,3847

 

0,3836

 

0,3825

 

 

0,3

 

0,3814

 

0,3802

 

0,3790

 

0,3778

 

0,3765

 

0,3752

 

0,3739

 

0,3725

 

0,3712

 

0,3697

 

 

0,4

 

0,3683

 

0,3668

 

0,3653

 

0,3637

 

0,3621

 

0,3605

 

0,3589

 

0,3572

 

0,3555

 

0,3538

 

 

0,5

 

0,3521

 

0,3503

 

0,3485

 

0,3467

 

0,3448

 

0,3429

 

0,3410

 

0,3391

 

0,3372

 

0,3352

 

 

0,6

 

0,3332

 

0,3312

 

0,3292

 

0,3271

 

0,3251

 

0,3230

 

0,3209

 

0,3187

 

0,3166

 

0,3144

 

 

0,7

 

0,3123

 

0,3101

 

0,3079

 

0,3056

 

0,3034

 

0,3011

 

0,2989

 

0,2966

 

0,2943

 

0,2920

 

 

0,8

 

0,2897

 

0,2874

 

0,2850

 

0,2827

 

0,2803

 

0,2780

 

0,2756

 

0,2732

 

0,2709

 

0,2685

 

 

0,9

 

0,2661

 

0,2637

 

0,2613

 

0,2589

 

0,2565

 

0,2541

 

0,2516

 

0,2492

 

0,2468

 

0,2444

 

 

1,0

 

0,2420

 

0,2396

 

0,2371

 

0,2347

 

0,2323

 

0,2299

 

0,2275

 

0,2251

 

0,2227

 

0,2203

 

 

1,1

 

0,2179

 

0,2155

 

0.2131

 

0,2107

 

0,2083

 

0,2059

 

0,2036

 

0,2012

 

0,1989

 

0,1965

 

 

1,2

 

0,1942

 

0,1919

 

0,1895

 

0,1872

 

0,1849

 

0,1826

 

0,1804

 

0,1781

 

0,1758

 

0,1736

 

 

1,3

 

0,1714

 

0,1691

 

0,1669

 

0,1647

 

0,1626

 

0,1604

 

0,1582

 

0,1561

 

0,1539

 

0,1518

 

 

1,4

 

0,1497

 

0,1476

 

0,1456

 

0,1435

 

0,1415

 

0,1394

 

0,1374

 

0.1354

 

0,1334

 

0,1315

 

 

1,5

 

0,1295

 

0,1276

 

0,1257

 

0,1238

 

0,1219

 

0,1200

 

0,1182

 

0,1163

 

0,1145

 

0,1127

 

 

1,6

 

0,1109

 

0,1092

 

0,1074

 

0,1057

 

0,1040

 

0,1023

 

0,1006

 

0,0989

 

0,0973

 

0,0957

 

 

1,7

 

0,0940

 

0,0925

 

0,0909

 

0,0893

 

0,0878

 

0,0863

 

0,0848

 

0,0833

 

0,0818

 

0,0804

 

 

1,8

 

0,0790

 

0,0775

 

0,0761

 

0,0748

 

0,0734

 

0,0721

 

0,0707

 

0,0694

 

0,0681

 

0,0669

 

 

1,9

 

0,0656

 

0,0644

 

0,0632

 

0,0620

 

0,0608

 

0,0596

 

0,0584

 

0,0573

 

0,0562

 

0,0551

 

 

2,0

 

0,0540

 

0,0529

 

0,0519

 

0,0508

 

0,0498

 

0,0488

 

0,0478

 

0,0468

 

0,0459

 

0,0449

 

 

2,1

 

0,0440

 

0,0431

 

0,0422

 

0,0413

 

0,0404

 

0,0396

 

0,0387

 

0,0379

 

0,0371

 

0,0363

 

 

2,2

 

0,0355

 

0,0347

 

0,0339

 

0,0332

 

0,0325

 

0,0317

 

0,0310

 

0,0303

 

0,0297

 

0,0290

 

 

2,3

 

0,0283

 

0,0277

 

0,0270

 

0,0264

 

0,0258

 

0,0252

 

0,0246

 

0,0241

 

0,0235

 

0,0229

 

 

2,4

 

0,0224

 

0,0219

 

0,0213

 

0,0208

 

0,0203

 

0,0198

 

0,0194

 

0,0189

 

0,0184

 

0,0180

 

 

2,5

 

0,0175

 

0,0171

 

0,0167

 

0,0163

 

0,0158

 

0,0154

 

0,0151

 

0,0147

 

0,0143

 

0,0139

 

 

2,6

 

0,0136

 

0,0132

 

0,0129

 

0,0126

 

0,0122

 

0,0119

 

0,0116

 

0,0113

 

0,0110

 

0,0107

 

 

2,7

 

0,0104

 

0,0101

 

0,0099

 

0,0096

 

0,0093

 

0,0091

 

0,0088

 

0,0086

 

0,0084

 

0,0081

 

 

2,8

 

0,0079

 

0,0077

 

0,0075

 

0,0073

 

0,0071

 

0,0069

 

0,0067

 

0,0065

 

0,0063

 

0,0061

 

2,9

 

0,0060

 

0,0058

 

0,0056

 

0,0055

 

0,0053

 

0,0051

 

0,0050

 

0,0048

 

0,0047

 

0,0046

 

3,0

 

0,0044

 

0,0043

 

0,0042

 

0,0040

 

0,0039

 

0,0038

 

0,0037

 

0,0036

 

0,0035

 

0,0034

 

3,1

 

0,0033

 

0,0032

 

0,0031

 

0,0030

 

0,0029

 

0,0028

 

0,0027

 

0,0026

 

0,0025

 

0,0025

 

3,2

 

0,0024

 

0,0023

 

0,0022

 

0,0022

 

0,0021

 

0,0020

 

0,0020

 

0,0019

 

0,0018

 

0,0018

 

3,3

 

0,0017

 

0,0017

 

0,0016

 

0,0016

 

0,0015

 

0,0015

 

0,0014

 

0,0014

 

0,0013

 

0,0013

 

3,4

 

0,0012

 

0,0012

 

0,0012

 

0,0011

 

0,0011

 

0,0010

 

0,0010

 

0,0010

 

0,0009

 

0,0009

 

3,5

 

0,0009

 

0,0008

 

0,0008

 

0,0008

 

0,0008

 

0,0007

 

0,0007

 

0,0007

 

0,0007

 

0,0006

 

3,6

 

0,0006

 

0,0006

 

0,0006

 

0,0005

 

0,0005

 

0,0005

 

0,0005

 

0,0005

 

0,0005

 

0,0004

 

3,7

 

0,0004

 

0,0004

 

0,0004

 

0,0004

 

0,0004

 

0,0004

 

0,0003

 

0,0003

 

0,0003

 

0,0003

 

3,8

 

0,0003

 

0,0003

 

0,0003

 

0,0003

 

0,0003

 

0,0002

 

0,0002

 

0,0002

 

0,0002

 

0,0002

 

3,9

 

0,0002

 

0,0002

 

0,0002

 

0,0002

 

0,0002

 

0,0002

 

0,0002

 

0,0002

 

0,0001

 

0,0001

 

4,0

 

0,0001

 

0,0001

 

0,0001

 

0,0001

 

0,0001

 

0,0001

 

0,0001

 

0,0001

 

0,0001

 

0,0001

 

4,1

 

0,0001

 

0,0001

 

0,0001

 

0,0001

 

0,0001

 

0,0001

 

0,0001

 

0,0001

 

0,0001

 

0,0001

 

4,2

 

0,0001

 

0,0001

 

0,0001

 

0,0001

 

0,0000

 

0,0000

 

0,0000

 

0,0000

 

0,0000

 

0,0000

 

Приложение 2


z

 

0

 

1

 

2

 

3

 

4

 

5

 

6

 

7

 

8

 

9

 

 

0,0

 

0,00000

 

0,00399

 

0,00798

 

0,01197

 

0,01595

 

0,01994

 

0,02392

 

0,02790

 

0,03188

 

0,03586

 

 

0,1

 

0,03983

 

0,04380

 

0,04776

 

0,05172

 

0,05567

 

0,05962

 

0,06356

 

0,06749

 

0,07142

 

0,07535

 

 

0,2

 

0,07926

 

0,08317

 

0,08706

 

0,09095

 

0,09483

 

0,09871

 

0,10257

 

0,10642

 

0,11026

 

0,11409

 

 

0,3

 

0,11791

 

0,12172

 

0,12552

 

0,12930

 

0,13307

 

0,13683

 

0,14058

 

0,14431

 

0,14803

 

0,15173

 

 

0,4

 

0,15542

 

0,15910

 

0,16276

 

0,16640

 

0,17003

 

0,17364

 

0,17724

 

0,18082

 

0,18439

 

0,18793

 

 

0,5

 

0,19146

 

0,19497

 

0,19847

 

0,20194

 

0,20540

 

0,20884

 

0,21226

 

0,21566

 

0,21904

 

0,22240

 

 

0,6

 

0,22575

 

0,22907

 

0,23237

 

0,23565

 

0,23891

 

0,24215

 

0,24537

 

0,24857

 

0,25175

 

0,25490

 

 

0,7

 

0,25804

 

0,26115

 

0,26424

 

0,26730

 

0,27035

 

0,27337

 

0,27637

 

0,27935

 

0,28230

 

0,28524

 

 

0,8

 

0,28814

 

0,29103

 

0,29389

 

0,29673

 

0,29955

 

0,30234

 

0,30511

 

0,30785

 

0,31057

 

0,31327

 

 

0,9

 

0,31594

 

0,31859

 

0,32121

 

0,32381

 

0,32639

 

0,32894

 

0,33147

 

0,33398

 

0,33646

 

0,33891

 

 

1,0

 

0,34134

 

0,34375

 

0,34614

 

0,34849

 

0,35083

 

0,35314

 

0,35543

 

0,35769

 

0,35993

 

0,36214

 

 

1,1

 

0,36433

 

0,36650

 

0,36864

 

0,37076

 

0,37286

 

0,37493

 

0,37698

 

0,37900

 

0,38100

 

0,38298

 

 

1,2

0,38493

 

0,38686

 

0,38877

 

0,39065

 

0,39251

 

0,39435

 

0,39617

 

0,39796

 

0,39973

 

0,40147

 

 

1,3

 

0,40320

 

0,40490

 

0,40658

 

0,40824

 

0,40988

 

0,41149

 

0,41308

 

0,41466

 

0,41621

 

0,41774

 

1,4

 

0,41924

 

0,42073

 

0,42220

 

0,42364

 

0,42507

 

0,42647

 

0,42785

 

0,42922

 

0,43056

 

0,43189

 

1,5

 

0,43319

 

0,43448

 

0,43574

 

0,43699

 

0,43822

 

0,43943

 

0,44062

 

0,44179

 

0,44295

 

0,44408

 

1,6

 

0,44520

 

0,44630

 

0,44738

 

0,44845

 

0,44950

 

0,45053

 

0,45154

 

0,45254

 

0,45352

 

0,45449

 

1,7

 

0,45543

 

0,45637

 

0,45728

 

0,45818

 

0,45907

 

0,45994

 

0,46080

 

0,46164

 

0,46246

 

0,46327

 

1,8

 

0,46407

 

0,46485

 

0,46562

 

0,46638

 

0,46712

 

0,46784

 

0,46856

 

0,46926

 

0,46995

 

0,47062

 

1,9

 

0,47128

 

0,47193

 

0,47257

 

0,47320

 

0,47381

 

0,47441

 

0,47500

 

0,47558

 

0,47615

 

0,47670

 

2,0

 

0,47725

 

0,47778

 

0,47831

 

0,47882

 

0,47932

 

0,47982

 

0,48030

 

0,48077

 

0,48124

 

0,48169

 

2,1

 

0,48214

 

0,48257

 

0,48300

 

0,48341

 

0,48382

 

0,48422

 

0,48461

 

0,48500

 

0,48537

 

0,48574

 

2,2

 

0,48610

 

0,48645

 

0,48679

 

0,48713

 

0,48745

 

0,48778

 

0,48809

 

0,48840

 

0,48870

 

0,48899

 

2,3

 

0,48928

 

0,48956

 

0,48983

 

0,49010

 

0,49036

 

0,49061

 

0,49086

 

0,49111

 

0,49134

 

0,49158

 

2,4

 

0,49180

 

0,49202

 

0,49224

 

0,49245

 

0,49266

 

0,49286

 

0,49305

 

0,49324

 

0,49343

 

0,49361

 

2,5

 

0,49379

 

0,49396

 

0,49413

 

0,49430

 

0,49446

 

0,49461

 

0,49477

 

0,49492

 

0,49506

 

0,49520

 

2,6

 

0,49534

 

0,49547

 

0,49560

 

0,49573

 

0,49585

 

0,49598

 

0,49609

 

0,49621

 

0,49632

 

0,49643

 

2,7

 

0,49653

 

0,49664

 

0,49674

 

0,49683

 

0,49693

 

0,49702

 

0,49711

 

0,49720

 

0,49728

 

0,49736

 

2,8

 

0,49744

 

0,49752

 

0,49760

 

0,49767

 

0,49774

 

0,49781

 

0,49788

 

0,49795

 

0,49801

 

0,49807

 

 

2,9

 

0,49813

 

0,49819

 

0,49825

 

0,49831

 

0,49836

 

0,49841

 

0,49846

 

0,49851

 

0,49856

 

0,49861

 

 

3,0

 

0,49865

 

0,49869

 

0,49874

 

0,49878

 

0,49882

 

0,49886

 

0,49889

 

0,49893

 

0,49896

 

0,49900

 

 

3,1

 

0,49903

 

0,49906

 

0,49910

 

0,49913

 

0,49916

 

0,49918

 

0,49921

 

0,49924

 

0,49926

 

0,49929

 

 

3,2

 

0,49931

 

0,49934

 

0,49936

 

0,49938

 

0,49940

 

0,49942

 

0,49944

 

0,49946

 

0,49948

 

0,49950

 

 

3,3

 

0,49952

 

0,49953

 

0,49955

 

0,49957

 

0,49958

 

0,49960

 

0,49961

 

0,49962

 

0,49964

 

0,49965

 

 

3,4

 

0,49966

 

0,49968

 

0,49969

 

0,49970

 

0,49971

 

0,49972

 

0,49973

 

0,49974

 

0,49975

 

0,49976

 

 

3,5

 

0,49977

 

0,49978

 

0,49978

 

0,49979

 

0,49980

 

0,49981

 

0,49981

 

0,49982

 

0,49983

 

0,49983

 

 

3,6

 

0,49984

 

0,49985

 

0,49985

 

0,49986

 

0,49986

 

0,49987

 

0,49987

 

0,49988

 

0,49988

 

0,49989

 

 

3,7

 

0,49989

 

0,49990

 

0,49990

 

0,49990

 

0,49991

 

0,49991

 

0,49992

 

0,49992

 

0,49992

 

0,49992

 

 

3,8

 

0,49993

 

0,49993

 

0,49993

 

0,49994

 

0,49994

 

0,49994

 

0,49994

 

0,49995

 

0,49995

 

0,49995

 

 

3,9

 

0,49995

 

0,49995

 

0,49996

 

0,49996

 

0,49996

 

0,49996

 

0,49996

 

0,49996

 

0,49997

 

0,49997

 

 

4,0

 

0,499968

 

 

4,5

 

0,49997

 

 

5,0

 

0,4999997

 

 

Приложение 3

Таблица значений функции Пуассона:


т

l

0,1

0,2

0,3

0,4

0,5

0,6

0,7

0,8

0.9

0

0,9048

 

0,8187

 

0,7408

 

0,6703

 

0,6065

 

0,5488

 

0,4966

 

0,4493

 

0,4066

 

1

 

0,0905

 

0,1638

 

0,2222

 

0,2681

 

0,3033

 

0,3293

 

0,3476

 

0,3596

 

0,3696

 

2

 

0,0045

 

0,0164

 

0,0333

 

0,0536

 

0,0758

 

0,0988

 

0,1217

 

0,1438

 

0,1647

 

3

 

0,0002

 

0,0011

 

0,0033

 

0,0072

 

0,0126

 

0,0198

 

0,0284

 

0,0383

 

0,0494

 

4

-

 

-

 

0,0002

 

0,0007

 

0,0016

 

0,0030

 

0,0050

 

0,0077

 

0,0111

 

5

-

 

-

 

-

 

0,0001

 

0,0002

 

0,0004

 

0,0007

 

0,0012

 

0,0020

 

6

-

-

-

-

-

-

0,0001

0,0002

0,0003

 

 

 

т

 

l

 

1,0

2,0

3,0

4,0

5,0

6,0

7,0

8,0

9,0

0

0,3679

 

0,1353

 

0,0498

 

0,0183

 

0,0067

 

0,0025

 

0,0009

 

0,0003

 

0,0001

 

1

 

0,3679

 

0,2707

 

0,1494

 

0,0733

 

0,0337

 

0,0149

 

0,0064

 

0,0027

 

0,0011

 

2

 

0,1839

 

0,2707

 

0,2240

 

0,1465

 

0,0842

 

0,0446

 

0,0223

 

0,0107

 

0,0055

 

3

 

0,0313

 

0,1804

 

0,2240

 

0,1954

 

0,1404

 

0,0892

 

0.0521

 

0,0286

 

0,0150

 

4

0,0153

 

0,0902

 

0,1680

 

0,1954

 

0,1755

 

0,1339

 

0,0912

 

0,0572

 

0,0337

 

5

0,0081

 

0,0361

 

0,1008

 

0,1563

 

0,1755

 

0,1606

 

0,1277

 

0,0916

 

0,0607

 

 

 

т

l

1,0

 

2,0

 

3,0

 

4,0

 

5,0

 

6,0

 

7,0

 

8,0

 

9,0

 

6

0,0005

 

0,0120

 

0,0504

 

0,1042

 

0,1462

 

0,1606

 

0,1490

 

0,1221

 

0,0911

 

7

 

0,0001

 

0,0034

 

0,0216

 

0,0595

 

0,1044

 

0,1377

 

0,1490

 

0,1396

 

0,1318

 

8

 

-

 

0,0009

 

0,0081

 

0,0298

 

0,0655

 

0,1033

 

0,1304

 

0,1396

 

0,1318

 

9

 

-

 

0,0002

 

0,0027

 

0,0132

 

0,0363

 

0,0688

 

0,1014

 

0,1241

 

0,0318

 

10

 

-

 

-

 

0,0008

 

0,0053

 

0,0181

 

0,0413

 

0,0710

 

0,0993

 

0,1180

 

11

 

-

 

-

 

0,0002

 

0,0019

 

0,0082

 

0,0225

 

0,0452

 

0,0722

 

0,0970

 

12

 

-

 

-

 

0,0001

 

0,0006

 

0,0034

 

0,0113

 

0,0264

 

0,0481

 

0,0728

 

13

 

-

 

-

 

-

 

0,0002

 

0,0013

 

0,0052

 

0,0142

 

0,0296

 

0,0504

 

14

 

-

 

-

 

-

 

0,0001

 

0,0005

 

0,0022

 

0,0071

 

0,0169

 

0,0324

 

15

 

-

 

-

 

-

 

-

 

0,0002

 

0,0009

 

0,0033

 

0,0090

 

0,0194

 

16

 

-

 

-

 

-

 

-

 

-

 

0,0003

 

0,0014

 

0,0045

 

0,0109

 

17

 

-

 

-

 

-

 

-

 

-

 

0,0001

 

0,0006

 

0,0021

 

0,0058

 

18

 

-

 

-

 

-

 

-

 

-

 

-

 

0,0002

 

0,0009

 

0,0029

 

19

 

-

 

-

 

-

 

-

 

-

 

-

 

0,0001

 

0,0004

 

0,0014

 

20

 

-

 

-

 

-

 

-

 

-

 

-

 


 

0,0002

 

0,0006

 

21

 

-

 

-

 

-

 

-

 

-

 

-

 

-

 

0,0001

 

0,0003

 

22

 

-

 

-

 

-

 

-

 

-

 

-

 

-

 

-

 

0,0001

 

 

 

Приложение 4

Критические точки распределения c2

Число степеней свободы k

 

Уровень значимости α

 

0,01

 

0,025

 

0,05

 

0,95

 

0,975

 

0,99

 

1

 

6,6

 

5,0

 

3,8

 

0,0039

 

0,00098

 

0,00016

 

2

 

9,2

 

7,4

 

6,0

 

0,103

 

0,051

 

0,020

 

3

 

11,3

 

9,4

 

7,8

 

0,352

 

0,216

 

0,115

 

4

 

13,3

 

11,1

 

9,5

 

0,711

 

0,484

 

0,297

 

5

 

15,1

 

12,8

 

11,1

 

1,15

 

0,831

 

0,554

 

6

 

16,8

 

14,4

 

12,6

 

1,64

 

1,24

 

0,872

 

7

 

18,5

 

16,0

 

14,1

 

2,17

 

1,69

 

1,24

 

8

 

20,1

 

17,5

 

15,5

 

2,73

 

2,18

 

1,65

 

9

 

21,7

 

19,0

 

16,9

 

3,33

 

2,70

 

2,09

 

10

 

23,2

 

20,5

 

18,3

 

3,94

 

3,25

 

2,56

 

11

 

24,7

 

21,9

 

19,7

 

4,57

 

3,82

 

3,05

 

12

 

26,2

 

23,3

 

21,0

 

5,23

 

4,40

 

3,57

 

13

 

27,7

 

24,7

 

22,4

 

5,89

 

5,01

 

4,11

 

14

 

29,1

 

26,1

 

23,7

 

6,57

 

5,63

 

4,66

 

15

 

30,6

 

27,5

 

25,0

 

7,26

 

6,26

 

5,23

 

16

 

32,0

 

28,8

 

26,3

 

7,96

 

6,91

 

5,81

 

17

 

33,4

 

30,2

 

27,6

 

8,67

 

7,56

 

6,41

 

18

 

34,8

 

31,5

 

28,9

 

9,39

 

8,23

 

7,01

 

19

 

36,2

 

32,9

 

30,1

 

10,1

 

8,91

 

7,63

 

20

 

37,6

 

34,2

 

31,4

 

10,9

 

9,59

 

8,26

 

21

 

38,9

 

35,5

 

32,7

 

11,6

 

10,3

 

8,90

 

22

 

40,3

 

36,8

 

33,9

 

12,3

 

11,0

 

9,54

 

23

 

41,6

 

38,1

 

35,2

 

13,1

 

11,7

 

10,2

 

24

 

43,0

 

39,4

 

36,4

 

13,8

 

12,4

 

10,9

 

25

 

44,3

 

40,6

 

37,7

 

14,6

 

13,1

 

11,5

 

26

 

45,6

 

41,9

 

38,9

 

15,4

 

13,8

 

12,2

 

27

 

47,0

 

43,2

 

40,1

 

16,2

 

14,6

 

12,9

 

28

 

48,3

 

44,5

 

41,3

 

16,9

 

15,3

 

13,6

 

29

 

49,6

 

45,7

 

42,6

 

17,7

 

16,0

 

14,3

 

30

 

50,9

 

47,0

 

43,8

 

18,5

 

16,8

 

15,0

 

Приложение 5

Критические точки распределения Стьюдента

Число степеней свободы k

Уровень значимости α (двусторонняя критическая область)

0,10

0,05

0,02

0,01

0,002

0,001

1

 

6,31

 

12,7

 

31,82

 

63,7

 

318,3

 

637,0

 

2

 

2,92

 

4,30

 

6,97

 

9,92

 

22,33

 

31,6

 

3

 

2,35

 

3,18

 

4,54

 

5,84

 

10,22

 

12,9

 

4

 

2,13

 

2,78

 

3,75

 

4,00

 

7,17

 

8,61

 

5

 

2,01

 

2,57

 

3,37

 

4,03

 

5,89

 

6,86

 

6

 

1,94

 

2,45

 

3,14

 

3,71

 

5,21

 

5,96

 

7

 

1,89

 

2,36

 

3,00

 

3,50

 

4,79

 

5,40

 

8

 

1,86

 

2,31

 

2,90

 

3,36

 

4,50

 

5,04

 

9

 

1,83

 

2,26

 

2,82

 

3,25

 

4,30

 

4,70

 

10

 

1,81

 

2,23

 

2,76

 

3,17

 

4,14

 

4,59

 

11

 

1,80

 

2,28

 

2,72

 

3,11

 

4,03

 

4,44

 

12

 

1,78

 

2,18

 

2,68

 

3,05

 

3,93

 

4,32

 

13

 

1,77

 

2,16

 

2,65

 

3,01

 

3,85

 

4,22

 

14

 

1,76

 

2,14

 

2,62

 

2,98

 

3,79

 

4,14

 

15

 

1,75

 

2,13

 

2,60

 

2,95

 

3,73

 

4,07

 

16

 

1,75

 

2,12

 

2,58

 

2,92

 

3,69

 

4,01

 

17

 

1,74

 

2,11

 

2,57

 

2,90

 

3,65

 

3,96

 

18

 

1,73

 

2,10

 

2,55

 

2,88

 

3,61

 

3,92

 

19

 

1,73

 

2,09

 

2,54

 

2,86

 

3,58

 

3,88

 

20

 

1,73

 

2,09

 

2,53

 

2,85

 

3,55

 

3,85

 

21

 

1,72

 

2,08

 

2,52

 

2,83

 

3,53

 

3,82

 

22

 

1,72

 

2,07

 

2,51

 

2,82

 

3,51

 

3,79

 

23

 

1,71

 

2,07

 

2,50

 

2,81

 

3,49

 

3,77

 

24

 

1,71

 

2,06

 

2,49

 

2,80

 

3,47

 

3,74

 

Число степеней свободы k

 

0,05

 

0,025

 

0,01

 

0,005

 

0,001

 

0,0005

 

Уровень значимости α (односторонняя критическая область)

 

 

Число степеней свободы k

 

Уровень значимости α (двусторонняя критическая область)

 

0,10

 

0,05

 

0,02

 

0,01

 

0,002

 

0,001

 

25

 

1,71

 

2,06

 

2,49

 

2,79

 

3,45

 

3,72

 

26

 

1,71

 

2,06

 

2,48

 

2,78

 

3,44

 

3,71

 

27

 

1,71

 

2,05

 

2,47

 

2,77

 

3,42

 

3,69

 

28

 

1,70

 

2,05

 

2,46

 

2,76

 

3,40

 

3,66

 

29

 

1,70

 

2,05

 

2,46

 

2,76

 

3,40

 

3,66

 

30

 

1,70

 

2,04

 

2,46

 

2,75

 

3,39

 

3,65

 

40

 

1,68

 

2,02

 

2,42

 

2,70

 

3,31

 

3,55

 

60

 

1,07

 

2,00

 

2,39

 

2,66

 

3,23

 

3,46

 

120

 

1,66

 

1,98

 

2,36

 

2,62

 

3,17

 

3,37

 

Число степеней свободы k

0,05

0,025

0,01

0,005

0,001

0,0005

Уровень значимости α (односторонняя критическая область)

 

Приложение 6

Критические точки распределения Фишера-Снедекора (К1 — число степеней свободы большей дисперсии, К2 — число степеней свободы меньшей дисперсии)

 

 

Уровень значимости a = 0,01

 

К1

K2

1

2

3

4

5

6

7

8

9

10

11

12

1

 

4052

 

4999

 

5403

 

5625

 

5764

 

5889

 

5928

 

5981

 

6022

 

6056

 

6082

 

6106

 

2

 

3

 

98,49

 

34,12

 

99,01

 

38,81

 

90,17

 

29,46

 

99,25

 

28,71

 

99,33

 

28,24

 

99,30

 

27,91

 

99,34

 

27,67

 

99,36

 

27,49

 

99,36

 

27,34

 

99,40

 

27,23

 

99,41

 

27,13

 

99,42

 

27,05

 

4

 

21,20

 

18,00

 

16,69

 

15,98

 

15,52

 

15,21

 

14,96

 

14,80

 

14,66

 

14,54

 

14,45

 

14,37

 

5

 

16,26

 

13,27

 

12,06

 

11,39

 

10,97

 

10,67

 

10,45

 

10,27

 

10,15

 

10,05

 

9,96

 

9,89

 

6

 

13,74

 

10,92

 

9,78

 

9,15

 

8,75

 

8,47

 

8,26

 

8,10

 

7,98

 

7,87

 

7,79

 

7,72

 

7

 

12,25

 

9,55

 

8,45

 

7,85

 

7,46

 

7,19

 

7,00

 

6,84

 

6,71

 

6,62

 

6,54

 

6,47

 

8

 

11,26

 

8,65

 

7,59

 

7,01

 

6,63

 

6,37

 

6,19

 

6,03

 

5,91

 

5,82

 

5,74

 

5,67

 

9

 

10,56

 

8,02

 

6,99

 

6,42

 

6,06

 

5,80

 

5,62

 

5,47

 

5,35

 

5,26

 

5,18

 

5,11

 

10

 

10,04

 

7,56

 

6,55

 

5,99

 

5,64

 

5,39

 

5,21

 

5,06

 

4,95

 

4,85

 

4,78

 

4.71

 

11

 

9,86

 

7,20

 

6,22

 

5,67

 

5,32

 

5,07

 

4,88

 

4,72

 

4,63

 

4,54

 

4,46

 

4,40

 

12

 

9,33

 

6,93

 

5,95

 

5,41

 

5,06

 

4,82

 

4,65

 

4,50

 

4,39

 

4,30

 

4,22

 

4,16

 

13

 

9,07

 

6,70

 

5,74

 

5,20

 

4,86

 

4,62

 

4,44

 

4,30

 

4,19

 

4,10

 

4,02

 

3,96

 

14

 

8,86

 

6,51

 

5,56

 

5,03

 

4,69

 

4,46

 

4,28

 

4,14

 

4,03

 

3,94

 

3,86

 

3,80

 

15

 

8,68

 

6,36

 

5,42

 

4,89

 

4,56

 

4,32

 

4,14

 

4,00

 

3,89

 

3,80

 

3,73

 

3,67

 

16

 

8,53

 

6,23

 

5,29

 

4,77

 

4,44

 

4,20

 

4,03

 

3,89

 

3,78

 

3,69

 

3,61

 

3,55

 

17

 

8,40

 

6,11

 

5,18

 

4,67

 

4,44

 

4,10

 

3,93

 

3,79

 

3,68

 

3,59

 

3,52

 

3,45

 

 

 

 

 

Уровень значимости a = 0,05

 

K1

 

K2

 

1

 

2

 

3

 

4

 

5

 

6

 

7

 

8

 

9

 

10

 

11

 

12

 

1

 

161

 

200

 

216

 

225

 

230

 

234

 

237

 

239

 

241

 

242

 

243

 

244

 

2

 

18,51

 

19,00

 

19,16

 

19,25

 

19,30

 

19,33

 

19,36

 

19,37

 

19,38

 

19,39

 

19,40

 

19,41

 

3

 

10,13

 

9,55

 

9,28

 

9,12

 

9,01

 

8,94

 

8,88

 

8,84

 

8,81

 

8,78

 

8,76

 

8,74

 

4

 

7,71

 

6,94

 

6,59

 

6,39

 

6,26

 

6,16

 

6,09

 

6,04

 

6,00

 

5,96

 

5,93

 

5,91

 

5

 

6,61

 

5,79

 

5,41

 

5,19

 

5,05

 

4,95

 

4,88

 

4,82

 

4,78

 

4,74

 

4,70

 

4,68

 

6

 

5,99

 

5,14

 

4,76

 

4,53

 

4,39

 

4,28

 

4,21

 

4,15

 

4,10

 

4,06

 

4,03

 

4,00

 

7

 

8

 

5,59

 

5,32

 

4,74

 

4,46

 

4,35

 

4,07

 

4,12

 

3,84

 

3,97

 

3,69

 

3,87

 

3,58

 

3,79

 

3,50

 

3,73

 

3,44

 

3,68

 

3,39

 

3,63

 

3,34

 

3,60

 

3,31

 

3,57

 

3,28

 

9

 

5,12

 

4,26

 

3,86

 

3,63

 

3,48

 

3,37

 

3,29

 

3,23

 

3,18

 

3,13

 

3,10

 

3,07

 

10

 

4,96

 

4,10

 

3,71

 

3,48

 

3,33

 

3,22

 

3,14

 

3,07

 

3,02

 

2,97

 

2,94

 

2,91

 

11

 

4,84

 

3,98

 

3,59

 

3,36

 

3,20

 

3,09

 

3,01

 

2,95

 

2,90

 

2,86

 

2,82

 

2,79

 

12

 

4,75

 

3,88

 

3,49

 

3,26

 

3,11

 

3,00

 

2,92

 

2,85

 

2,80

 

2,76

 

2,72

 

2,69

 

13

 

4,67

 

3,80

 

3,41

 

3,18

 

3,02

 

2,92

 

2,84

 

2,77

 

2,72

 

2,67

 

2,63

 

2,60

 

14

 

4,60

 

3,74

 

3,34

 

3,11

 

2,96

 

2,85

 

2,77

 

2,70

 

2,65

 

2,60

 

2,56

 

2,53

 

15

 

4,54

 

3,68

 

3,29

 

3,06

 

2,90

 

2,79

 

2,70

 

2,64

 

2,59

 

2,55

 

2,51

 

2,48

 

16

 

4,49

 

3,63

 

3,24

 

3,01

 

2,85

 

2,74

 

2,66

 

2,59

 

2,54

 

2,49

 

2,45

 

2,42

 

17

 

4,45

 

3,59

 

3,20

 

2,96

 

2,81

 

2,70

 

2,62

 

2,55

 

2,50

 

2,45

 

2,41

 

2,38

 

 

Содержание

ПРЕДИСЛОВИЕ................................................................................................................................................................................................... 3

1. ЭЛЕМЕНТЫ КОМБИНАТОРИКИ................................................................................................................................................................... 3

1.1. Размещения................................................................................................................................................................................................... 3

1.2. Понятие факториала.................................................................................................................................................................................... 4

1.3. Размещения с повторениями.................................................................................................................................................................... 4

1.4. Сочетания....................................................................................................................................................................................................... 4

1.5. Сочетания с повторениями........................................................................................................................................................................ 5

1.6. Перестановки................................................................................................................................................................................................ 6

1.7. Перестановки с повторениями................................................................................................................................................................. 6

Задачи к теме 1..................................................................................................................................................................................................... 6

2. ЭЛЕМЕНТЫ ТЕОРИИ ВЕРОЯТНОСТЕЙ....................................................................................................................................................... 8

2.1. Определение вероятности и свойства, вытекающие из ее определения, классификация событий, диаграммы Венна...... 8

2.2. Правила сложения и умножения вероятностей. Зависимые и независимые события............................................................. 12

Задачи к теме 2................................................................................................................................................................................................... 18

3. ФОРМУЛЫ ПОЛНОЙ ВЕРОЯТНОСТИ И БАЙЕСА................................................................................................................................. 20

Задачи к теме 3................................................................................................................................................................................................... 25

4. ДИСКРЕТНЫЕ СЛУЧАЙНЫЕ ВЕЛИЧИНЫ................................................................................................................................................ 28

4.1. Определение дискретной случайной величины................................................................................................................................. 28

4.2. Математические операции над случайными величинами.............................................................................................................. 30

4.3. Распределения Бернулли и Пуассона.................................................................................................................................................... 31

4.4. Гипергеометрическое распределение.................................................................................................................................................. 33

Задачи к теме 4................................................................................................................................................................................................... 44

5. НЕПРЕРЫВНЫЕ СЛУЧАЙНЫЕ ВЕЛИЧИНЫ............................................................................................................................................. 47

5.1. Функция распределения и плотность распределения непрерывной случайной величины..................................................... 47

5.2. Нормальное распределение.................................................................................................................................................................... 48

Задачи к теме 5................................................................................................................................................................................................... 63

6. ВАРИАЦИОННЫЕ РЯДЫ И ИХ ХАРАКТЕРИСТИКИ............................................................................................................................ 65

6.1. Понятие вариационного ряда. Виды вариационных рядов.............................................................................................................. 65

6.2. Числовые характеристики вариационного ряда................................................................................................................................. 68

Задачи к теме 6................................................................................................................................................................................................... 75

7. ВЫБОРОЧНЫЙ МЕТОД И СТАТИСТИЧЕСКОЕ ОЦЕНИВАНИЕ......................................................................................................... 79

7.1. Основные понятия и определения выборочного метода................................................................................................................. 79

7.2. Статистическое оценивание.................................................................................................................................................................... 80

7.3. Ошибки выборки........................................................................................................................................................................................ 81

7.4. Определение численности (объема) выборки.................................................................................................................................... 82

7.5. Интервальное оценивание....................................................................................................................................................................... 83

Задачи к теме 7................................................................................................................................................................................................... 93

8. ПРОВЕРКА СТАТИСТИЧЕСКИХ ГИПОТЕЗ.............................................................................................................................................. 95

Задачи к теме 8................................................................................................................................................................................................. 110

9. СТАТИСТИЧЕСКОЕ ИЗУЧЕНИЕ СВЯЗЕЙ МЕЖДУ ЯВЛЕНИЯМИ И ИХ ИСПОЛЬЗОВАНИЕ ДЛЯ УПРАВЛЕНИЯ СОЦИАЛЬНО-ЭКОНОМИЧЕСКИМИ ПРОЦЕССАМИ.................................................................................................................................... 113

9.1. Виды и формы связей, различаемые в статистике........................................................................................................................... 113

9.2. Оценка достоверности коэффициента корреляции......................................................................................................................... 117

9.3. Эмпирическое и теоретическое корреляционные отношения..................................................................................................... 118

9.4. Ранговая корреляция............................................................................................................................................................................... 120

9.5. Корреляция альтернативных признаков............................................................................................................................................. 121

9.6. Оценка уравнения парной регрессии................................................................................................................................................. 122

9.7. Парная линейная зависимость.............................................................................................................................................................. 123

9.8. Коэффициент эластичности.................................................................................................................................................................. 124

9.9. Пример расчета коэффициента уравнения регрессии................................................................................................................... 125

9.10. Стандартная ошибка оценки уравнения регрессии....................................................................................................................... 128

9.11. Измерение вариации по уравнению регрессии............................................................................................................................. 130

9.12. Доверительные интервалы для оценки неизвестного генерального значения `yген(m) и индивидуального значения `yi 132

9.13. Доверительные интервалы для оценки истинных значений неизвестного параметра уравнения регрессии  b1 и коэффициента регрессии ρ в генеральной совокупности........................................................................................................................... 135

Задачи к теме 9................................................................................................................................................................................................. 137

ЛИТЕРАТУРА...................................................................................................................................................................................................... 141

Приложение 1................................................................................................................................................................................................... 143

Приложение 2................................................................................................................................................................................................... 145

Приложение 3................................................................................................................................................................................................... 146

Приложение 4................................................................................................................................................................................................... 148

Приложение 5................................................................................................................................................................................................... 149

Приложение 6................................................................................................................................................................................................... 151

 

 

Учебное издание

Ниворожкина Людмила Ивановна,
Морозова Зоя Андреевна,
Герасимова Ирина Алексеевна,
Житников Игорь Васильевич

Основы статистики с элементами теории вероятностей для экономистов

Руководство для решения задач

Редактор Е. Г. Гежа
Корректоры Е. Г. Екатеринини, Г. А. Бибикова

Обложка художника С. А. Каштанова

Компьютерный набор и верстка А. Ю. Алейниковой

Лицензия ЛР № 065194 от 02.06.97 г.

Сдано в набор 10.03.99. Подписано в печать 05.04.99.

Формат 84X108 1/32. Бумага газетная. Печать офсетная.
 Гарнитура Школьная.
Усл. печ. л. 16,8. Уч.-изд. л. 13,5.

Тираж 10 000 экз. Заказ № 168

Издательство «ФЕНИКС» 344007, г. Ростов-на-Дону, пер. Соборный, 17.

Отпечатано с готовых диапозитивов в ЗАО «Книга» 344019, г. Ростов-на-Дону, ул. Советская, 57.