Теория вероятностей - примеры с решением заданий и выполнением задач
Теория вероятностей - это математическая наука, которая изучает закономерности случайных явлений. Случайные явления определяются как явления с неопределенным исходом, возникающие при многократном воспроизведении определенного набора условий.
На данной странице находится курс лекций по теории вероятности по всем темам предмета "Теория вероятностей".
Лекции по теории вероятностей содержат большое количество примеров решения задач и выполнения заданий.
Содержание:
Основные понятия о теории вероятностей
Теория вероятностей - это математическая наука, изучающая закономерности случайных явлений. Случайные явления определяются как явления с неопределенным исходом, возникающие при многократном воспроизведении (повторении) одного и того же опыта в одних и тех же условиях.
В природе и технике, экономике и спорте нет ни одного физического явления, не содержащего элементов случайности. Разработка и изучение методов теории вероятностей и вероятностных моделей позволяет понять различные свойства случайных явлений на абстрактном и обобщенном уровне, не прибегая к экспериментам.
Цель вероятностных методов - обойти чрезмерно сложное (и часто невозможное) изучение одного случая, исследовать закономерности массовых случайных явлений, предсказать их характеристики, повлиять на ход этих явлений, контролировать их, ограничить масштаб случайности.
Фундамент каждой науки - ее важные понятия, основа красивого здания, которое пригодится на всю жизнь.
Предмет теории вероятностей
Рассмотрим некоторый эксперимент, в результате которого может появиться или не появиться событие А. Примерами такого эксперимента могут быть:
- а) эксперимент - изготовление определенного изделия, событие А - стандартность этого изделия;
- б) эксперимент - подкидывание монеты, событие А - выпал герб;
- в) эксперимент - стрельба пятью выстрелами в мишень, событие А - выбито 30 очков;
- г) эксперимент - введение программы в компьютер, событие А - безошибочный ввод.
Общим для всех экспериментов является то, что каждый из них может реализовываться в определенных условиях сколько угодно раз. Такие эксперименты называют испытаниями.
События бывают достоверные, случайные и невозможные.
Достоверным называют такое событие, которое при рассмотренных условиях обязательно случится.
Невозможным называют такое событие, которое при рассмотренных условиях не может случится.
Случайным называют такое событие, которое при рассмотренных условиях может случится, а может и не случится.
например, если в урне есть только белые шары, то добывание белого шара из урны - достоверное событие, а добывание из этой урны шара другого цвета -невозможное событие.
Если бросить монету на плоскость, то появление герба будет случайным событием, потому что вместо герба может появиться надпись.
Случайные события обозначают большими буквами, например
Каждое случайное событие является следствием многих случайных или неизвестных нам причин, которые влияют на событие. Поэтому невозможно предсказать исход однофакторного испытания.
Но если рассматривать случайное событие много раз при одинаковых условиях, то можно выявить определенную закономерность его появления или не появления. Такую закономерность называют возможной закономерностью массовых случайных событий.
В теории вероятностей под массовыми однородными случайными событиями понимают такие события, которые осуществляются многократно при одинаковых условиях или много одинаковых событий.
Например, бросить одну монету 1000 раз или 1000 одинаковых монет бросить один раз в теории вероятностей считают одинаковыми событиями.
Предметом теории вероятностей является изучение вероятностных закономерностей массовых однородных случайных событий.
Основные понятия, методы, теоремы и формулы теории вероятностей эффективно применяются в науке, технике, экономике, в теориях надежности и массового обслуживания, в планировании и организации производства, в страховом и налоговом делах, в социологии и политологии, в демографии и охране здоровья.
Краткая история о теории вероятностей
Первые работы, в которых возникли основные понятия теории вероятностей, появились в
Следующий этап (конец - начало ) развития теории вероятностей связан с работами Б. Паскаля, П. Ферма, Х. Гюйгенса, К. Гаусса, Я. Бернулли, С. Пуассона, А. Муавра, П. Лапласа, Т. Байеса.
Я. Бернулли сделал первые теоретические обоснования накопленных ранее фактов.
В теорию вероятностей начали успешно использовать в стразовом деле, артиллерии, статистике.
Только в конце П.Л. Чебышев и его ученики А.А. Марков и А.М. Ляпунов превратили теорию вероятностей в математическую науку.
Дальнейшим развитием теории вероятностей и случайных процессов обязаны таким математикам, как С.Н. Бернштейн, А.М. Колмогоров, Б.В. Гниденко, А.В. Скороход, В.С. Королюк, Ю. Нейман, И.И. Гихман, И.М. Коваленко.
Алгебра случайных событий
сначала познакомимся с разновидностями случайных событий.
Определение 1. События называют несовместными, если появление одного из них исключает появление других событий в одном и том же испытании.
Пример №1
Среди однородных деталей есть стандартные и нестандартные. Наугад берут из ящика одну деталь.
События
А - взята стандартная деталь,
В - взята нестандартная деталь
несовместны потому, что взята только одна деталь, которая не может быть одновременно стандартной и нестандартной.
Определение 2. События называют совместными, если появление одного из них не исключает возможности появления других (не обязательно одновременно).
Пример №2
Два стрелка стреляют в мишень.
События
- первый стрелок попал в цель,
- второй стрелок попал в цель
будут совместными случайными событиями.
Определение 3. Случайные события образуют полную группу событий, сели вследствие испытания хотя бы одно из них появится обязательно.
Пример №3
Бросают шестигранный кубик. Обозначим события так
- выпала грань 1; - выпала грань 2; - выпала грань 3; - выпала грань 4; - выпала грань 5; - выпала грань 6.
События образуют полную группу.
В примере 2 события и не образуют полную группу. Но если обозначить событие, при котором никто из стрелков не попал в цель, тогда события и образуют полную группу.
Определение 4. События называют равновозможными, если нет причин утверждать, что любое из них вероятнее другого.
Пример №4
События - появление 1, 2, 3, 4, 5 или 6 очков при бросании шестигранного кубика - равновозможные, при условии, что центр его тяжести не смещенный.
Определение 5. Два несовместных события , которые образуют полную группу , называют противоположными.
Событие, противоположное событию А, обозначается
Пример №5
Если обозначить через А событие, при котором при стрельбе по мишени выбито 8 очков, то событие - при котором при стрельбе по мишени выбито любое другое число очков.
Теперь рассмотрим важное понятие пространства элементарных исходов.
Путь выполняется некоторый эксперимент, который имеет элементы случайности. Каждое испытание может иметь разные исходов.
Так, при бросании монеты могут быть два возможных исхода: герб или надпись
При бросании игрального кубика могут быть шесть возможных исходов.
В испытании "выстрел в мишень" можно рассматривать такие исходы, как попадание в цель, или количество выбитых очков, или координаты точки попадания.
Следовательно, что принимать за исход испытания, зависит от условия задачи.
Определение 6. Элементарными исходами называют такие события, которые невозможно разделить на более простые.
Множество всех возможных элементарных исходов называют пространством элементарных исходов.
Пространство элементарных исходов может содержать конечное, счетное, или несчетное множество элементов.
В роли элементарных исходов можно рассматривать точки -мерного пространства, отрезок некоторой линии, точки поверхности или объема трехмерного пространства, функцию одной или многих переменных.
В большинстве случаев, которые рассматриваются, допускают, что элементарные исходы равновозможные.
Пример №6
а) При двукратном бросании монеты пространство элементарных исходов содержит 4 точки
где означает появление герба, - появление надписи.
б) Пусть в мишень стреляют одиночными выстрелами до первого попадания. Возможные такие элементарные события:
{попадание при первом выстреле},
{попадание при втором выстреле},
{попадание при третьем выстреле}
и т.д.
В этом случае пространство элементарных исходов может иметь бесконечное количество точек, которые можно путем нумерации перечислить. Поэтому пространство элементарных исходов будет счетным.
в) При производстве кинескопов возникают неодинаковые условия технологического процесса, поэтому время работы кинескопа отличается от его номинального значения, то есть будет случайным событием.
Пространство элементарных исходов в этом случае будет бесконечным несчетным множеством, элементы которого невозможно пронумеровать.
Теперь ознакомимся с алгеброй случайных событий.
Пусть и - случайные события.
Объединением (суммой) случайных событий (или ) называют такое случайное событие, которое заключается в появлении событий.
А или В
или
А и В.
Если А и В - несовместимы, то означает появление события А или события В.
Рис. 1а и 1б. Событие В и противоположное ему
Рис. 1г. Заштрихованная площадь - произведение событий АВ.
Рис. 1д. Заштрихованная площадь - сумма событий
Рис. 1е. Заштрихованная площадь - разность событий
Аналогично определяют объединение (сумму) большего количества случайных событий.
Определение 7. Объединением (суммой) случайных событий называют такое случайное событие, которое заключается в появлении хотя бы одного из 'mnb[ событий.
Если события парно несовместимы, то их сумма заключается в том, что должно появиться событие или или Бесконечную сумму случайных событий обозначают
Пример №7
Стрелок совершает один выстрел в мишень, разделенную на три области. Обозначим
событие - попадание в первую область;
событие - попадание во вторую область;
событие - попадание в третью область;
событие - нет попадания в мишень;
событие - попадание в первую или вторую области;
событие = попадание хотя бы в одну область мишени.
Тогда получим
Отметим, что события и - несовместимые.
Определение 8. Разностью (или ) двух случайных событий называют все исходы, которые заключаются в том, что событие А не появляется.
Произведением (пересечением) (или) случайных событий А, В называют такое случайное событие, которое заключается в появлении событий А и В одновременно.
Если А и В - несовместимые, то произведение является множество, которое не содержит ни одного элемента. Такое множество называется пустым и обозначается
Таким образом, в случае несовместимости событий получим
Определение 9. Произведением (пересечением) конечного количества случайных событий называют такое случайное событие, которое заключается в появлении всех этих событий одновременно.
Событие означает, что рассматриваются все события одновременно.
Указанные соотношения между событиями являются обычными соотношениями между множествами, которые можно представить графически (см. рис.1).
Пример №8
Стрелок стреляет дважды в мишень. Описать пространство элементарных исходов. Записать, событие, которое заключается в том, что:
а) стрелок попал в мишень хотя бы один раз (событие С); б) стрелок попал ровно один раз (событие ); в) стрелок не попал в мишень (событие ).
Решение.
Обозначим
Событие - попадание с первого выстрела;
событие - попадание со второго выстрела.
Пространство элементарных исходов состоит из четырех событий
а) Если стрелок попал в мишень хотя бы один раз, то это означает, что он попал или с первого выстрела или со второго выстрела или с обоих
То есть,
б) Ровно одно попадание может быть только тогда, когда стрелок с первого выстрела попал, а со второго - нет, или с первого выстрела не попал, а со второго - попал.
Поэтому,
в) Если стрелок не попал в мишень, то это означает, что он не попал с обоих выстрелов,
То есть,
Определение и свойства вероятности и частоты
Для сравнения случайных событий по степени их возможности необходимо каждое событие связать с определенным числом, которое должно быть тем больше, чем более возможно событие. Такое число называют вероятностью события. Существует несколько определений вероятности. Ознакомимся с ними.
Определение 1. Вероятностью события является мера степени объективной возможности этого события.
Это определение вероятности определяет философскую суть вероятности, но не показывает закон нахождения вероятности любого события.
Определение 2 (классическое). Вероятность события А равна отношению числа элементарных исходов, которые способствуют появлению события А, к общему числу всех единственно возможных и равновозможных элементарных исходов.
Вероятность события обозначают По определению 2
где - число элементарных исходов, которые способствуют событию ,
- число всех единственно возможных и равновозможных исходов.
Пример №9
В урне 6 одинаковых по размеру шаров: 2 красных, 3 синих, 1 белый. Найти вероятность появления красного шара, если берут один шар из урны наугад.
Решение. Пусть событие - наугад взяты красный шар. Из урны можно взять любой шар из шести, поэтому всех возможных исходов 6 Появлению красного шара будут способствовать только два шара, поэтому По формуле (1) получим
Замечание 1. При решении многих задач нахождение чисел и имеет определенные трудности, предотвратить которые помогают принципы и формулы комбинаторики, с которыми ознакомимся ниже.
Замечание 2. Классическое определение вероятности имеет место только тогда, когда и конечные, все элементарные исходы равновозможные (именно это положение в большинстве азартных игр, которые осуществляются без мошенничества) .
Если множество элементарных исходов бесконечно или элементарные исходы не равновозможные, то формулой (1) пользоваться нельзя.
Если множество всех элементарных исходов бесконечно и, как следствие, занимает некоторую область а событию способствует только часть то вычисление вероятности события выполняют в соответствии с геометрическим определением вероятности.
Определение 3 (геометрическое). Вероятность случайного события А равна отношению меры к мере
Замечание 3. Если область - промежуток, поверхность или пространственное тело, - часть , тогда мерой и будет длина, площадь или объем соответствующей области. Если и промежутки времени, тогда их мерой будет время.
В общем случае меры области определяют аксиомами.
Пример №10
Два туристических парохода должны причалить к одному причалу. Время прибытия обоих пароходов равновозможное в течение суток.
Определить вероятность того, что одному из пароходов придется ждать освобождения причала, если время стоянки первого парохода равно одному часу, а второго - двум часам.
Решение. Пусть и - время прибытия пароходов.
Возможные значения и :
Благоприятные значения:
Построим эту область (см. рис. 2)
Отношение площади заштрихованной фигуры к площади квадрата, сторона которого равна 24, согласно формуле (2) равно искомой вероятности
Определение 4. Относительной частотой или частостью события А называют отношение числа испытаний, в которых событие А появилось, к числу фактически выполненных испытаний.
Относительную частоту события А обозначают или Следовательно,
где - количество испытаний, в которых появилось событие А,
- количество всех испытаний.
Пример №11
Отдел технического контроля среди 100 изделий выявил 8 нестандартных. Чему равна относительная частота появления нестандартных изделий?
Решение. Обозначим через такое событие, как появление нестандартного изделия. Тогда по определению частоты события А, получим
Замечание 4. Подчеркнем, что вероятность события А вычисляется до испытания, а частота вычисляется после испытания.
Частота имеет свойство стойкости: при большом количестве испытаний частота изменяется очень мало, колеблясь около некоторого постоянного числа - вероятности появления этого события, то есть
Определение 5. Статистическая вероятность - это относительная частота (частость) или число, близкое к ней.
Теперь рассмотрим основные свойства вероятности, используя формулу (1) классического определения вероятности события А.
- Если событие А достоверно, то его вероятность равна единице, то есть
- Если событие А невозможно, то его вероятность равна нулю, то есть
- Если событие А случайное, то его вероятность удовлетворяет соотношение
Действительно, при рассматриваемых условиях достоверное событие обязательно появится, как вследствие, все возможные элементарные исходы способствуют событию А, то есть и по формуле (1) получим
Если при условиях, которые рассматриваются, событие А невозможно, тогда среди всех возможных исходов нет тех, которые способствуют событию А, то есть и по формуле (1) получим
Если событие А случайное то среди всех возможных исходов существует исходов, которые способствуют событию А, Поэтому, согласно формуле (1) получим соотношение (3).
Замечание 5. Последнее свойство вероятности случайных событий используется для осуществления самоконтроля при решении многих задач теории вероятностей.
Основные понятия и принцип комбинаторики
Часто для нахождения чисел и которые входят в классическое определение вероятности события, необходимо знать количество разнообразных соединений, которые можно получить из элементарных исходов.
Классификация и свойства таких соединений, а также формулы для вычисления количества разных соединений разработаны математиками и содержатся в разделе "Комбинаторика" курса алгебры.
Ознакомимся с основными понятиями и формулами комбинаторики.
Определение 1. Разные группы, составленные из любых элементов, которые отличаются элементами или порядком этих элементов, называют соединениями или комбинациями этих элементов.
Пример №12
Из цифр можно составить много разных соединений по цифр. Некоторые из них будут отличаться количеством цифр, а некоторые будут отличаться только порядком цифр. Например,
Все возможные соединения целесообразно классифицировать. Соединения бывают трех видов:
- перестановка;
- размещение;
- сочетание.
Определение 2. Соединения из элементов, которые отличаются только порядком элементов, называют перестановкой этих элементов.
Количество перестановок из элементов обозначают и находят по формуле
Обозначение проговаривают " факториал".
По определению
Пример №13
Сколько пятизначных чисел можно записать, используя пять разных цифр (кроме нуля)?
Решение. Соединения, которые образуют из пяти разных цифр пятизначные числа, могут отличаться только порядком цифр, поэтому такие соединения будут перестановкой из 5 элементов. Согласно формуле (1) их количество будет
Определение 3. Размещением из элементов по называют такие комбинации, которые состоят из элементов, взятых из данных элементов и отличаются как порядком, так и элементами.
Количество размещений из элементов по обозначают и находят по формуле
Пример №14
Студенты второго курса согласно учебного плана изучают 10 дисциплин. На один день можно планировать занятия по 4 дисциплинам. Сколькими способами можно составить расписание занятий на один день?
Решение. Все возможные расписания занятий на один день - это соединения из 10 по 4, которые могут отличаться дисциплинами или их порядком, то есть эти соединения - размещение. Количество таких размещений согласно формуле (2) будет
Определение 4. Сочетанием из элементов по называют комбинации, которые состоят из элементов, взятых из данных элементов и отличаются хотя бы одним элементом.
Количество сочетаний из элементов по обозначают находят по формуле
Замечание 1. Перестановку можно рассматривать как частный случай размещения
Между количеством перестановок, размещений и сочетаний сцуществует простая связь
Часто целесообразно использовать такие свойства соединений:
Пример №15
В ящике 10 изделий, из которых 2 нестандартные. Наугад берут 6 изделий. Какая вероятность того, что все взятые изделия будут стандартными?
Решение. Обозначим событие - взято 6 стандартных изделий. Согласно условию задачи, нет значения, в каком порядке берт 6 изделий, то есть это будут сочетания.
Поэтому количество всех возможных элементарных исходов будет
Событию способствуют только соединения по 6 изделий из 8 стандартных в любом порядке то есть
Следовательно, согласно классическому определению вероятности события А, получим
Теперь ознакомимся с основными принципами комбинаторики.
Принцип суммы. Если множество содержит элементов, а множество содержит элементов и тогда множество содержит элементов.
Доказательство. Осуществляется простым подсчетом элементов множества
Сначала считаем все элементы множества А. Они получат номера от 1 до Среди них нет элементов множества потому что
Теперь будем считать элементы множества Они получат номера от поскольку множество В по условию имеет элементов.
Таким подсчетом все элементы множества будут вычерпаны. Они поучат номера от 1 до поэтому содержит элементов.
Замечание 2. Принцип суммы имеет место для суммы множеств, то есть для
Принцип произведения. Если множество содержит элементов, а множество содержит элементов, то множество всех возможных пар содержит элементов.
Доказательство. Множество С разобьем на подмножества
Поскольку состоит только из пар, которые содержат а множество состоит только их пар, которые содержат то
Аналогично получаем, что когда
Теперь докажем, что
Действительно, пусть любая пара. Она входит в согласно определению множества Она также входит и в множество так как Каждое подмножество множества содержит элементов, поэтому согласно определению принципа суммы, число элементов в их объединении равно
Пример №16
В корзине 4 яблока первого сорта и 5 яблок второго сорта. Наугад берут 2 яблока. Найти вероятность того, что будут взяты яблоки разных сортов.
Решение. Пусть событие А - наугад взятые 2 яблока разных сортов.
Всего яблок 9, из них сочетаний по 2 будет то есть количество всех возможных исходов
Событию А будут способствовать сочетания, созданные из пар, элементами которых будут яблоки разных сортов. Согласно принципу умножения, количество таких пар будет равно
Используя классическое определение вероятности, получим искомую вероятность события А
Основные теоремы теории вероятностей
Основными теоремами теории вероятностей являются две: теорема сложения вероятностей и теорема умножения вероятностей. Обе эти теоремы являются теоремами и могут быть доказаны только для событий, сводящихся к схеме случаев.
Сложение вероятностей несовместных событий
Теорема 1. Вероятность объединения двух случайных несовместных событий равна сумме их вероятностей
Доказательство. Пусть число всех возможных элементарных исходов появления событий А и В равно и - число исходов, которые способствуют событиям А и В соответственно. Тогда событиям будут способствовать исходов. Следовательно, по классическому определению вероятности, получим
то есть утверждение теоремы доказано.
Совсем аналогично можно доказать следующее утверждение.
Теорема 2. Если случайные события попарно несовместны, то вероятность появления хотя бы одного из этих событий равна сумме их вероятностей
Пример №17
Вероятность попадания стрелком в первую область мишени равна 0,45, во вторую область - 0,35, в третью - 0,15. Найти вероятность того, что с одного выстрела стрелок попадет в первую или вторую область мишени.
Решение. Обозначим событием - попадание в первую область мишени; событием - попадание во вторую область мишени.
С одного выстрела события и несовместны. Поэтому вероятность попадания в первую или вторую область мишени будет
Теорема 3. Сумма вероятностей полной группы случайных событий равна единице
Доказательство. Если случайные события образуют полную группу, то они попарно несовместны, а их объединение будет достоверным событием. По Теореме 2 получим
Вероятность достоверного события равна единице, поэтому
Левые части равенств (2) и (3) одинаковые, поэтому правые части будут равными, то есть имеет место равенство (1). Теорема доказана.
Следствие. Два противоположных события и образуют полную группу, поэтому имеет место равенство
из которого получаем формулу
нахождения вероятности противоположного события.
Пример №18
Вероятность получить сообщение от определенного лица в течение суток равна 0,25. Найти вероятность того, что сообщение в течение суток от этого лица не будет получено.
Решение. Обозначим событием А - сообщение от этого лица в течение суток поступит. По условию задачи имеет место соотношение Противоположное событие означает, что в течение суток от этого лица сообщение не поступит. По формуле (4) получим
В страховом деле необходимо высчитывать, например, такую задачу.
Пример №19
По статистическим показателям государства можно сделать вывод, что 68% мужчин, которые достигли 60-тилетия, достигают также и 70-тилетия. Какая вероятность того, что 60-тилетний мужчина не достигнет своего 70-тилетия?
Решение. Если событие А - 60-тилетний мужчина достигает своего 70-тилетия, то противоположное событие - 60-тилетний мужчина не достигает своего 70-тилетия. По условию задачи поэтому по формуле (4) получим
Следовательно, используя статистические данные государства, можно вычислить вероятность того, что 32% 60-тилетних мужчин умрет в течение 10 лет.
Зависимые и независимые события, условные вероятности
Определение 1. Случайные события А и В называют зависимыми, если вероятность появления одного из них зависит от появления или непоявления второго события.
Если вероятность появления одного события не зависит от появления или непоявления второго, то такие события называют независимыми.
Определение 2. Вероятность события В, вычисленная при условии появления События А, называют условной вероятностью события В и обозначают или
Пример №20
В урне 10 шаров: 3 белых и 7 черных. Наугад берут два шара. Пусть событие А - взят белый шар; событие В - взят черный шар.
Если шар, который взяли первым, возвращают в урну, то вероятность появления второго шара не зависит от того, какой взят первый шар.
Если первый шар не возвращается в урну, то вероятность второго события зависит от результата первого испытания.
Если первым взяли белый шар, то в урне осталось 2 белых шара и 7 черных, поэтому
Если первым взяли черный шар, то в урне осталось 3 белых шара и 6 черных шаров, поэтому
Следовательно, вероятность события В зависит от появления или непоявления события А.
Замечание. Если события А и В независимые, то условная вероятность равна безусловной вероятности, то есть
Умножение вероятностей
Теорема 4. Вероятность совместного появления двух случайных событий А и В равна произведению вероятностей одного из этих событий и условной вероятности второго события при условии, что первое событие появилось
Доказательство. Все элементарные исходы изобразим в виде точек (рис. 3).
Пусть появлению события А способствуют исходов, а появлению события В - исходов. Всех возможных исходов а событиям будут способствовать исходов.
Так как
то
что и требовалось доказать.
Соотношения (1) называют формулой умножения вероятностей зависимых случайных событий.
Следствие. В случае независимых случайных событий А и В формула (1) принимает вид
и называется формулой умножения вероятностей независимых случайных событий.
В случае конечного количества независимых случайных событий Формула (2) принимает вид
Пример №21
В некотором сообществе людей 70% курят, 40% болеют раком легких и 25% курят и имеют рак легких. Найти вероятность того, что наугад взятое человек из этого общества:
а) не курит, но имеет рак легких;
б) курит, но не имеет рак легких;
в) никогда не курит и не имеет рак легких;
г) или курит или имеет рак легких.
Решение. Обозначим события: А - человек курит; В - человек болеет раком легких. Тогда по условию задачи получим
Пример №22
Привести иллюстративную диаграмму свойства
Ответ. См. рис. 4.
Вероятность появления хотя бы одного случайного события
Пусть существует совместных случайных событий Обозначим А - событие, которое заключается в том, что появится хотя бы одно из этих событий. Тогда событие заключается в том, что события События и образуют полную группу событий, поэтому
Отсюда получим
По этой формуле необходимо вычислять вероятность появления хотя бы одного случайного события из совместных событий.
Пример №23
Вероятность попадания в мишень первого стрелка равна 0,7, второго стрелка - 0,8, а третьего стрелка - 0,9. Найти вероятность попадания в мишень хотя бы одного стрелка.
Решение. Обозначим события
- в мишень попал первый стрелок;
- в мишень попал второй стрелок;
- в мишень попал третий стрелок;
- в мишень попал хотя бы один стрелок.
По условию задачи события и независимые, поэтому события и также независимые.
Согласно формуле (1) и формуле умножения вероятностей независимых событий получим
Так как
то по формуле (2) получим
Теорема сложения вероятностей совместных событий
Теорема 5. Если случайные событие А и В совместные, то вероятность их объединения равна сумме их вероятностей без вероятности их совместного появления, то сеть
Доказательство. Согласно условию теоремы события А и В совместные, поэтому появится, если появится одно из трех несовместных событий или
Согласно теореме сложения вероятностей несовместных событий получим
Событие А появится, если появится одно из двух несовместных событий или
Согласно теореме сложения вероятностей несовместных событий
Аналогично получим
Подставим (3) и (4) в формулу (2), тогда получим равенство (1), которое требовалось доказать.
Замечание. Если события А и В независимые, то формула (1) принимает вид
Для зависимых случайных событий получим
Пример №24
В зависимости от наличия сырья предприятие может производить и отправлять заказчикам ежедневно количество определенной продукции от 1 до 100. Какая вероятность того, что полученное количество продукции можно распределить без остатка
а) трем заказчикам;
б) четырем заказчикам;
в) двенадцати заказчикам;
г) трем или четырем заказчикам?
Решение. Обозначим события
А - полученное количество изделий делится на 3 без остатка;
В - полученное количество изделий делится на 4 без остатка.
Используя классическое определение вероятности, находим
События А и В - совместные, поэтому по формуле (1) получим
Надежность системы
Определение 1. Надежностью системы называют вероятность ее безотказной работы в определенное время (гарантийный срок).
Системы состоят из элементов, соединенных последовательно
или параллельно
При вычислении надежности систем необходимо выразить надежность системы через надежность элементов и блоков.
Надежность элементов считается известной, так как она связана с технологией их производства.
Обозначим надежность того элемента, - вероятность выхода из строя за время того элемента, - надежность блока.
Рассмотрим блок, все элементы которого независимые и соединенные последовательно (см. рис. 5).
Такой блок будет работать безотказно только в то время, когда все элементы работают безотказно. Согласно теореме умножения вероятностей независимых событий вероятность безотказной работы такого блока будет
Теперь рассмотрим блок, элементы которого соединенные параллельно (см. рис. 6).
Такой блок будет работать безотказно, если хотя бы один элемент не выйдет из строя. Поэтому вероятность безотказной работы будет
Любую сложную систему можно рассматривать как последовательное или параллельное соединение блоков, надежность которых вычисляют по формулам (1) и (2).
Пример №25
Прибор собран из двух блоков, соединенных последовательно и независимо работающих. Вероятность отказа блоков равна 0,05 и 0,08. Найти вероятность отказа прибора.
Решение. Отказом прибора является событие противоположное его безотказной работе. Вероятности безотказной работы блоков составят
Вероятность безотказной работы прибора составит согласно формуле (1)
Поэтому вероятность отказа прибора составит
Формулы полной вероятности и Байеса
Теорема 6. Если случайное событие А может появится только совместно с одним из несовместных между собой событий которые образуют полную группу, тогда вероятность события А вычисляется по формуле
Доказательство. По условию теоремы появление события А означает появление одного из событий то есть
События несовместные, поэтому и события также несовместные. Согласно теореме сложения вероятностей несовместных событий получим
События А и - зависимые, поэтому для вычисления можно использовать теорему умножения вероятностей зависимых событий, то есть
Подставим (3) в формулу (2) и получим равенство (1), которое требовалось доказать.
Формулу (1) называют формулой полной вероятности.
Пример №26
В первом ящике 20 деталей, из которых 15 стандартных. Во втором ящике 0 деталей, из которых 9 стандартных. Из второго ящика берут наугад одну деталь и перекладывают ее в первый ящик. Найти вероятность того, что взятая после этого наугад деталь из первого ящика стандартная.
Решение. Обозначим такие события: А - из первого ящика взята стандартная деталь; - из второго ящика переложили в первый стандартную деталь; - из второго ящика переложили в первый нестандартную деталь.
Согласно условия задачи, из первого ящика модно взять деталь только после того, как произойдет событие или событие
События и несовместны, а событие А может появится только совместно с одним из них. Поэтому для нахождения вероятности события А можно использовать формулу полной вероятности (1), которая в данном случае примет вид
Найдем нужные вероятности
Подставим эти значения в формулу (4) и получим
Теперь познакомимся с формулами Байеса.
По условиям Теоремы 1 неизвестно, с каким событием из несовместных событий появится событие А. Поэтому каждое из событий можно считать гипотезой. Тогда - вероятность той гипотезы.
Если испытание проведено и в результате его событие А появилось, то условная вероятность может быть не равна
Сравнение вероятностей и позволяет переоценить вероятность гипотезы при условии, что событие А появилось.
Для получения условной вероятности используем теорему умножения вероятностей зависимых событий
Подставим в формулу (5) вместо ее значение из формулы полной вероятности. Получим
Формулы (6) называют формулами Байеса. Они позволяют переоценить вероятности гипотез. Это важно при контроле или ревизиях.
Пример №27
Детали, изготовленные цехом завода, попадают для проверки их стандартности к одному из двух контролеров. Вероятность того, что деталь попадет к первому контролеру равна 0,6, а ко второму - 0,4. Вероятность того, что пригодная деталь будет признана стандартной первым контролером равна 0,94, а вторым - 0,98.
Пригодная деталь при проверке признана стандартной. Найти вероятность того, что деталь проверял первый контролер.
Решение. Обозначим такие события: А - пригодная деталь признана стандартной; - деталь проверял первый контролер; - деталь проверял второй контролер. По условию примера
По формуле Байеса (6) при получим
Отметим, что до появления события А вероятность а после появления события А вероятность проверки детали первым контролером уменьшилась.
Пример №28
Вероятность уничтожения самолета с одного выстрела для первой пушки равна 0,2, а для второй пушки - 0,1. Каждая пушка делает по одному выстрелу, причем было одно попадание в самолет. Какая вероятность того, что попала первая пушка?
Решение. Обозначим такие события: А - уничтожение самолета с первого выстрела первой пушкой; В - уничтожение самолета с первого выстрела второй пушкой; С - одно попадание в самолет. Имеем четыре гипотезы
которые образуют полную группу событий. Вероятностями этих гипотез будут
Так как сумма
является достоверным событием, то
Условные вероятности события С будут
Теперь по формуле Байеса находим искомую вероятность
Последовательности испытаний
Схемой Бернулли или последовательностью независимых одинаковых испытаний, или биномиальной схемой испытаний называют последовательность n испытаний, удовлетворяющих условиям.
Схема и формула Бернулли
Во многих задачах теории вероятностей, статистике и повседневной практике необходимо исследовать последовательность (серию) испытаний. Например, испытание "брошено 1000 одинаковых монет" можно рассматривать как последовательность 1000 более простых испытаний - "брошена одна монета". При бросании 1000 монет вероятность появления герба или надписи на одной монете не зависит от того, что появится на других монетах. Поэтому можно говорить, что в этом случае испытание повторяется 1000 раз независимым образом.
Определение 1. Если все испытаний проводить в одинаковых условиях и вероятность появления события А во всех испытаниях одинаковая и не зависит от появления или непоявления А в других испытаниях, то такую последовательность независимых испытаний называют схемой Бернулли.
Пусть случайное событие А может появится в каждом испытании с вероятностью или не появится с вероятностью
Поставим задачу: найти вероятность того, что при испытаниях событие А появится раз и не появится раз. Искомую вероятность обозначим
Сначала рассмотрим появление события А три раза в четырех испытаниях. Возможны такие события
то есть их
Если событие А появилось 2 раза в 4 испытаниях, то возможны такие события
их
В общем случае, когда событие А появляется раз в испытаниях, таких сложных событий будет
Вычислим вероятность одного сложного события, например
Вероятность совместного появления независимых событий равна произведению вероятностей этих событий согласно теореме умножения вероятностей, то есть
Количество таких сложных событий и они несовместные. Поэтому, согласно теореме сложения вероятностей несовместных событий, получим
Формулу (1) называют формулой Бернулли .Она позволяет находить вероятность появления события А раз при испытаниях, которые образуют схему Бернулли.
Замечание 1. Вероятность появления события А в испытаниях схемы Бернулли менее раз находят по формуле
Вероятность появления события А не менее раз можно найти по формуле
или по формуле
Вероятность появления события А хотя бы один раз в испытаниях целесообразно находить по формуле
Замечание 2. Во многих случаях необходимо находить наиболее вероятное значение числа появления новых событий А. Это значение определяется соотношениями
Число должно быть целым. Если - целое число, тогда наибольшее значение вероятность имеет при двух числах
Замечание 3. Если вероятность появления события А в каждом испытании равна то количество испытаний, которые необходимо провести, чтобы с вероятностью можно было утверждать, что событие А появится хотя бы один раз, находят по формуле
Пример №29
Прибор собран из 10 блоков, надежность каждого из них 0,8. Блоки могут выходить из строя независимо друг от друга. Найти вероятность того, что
а) откажут два блока;
б) откажет хотя бы один блок;
в) откажут не менее двух блоков.
Решение. Обозначим событием А отказ блока. Тогда вероятность события А по условию примера будет
поэтому
Согласно условию задачи Используя формулу Бернулли и Замечание 1, получим
Пример №30
За один час автомат производит 20 деталей. За сколько часов вероятность производства хотя бы одной бракованной детали будет не менее 0,952, если вероятность брака любой детали равна 0,01?
Решение. Используя формулу (2), найдем сначала такое количество произведенных деталей, чтобы с вероятностью можно было утверждать о наличии хотя бы одной бракованной детали, если вероятность брака по условию
Следовательно, за время (часов) автомат с вероятность. 0,952 произведет хотя бы одну бракованную деталь.
Пример №31
При новом технологическом процессе 80% всей произведенной продукции имеет наивысшее качество. Найти наиболее вероятное число произведенных изделий наивысшего качества среди 250 произведенных изделий.
Решение. Обозначим искомое число
Согласно Замечанию 2
По условию примера поэтому
Но должно быть целым числом, поэтому
Предельные теоремы в схеме Бернулли
Нахождение вероятностей и по формуле Бернулли усложняется при достаточно больших значениях и при малых или В таких случаях часто можно использовать вместо формулы Бернулли приближенные асимптотические формулы.
Укажем без доказательства три предельных теоремы, которые содержат приближенные формулы для вероятностей
Теорема 1 (Теорема Пуассона). Если так , что
для любого постоянного
Следствие. Вероятность появления события А раз в испытаниях схемы Бернулли можно находить по приближенной формуле Пуассона
где
Формулу (1) целесообразно применять при больших и при малых
Пример №32
Учебник напечатан тиражом 100000 экземпляров. Вероятность неправильной брошюровки учебника равна 0,0001. Найти вероятность того, что тираж имеет 5 бракованных учебников.
Решение. Брошюровку каждого учебника можно рассматривать как испытание. Испытания независимые и имеют одинаковую вероятность неправильной брошюровки, поэтому задача укладывается в схему Бернулли. Согласно условию задачи
достаточно большое; малое;
Используя формулу Пуассона (1), получим
Для приведения еще двух предельных теорем необходимо сначала определить локальную и интегральную функции Лапласа и ознакомится с их основными свойствами.
Определение 1. Локальной функцией Лапласа называют функцию вида
Эта функция часто используется, поэтому ее значение для разных приведены в учебниках и пособиях по теории вероятностей. Она табулирована для положительных .
Основные свойства локальной функции Лапласа
- Функция Лапласа четная, то есть
- Функция определена для всех
- когда
График локальной функции Лапласа имеет вид, показанный на рис. 7.
Определение 2. Интегральной функцией Лапласа называют функцию
Легко увидеть, что между локальной функцией и интегральной функцией существует простоя связь
Основные свойства интегральной функции Лапласа
- Интегральная функция Лапласа является нечетной функцией
График интегральной функции Лапласа изображен на рис. 8.
Интегральная функция Лапласа табулирована для
Теорема 2 (Локальная теорема Муавра-Лапласа). Если в схеме Бернулли количество испытаний достаточно большое, а вероятность появления события А во всех испытаниях одинаковая, то вероятность появления события А раз может быть найдена по приближенной формуле
где
Замечание. Формулу (2) целесообразно использовать при и
Пример №33
Игральный кубик бросают 800 раз. Какая вероятность того, что количество очков, кратное трем, появится 267 раз.
Решение. В данном случае и достаточно большие. Поэтому для нахождения можно использовать формулу (2). Получим
Следовательно, по формуле (2) получим
Значение взято из таблицы. Так
Теорема 3 (Интегральная теорема Муавра-Лапласа). Если в схеме Бернулли в каждом из независимых испытаний событие А может появится с постоянной вероятностью тогда вероятность появления события А не меньше и не больше раз может быть найдена по формуле
где - интегральная функция Лапласа,
Пример №34
Игральный кубик бросают 800 раз. Какая вероятность того, что количество очков, кратное трем, появится не меньше 260 и не больше 274 раз?
Решение. Для нахождения вероятности
используем формулы (4) и (3). Получим
Значение интегральной функции Лапласа взято из таблицы и применяется свойство нечетности функции
Последовательность испытаний с разными вероятностями
В схеме Бернулли вероятность появления события А во всех испытаниях одинаковая. Но на практике иногда встречаются и такие случаи, когда в независимых испытаниях вероятности появления события А разные, например, они равны
Тогда вероятности непоявления события А также будут разными
В этом случае нельзя вычислять по формуле Бернулли вероятность появления события А раз в испытаниях, а необходимо использовать производную функцию
Правило. Искомая вероятность равна коэффициенту, который стоит при
Пример №35
Вероятности отказа каждого из 4 приборов в 4 независимых испытаниях разные и равны
Найти вероятность того, что вследствие испытаний
а) не откажет ни один прибор;
б) откажут один, два, три, четыре прибора;
в) откажет хотя бы один прибор;
г) откажут не менее двух приборов.
Решение. Вероятности отказа приборов в испытаниях разные, поэтому используем производную функцию (1), которая в данном случае имеет вид
Раскроем скобки и приведем подобные члены. Тогда получим
Согласно Правилу, отсюда получаем ответы на вопросы примера
Пример №36
Работник обслуживает три станка, которые работают независимо друг от друга. Вероятность того, что в течение часа первый станок не потребует внимания работника, равна 0,9, а для второго и третьего станков - 0,8 и 0,85 соответственно. Какой является вероятность того, что в течение часа
а) ни один станок не потребует внимания работника;
б) все три станка потребуют внимания работника;
в) хотя бы один станок потребует внимания работника?
Решение. Этот пример можно решить с использованием теорем умножения и сложения вероятностей (смотри упражнение 15 Раздела 2). Решим теперь этот пример с использованием производной функции, которая в данном случае принимает вид
Следовательно, коэффициент при равен вероятности того, что в течение час внимания работника не потребуют станков. Поэтому получим ответы на вопросы этого примера:
а) вероятность того, что все три станка не потребуют внимания работника равна коэффициенту при то есть
Теорема Бернулли
Теорема Бернулли устанавливает связь теории вероятностей с ее практическим использованием. Она была доказана Я. Бернулли в конце а опубликована в 1713 году.
Теорема 4 (Я. Бернулли). Если в независимых испытаниях вероятность появления события А одинакова и событие А появилась раз, то для любого положительного числа имеет место равенство
- то есть предел вероятности отклонения относительной частоты события А от его вероятности на величину, которая больше или равна равна нулю.
Согласно определению предела равенство (1) означает, что
- бесконечно малая величина.
Это означает, что событие
практически невозможно. Но тогда противоположное событие
практически достоверно для любого положительного числа
Следствие теоремы Бернулли
Равенство
может отличаться от практически достоверного события
на бесконечно малую величину.
Это значит, что то есть относительная частота (частость) события А отличается от вероятности события А на бесконечно малую величину, которую практически можно не учитывать.
Другую формулировку и доказательство теоремы Бернулли смотри в подразделе 4.4.3 Раздела 4.
Замечание. Формулу (1) можно записать, используя интегральную функцию Лапласа в виде
Отсюда получим важную формулу
которая позволяет решать много задач.
Пример №37
Вероятность появления события в каждом из 625 независимых испытаний равна 0,8. Найти вероятность того, что частота появления события отклоняется от вероятности по абсолютной величине не больше чем на 0,04.
Решение. По условию примера Нужно найти
По формуле (2) получим
Из таблицы значений функции Лапласа находим Следовательно,
Таким образом, искомая вероятность приближенно равна
Пример №38
Вероятность появления события в каждом из независимых испытаний равна 0,5. Найти число испытания при котором с вероятностью 0,7698 модно ожидать, что частота появления события отклоняется от его вероятности по абсолютной величине не больше чем на 0,02.
Решение. По условию задачи
Используем формулу (2). Тогда согласно условию получим
По таблице значений интегральной функции Лапласа найдем
Следовательно, искомая вероятность испытаний
Пример №39
Отдел технического контроля проверяет стандартность 900 изделий. Вероятность того, что изделие стандартное, равна 0,9. Найти с вероятностью 0,9544 границы интервала, который содержит число стандартных изделий среди проверенных.
Решение. По условию
По таблице значений интегральной функции Лапласа находим
Следовательно, с вероятностью 0,9544 отклонение частоты количества стандартных изделий от вероятности 0,9 удовлетворяет неравенство
Из последних соотношений следует, что искомое число стандартных изделий среди 900 проверенных с вероятностью 0,9544 принадлежит интервалу
Простой поток событий
Определение 1. Потоком событий называют последовательность таких событий, которые появляются в случайные моменты времени.
Например, заявление в диспетчерский пункт по вызову такси.
Определение 2. Поток событий называется пуассоновским, если он:
- Стационарный, то есть зависит от количества появлений событий и времени и не зависит от момента своего начала.
- Имеет свойство отсутствия последействия, то есть вероятность появления события не зависит от появления или не появления события раньше и влияет на ближайшее будущее.
- Ординарный, то есть вероятностью появления больше одного события за малый промежуток времени является величина бесконечно малая по сравнению с вероятностью появления события один раз в этот промежуток времени.
Определение 3. Среднее число появлений события А в единицу времени называют интенсивностью потока.
Теорема 5. Если поток событий пуассоновский, то вероятность появления события А раз за время можно найти по формуле
где - интенсивность потока.
Замечание 1. Формулу (1) иногда называют математической моделью простого потока событий.
Пример №40
Среднее количество заказов, которые поступают в комбинат бытового обслуживания каждый час, равно 3. Найти вероятность того, что за два часа поступят
а) 5 заказов;
б) меньше 5 заказов;
в) не меньше 5 заказов.
Решение. Имеем простой поток событий с интенсивностью По формуле (1) получим
Замечание 2. Примерами простого потока могут быть: появление вызовов на АТС, на пункты скорой медицинской помощи, прибытие самолетов в аэропорт или клиентов на предприятие бытового обслуживания, серия отказов элементов или блоков приборов и так далее.
Случайны величины
Случайные величины бывают:
- непрерывные – значения которых непрерывно заполняют какой-либо промежуток (например: давление крови человека, температура его тела или состав крови);
- дискретные – принимающие отдельные друг от друга значения (например: число звонков на станцию скорой помощи в течение часа или количество очков, выпадающих при бросании игрального кубика).
Виды случайных величин и способы их задания
При исследовании многих проблем возникают такие случайные события, исходом которых является появление некоторого числа, заранее неизвестного. Поэтому такие числовые значения - случайные.
Примером такого события является: количество очков, которое выпадает при бросании игрального кубика; количество студентов, которые придут на лекцию; количество сахарной свеклы, которое ожидают получить с одного гектара.
Случайной величиной называют такую величину, которая вследствие испытания может принять только одно числовое значение, заранее неизвестное и обусловленное случайными причинами.
Случайные величины целесообразно обозначать большими буквами а их возможные значения - соответствующими малыми буквами с индексами. Например,
Случайные величины бывают дискретными и непрерывными.
Определение 1. Дискретной случайной величиной (ДСВ) называют такую величину, которая может принимать отдельные изолированные друг от друга числовые значения (их можно пронумеровать) с соответствующими вероятностями.
Пример:
Количество попаданий в мишень при трех выстрелах будет Следовательно, может принимать четыре изолированных числовых значения с разными вероятностями. Поэтому - дискретная случайная величина.
Количество вызовов такси на диспетчерском пункте также будет дискретной случайной величиной, но при значения также увеличиваются, то есть их количество стремится к бесконечности
Определение 2. Непрерывной случайной величиной (НСВ) называют величину, которая может принимать любое числовое значение из некоторого конечного или бесконечного интервала Количество возможных значений такой величины является бесконечным.
Пример:
Величина погрешности, которая может быть при измерении расстояния; время безотказной работы прибора; рост человека; размеры детали, которую производит станок-автомат.
Пример:
Рассмотрим случайные величины: количество очков, и которые могут появится при бросании правильного игрального кубика и неправильного игрального кубика. Их возможные значения одинаковые.
Вероятность появления любого значения равна одинакова для всех возможных значений а вероятности появления возможных значений будут разными. Следовательно, случайные величины и не равны, поэтому при получим
Таким образом, для полной характеристики случайной величины необходимо указать не только все ее возможные значения, а и закон, по которому находят вероятности каждого значения
или
Определение 3. Законом распределения случайной величины называют такое соотношение, которое устанавливает связь между возможными значениями случайной величины и соответствующими им вероятностями.
В случае дискретной случайной величины функциональную зависимость можно задавать в виде таблицы, аналитически или графически.
В экономических дисциплинах все эти способы задания ДСВ имеют другие названия, поэтому ознакомимся с ними более детально в следующем разделе.
Определение 4. Интегральной функцией распределения (функцией распределения) называют вероятность того, что случайная величина примет значение меньше
Функцию распределения обозначают Таким образом,
Если НСВ может принимать любое значение из то
Формулу (1) часто называют основной формулой теории вероятностей.
Замечание. Непрерывная случайная величина которая принимает значение в промежутке имеет бесконечное количество возможных значений, поэтому приобретение определенных значений или будет практически невозможным событием. Это означает, что и будут бесконечно малыми величинами, которые в практических расчетах можно не учитывать. Поэтому имеют место равенства
Определение интегральной функции распределения и свойства вероятности позволяют получить такие свойства функции распределения:
- - возрастающая функция, то есть если
График функции распределения может иметь вид, изображенный, например, на рис. 9.
Определение 5. Дифференциальной функцией распределения или плотностью вероятностей непрерывной случайной величины называют производную первого порядка от ее интегральной функции распределения и обозначают
Название "плотность вероятностей" следует из равенства
Из формулы (2) следует, что функция распределения является первоначальной для дифференциальной функции распределения
Теорема 1. Вероятность того, что непрерывная случайная величина примет значение из интервала можно найти по формуле
Доказательство. Интегральная функция распределения - первоначальная для поэтому согласно формуле Ньютона-Лейбница получим
Правые части равенств (1) и (4) равные, поэтому и левые их части равные, то есть имеет место равенство (3), которое и требовалось доказать.
Следствие. Если дифференциальная функция распределения (плотность вероятности) известна, то интегральную функцию распределения можно найти по формуле
Дифференциальная функция распределения НСВ имеет следующие свойства:
- 1) потому что она является производной возрастающей функции
- 2) и потому что является производной при и
- 3) потому что событие - достоверное.
График плотности вероятности называют кривой распределения. Он может иметь вид, изображенный, например, на рис. 10.
Пример №41
Случайная величина имеет плотности вероятностей Определить параметр и функцию распределения.
Решение. Параметр находим, используя свойство 3 дифференциальной функции распределения
Следовательно, получим
Функцию распределения найдем по формуле (5)
Пример №42
Случайная величина задана функцией распределения
Определить область значений случайной величины и вероятность того, что
Решение. Согласно свойствам функции распределения получим
поэтому должны выполняться условия
Если область значений случайной величины и Подставим в (6) вместо и тогда получим
Но в промежутке поэтому Следовательно областью значений НСВ будет
Теперь найдем вероятность Событие будет противоположным, поэтому
Из равенства (6) получаем
Теперь по формуле (7) находим
Законы распределения и числовые характеристики дискретных случайных величин
Законом распределения дискретной случайной величины называют соответствие между полученными на опыте значениями этой величины и их вероятностями.
Способы задания и законы распределения
Пусть случайная дискретная величина принимает значения с соответствующими вероятностями
Задать закон распределения такой случайной величины - это задать равенство которое можно рассматривать как функцию.
Поэтому закон распределения можно задавать аналитически, в виде таблицы, графически. Функция распределения для дискретной случайной величины имеет вид
Чаще всего используют табличный способ задания ДСВ, который называют рядом распределения и изображают в виде
В первом ряду записаны все возможные значения а во втором ряду - соответственные вероятности, которые имеют свойство
Пример №43
Условиями лотереи предусмотрены: один выигрыш - 100 рублей, два - 50 рублей, восемь - 10 рублей, девятнадцать - 1 рубль. Найти закон распределения суммы выигрыша владельцем одного лотерейного билета, если продано 1000 билетов.
Решение. Будем искать закон распределения суммы выигрыша в виде ряда распределения. Тогда
где
Замечание 1. Если случайная дискретная величина может принимать бесконечное количество значений, то ее ряд распределения (таблица) будет иметь бесконечное количество элементов в каждом ряду, причем ряд должен сходится, а его сумма должна быть равна единице.
Графический способ. Возьмем прямоугольную систему координат. На оси абсцисс будем откладывать возможные значения ДСВ, а на оси ординат - соответствующие значения вероятности. Получим точки с координатами
Соединив эти точки прямыми, получим график (см. рис. 11) в виде многоугольника распределения случайной дискретной величины.
Значение ДСВ, вероятность которой самая большая, называют модой. На рисунке 11 мода -
Аналитический способ задания дискретной случайной величины основан на задании определенной функции, по которой можно найти вероятность соответствующего значения то есть
Укажем некоторые важнейшие законы распределения ДСВ и задачи, в которых они встречаются.
Биномиальный закон распределения
Этот закон имеет вид
и используется в схеме Бернулли, то есть в случае независимых повторяющихся испытаний, в каждом из которых некоторое событие появляется с вероятностью
Закон распределения Пуассона
ДСВ принимает счетное множество значений с вероятностями
Это распределение используют в задачах статистического контроля качества, в теории надежности, теории массового обслуживания, для вычисления: количества требований на выплату стразовых сумм за год, количества дефектов одинаковых изделий.
Если в схеме независимых повторяющихся событий достаточно большое, а или стремится к нулю, то биномиальное распределение аппроксимирует распределение Пуассона, параметр которого причем при или эта аппроксимация дает хорошие результаты независимо от величины
Замечание 2. Если в формулу Пуассона поставить где - интенсивность течения случайных событий в единицу времени, то формула примет вид
Геометрическое распределение
Это распределение имеет вид
где - вероятность появления события А в каждом испытании, - количество испытания до появления события А в серии независимых повторяющихся испытаний.
Ряд вероятностей этого распределения бесконечно убывающей геометрической прогрессией со знаменателем сумма которой равна единице.
Геометрическое распределение используют в разнообразных задачах статистического контроля качества приборов, в теории надежности и в страховых расчетах.
Гипергеометрическое распределение
Это распределение имеет вид
Оно показывает вероятность появления элементов с определенным свойством среди элементов, взятых из совокупности элементов, которая содержит элементов именно с таким свойством.
Это распределение используют во многих задачах статистического контроля качества.
Замечание 3. Если объем выборки маленький по сравнению с объемом совокупности, то есть то вероятности в гипергеометрическом распределении будут близки к соответствующим вероятностям биномиального распределения с
В статистике это означает, что расчеты вероятностей для бесповторной выборки будут мало отличаться от расчетов вероятностей для повторной выборки.
Полиномиальное распределение
Это распределение имеет вид
Оно применяется тогда, когда вследствие каждого из проведенных повторяющихся независимых испытаний может появится разных событий с вероятностью причем
Числовые характеристики
Законы распределения ДСВ полностью характеризуют случайные величины и позволяют решать все связанные с ними задачи.
Но в практической деятельности не всегда удается получить закон распределения, или закон слишком сложный для практических расчетов. Поэтому появилась необходимость характеризовать ДСВ с помощью числовых характеристик, которые достаточно характеризуют особенности случайных величин.
Чаще всего используют три числовых характеристики: математическое ожидание, дисперсию и среднеквадратическое отклонение от математического ожидания.
Ознакомимся с этими числовыми характеристиками и их свойствами.
Математическое ожидание и его основные свойства
Определение 1. Математическим ожиданием дискретной случайной величины наpsdf.n число, которое равно сумме произведений всех возможных значений на соответствующие им вероятности.
Математическое ожидание ДСВ обозначают или то есть
Если принимает бесконечное количество значений, то
Математическое ожидание ДСВ характеризует среднее значение случайной величины с учетом вероятностей его возможных значений. В практической деятельности под математическим ожиданием понимают центр распределения случайной величины.
Основные свойства математического ожидания
1. Математическое ожидание постоянной величины равно самой постоянной
2. Постоянный множитель можно выносить за знак математического ожидания
Свойства 1 и 2 следуют непосредственно из Определения 1.
3. Математическое ожидание произведения нескольких взаимно независимых дискретных случайных величин равно произведению их математических ожиданий, то сеть
Доказательство. Если две величины и распределены по законам
(для упрощения выкладок взято только по 2 возможных значения), тогда закон распределения произведения будет
По формуле (1) получим математическое ожидание
В случае трех случайных величин получим
Методом математической индукции теперь не сложно завершить доказательство.
Аналогично, но немного сложнее, можно доказать следующее свойство.
4. Математическое ожидание суммы случайных величин равно сумме их математических ожиданий, то есть
Пример №44
Независимые случайные величины и распределены так
Найти математическое ожидание случайной величины
Решение. Сначала найдем математические ожидания каждой их этих величин. По формуле (1) получим
Случайные величины и независимые, поэтому согласно свойства 3 математического ожидания получим
Пример №45
Найти математическое ожидание суммы числа очков, которые могут появиться при бросании двух игральных кубиков.
Решение. Обозначим количество очков, которые могут появиться на первом кубике а на втором - Возможные значения этих величин одинаковые, вероятность каждого из этих значений равна Поэтому
Согласно свойства 4 математического ожидания, получим
Следовательно, математическое ожидание суммы числа очков, которые могут появиться при бросании двух игральных кубиков равно 7.
Дисперсия и ее свойства
Математическое ожидание характеризует центр распределения дискретной случайной величины. Но этой характеристики недостаточно, так как возможно значительное отклонение возможных значений от центра распределения. Для характеристики рассеивания возможных значений относительно центра распределения введем новую числовую характеристику.
Определение 2. Дисперсией дискретной случайной величины называют число, которое равно математическому ожиданию квадрата отклонения ДСВ от ее математического ожидания.
Дисперсию величины обозначают или Это определение математически выглядит так
Основные свойства
1. Дисперсия любой ДСВ не отрицательная
Действительно не отрицательная, поэтому согласно определению математического ожидания и свойств вероятностей также не отрицательная.
2. Дисперсия постоянной величины равна нулю
Действительно, если поэтому
3. Постоянный множитель можно выносить за знак дисперсии, при этом постоянный множитель необходимо возвести в квадрат
Действительно,
поэтому
Постоянный множитель можно выносить за знак математического ожидания, поэтому из формулы (2) следует нужное равенство (3).
4. Дисперсия ДСВ равна разности между математическим ожиданием квадрата случайной величины и квадрата ее математического ожидания
Действительно,
Замечание 4. Формула (2) определяет дисперсию случайной величины а по формуле (4) ее целесообразно находить.
5 Дисперсия алгебраической суммы ДСВ и равна сумме их дисперсий
Доказательство. Сначала докажем это свойство для Согласно формуле (4) получим
Теперь рассмотрим дисперсию разности и
Замечание 5. Пятое свойство дисперсии имеет место для алгебраической суммы не только двух, а и конечного числа дискретных случайных величин.
Пример №46
Найти дисперсия случайной величины которая задана законом
Решение. Будем искать с использованием формулы (4). Математическим ожидание согласно формуле (1) будет
Чтобы найти математическое ожидание то есть запишем закон распределения в виде таблицы
Отметим, что все значения получены путем возведения в квадрат соответствующих значений Элементы второго ряда - вероятности этих значений - не изменяются.
По формуле (1) находим
Согласно формуле (4) теперь получаем
Среднеквадратическое отклонение дискретной случайной величины
В большинстве случаев случайная величина имеет размерность, например, метр, миллиметр, грамм, поэтому ее дисперсия будет измеряться в квадратных единицах этой размерности.
В практической деятельности целесообразно знать величину рассеивания случайной величины в размерности этой величины. Для этого используют среднеквадратическое отклонение, которое равно квадратом у корню из дисперсии и обозначается
Понятия моментов распределения
Определение 3. Начальным моментом -того порядка случайной величины называют математическое ожидание величины и обозначают
Центральным моментом -того порядка случайной величины называют математическое ожидание величины и обозначают
Отметим, что
поэтому
Начальные и центральные моменты порядка позволяют лучше учитывать влияние на математическое ожидание (центр распределения случайной величины ) тех возможных значений которые большие и имеют маленькую вероятность.
Пример №47
Дискретная случайная величина задана законом
Математическим ожиданием будет
Законом распределения будет
Поэтому
Следовательно, значительно больше а это означает, что роль значения выросла.
Замечание 6. Целесообразно знать числовые характеристики основных законов распределения дискретных случайных величин, которые можно представить в виде следующей таблицы.
Числовые характеристики законов распределения непрерывных случайных величин
Числовые характеристики непрерывных случайных величин:
В случае непрерывных случайных величин (НСВ) математическое ожидание, дисперсия и среднеквадратическое отклонение имеют такой же смысл и свойства, как и для дискретных случайных величин, но вычисляют их по другим формулам.
Пусть возможные значения непрерывной случайной величины заполняют отрезок Разделим на частей длиной
В каждой части возьмем точку
Тогда плотность вероятности в точке будет - вероятность того, что примет значения. Получим распределение НСВ вида
Сумма
характеризует математическое ожидание тем точнее, чем меньше будет Эта сумма будет равна математическому ожиданию непрерывной величины если перейти к пределу при Согласно определению определенного интеграла получим
Таким образом доказана
Теорема 2. Если непрерывная случайная величина принимает значение на отрезке и имеет плотность вероятности то ее математическое ожидание находится по формуле
Аналогично доказывается
Теорема 3. Если является плотностью вероятности непрерывная случайная величина является функцией случайной величины то есть тогда математическое ожидание находится по формуле
Замечание 1. Если возможные значения принадлежат отрезку то центр распределения величины находится на этом промежутке, потому что из неравенств
и условия нормирования следуют соотношения
Если плотность вероятности - четная функция, то есть то центр распределения совпадает с началом. Если график функции симметричный относительно прямой то
Как и в случае дискретных случайных величин, дисперсию непрерывных случайных величин определяют так
а вычисляют по формуле
Если возможные значения принадлежат только конечному промежутку то равенства (2) и (3) принимают вид
Среднеквадратическое отклонение непрерывной случайной величины определяют и вычисляют так
Пример №48
Найти числовые характеристики случайной величины которая задана функцией распределения
Решение. Сначала найдем дифференциальную функцию распределения, то есть плотность вероятности
Теперь по формуле (1) найдем математическое ожидание
Дисперсию найдем по формуле (4)
Среднеквадратическое отклонение получим по формуле (5)
Законы распределения НСВ и их числовые характеристики
Основные законы распределения непрерывных случайных величин разделяют по виду их дифференциальных функций распределения (плотности вероятностей)
Чаще всего используют следующие законы распределения
Равномерное распределение
Определение 1. Величина распределена равномерно в промежутке если все ее возможные значения принадлежат этому промежутку и плотность ее вероятностей на этом промежутке постоянная, то есть
Величина постоянной определяется условием нормирования
Если равномерно распределена в промежутке то вероятность принадлежности любому интервалу пропорциональна длине этого интервала
Другими словами, вероятность попадания в интервал равна отношению длины этого интервала к длине всего промежутка
Этому распределению отвечают, например, погрешности округления разнообразных расчетов.
График равномерного распределения НСВ изображен на рис. 12.
Числовыми характеристиками НСВ которая распределена по равномерному закону, будут
Показательное распределение
Определение 2. Случайную величину называют распределенной по показательному закону, если плотность ее вероятностей имеет вид
где - параметр.
Показательному распределению отвечают: время телефонного разговора, время ремонта техники, время безотказной работы компьютера.
Числовыми характеристиками показательного распределения будут
Следовательно, если НСВ распределена по показательному закону. то она имеет равные математическое ожидание и среднеквадратическое отклонение.
Пример №49
Найти числовые характеристики случайной величины, распределенной по закону
Решение. В данном случае случайная величина распределена по показательному закону с параметром Согласно формулам (6) получим
Замечание 2. Если случайная величина распределена по показательному закону, то ее функция распределения (интегральная функция распределения) имеет вид Поэтому основная формула теории вероятностей примет вид
Пример №50
Величина распределена по закону
Найти вероятность того, что попадет в интервал
Решение. Случайная величина распределена по показательному закону с параметром Используя формулу (7) получим
Соответствующее значение можно взять из таблицы значений этой функции.
Нормальное распределение
Определение 3. Случайную величину называют распределенной нормально, если плотность ее вероятностей имеет вид
где и - параметры распределения.
График этой функции называют нормальной кривой или кривой Гаусса.
Полное исследование этой функции методами дифференциального исчисления позволяет построить график нормальной кривой, который изображен на рис. 13.
При и нормальную кривую называют нормированной, ее уравнение будет
То сеть это табулированная функция Лапласа.
Замена переменной использование интеграла Пуассона
и формул (1), (2) и (5) позволяют получить числовые характеристики нормально распределенной НСВ в виде
Следовательно, математическое ожидание нормального распределения равно параметру этого распределения, а среднеквадратическое отклонение равно параметру
Замечание 3. Если случайная величина распределена по нормальному закону с параметрами и то случайная величина будет распределена по нормированному нормальному закону и
Интегральной функцией нормального закона распределения будет
а для нормированного нормального закона
Вероятность попадания в интервал нормально распределенной случайной величины находят по формуле
где функция Лапласа имеет вид (8).
Пример №51
Случайная величина распределена по нормальному закону, ее математическое ожидание равно 30, а среднеквадратическое отклонение - 10. Найти вероятность того, что будет иметь значения с интервала
Решение. Согласно условию поэтому по формуле (2) получим
Здесь использованы свойства нечетности интегральной функции Лапласа и значение из таблицы значений этой функции.
Пример №52
Рост студентов распределен по нормальному закону. Математическое ожидание роста студентов равно 175 см., а среднеквадратическое отклонение - 6 см. Найти вероятность того, что хотя бы один из пяти вызванных студентов будет иметь рост от 170 до 180 см.
Решение. Рост студента - случайная величина, которая по условию задачи распределена нормально с математическим ожиданием и среднеквадратическим отклонением -
Обозначим события: А- из 5 вызванных студентов рост хотя бы одного принадлежит промежутку ; - рост всех 5 вызванных студентов не принадлежит промежутку
Величина распределена нормально, поэтому по формуле (9) найдем вероятность того, что рост одного вызванного студента принадлежит промежутку
Используя табличное значение интегральной функции Лапласа, получим
Вероятность того, что рост одного из вызванных студентов не принадлежит промежутку будет
Применяя теорему умножения вероятностей независимых событий, найдем вероятность события
Следовательно, вероятность искомого события А будет
Правило трех сигм
Если случайная величина распределена нормально, то
то есть вероятность того, что абсолютная величина отклонения от ее математического ожидания больше стремится к 0, а это означает, что - практически достоверное событие.
На практике это правило используют так:
Если закон распределения случайной величины неизвестен, но тогда можно допустить, что распределена нормально.
Распределение (хи-квадрат)
Пусть - нормальные нормированные, независимые величины, то есть их математическое ожидание равно нулю, среднеквадратическое отклонение равно единице и каждая из них распределена по нормальному закону. Тогда сумма квадратов этих величин
распределена по закону с степенями свободы
Если величины связаны одним линейным соотношением, например, то число степеней свободы будет
Дифференциальная функция распределения имеет вид
где - гамма-функция,
Отметим, что распределение определяется параметром - числом степеней свободы Когда увеличивается, распределение стремится к нормальному распределению очень медленно.
Распределение Стьюдента
Пусть - нормальная нормированная случайная величина, а - независимая от величина, которая распределена по закону хи-квадрат с степенями свободы. Тогда величина
имеет распределение, которое называют -распределением или распределением Стьюдента (это псевдоним английского статиста Уильяма Госсета) с степенями свободы.
При увеличении распределение Стьюдента быстро приближается к нормальному распределению.
Закон больших чисел и центральная предельная теорема
Предельные теоремы теории вероятностей устанавливают соответствие между теоретическими и исследовательскими характеристиками случайных величин или случайных событий при большом количестве испытаний. Предельные теоремы описывают также предельные законы распределения. В подразделах 3.2 и 3.4 мы ознакомились с некоторыми предельными теоремами схемы Бернулли.
Предельные теоремы, которые устанавливают соответствие между теоретическими и исследовательскими характеристиками случайных событий, объединяют общим называнием - закон больших чисел.
Закон больших чисел играет важную роль в разных процессах, связанных с массовым производством.
Предельные теоремы, которые устанавливают предельные законы распределения случайных величин, объединяют общим называнием - центральная предельная теорема.
Необходимость предельных теорем обусловлена потребностью решения, например, таких задач:
- Когда сумма многих случайных величин мало отличается от постоянной величины, то сеть почти перестает быть случайной величиной и поэтому ее поведение может прогнозироваться со значительной вероятностью?
- При каких условиях можно со значительной вероятностью прогнозировать число появлений некоторого случайного события при большом количестве независимых испытаний?
- При каких ограничениях сумма многих случайных величин будет распределена по нормальному закону?
Неравенство Чебышева
При доказательстве разных предельных теорем, а также при решении разных задач важную роль играет неравенство Чебышева, которое имеет две формы.
Первая форма неравенства Чебышева
Для произвольной случайной величины которая принимает неотрицательные значения и имеет конечное математическое ожидание
Если - дискретная случайная величина, то
Если - непрерывная случайная величина, - плотность ее вероятностей, то
Следствие. Если принимает только неотрицательные значения,
Действительно,
Неравенство (1) иногда называют неравенством Маркова.
Вторая форма неравенства Чебышева
Если случайная величина имеет конечное математическое ожидание и дисперсию, то для произвольного имеет место неравенство
Доказательство. Сначала рассмотрим противоположное событие Легко увидеть, что это событие эквивалентно событию поэтому к нему можно применить первую форму неравенства Чебышева
Теперь вероятность противоположного события удовлетворяет неравенство (2), что и требовалось доказать.
Пример №53
Дисперсия случайной величины равна 0,001. Какая вероятность того, что случайная величина отличается от ее математического ожидания больше, чем на 0,1?
Решение. По неравенству Чебышева (3) получим
Неравенства Чебышева позволяют доказать предельную теорему Бернулли (см. подраздел 3.4) и другие важные предельные теоремы про устойчивость средних.
Важные предельные теоремы
Теорема Бернулли. Пусть вероятность появления события А в каждом из независимых повторяющихся испытаний равна - число появлений события А (частота события) в испытаниях. Тогда
Доказательство. Частость можно рассматривать как неотрицательную случайную величину Найдем ее математическое ожидание
Следовательно, необходимо оценить вероятность отклонения случайной величины от ее математического ожидания. Для этого найдем дисперсию этой случайной величины
По неравенству Чебышева (2) получим
Отсюда предельным переходом при получаем (4), что и требовалось доказать.
Теорема Чебышева. Пусть - последовательность попарно независимых случайных величин, которые удовлетворяют условиям
для всех
Тогда
Доказательство. Найдем математическое ожидание и дисперсию средней случайных величин, то есть
Применим для случайной величины неравенство Чебышева (2)
Предел этой вероятности при равен единице, то есть равенство (5) доказано.
Центральная предельная теорема. Пусть задана последовательность независимых одинаково распределенных случайных величин
Рассмотрим случайную величину Тогда
При функция распределения
то есть сумма будет распределена по нормальному закону с математическим ожиданием 0 и дисперсией
Для доказательства этой теорему нужно найти предел характеристической функции, построенной для нормированной случайной величины
Следствие. При распределение суммы одинаково распределенных случайных величин мало отличается от нормального распределения.
Теорема Ляпунова. Пусть задана последовательность независимых случайных величин таких, что
Построим сумму случайных величин Обозначим Если выполняется условие равномерной малости величин, которые образуют сумму
то сумма будет распределена нормально с математическим ожидание и дисперсией
Доказательство этой теоремы достаточно сложное, но отметим, что в случае, когда можно рассматривать случайные величины Величины будут удовлетворять условию теоремы Ляпунова.
Пример №54
Сколько приложений нужно взять в теореме Чебышева, чтобы с надежностью 96% и точностью до 0,01 выполнялось приближенное равенство
Решение. В этом примере Чтобы получить надежность 96% согласно формуле (6) достаточно подобрать такое которое удовлетворяет неравенство
Замечание 1. Пример 2 показывает, что даже в случае не очень больших точности и надежности, нужно брать значительное количество приложений (- достаточно большое число). Это означает, что оценки, полученные с использованием неравенства (6), - завышенные. Более точные оценки можно получить с помощью теоремы Ляпунова.
Закон распределения и числовые характеристики двумерных случайных величин
Выше рассмотрены случайные величины которые при каждом испытании определялись одним возможным числовым значением. Поэтому такую случайную величину называют одномерной.
Если возможные значения случайной величины определяются в каждом испытании числами, то такие величины называют соответственно, двух, трех, -мерными соответственно.
Двумерную случайную величину будем обозначать и при этом будут компонентами. Величины и которые рассматриваются одновременно, образуют систему двух случайных величин. Аналогично можно рассматривать систему случайных величин.
Определение 1. Совокупность одновременно рассматриваемых случайных величин называют системой случайных величин.
Систему случайных величин можно рассматривать как случайную точку в -мерном пространстве с координатами или как случайный вектор, направленный из начала систему координат в точку
При получим систему двух случайных величин которую можно изобразить как случайную точку на плоскости или как случайный вектор (см. рис. 14).
Многомерные случайные величины бывают дискретными и непрерывными (компоненты этих величин соответственно будут дискретными и непрерывными).
Закон распределения вероятностей дискретной двумерной случайной величины
Определение 2. Законом распределения дискретной двумерной случайной величины называют перечень возможных значений этой величины и их вероятностей
Чаще всего закон распределения двумерной дискретной случайной величины задают в виде таблицы с двумя входами.
В первом ряду таблицы записывают все возможные значения компоненты В первом столбце таблицы записывают все возможные значения компоненты На пересечении -того ряда и -того столбца записывают вероятность того, что двумерная случайная величина принимает значения
События образуют полную группу, поэтому сумма вероятностей таблицы равна единице, то есть
Закон распределения двумерной случайной величины позволяет получить законы распределения каждой компоненты.
Действительно, события несовместны, поэтому вероятность того, что примет значения по теореме сложения вероятностей будет
то есть равен сумме вероятностей, которые расположены в -том столбце таблицы распределения.
Аналогично, сложением вероятностей -того ряда таблицы, получим вероятность
Пример №55
Найти законы распределения компонент двумерной случайной величины, закон распределения которой задан таблицей
Решение. Законы распределения и будут иметь вид
Вероятности соответствующих значений и находим так
Определение 3. Интегральной функцией функцией распределения (функцией распределения) двумерной случайной величины называют функцию двух переменных которая определяет для каждой пары чисел вероятность выполнения неравенств то есть
Аналогично определяют функцию распределения системы случайных величин
Свойства вероятности и Определение 3 функции распределения позволяют доказать такие свойства функции распределения, которые в случае двумерной случайной величины выглядят
не убывающая функция по каждому аргументу, то есть
если
если
3) Имеют место предельные соотношения
4) Вероятность попадания случайной точки в прямоугольник
можно найти по формуле
Геометрический смысл функции распределения - это вероятность того, что случайная точка попадет в бесконечный прямоугольник с вершиной в точке и размещенный ниже и левее этой вершины (см. рис. 15).
Пример №56
Найти вероятность попадания случайной точки в прямоугольник, ограниченный линиями
если задана функция распределения вида
Решение. В заданном случае
Согласно формуле (1) получим
Непрерывная двумерная случайная величина
Двумерную случайную величину можно задавать функцией распределения или дифференциальной функцией распределения.
Определение 4. Дифференциальной функцией распределения (двумерной плотностью вероятностей) двумерной случайной величины называют смешанную частную производную второго порядка от интегральной функции распределения
Аналогично определяют плотность вероятностей -мерной случайной величины, то есть
Таким образом, если функция распределения двумерной случайной величины известна, то по формуле (2) можно найти дифференциальную функцию распределения этой случайной величины.
Если известна плотность вероятностей двумерной случайной величины, то ее функцию распределения находят по формуле
то сеть с использованием несобственного двукратного интеграла.
Вероятность попадания случайной точки в произвольную область находят по формуле
Дифференциальная функция распределения удовлетворяет свойствам:
то есть она не отрицательная;
Зависимые и независимые случайные величины
Две случайные величины независимы, если закон распределения одной из них не зависит от того, какие значения приняла другая величина.
Случайные величины зависимы, если закон распределения одной величины зависит от того, какие значения приняла другая величина.
В теории вероятностей доказано такое утверждение.
Теорема. Чтобы случайные величины и были независимыми, необходимо и достаточно, чтобы интегральная функция системы была равна произведению интегральных функций каждой из них
Следствие. Чтобы непрерывные случайные величины и были независимыми, необходимо и достаточно, чтобы дифференциальная функция системы была равна произведению дифференциальных функций составляющих
Числовые характеристики двумерной случайной величины
Математическое ожидание двумерной случайной величины характеризует координаты центра распределения случайной величины. Эти координаты в случае непрерывных величин находят по формулам
Дисперсии и характеризуют рассеивание случайной точки вдоль координатных осей и соответственно, их находят по формулам
Для описания двумерной случайной величины кроме математического ожидания, дисперсии и среднеквадратичных отклонений используют также другие характеристики, а именно корреляционный момент (или ковариация)
Для непрерывных величин и
Коэффициент корреляции
Коэффициент корреляции является количественной характеристикой зависимости случайных величин и и часто используется в статистике.
Если случайные величины и дискретные, то в формулах (3)-(6) знаки интервалов заменяют знаками суммы по всем возможным значениям случайных величин.
Определение 5. Случайные величины и называют некоррелированными, если их корреляционный момент или коэффициент корреляции равен нулю.
Свойства коэффициента корреляции
- 2) если и независимые, то
- 3) если между и есть линейная зависимость где и - постоянные, то
Замечание. Если момент корреляции или коэффициент корреляции не равен нулю, тогда случайные величины и - коррелированные. Две коррелированные величины обязательно зависимы. Но две зависимые случайные величины могут быть коррелированными или некоррелированными, то есть их коэффициент корреляции может быть равен нулю, а может быть и не равен нулю.
Из независимости двух величин следует их некоррелированность, но из некоррелированности еще не следует независимость этих величин. В случае нормального распределения величин из некоррелированности случайных величин следует их независимость.
Функции случайной величины и их характеристики
Понятие функции:
Во многих случаях нужно рассматривать две случайные величины и Так, например, при анализе деятельности предприятия нужно учитывать количество всех работников и количество всех произведенных изделий По разным причинам количество работников и произведенных изделий каждый день может быть разным, то есть и будут случайными величинами.
Определение 2. Если указан закон, по которому каждому возможному значению случайной величины отвечает определенное значение случайной величины то называют функцией и обозначают
Отметим, что иногда разным возможным значениям случайной величины отвечают одинаковые значения Например, если то значениям -3 и 3 случайной величины отвечает одно значение случайной величины
Одной из возможных задач теории вероятностей является определение законов распределения и числовых характеристик функций случайного аргумента, закон распределения которого известен. Укажем основные формулы для решения этой задачи.
Закон распределения и числовые характеристики функции дискретного случайного аргумента
Пусть - дискретная случайная величина с возможными значениями вероятности которых равны соответственно, то есть задана законом
В этом случае также дискретная случайная величина с возможными значениями
Из события "величина приняла значение " следует событие "величина приняла значение ", поэтому вероятности возможных значений также будут иметь вид
Математическое ожидание, дисперсию и среднеквадратическое отклонение функции вычисляют по формулам
Начальные и центральные моменты распределения находят по формулам
Пример №57
Дискретная случайная величина задана законом распределения
Найти математическое ожидание функции
Решение. Возможными значениями будут
По формуле (1) находим математическое ожидание
Закон распределения и числовые характеристики функции непрерывного случайного аргумента
Пусть - непрерывная случайная величина, закон распределения которой задан дифференциальной функцией распределения (плотность вероятностей) случайная величина
Если - дифференцированная функция, монотонная на всем промежутке возможных значений то плотность распределения функции определяют так
где - функция, обратная по отношению к функции
- производная первого порядка.
Если - не монотонная функция в области определения аргумента то обратная функция неоднозначна и плотность распределения определяется как сумма приложений, количество которых равно количеству значений обратной функции, то есть
где - обратные функции при заданном
Пример №58
Случайная величина распределена по нормальному закону с математическим ожиданием, равным нулю. Найти закон распределения функции
Решение. Согласно определению нормального распределения непрерывной случайной величины и условия примера дифференциальная функция распределения имеет вид
Функция - дифференцирована, поэтому она возрастает для всех Следовательно, можно применить формулу (2) для нахождения дифференциальной функции распределения случайной величины
В данном случае из равенства
то есть
Поэтому формула (2) принимает вид
Для нахождения математического ожидания от можно сначала найти - дифференциальную функцию распределения величины по формуле (2) или (3), а потом использовать формулу
Но более целесообразно находить математическое ожидание функции непрерывного случайного аргумента непосредственно по формуле
где - плотность вероятностей величины
Если величина может принимать значения только в промежутке то формула (4) упрощается
Пример №59
Непрерывная случайная величина задана дифференциальной функцией распределения
Найти математическое ожидание функции
Решение. В данном случае поэтому по формуле (5) получим
Интегрируя частями два раза, получим необходимое математическое ожидание
Следовательно, получили
Дисперсия функции непрерывного случайного аргумента определяют обычным образом а вычисляют по формуле
В случае, когда меняется только в промежутке дисперсию функции находят по формуле
В формулах (6) и (7) - это плотность вероятностей непрерывной случайной величины (дифференциальная функция распределения )
Основные понятия о статистическом распределение
Статистическим распределением выборки называется перечень вариант и соответствующих им частот или относительныхчастот. Статистическое распределение можно задать также в виде последовательности интервалов и соответствующих им частот (суммы частот, попавших в этот интервал значений).
Желание и внимательность всегда помогают начать изучение любой науки.
Предмет математической статистики и короткая историческая справка:
Цель каждого научного исследования - выявление закономерности явлений, которые наблюдают, и использование этих закономерностей в повседневной практической деятельности. Для установления этих закономерностей проводят специальные опыты и наблюдают единичные случаи. Далее делают обобщенный вывод в виде закона.
В тех случаях, когда явление находится под воздействием многих факторов и невозможно выявить влияние всех этик факторов, используют другой метод изучения - статистический, то есть систематизация и обработка статистических данных однородных опытов.
Обычно систематический метод изучения используют в экономике, социологии и политологии.
Пусть, например, темп роста промышленного производства за первый период времени равен 5%. Это означает, что в среднем для всей совокупности предприятий показатель 5% является статистической закономерностью роста промышленного производства. Этот средний показатель не исключает, а, наоборот, допускает, что на отдельных предприятиях темп прироста может быть больше или меньше 5%.
Предмет математической статистики заключается в разработке методов сбора и обработки статистических данных для получения научных и практичных выводов.
Укажем основные задачи, которые решает математическая статистика:
- указать способы сбора и группировки (если данных слишком много) статистических сведений;
- определим закон распределения случайной величины или системы случайных величин по симметрическим данным;
- определить неизвестные параметры распределения;
- проверить правдоподобность предположений про закон распределения случайной величины, про форму связи между случайными величинами или про определения параметра, который оценивают.
Можно сказать, что основная задача математической статистики - разработка методов анализа статистических данных в зависимости от цели исследования.
Методы математической статистики эффективно использовать для решения многих задач науки, организации технологического процесса, планирования, управления и ценообразования.
Математическая статистика возникла ( в.) и начала развиваться параллельно с теорией вероятностей. Дальнейшим развитием (конец - начало в.) математическая статистика обязана П.Л. Чебишову, А.А. Маркову, О.М. Ляпунову, а так же К. Гауссу, Ф. Гальтону, К. Пирсону и другим.
В в. наибольший вклад в математическую статистику внесли В.И. Романовский, Е.Е. Слуцкий, А.Н. Ляпунов, Стьюдент (псевдоним У. Госсета), Е. Пирсон, Ю. Нейман, А. Вальд, А.В. Скороход, В.С. Королюк и другие ученые.
Генеральная и выборочная совокупности
Пусть нужно изучить совокупность объектов относительно некоторого качественного или количественного значения, которые характеризуют эти объекты. Любой объект, который наблюдают, имеет несколько признаков. Рассматривая только один признак каждого объекта, мы допускаем, что другие признаки равноправные, или что множество объектов однородно.
Такие множества однородных объектов называют статистической совокупностью.
Например, если исследуют партию деталей, то качественным признаком может быть стандартность или нестандартность каждой детали, а количественным признаком - размер детали. Количественные признаки бывают прерывными и дискретными.
Проверку совокупности деталей можно совершить двумя способами:
- выполнить проверку (контроль) всех деталей;
- проверить только первую часть деталей.
Если деталей слишком много или проверка связана с разрушением детали (например, испытание детали на прочность), тогда первый способ проверки нецелесообразен. Если исследовать все детали невозможно,тогда выбирают из всей совокупности ограниченное количество деталей и проверяют только их.
Выборочной совокупностью (выборкой) называют совокупность случайно выбранных объектов.
Генеральной называют совокупность объектов, из которых сделана выборка.
Объемом совокупности ( выборки или генеральной) называют количество объектов этой совокупности.
Например, если из 5000 изделий для исследования взяты 50, тогда объем генеральной совокупности а объем выборки
Приведем примеры выборок.
Первичным результатом статистического наблюдения является перечень членов совокупности и соответственных им значений.
Пример №60
Наблюдают величину урожая пшеницы на 10 исследовательских участках. Результаты наблюдения представлены в таблице 1 (признак - номер участка, признак - урожай в центнерах в га)
Таблица 1.
Такие сведения называют рядом вариант или простым статистическим рядом.
Выборки бывают повторные или бесповторные. Повторной называют выборку, при которой выбранный объект возвращается к генеральной совокупности перед выбором другого объекта. Выборку называют бесповторной, если выбранный объект к генеральной совокупности не возвращаются. Чаще используют бесповторные выборки.
Альтернативой выборки является перепись. Переписью называют обследования, у которых цель исследования - изучение каждого элемента совокупности (генеральной совокупности).
Образцами переписи являются перепись населения в стране, отчет о всех производственных показателей всех предприятий в одной отрасли (например, шахт угольной промышленности).
Преимущества изучения выборки по сравнению с переписью: малые затраты, оборудования и времени.
Выборку можно эффективно использовать для изучения общего признака генеральной совокупности только тогда, когда данные выборки верно отображают этот признак. Вкратце это условие формируется таким образом - выборка должна быть репрезентативной, то есть представительской.
Согласно с законом больших чисел теории вероятностей можно утверждать, что выборка будет репрезентативной только тогда, когда ее осуществляют случайно.
В большинстве случаев для математической статистики наиболее подходящим способом использования случайного выбора является простой случайный.
Определение 1. Простым случайным является такой отбор из генеральной совокупности, при котором каждый объект, что выбирается, имеет одинаковую вероятность попасть в выборку.
Выборка, которая сделана с помощью простого случайного отбора, называется простой случайной. Способы выполнения простого случайного отбора рассмотрены в параграфе 5.5.
Важно отметить, что альтернативой для простой случайной выборки в статистике является расслоенная случайная выборка.
Способы выполнения рассмотрены в параграфе 5.4.
Источники данных в статистике
Исследователи и менеджеры получают данные, необходимые для принятия решения в основном из трех источников:
Выборочные обследования, специально поставленные эксперименты и действия, являющиеся результатом повседневной работы в бизнесе.
Рассмотрим примеры использования вышеупомянутых источников.
При случайном обследовании способа выбора данных выборка могут быть индивидуальные опросы (интервью), опросы по почте, телефонные интервью и так далее. Способы организации выборки описаны в параграфе 5.4. Приведем пример выборки.
Пример: Издательство газеты выбирает 1000 потенциальных избирателей для опроса с целью изучения рейтинга первого кандидата на выборах.
На специально спланированном эксперименте у исследователя есть возможность, в определенных рамках, управления процессом. Приведем пример планирования эксперимента и использования его как источника в статистике.
Пример: В одной из японских фирм разработали следующий бланк для оценки по бальной системе способностей руководителя (см. таблицу 2).
Собрав данные про каждом руководящем сотруднику в виде таблицы 2 согласно тестированию, руководитель фирмы может использовать эти данные для объективной оценки работы руководящего состава, для оценки влияния реформы системы управления внедряемое фирмой, на прибыль и так далее.
Часто источником являются данные, что собираются в повседневной, рутинной работы и бизнесе. Приведем примеры.
Пример: Руководитель магазина, анализируя данные уровня продажи "Вид товара - сезон года", можно более оптимально планировать свою работу для получения большей прибыли за счет увеличения объема продаж ходовых видов товаров, уменьшения расходов, которые тратятся на излишки запаса товаров на складе магазина и так далее.
Вторым примеров источников такого рода данных являются разнообразные официальные источники статистических данных.
Пример:
Книга: Народное государство Украины в 1994 году. Статистический ежегодник Украины: ответственный за выпуск В.В. Самченко - Изд.: Техника 1994, 494 ст.
Оценка способностей руководителя.
1. Потенциал (возможность совершенствовать способности и результаты работы) | Гибкость мышления, активность, наличие потенциала внутреннего роста. Постоянное стремление к совершенствованию, не останавливается при достигнутом, Желание принять на себя более высокую ответственность | 3-15 |
2. Лидерство, мотивация подчиненных | Хороший контакт с подчиненными | 5-25 |
3. Результативность работы, прогноз на следующий год | Отношение к планам на продажу, прибыли | 4-20 |
4. Умение вести переговоры и взаимодействовать с партнерами | Умение хорошо говорить и слушать. Стремление понять других. Спокойная манера речи, выдержка. Способность к взаимодействию с партнерами | 3-15 |
5. Креативность (способность к творчеству в будущем). | Постоянное стремление к решению сложных проблем. Творческий подход к решению проблем | 2-10 |
Знания и осведомленность | Обеспечение необходимой информацией. Умение работать по плану, вовремя реагируя на изменения. Умение оценивать и прогнозировать ситуацию | 3-15 |
Всего | 20 -100 |
Источники данных бывают первичными и вторичными.
Первичные данные собираются специально для статистического исследования. Для этих данных есть сведения про методы сборки, точность данных и так далее.
Вторичными данными являются данные, что используются в статистике, но изначально собирались для других целей.
Очевидно, что рутинные записи про деятельность фирм, официальные статистические отчеты являются вторичными данными.
Безусловно, более ценными данными в статистике являются первичные данные, но их не всегда возможно получить, потому часто используются вторичные данные.
Способы отбора
У практичной деятельности используют разнообразные способы отбора объектов из генеральной совокупности. Все способы отбора можно поделить на два вида:
1. Выбор, который не требует разделения генеральной совокупности на части. Для этого вида отбора относят:
- - простой случайный бесповторный отбор;
- - простой случайный повторный отбор.
2. Отбор, при котором генеральная совокупность разделяется на части ( расслоенный случайный отбор). Для этого вида отбора относят:
- - типовой отбор;
- - механический отбор;
- - серийный отбор.
Типовым называют отбор, при котором объекты выбирают не из всей генеральной совокупности, а только из ее типовых частей. Например, если изделия изготовлены на разных станках, то отбор проводят только из изделий каждого станка по-отдельности.
Типовой отбор целесообразно использовать тогда, когда одинаковые изделия изготавливают на станках, среди которых есть большие или меньшие изделия, или в случае изготовления одинаковых, сделанных разными предприятиями.
Механическим называют отбор, при котором генеральная совокупность механично разделяется на столько частей, сколько может быть объектов в выборке. В каждой части случайным образом выбирают один объект. Например, если нужно проверить 25% всех изготовленных станком - автоматом изделий, то выбирают каждое четвертое изделие. Чтобы механический отбор был репрезентативным, нужно учитывать специфику технологического процесса.
Серийным называют отбор, при котором объекты из генеральной совокупности отбирают не по одному, а сериями, которые и исследуются. Серийный отбор используют тогда, когда признак, который исследуют, мало изменяется в разных сериях.
В экономических исследованиях иногда используют комбинированный отбор. Например, сначала используют генеральную совокупность на серии с одинаковым объемом, случайным образом отбирают несколько серий и, в конце, из каждой серии случайным образом отбирают отдельные объекты.
Простая случайная выборка
В этом разделе детально рассматривается попытка построения простой случайной выборки с помощью таблицы случайных чисел. Решение этой задачи с помощью электронной таблицы Excel 97 рассмотрено в параграфе 8.2 раздела 8.
Условия осуществления простой случайной выборки
Для осуществления простой случайной выборки необходима наличие основы выборки, то есть такого представления генеральной совокупности, при котором ее элементы были хотя бы перечислены. Приведем примеры основ выборки.
Пример:
а) Генеральная совокупность - все покупатели магазина. Основой выборки могут быть рабочие списки покупателей, что вел магазин.
б) Генеральная совокупность - все жители города, которые имеют телефон. Основой выборки может быть справочная телефонная книга.
Как правило, данные для образования случайной выборки представляются в виде некоторой таблицы и потому основой выборки является нумерация элементов этой таблицы.
Основа выборки должна полностью отражать признаки генеральной совокупности, что изучается. Нарушение этого условия может сделать выборку не репрезентативной. Объясним это на примере.
Пример:
Нужно проверить все молодые семьи небольшого города на предмет наличия и количества детей дошкольного возраста.
С этой целью, специальный работник отдела. что занимается данным вопросом, случайным образом с помощью телефонного справочника обзванивает семьи с 18:00 до 21:00 каждый день.
Будет ли выборка данных, полученная таким образом, репрезентативной?
Основой выборки в этом случае является телефонный справочник. Простая случайная выборка, что сложенная из этой основы, не будет репрезентативной по целому ряду причин: не все семьи города, что исследуются, имеют телефон, некоторые семьи в этот период не будут находиться дома, или члены этих семей не смогут подойти к телефону, некоторые семьи пользуются телефонами, номера которых не записаны в телефонный справочник и так далее.
Приведем примеры, где может быть использована простая случайная выборка.
Пример:
а) Телефонная компания проверяет счета 10% всех международных телефонных переговоров с целью выявления средней их величины.
б) Аудиторская проверка накладных 20% фирм региона с целью контроля правильности уплаты налогов.
Случайные выборочные числа
Общеизвестно, что кратчайшим способом осуществления простой выборки является использование выборочных чисел.
Эти числа складываются из цифр от 0 до 9, генерируются случайным образом (как правило, с помощью компьютера) и записываются в специальной таблице.
Выражение "генерируется случайным образом" отбивает тот факт, что шанс появления любой цифры в любом месте таблицы не больше и не меньше шанса появления любой другой цифры из десяти названных цифр.
В приложении 4 приведена типовая таблица случайных чисел (таблица 8) что сгруппированы; для удобства при чтении, в блоке по пять цифр.
Использование таблиц случайных чисел гарантирует, что не будет сделана систематическая ошибка (то есть ошибка, что делает данные не репрезентативными).
В следующем подразделе подробно рассмотрена попытка использования таблицы случайных чисел для осуществления, простые случайные выборки.
Осуществление простой случайной выборки и использованием случайных чисел
Опишем процедуру получения простой случайной выборки на следующем примере.
Пример:
В таблице А приведен результат тестирования 180 специальных работников фирмы по первому методу с целью принятия решения про очередное повышение зарплаты. В ней перечислены 180 двузначных цифр - число баллов, что собрал каждый, кто исследовался. Необходимо выполнить простую случайную выборку по таблице А.
Построение простой случайной выборки выполняется в такой последовательности.
- Генеральная совокупность - данные таблицы А. Основы выборки - нумерация элементов таблицы. Объем генеральной совокупности
- Зададим числом элементов простой случайной выборки, например,
- Для обеспечения случайного выбора используем таблицей 8 приложения 4. Выберем в ней любой ряд или столбец, например, начнем с шестого ряда. Представим тут его часть
Числа баллов, набранных при тестировании 180 сотрудников фирмы мы будем выбирать из этого ряда числа, что образованы тремя цифрами, поскольку нумерация элементов таблицы А не превышает число 180.
Таблица А
По этому принципу удобнее в ряд (1) переписать по три цифры в группе
4. Выбираем из ряда (2) только те числа, что входят в основу выборки, то есть все числа больше 180 игнорируются. (В ряду (2) существует четыре таких числа - они подчеркнуты).
Отобрав таким способом 10 случайных чисел, мы составим простую случайную выборку, приведенную в таблице 3.
Простая случайная выборка объема что получена из таблицы А результатов тестирования
таблица 3
В этой таблице каждому случайному числу (первый столбец) ставиться в соответствие число баллов (третий столбец) соответственно таблицы А. Для удобства использования все элементы простой случайной выборки пронумерованы (второй столбец).
Организация данных: статистическое распределение выборки
Упорядочивание данных:
Данные в статистике, полученные с помощью специальных исследований или из обычных (рутинных) записей в бизнесе, приходят к исследователю или менеджеру в виде неорганизованной массы, независимо от того, являются ли они выборочными данными, или данными генеральной совокупности.
В математической статистике вместо слова "данные" вводится термин "варианты". Числовую характеристику вариантов при этом называют признаками.
Пусть из генеральной совокупности взята выборка объектов объема для вычисления признака То есть значения являются вариантами признака
Первым шагом обработки является упорядочение вариант. Рассмотрим этот процесс на примере.
Пример №61
В таблице В приведена выборка среднемесячной оплаты 100 сотрудников фирмы Нужно упорядочить выборку.
Таблица В.
В нашем примере признаков является число, что выражает среднемесячную зарплату сотрудников фирмы Следовательно, в таблице В приведено 100 значений вариант.
Разместим данные Таблицы Б в порядке возрастания (см. таблицу В.1).
Упорядоченная выборка среднемесячной оплаты 100 сотрудников фирмы ( в порядке возрастание)
Таблица В.1
Варианты, что записаны в таблице по возрастанию (убыванию), называют вариационным рядом. То есть, таблица В.1 с вариационным рядом, что насчитывает 100 вариант.
После упорядочения можно получить больше информации, например, что границы изменения среднемесячной оплаты.
Распределение частот
Пусть в нашей выборке из вариант признака принял значение раз, значение раз, значение раз.
Положительное число, что показывает, сколько раз та или иная варианта встречается в таблице данных, называется частотой.
Рядназывается рядом частот. Отметим, что сумма всех частот должно равняться объему выборки
Статистическое разделение выборки устанавливает связь между рядом вариант, что возрастает или убывает и соответственными частотами. Он может быть представлен таблицей
где - объем выборки,
Статистическое разделение выборки, заданный этой таблицей, также называют простым или не группированным статистическим распределением или распределением частоты варианты ( рядом распределения частоты варианты ).
Пример №62
Для изучения потребностей в определенных размерах обуви, проданного на протяжении дня:
Статистическое разделение этой выборки (разделение частоты размера обуви) будет иметь такой вид
Контроль:
Замечание. Свойство элементов ряда частот (смотреть формулу (1)) используют для контроля полученного статистического раздела выборки.
Приведем дальше доскональную выборку, что фигурирует в примере 1 (таблица В.1), преобразив ее в раздел частот среднемесячной оплаты сотрудников фирмы (таблица В.2)
Разделение частоты среднемесячной оплаты сотрудников фирмы
Всего: 100.
Таблица В.2
Следующий шаг в обработки данных, что приводит к существенному упрощению исследования, является их группировка.
Как видно в таблице В.2 максимальным и минимальным значениями варианты будут
Разницей этих чисел
называется размахом вариант. В нашем случае Введем для варианты интервалы изменения оплаты
Каждый интервал называется классом интервалов или классом. всего получим классов оплаты.
Используя данные таблицы В.2, просчитаем частоты для каждого класса интервалов (1), причем значение что находится на границе классов, заносим к тому классу, что является следующим к классу, где это число встречается впервые встречались впервые. Результат выпишем в виде таблицы В.3.
Сгруппированное разделение частоты среднемесячной оплаты сотрудников фирмы
Таблица вида В.3, которая устанавливает связь между сгруппированным рядом вариант, что возрастает или убывает, и суммами их частот по классам, называется сгруппированным разделом частоты варианты
Для каждого класса получаем верхнюю и нижнюю границы
шириной класса - число единиц измерения,то есть разница
Введены величины - размах вариант, - число классов, - ширина класса, из этого следует
Приведем другой пример сгруппированного разделения частоты выборки.
Использовали данные таблицы 1.
Сгруппированное распределение накопленной частоты
Часто, наряду с распределением частоты варианты необходимо иметь разделение накопленной (кумулятивной) частоты. Распределение накопленной частоты получают последовательным добавлением частот очередного интервала, начиная с первого и заканчивая последним (см. таблицу В.4).
Распределение накопленной частоты (обозначается F) позволяет ответить на вопрос: “сколько существует вариантов, которые меньше чем, например, 350?” Из таблицы В.4 находим: таких вариантов 87, что можно записать так:
Сгруппированное разделение накопленной частоты среднемесячной оплаты сотрудников фирмы
Таблица В.4
Распределение относительной частоты выборки
Нередко вместо значений частот используют относительные частоты. Пусть существует частот
Отношение частоты варианты к объему выборки
называется относительной частотой или частотностью, причем сумма всех относительных частот
Зависимость между упорядоченным рядом вариант и соответствующим им относительными частотами также называют статистическим распределением выборки, то есть получим табличное представление распределения.
где - объем выборки и
Пример №63
Задано разделение частоты выборки
Найти распределение частот.
Решение. Объем выборки Частотами будут
Поэтому распределение частот этой выборки будет
Замечание. Свойство элементов ряда частот (смотреть формулу (2)) используют для контроля полученного статистического распределения выборки.
Проведем дальше организацию выборки, что задана таблицей В.
Рассмотрим таблицу В.4. Если поделить частоты (второй столбик) и накопленной частоты (четвертый столбик) на объем выборки то получим соответственно распределение относительной частоты и накопительной относительной частотой выборки (смотреть таблицу В.5).
Сгруппированное разделение накопленной частоты среднемесячной оплаты сотрудников фирмы
Таблица В.5
Распределение накопленной относительной частоты получается последовательным складыванием относительных частот дежурного интервала, начиная с первого и заканчивая последним.
Распределение накопленной относительной частоты позволяет ответить на вопрос: "Какая пропорция вариант, что меньше чем, например, 350?".
Из таблицы В.5 находим: пропорция этих вариант будет 0,88 то есть это доля среднемесячной оплаты, что меньше 350.
Ряды распределения частоты с переменной шириной классов интервалов
Иногда невозможно, или неудобно выбирать ширину классов интервалов одинаковой. Неровная ширина классов желательна, например, если значения частоты одного или нескольких классов намного больше (меньше) значений частоты других интервалов. Как правило, ширина интервалов возрастает (или убывает) и может содержать интервалы открытого типа "более чем...", "менее чем...".
Например распределение частоты из возрастающей шириной интервалов приведенный в таблице 4.
распределение частоты возраста 30 сотрудников фирмы
Таблица 4.
Сгруппированное разделение плотности частоты и плотности относительной частоты
Если поделить все частоты (второй столбик) таблицы В.3 на ширину интервала то получим распределение плотности частоты выборки
Если поделить все относительные частоты (второй столбик) таблицы В.5 на ширину интервала то получим распределение относительной плотности частоты выборки
Чтобы вычислить результаты, которые получены в примере 1, приведем сразу в одной таблице В.6 рассмотренные выше таблицы В.4 и В.5 и основу введенного распределения.
Сгруппированное распределение частоты относительной частоты плотности частоты плотности относительной частоты накопительной частоты и накопительной относительной частоты выборки среднемесячной оплаты 100 сотрудников фирмы
Таблица В.6
Эта таблица знакомит со всеми важными статистическими распределениями выборки.
Распределение частоты и относительной частоты будут использовать в построении полигонов частот и гистограмм (смотреть параграф 5.8).
Распределение накопительной частоты и накопительной относительной частоты будут использованы в построении полигонов накопительных частот и эмпиричной функции распределения (смотреть параграф 5.8).
Приведенные понятия распределения плотности частоты и распределения плоскости относительной частоты выборки имеют глубокое вероятное содержание и будут также использованы в графическом представлении распределений (смотреть пункт 5.8.3 параграфа 5.8).
Общая схема построения сгруппированного распределения частоты
Изложенный алгоритм группировки данных выборки можно предоставить в виде следующей общей схемы последовательности действий:
- Обозначить наибольшее и наименьшее значения варианты и обозначить размах вариант
- Зададим первым числом классов Число классов следует принимать непарным, и при общем числе замеров целесообразно брать а при можно брать
- Обозначить ширина класса Для упрощения расчетов, полученное значение округлили в любую сторону.
- Вставить границы классов и рассчитать количество вариант каждого класса. При расчете числа вариант значения что находится на границе классов, следует относить к одному и тому же классу, например, к тому классу, что является к следующему классу, где это число встречалось ранее. Оно, таким образом, станет нижней границей класса.
- Обозначить частоту для каждого класса и записать ряд распределения.
Эмпирическая функция распределения и ее свойств
Пусть есть статистическое распределение частоты некоторого признака Обозначим через общее количество наблюдений, при которых объем выборки; - количество наблюдений; при которых наблюдались признаки меньше
Тогда относительная частота (или частность) события равна
Если изменяется, то может изменятся относительная частота, то есть является функция от Эта функция находиться эмпирическим путем, потому ее называют эмпиричной.
Определение 1. Эмпиричной функцией распределения (или функцией распределения выборки) называют функцию которая обозначает для каждого значения частотность действия
Математически это определение имеет вид
где - количество вариант, которые меньше от - объем выборки.
Таким образом, чтобы найти, например, нужно количество вариант, что меньше поделить на объем выборки, то есть
Замечание. Интегральную функцию распределения генеральной совокупности в математической статистике называют теоретической функцией распределения. Она отличается от эмпиричной функции распределения тем, что означает вероятность события а не частность этого события.
Из теоремы Бернулли выходит, что частность
события
направляется к вероятности этого события. Потому и мало отличаются одна от другой.
Целесообразно использовать для ближайшего представления функции распределения генеральной совокупности.
Эмпирическая функция распределения имеет такие свойства:
- возрастающая функция.
- где - наименьшая варианта, - наименьшая варианта.
Пример №64
Найти эмпиричную функцию распределения с статистическом распределением выборки
Таблица 5
и построить ее график.
Решение. Объем этой выборки будет Наименьшая варианта равна 2, потому для Наибольшая варианта равна 10, потому для Значение то есть наблюдались 12 разов, потому при
Значение то есть и наблюдались раз, потому при
То есть, простой статистическое распределение частоты, что заданны таблицей 5, заменяется сгруппированным распределением частоты (смотреть таблицу 6).
Таблица 6
Тут же построить распределение накопительной частоты. Таким образом, получим эмпиричную функцию распределения вида
График этой функции изображено на рис. 18.
Рисунок 18.
Этот график можно рассмотреть как и приближенный график теоретической функции распределения
Установим связь между эмпиричной функцией распределения и функцией накопительных частот как следует из определения 1, примера 1 и таблицы 6 эмпиричная функция распределения обозначается как кусочно - заданная функция, равна значению накопительной относительной частоты
на каждом классе интервалов
Графическое изображение статистических распределений
Все статистические распределения, что изучались в параграфе 5.6, могут быть представлены графически. Благодаря этому мы можем посмотреть характерные переменные ряда распределения, не пользуясь анализом цифровых данных.
Графическое изображение статистических распределений нужно рассмотреть отдельно для не сгруппированных и сгруппированных данных.
Не сгруппированные данные: полигоны частот и частностей, гистограмма
Если в результате выборки мы получили статистическое распределение признака которые нужно исследовать, то будем иметь перечень вариант признака и соответственных им частот или частностей
Значение вариант и частот или частностей можно рассмотреть как координаты точек или
Определение 1. Полигоном частот называют ломанную, отрезки которой объединяют точки
Полигоном относительной частоты (частностей) называют ломанную, отрезки которой проходят через точки
Полигоны частот и частностей являются аналогами плотности вероятностей.
Для построения полигона частот на оси абсцисс ставят варианты признака а на оси ординат - соответственные им частоты. Точки объединяют отрезками прямых и получают полигон частот.
Для построения полигона относительных частот (частностей) на оси ординат ставят частоты а потом точки объединяют отрезками прямых.
Пример №65
В результате выборки получили такие значения признака
Построить полигон частот этой выборки.
Решение. В этом случае вариантами будут
Соответственные им частоты
Поставив в системе координат точки
и соединяем их отрезками прямых, получим полигон частот этой выборки (смотреть рис. 19).
рисунок 19
Определение 2. Гистограммой частот называют ступенчатую фигуру, которая складывается из прямоугольников, основами которых является долевые интервалы вариант длиной а высоты равняются (плотность частоты).
Гистограммой относительных частот (частностей) называют ступенчатую фигуру, которая складывается из прямоугольников, основами которых является долевые интервалы вариант, а высоты равны отношению (плотности частности).
Плоскость гистограмм частот равны объему выборки, а плоскость гистограммами частностей - единицы.
Для построения гистограмм частот (частностей) промежуток вариант то есть от наименьшего значения что наблюдается, до наибольшего значения разбивают на несколько отрезков равной длины Потом рассчитывают сумму частот (частностей) этих значений вариант признака которые принадлежат каждому из полученных отрезков. Если на -ом отрезке количества вариант, что рассматривали, с учетом их частот, равны то строят прямоугольник основой которого будет - тый отрезок длиной а высотой будет ( для частностей высота - ).
Плоскость такого прямоугольника равна (в случае частностей ). Потому плоскость всех прямоугольников будет равна сумме то есть - объем выборки.
В случае гистограмм частностей плоскость прямоугольников будет равны сумме всех частностей
Пример №66
В результате наблюдения получили распределение признака выборки в виде таблицы
Построить гистограмму частот этого распределения.
Решение. В данном случае наименьшее значение варианты а наибольшее значение потому длина промежутка равно 9. Разобьем этот отрезок на 4 равные части длиной
Для построении гистограмм целесообразно сложить таблицу 7: в первой ряд таблицы записывают полученные отрезки, во второй ряд таблицы записывают сумму частот вариант, что принадлежат соответственному отрезку, в третий ряд записывают высоты соответственных прямоугольников. В этом случае эта таблица будет выглядеть так:
таблица 7.
Отсюда видим, что
- отрезку принадлежат 9 значений вариант (-2 четыре раза и 0 пять раз);
- отрезку принадлежат 15 значений вариант ( 1 - семь раз и 2 - восемь раз);
- отрезку принадлежат 6 значений вариант (3 - шесть раз);
- отрезку принадлежат 3 значения вариант (5 - 2 раза и 7 - один раз).
По данным таблицы 7 строим соответственную гистограмму частот (см. рисунок 20).
рисунок 20.
Замечание 1. Иногда для построения гистограмм первые два ряда распределения виды таблицы 7 уже заданы. В этом случае нужно учитывать элементы третьего ряда таблицы и построить соответственную гистограмму.
Пример №67
Построить гистограмму частностей заданного распределения
Решение. В этом случае объем выборки
длина долевого интервала варианты
По формуле находим частности каждого интервала
Для построения гистограммы частностей по определению 2, найдем плотность частности
Следует, нужна гистограмма частностей будет иметь вид, который изображен на рисунке 21.
рисунок 21.
Замечание 2. При наблюдении практичных проблем часто выборка имеет значительное количество вариант. Рассмотрим в следующем примере способ их обработки.
Пример №68
Контрольные измерения радиуса 200 цилиндров дали следующие результаты
Построить гистограмму распределения частот выборки.
Решение. В заданном виде варианты не пригодны для контроля. Эти варианты нужно как-либо упорядочить. Простейший способ упорядочения - представить варианты графически: на оси абсцисс поставить результаты измерений, а над каждым значением варианты поставить столько точек, сколько раз встречается эта варианта.
В результате мы получим точечную диаграмму, которая позволяет сложить некоторые представления про выборку и может быть поставлена в основу дальнейшей обработки результатов контроля (см. рисунок 22).
рисунок 22.
Чтобы упростить построение гистограмм, в таблице распределения используют не отрезки, в которых сгруппированы результаты измерений, а их середины. Эти середины обозначают отрезки и отдалены одна от другой на расстоянии которая равна длине отрезков.
Действительно, если длина отрезка равно а его серединой будет число то отрезок будет
Для построения гистограммы частот выборки из рисунка 22 при получим таблицу вида
По данным таблицы строим гистограмму частот выборки.
рисунок 23.
Сгруппированные данные: гистограмма и полигон частот
Для сгруппированного распределения частоты, относительной частоты, плотности частоты и плотности относительной частоты могут быть построены специальные диаграммы, сложенные из прямоугольником ступенчатые фигуры, что называются гистограммами.
Для построения гистограмм на горизонтальную ось наносятся классы интервалов. На каждом классе строиться прямоугольник, высота которого равна значению частоты (или относительной частоты, или плотности частоты или плотности относительной частоты) на этом интервале.
рисунок 24. Гистограмма частот среднемесячной зарплаты 100 сотрудников фирмы
Сгруппированное распределение частоты, относительной частоты, плотности частоты и плотности относительной частоты
На рисунке 24 изображена гистограмма частот согласно данным таблицы 8, что построена по таблице В.6 параграфу 5.6.
Далее изобразим заштрихованные контуры гистограмм для плоскости частоты и относительной плотности частоты согласно данных таблицы 8 (смотреть рисунок 25 и 26).
рисунок 25. Контур гистограмм для плотности частоты Плоскость гистограммы 5 равна объему выборки
рисунок 26. Контур гистограмм для плотности относительной частоты Плоскость гистограммы равна 1.
Рассматривая рисунки 24, 25, 26 легко увидеть, что все три гистограммы геометрически подобны и отличаются лишь масштабом вертикальной оси.
Вид способа избрания ширины класса интервалов зависит внятность гистограммы. Если довольно маленькое, то гистограмма содержит много случайного. Если довольно большое, то в гистограмме возникают индивидуальные особенности выборки.
На рисунке 27 и 28 изображены гистограммы для примера 1 при значениях ширины классов интервалов и согласно распределения частот, что приведены в таблице 9.
рисунок 27. Гистограмма частот среднемесячной зарплаты 100 сотрудников фирмы (ширина классов интервалов )
рисунок 28. Гистограмма частот среднемесячной зарплаты 100 сотрудников фирмы (ширина классов интервалов )
Сгруппированное распределение частоты среднемесячной оплаты сотрудников фирмы для двух значений ширины классов интервалов и
таблица 9.
Альтернативой гистограммы для распределения частот является полигон частот. Для построения этого графика над серединой каждого интервала вариант ставится точка на высоте, соответственной частоты этого интервала. После этого эти точки получаются отрезками прямых (смотреть рисунки 29).
рисунок 29. Полигон частот среднемесячной оплаты 100 сотрудников фирмы
На графике, где размещена гистограмма частот (рис. 29), полигон частот изображенный так, что конечные точки графика касаются горизонтальной оси в точках 275 и 395.
Совмещение двух типов графиков на одном рисунке сделано с целью подчеркнуть разное геометрическое содержание этих двух графических изображений распределения частот. Обычно же полигон частот изображается на отдельном чертеже, как это показано на рисунке 30.
рисунок 30. Полигон частот среднемесячной оплаты сотрудников фирмы
рисунок 31. медиана сгруппированного распределения частот, заданного таблицей 8.
С помощью гистограмм удобно обозначить следующее важное понятие.
Определение 3. Медианой сгруппированного распределения частот при постоянной ширине классов интервалов) называется значение или точка на горизонтальной оси гистограммы распределения частот такая, в которой перпендикулярная линия, что проходит через нее, делит эту плоскость гистограммы на две равные части.
Алгоритм нахождения медианы будет рассмотрено в конце этого раздела.
Вероятностное содержание гистограмм и полигона частот
Чтоб выяснить, какое вероятное содержание гистограмм и полигона частот, изобразим на одном рисунке (см. рисунок 32) контур гистограмм для плотности относительной частоты и полигон плотности относительных частот.
Плоскость фигуры, ограниченна полигоном плотности относительных частот приблизительно равна плоскости контура диаграммы, что в свою очередь равна 1. Следует, полигон плоскости относительных частот является приблизительным изображением функции плотности вероятности генеральной совокупности.
Если увеличить объем выборки то полигон плотности относительных частот будет более точно изображен функцией плотности вероятности генеральной совокупности.
рисунок 32. Контур гистограмм для плотности относительной частоты и полигон плотности относительных частот. Плоскость гистограммы равна 1.0
Полигоны накопительных частот и частности. Нахождение их медианы
Для накопительной частоты и накопительной относительной частоты могут быть построены графики похожие на полигон частот. Эти графики называют полигоном накопительной частоты или полигоном накопительной относительной частности. В статистике их так же называют огивой и кумулятивной кривой. Полигон накопительной частоты удобно использовать в целом ряде задач статистики.
Рассмотрим построение полигона накопительной относительной частоты на примере распределения накопительной относительной частоты выборки среднемесячной оплаты 100 сотрудников фирмы (смотреть таблицу 10, которая была построена по данным таблицам В.6).
Сгруппированное распределение накопительной частоты и накопительной относительной выборки среднемесячной оплаты 100 сотрудников фирмы
Для построения полигона мы ставим точку над нижней границей каждого класса интервалов на горизонтальной оси на высоте, что соответствует величины накопительной относительной частоты на предыдущих интервалов.
Так на верхней границе интервала поставлена точка на высоте 0, накопительная относительная частота на предыдущих интервалах равна 0 (смотреть 3-ий столбик таблицы 10).
На верхней границе интервала поставлена точка на высоте 0,01, накопительная относительная частота на предыдущих интервалах равна 0,01 (смотреть 3-ий столбик таблицы 10) и так далее. Окончательный вид построенного полигона накопительной относительной частности приведен на рисунке 33.
рисунок 33. Полигон накопительной относительной частоты
В заключение параграфа рассмотрим, как строится медиана сплоченного распределения частоты выборки. Существуют два способа: по формуле и графически.
Рассмотрим графический способ построения медианы сгруппированного распределения частоты выборки.
Вернемся к рисунку 32. В верхней части рисунка изображен полигон накопленной относительной частоты, а в нижней части - гистограмма частот.
Из точки с ординатой 0,5 на оси проводим горизонтальную линию до пересечения с ломанной полигона накопленной относительности частот в точке
рис. 34 Графическое построение медианы группированного распределения частот с помощью полигона накопительных относительных частот.
Далее из точки проводим вертикальную линию до пересечения оси графика гистограммы частот в точке что и является медианой. По графику на рисунке 34 можно только приблизительно обозначить значение координаты точки
Рассмотрим построение медианы сгруппированного распределения частоты выборки по формуле.
Точное значение можно зайти по следующей интерполяционной формуле. Пусть медиана принадлежит интервалу тогда
где - нижняя граница интервала - значение функции накопительных относительных частот на предыдущем интервале - относительная частота варианты в интервале - ширина интервала.
Интервал это тот класс интервалов, что содержит число где - объем выборки. В нашем случае Вернемся в таблице В.4 и воспользуемся функцией накопительной частоты. Из таблицы видно, что числу 50 соответствует интервал
Следовательно, получим
После подстановки этих значений в формулу (1) получаем
Сравнивая два способа построения медианы объединенного распределения частоты выборки по формуле или графический, приходим к следующего вывода.
Графическое нахождение медианы группированного распределения частот более наглядное, но дает только приблизительное значение медианы и показывает тот класс интервалов, где находится медиана. Этим обстоятельством можно воспользоваться для нахождения ее точного значения по интерполяционной формуле, что приведена выше.
График эмпиричной функции распределения
Пользуясь данными таблицы 9, запишем эмпиричную функцию распределения для нашего примера (теорию смотреть параграф 5.7).
Очевидно, что функция обозначает относительную частоту действия "значение варианты меньше ", то есть
График эмпиричной функции распределения (смотреть рисунок 35) является близким изображением графика теоретичной функции распределения случайной величины из элементов которой составлена выборка.
рисунок 35. Эмпиричная функция распределения
рисунок 36. Полигон накопительной относительной частоты (кусковая линия) и эмпиричная функция распределения (ступенчатая линия).
На рисунке 36 совмещены графики полигона накопительной относительной частности (рис. 33) и эмпиричной функции распределения (рис. 35).
Из этого графика видно, что распределение накопительной относительной частности может быть изображен двумя разными графиками: ступенчатым графиком или ломанной прямой.
Первому изображению соответствует эмпиричная функция распределения, а во втором - полигон накопительной относительной частоты.
В то же время, ясно, что оба эти графика являются разными, но близкими изображениями теоретичной функции распределения показано выше.
Раздел 6. Статистические оценки параметров распределения
Использование математики для обработки выборки позволяет найти числовые характеристики.
Основные требования к статистическим оценкам
В большинстве случаях нужно отследить количественный признак генеральной совокупности, используют результаты выборки. Часто для этого достаточно найти приближенные значения математического ожидания , дисперсии среднеквадратичное отклонение , начальные или центральные моменты случайной величины
Иногда из некоторых рассуждений получается закон распределения Тогда нужно уметь оценивать параметры этого закона распределения.
Например, известно, что случайная величина распределена равномерно; нужно по данным выборки приблизительно найти отрезок, в котором находятся значения случайной величины
Если распределена в генеральной совокупности по нормальному закону, то ее плотность вероятностей имеет вид
Необходимо оценить (найти приближенные значения) параметра который равен и который равен Эти параметры полностью обозначают нормальное распределение
Если распределена по закону Пуассона, то необходимо оценивать только один параметр которым это распределение обозначается.
Исследователь имеет в своем распоряжении только данные выборки полученные в результате наблюдений. Именно через эти данные и нужно выразить нужный параметр случайной величины генеральной совокупности.
Определение 1. Статистической оценкой неизвестного параметра случайной величины генеральной совокупности (теоретичного распределения ) называют функцию от случайных величин (результатов выборки), что наблюдаются.
Чтобы статистические оценки давали лучшее приближение параметров, они должны соответствовать определенным требованиям. Рассмотрим эти требования.
Пусть является статистической оценкой неизвестного параметра теоремой распределения.
Предположим, что по выборке с объемом найдена оценка При других случаях того же объема получим некоторые другие оценки Саму оценку можно рассмотреть как случайную величину, а числа как и ее возможные значения.
Если числа будут больше значения , тогда оценка дает приближенные значения с излишком. В этом случае математическое исследование случайной величины будет больше
Если дают оценку с недостачей, тогда
Таким образом, использование статистической оценки, математическое исследование которой не равняется параметру , приводят к систематическим погрешностям.
Условие предостерегает от систематических погрешностей.
Определение 2. Статистическую оценку параметра называют не сдвигаемым параметром, если
Оценку называют параметром сдвига, если это равенство не выполняется.
Условие про не сдвигаемую оценку является недостаточной, потому что возможные значения могут быть сильно рассеяны от своего среднего значения, дисперсия может быть слишком большой. Тогда найденная по данным одной выборки оценка, например, может намного отличаться от среднего значения , следовательно и от параметра
Если будет маленькой, тогда возможность допустить большую погрешность будет исключена. Потому для статической оценки получается условие про ее эффективность.
Определение 3. Эффективной называют такую статистическую оценку , которая при заданном объеме имеет наименьшую возможную дисперсию.
При рассматривании выборки большого объема к статистических оценках предъявляют условие их обоснованности.
Определение 4. Обоснованностью называют статистическую оценку, которая при направляется из вероятности к оценке параметра.
Например, если дисперсия не сдвигаемой оценки при направляется к нулю, то оценка будет и обоснованной.
Числовые характеристики выборочной совокупности
Выборочные характеристики:
В дополнение к табличным и графическим методам представления данных следующим важнейшим способом обработки данных являются вычисление их числовых характеристик. Важнейшие из них: среднее значение, дисперсия, среднеквадратичное отклонение (стандартное отклонение).
Эти характеристики могут быть вычислены по данным, что находятся в выборке или по данным, что входят в конечную генеральную совокупность.
Числовые характеристики, вычисленные по выборке или те, что используются для описания данных выборки, называют статистиками.
Числовые характеристики, вычисленные по генеральной совокупности или те, что используются для описания данных генеральной совокупности, называют параметрами.
По аналогии с математическими наблюдениями, дисперсию и среднеквадратичным отклонение дискретной случайной величины обозначают выборочные характеристики, изменяя при этом вероятности частотами выборки
Но в статистике используют и другие числовые характеристики.
Определение 1. Простой среднеарифметической выборкой называют сумму вариант выборки, поделенную на объем выборки. Ее обозначают
где - вариант выборки, - объем выборки.
Определение 2. Выборочной средней или взвешенной среднеарифметическая называют среднеарифметическую варианту выборки с отклонением их частот и обозначают
где - объем выборки, - число разных вариант, - частоты вариант - значение -нной варианты.
Выборочная средняя является аналогом математического наблюдения и выполняется очень часто. Она может принимать разные числовые значения при разных выборках одинакового объема.
Потому можно рассмотреть распределения (теоретический и эмпиричный) выборочной средней и числовые характеристики этого распределения (это распределение называют выборочным).
Основные свойства выборочной средней
1. при умножении всех вариант выборки на одинаковый множитель выборочное среднее также умножается на этот множитель
2. Если прибавить (отнять) к всем вариантам выборки одинаковое число, то выборочная средняя возрастает (уменьшается) на это число
Эти свойства можно объединить в одну формулу, которую называют формулой момента
и используют в статистике.
Замечание 1. Если ввести условную варианту то формула момента (2) принимает простой вид
Определение 3. Степенной средней выборки называют такую среднюю, которую находят по формуле
При получим формулу (1), то есть выборочной средней.
При получим среднеквадратичную выборку
При получим среднюю гармоническую
Среднюю гармоническую применяют в том случае, когда искомый показатель является величиной, что обратный среднему значению признака.
При уравнение (3) будет неопределенным. Используя логарифмы и правило Лопиталя раскрытия неопределенности, получаем среднюю геометрическую
Эта средняя вычисляется только при условии, что все варианты являются положительными
Средняя геометрическая используется в статистике для обозначения темпа возрастания при наблюдении изменения признаков с течением времени
Замечание 2. Обратная той или иной средней для характеристики распределения связанно с качественным анализом этого распределения.
Замечание 3. Кроме указанных степенных средних, в статистике используются еще структурные средние, которые не зависят от значений варианты, что расположены на краях распределения, и связанны с рядом частот.
К структурным средним относят моду и медиану. Напомним, что модой называют значения варианты, которая имеет наибольшую частоту. Определение медианы и способы ее построение смотреть параграф 5.8.
Определение 4. Выборочной дисперсией называют среднюю квадратов отклонения вариант от выборочной средней с отклонениями соответственных частот
Замечание 4. Вычисления выборочной дисперсии упрощается, если находить по формуле
Определение 5. Выборочным среднеквадратичным отклонением (стандартом) называют квадратичный корень из выборочной дисперсии
Замечание 5. Выборочная дисперсия дает заниженные значения для дисперсии генеральной совокупности, она будет сдвигаемой оценкой . Или математические ожидание будет
Потому выборочную дисперсию целесообразно исправить таким образом, чтобы она стала не сдвигаемой оценкой. Для этого достаточно умножить на дробь
исправленную выборочную дисперсию обозначают
Тогда исправленным среднеквадратичным отклонением выборки будет
Из формул (4) и (7) получается, что при больших (объем выборки) выборочная дисперсия и исправленная выборочная дисперсия мало отличаются. Потому в практичных задачах исправленную дисперсию и исправленное среднеквадратичное отклонение выборки используют только при объеме выборки
Пример №69
Выборочная совокупность задана таблицей
Найти выборочные характеристики.
Решение. В данном случае объем выборки равен
По формуле (1) находим выборочную среднюю
По формуле (4) находим выборочную дисперсию
По формуле (6) находим выборочные среднеквадратичные отклонения (стандарт)
Вычисления выборочных характеристик методом произведений
Как правило, вычисления и по формулам (1) и (4) или (5) проводится с использованием компьютерной техники. Часто расчеты можно упростить, используя метод произведений, в основе которого лежат равноудаленные варианты и следующая расчетная таблица.
Дадим необходимые пояснения для этого метода
Алгоритм метода произведений
1) В первый столбец таблицы записывают равноудаленные варианты выборки, размещая их в возрастающем порядке.
2) Во второй столбец таблицы записывают соответственные частоты вариант. Сумму всех вариантов этого столбца (объем выборки ) записывают в последнюю клетку этого столбца.
3) Третий столбец содержит условия варианты выборки. Для нахождения условных вариант выборки нужно:
а) значения варианты выборки с наибольшей частотой избранный за условный ноль. Эти значения варианты называют модой.
б) найти разницу между любыми двумя соседними вариантами;
в) вычислить условные варианты выборки по формуле
Отметим, что условные варианты всегда будут целыми числами.
4) В четвертый столбец записывают произведения частот и соответственных условных вариант Сумму элементов столбца записывают в последнюю клетку этого столбца.
5) Находят произведения частот и квадратов условных вариант и записывают их в пятый столбик. Сумму элементов столбца записывают в последнюю клетку этого столбца.
6) Находят произведение частот и квадратов условных вариант, увеличенных на единицу, и записывают из в шестой столбец. Сумму элементов столбца записывают в последнюю клетку этого столбца.
7) Проверяют вычисления так: сумма элементов шестого столбца должна удовлетворять тождество
8) Вычисляют условные моменты по формуле
9) Вычисляют выборочную среднюю и дисперсию по формуле
Пример №70
Найти методом произведения выборочной средней и дисперсию заданной выборки
Решение. Будем использовать расчет таблицы методом произведения. В этом случае: варианты выборки равноудалены наибольшая частота 40 в варианте 19,8. Потому условным нулем будет
В первые для столбца расчетной таблицы записываем варианты и частоты заданной выборки, а элементы третьего столбца вычисляем по формуле (8) при указанных и
Для контроля проверяем условие (9)
Найдем условия момента по формуле (10)
По формуле (11) находим искомую выборочную середину и выборочную дисперсию
Статистические моменты распределения
Обозначим аналогично начальному и центральному распределению из теории вероятностей некоторые числовые характеристики выборки.
Определение 6. Моментом порядка называют среднее значение - ой степени разницы
При получим начальный момент порядка выборки
При получим центральный момент порядка выборки
Моменты порядка и условные моменты и которые вычисляют по формуле (10), часто используют в статистике.
Примеры нахождения статистики выборки
В случае сгруппированной выборки допускается, что всякое значение варианты, что попали в данный класс интервалов, равно среднему значению варианты в этом классе.
1. Выборочное среднее вычисляется по формуле
где - объем выборки, - среднее значение варианты класса, - частота -ного класса интервалов, - количество классов.
2. Для дисперсии получаем формулу
и формулу для вычислений
Для исправленной дисперсии получаем формулу
и формулу для вычислений
или
Пример №71
Вычислить числовые характеристики выборки сгруппированного распределения частот среднемесячной оплаты сотрудников фирмы (смотреть таблицу 11).
таблица 11 таблица 12
Перейдем из таблицы 11 к таблице 12, заменяя классы интервалов на средние значения вариант в классе. Пользуясь данными из таблицы 12, по формуле (12) получаем
Сравнивая полученное значение выборочной средней и точным значением видим, что они отличаются незначительно.
Погрешность возникла на счет округления всех вариант в классе к среднему значению. Как показывает практика, погрешность, что получилась ранее, незначительная.
Далее по формулам (13), (14) получим
Для среднеквадратичного отклонения получим
Согласно приведенным выше терминам является статистиками.
Как видно из формул (13) и (14) дисперсия является мерой рассеивания варианты в выборке вокруг их среднего значения. Объясним это на следующем примере.
Пример №72
Обследованы по 65 случаев выплаты страховых сумм двумя страховыми компаниями и за некоторый период времени. За единицу отплаты принята некоторая стандартная сумма. Выплата может принимать любые значения от 0 до 4. Знак "минус" перед числом обозначает, что выплату вносит страховая компания, а знак "плюс" - что компания получит страховой взнос. Нужно рассчитать числовые характеристики этих выборок.
Распределение частот выплат страховых сумм обоих компаний приведено в таблицах 13 и 14.
Рассчитаем выборочное среднее и для обоих компаний
Рассчитаем выборочные дисперсии и
таблица 13 таблица 14
Полигон частот обоих распределений изображений на рисунке 37. Из рисунка 37 видно, что чем меньше дисперсия, тем в большем узком интервале данные выборки группируются около среднего значения ( в нашем случае ).
рисунок 37
Точечные и интервальные оценки
Определение 1. Точечными оценками параметров распределение генеральной совокупности называют такие оценки, которые обозначаются одним числом.
Например, выборочная средняя выборочная дисперсия и выборочное среднеквадратичное - точечные оценки соответственных числовых характеристик генеральной совокупности.
Точечные оценки параметров распределения являются случайными величинами, их можно считать первичными результатами обработки выборки потому, что неизвестно, с какой точностью каждая из них оценивает соответственную числовую характеристику генеральной совокупности.
Если объем выборки достаточно большой, то точечные оценки удовлетворяют практичной потребности точности.
Если объем выборки маленький, то точечные оценки могут давать значительные погрешности, потому вопрос точности оценок в этом случае очень важное и используют интервальные оценки.
Определение 2. Интервальной называют оценку, которая обозначается двумя числами - концами интервала.
Интервальные оценки позволяют установить точность и надежность оценок. Познакомьтесь с этими понятиями.
Пусть найдена по данным выборки статистическая оценка будет оценкой неизвестного параметра .
Ясно, что а точнее обозначает , тем меньше абсолютная величина разницы .
Другими словами, если и тогда меньшему соответствует более точная оценка. Потому число характеризует точность оценки.
Но статистические методы не позволяют категорично утверждать, что оценка удовлетворяют неравенство
Такое утверждения можно сделать только с вероятностью .
Определение 3. Надежностью (доверительной вероятностью) оценки параметра в называют вероятностью
с которой выполняется неравенство
Частое число задается изначально и в зависимости от обстоятельств, равно 0.95 или 0.99 или 0.999.
Формулу (1) можно записать в виде
Из этого равенства получается, что интервал содержит неизвестный параметр генеральной совокупности.
Определение 4. Интервал называют доверительным, если он покрывает неизвестный параметр с заданной надежностью .
Замечание 1. Концы доверительного интервала являются случайными величинами.
Доверительный интервал для оценки математического ожидания нормального распределения
Пусть количественный признак генеральной совокупности распределена по нормальному закону, среднеквадратичное отклонение известно. Нужно найти доверительный интервал, что покрывает математическое ожидание генеральной совокупности с заданной надежностью .
Согласно свойству нормально распределенной случайной величины получаем
Поскольку интегральная функция Лапласа Ф. является непарной, то получим
Только случайная величина потому при замене на в получим где
Используя формулы (3) и (2), получим
то есть надежностью доверительный интервал
покрывает неизвестный параметр Точность оценки будет
с использованием таблицы значений интегральной функции Лапласа.
Замечание 2. Из формулы (5) получается, что при возрастании объема выборки число уменьшается, а это означает, что точность оценки увеличивается. Если надежность увеличивается, функция возрастает и согласно с ее свойствами, возрастает , как следствие, возрастает . Следовательно, увеличение надежности оценки уменьшает ее точность.
Пример №73
Случайная величина распределена по нормальному закону с параметром Сделана выборка объема С надежностью найти доверительный интервал неизвестного параметра этого распределения.
Решение. Из равенства
Из таблицы интегральной функции Лапласа Ф найдем число Тогда по формуле (5) точность оценки будет
Следовательно, доверительный интервал будет Если , то с надежностью 95% интервал покрывает параметр с точностью до
Замечание 3. Нахождение объема выборки. Пусть признак генеральной совокупности распределена по нормальному закону с параметром и нужно найти объем выборки который с заданной точностью и надежностью позволит найти оценку параметра Из формулы (5) получим равенство
из которой получается
Для надежности воспользовавшись (6) и таблицей значений интегральной функции Лапласа, найдем соответственное число
Теперь, и известны, тогда по формуле (7) можно найти нужный объем выборки.
Пример №74
Случайная величина распределена по нормальному закону с параметром . Найти минимальный объем выборки, чтобы с надежностью и точностью использовалось равенство если
Решение. Для согласно с формулой (6) получим
Используя формулу (7), найдено и заданы получаем
Следовательно, минимальный объем выборки
Замечание 4. Если неизвестное среднеквадратичное отклонение признака генеральной совокупности, то используют распределение Стьюдента (смотреть параграф 16 работы (4)), можно также в формулах (3) - (4), (7) вместо используя
Обработка выборки методом наименьших квадратов
Предположим, что нам известна функциональная зависимость между случайными величинами и вида с неизвестными параметрами
Например, можно рассмотреть зависимость между себестоимостью продукции (признак ) и объем продукции (признак ) некоторого количества однотипных предприятий.
Обычно, при возрастании объема продукции себестоимость должна спадать. Только эта зависимость не является однозначной. Вследствие, разные причины при выпуске одинакового объема продукции себестоимость ее на разных предприятий будет неодинаковой.
Пусть вследствие независимых испытаний получены варианты признака и , которые оформлены в статистической таблице вида
Для нахождения оценок, параметров функциональной зависимости по данным выборки используем метод наименьших квадратов. Этот метод основывается на том, что верные значения параметров должны давать минимум функции
Если функция имеет непрерывные частные производные относительно параметров то необходимым условием существования минимум функции будет система уравнений с неизвестными
Нахождение функциональной зависимости между случайными величинами и из использованием данных испытаний (или выборки) называют выравниванием эмпиричных данных вдоль кривой
Ниже рассмотрим детальнее оценки параметров линейной и параболической функциональной зависимостей, которые используются чаще всего.
Оценка параметров линейной функции
Пусть между случайными величинами и существует линейная функциональная зависимость
параметры и которой неизвестны.
Согласно формуле (1) получим
Эта функция непрерывно дифференцирована, потому согласно с необходимыми условиями существования минимума обязаны выполняться равенства и
В нашем случае эти равенства имеют вид
Выписанная система является неоднородной линейной системой двух уравнений относительно двух неизвестных и По правилу Крамера можно найти единственное решение этой системы в виде
Если количество значений и велика, то вычисления параметров и по формулам (3), (4) выполняется . Для упрощения вычислений начало расчета величин переносят в среднее значение всех, то есть в точку
Тогда после некоторых промежуточных выкладок получаем
Формулы (5) позволяют обозначить параметры и линейной функциональной зависимости (2) путем вычисления более простым, чем по формулам (3), (4).
Оценка параметров параболической функциональной зависимости
Пусть между случайными величинами и существует функциональная зависимость вида
Методом наименьших квадратов на основе данных исследований найдем значения неведомых параметров Теперь формула (1) будет иметь вид
Необходимые условия существования минимума функции является равенства нулю частичных производных первого порядка
Эту систему можно записать в виде
Система (7) является неоднородной линейной системы трех уравнений с неизвестными Решением этой системы можно найти разными методами ( матричным по правилу Крамера, методом Гаусса - Жордана) а его вид будет громоздким при слишком большом количестве исследований
Система (7) и ее решение намного упрощается, если значения равноудалены и выполняется условие которое можно получить с помощью нового аргумента
Предположим, что указанные условия выполняется, тогда вместо системы (7) получим систему
Решение этой системы можно найти по формуле
Пример №75
Используя метод наименьших квадратов, сложить уравнение параболы (6), которая проходит близко к точкам
Решение. В этом случае значения равноудалены
и выполняются условия, которые позволяют найти параметры с упрощенными формулами. Потому, подставив значения и из таблицы в эти формулы, получим
потому что
Таким образом, уравнением искомой параболы будет
Статистическая проверка гипотез
Гипотезы полезны в многих случаях. Они бывают разные. Как их проверить?
Статистические гипотез и из разновидности
Часто необходимо знать закон распределения генеральной совокупности. Если закон распределения неизвестный, только есть рассуждения для предположение его определенного вида например, распределение равномерный, показательный или нормальный, тогда выдвигают гипотезу:
- генеральная совокупность распределена по закону
В этой гипотезе идет речь про вид неизвестного распределения.
Иногда закон распределения генеральной совокупности известный , но его параметры (числовые характеристики) неизвестны. Если есть рассуждение, допустим, что неведомый параметр равны определенному значению то используют гипотезу . Эта гипотеза показывает предположенную величину параметра известного распределения.
Возможны так же другие гипотезы: про равенство параметром двух разных распределений, про независимость выборок, про то, что в ноябре 2000 года будет конец света, и много других.
Определение 1. Статистическими называют гипотезы про вид распределения генеральной совокупности или про параметры известных распределений.
Например, статистическими будут гипотезы:
- генеральная совокупность распределена по нормальному закону;
- дисперсии двух совокупностей, распределенных по закона Пуассона, равны между собой.
Известно, что на творческие возможности людей влияют не только гены и условия жизни, но и космос. Рассмотрим гипотезы:
- значительная часть рожденных в первом полугодии имеет более развитую левую часть мозга, которая отвечает за логичное мышление.
- значительная часть людей, рожденных в другом полугодии, имеет более развитую часть мозга, которая отвечает за образное мышление.
Эти гипотезы не статистические, ибо в них идет речь не об вид и не об параметры распределения. Но для указанной ситуации можно сформулировать несколько статистических гипотез.
Вместе с предположенной гипотезой всегда можно рассмотреть противоположной ее гипотезу. Если предположенная гипотеза будет отклонена, то имеет место быть противоположная гипотеза. Следовательно, эти гипотезы значительно отличаются.
Определение 2. Основой (нулевой) называют предположительную гипотезу и обозначают
Определение 3. Альтернативной (конкурентной) называют гипотезу, что противоречит основной, ее обозначают .
Например, если то
Гипотезы могут содержать только одну или больше одного предположения.
Определение 4. Гипотезу зовут простой, если она содержит только одно предположение.
Например, если - параметр показательного распределения, то гипотеза будет простой.
Определение 5. Гипотезу называют сложной, если она складывается из ограниченного или не ограниченного количества простых гипотез.
Например, гипотеза : математическое исследование нормального распределения равна 2 - сложная гипотеза тому, что среднеквадратичное отклонение неизвестное и может принимать любые значения.
Гипотеза показательное распределение имеет параметр складывается из неограниченного множества гипотез где
Погрешности проверки гипотез
Статистическая гипотеза, которая смещена, может быть правильной или неправильной, потому возникает необходимость ее проверки.
Проверка гипотеза выполняется по данным выборки, то есть статистическими методами. Потому проверку гипотезы по данным выборки называют статистической.
При проверке статистической гипотезы по данным случайной выборки можно сделать ложный вывод. При этом могут быть погрешности первого и второго рода.
Определение 1. Если в выводе была отклонена правильная гипотеза, то говорят, что это погрешность первого рода.
Определение 2. Если в выводе была принята не правильная гипотеза, то говорят, что это погрешность второго рода.
Отметим, что последствия этих погрешностей могут быть разными. Например, если откинуть правильную гипотезу "продолжить постройку мясокомбината", то эта погрешность первого рода будут способствовать материальным тратам.
Если принять неправильную гипотезу "продолжить постройку, не учитывая возможность обвала объекта", то в последствии погрешности второго рода могут погибнуть люди.
Определение 3. Вероятность сделать погрешность первого рода обозначают и называют уровнем значимости.
Чаще всего уровень значимости принимают равным 0,05 или 0,01. Если принят уровень значимости равный 0,05, то это означает, что в пяти случаях из 100 мы рискуем получить погрешность первого рода (отклонили правильную гипотезу).
Замечание. При контроле качества продукции вероятность признать нестандартные стандартные изделия называют риском производителя, а вероятность признать пригодным бракованные изделия называют риском потребителя.
Критерии координирования проверки гипотез
Статистический критерий проверки основной гипотезы:
Проверку статистической гипотезы можно проверить с использованием данных выборки. Для этого следует выбрать, некоторую случайную статистическую характеристику (выборочная функция), точное или приближенное распределение. который известен, и с помощью этой характеристики проверить основную гипотезу.
Определение 1. Статистическим критерием координирования проверки гипотезы (или просто критерием) называют случайную величину распределение которой (точное или приближенное) известен и которая используется для проверки основной гипотезы.
Замечание 1. В определении 1 не учитывается вид распределения статистической характеристики.
Если статистическая характеристика распределена нормально, то критерий обозначают не буквой а буквами или Если статистическая характеристика распределена по законом Фишера - Снедекора, то ее обозначают
В случае распределения статистической характеристики по закону Стьюдента и обозначают а в случае закона
Например, для проверки гипотез про равенство дисперсии двух нормальных генеральных совокупностей в статистической характеристике выбирают отношения исправленных выборочных дисперсий
В разных опытах дисперсия будет принимать разные, изначально известные значения, потому эта величина случайная. Она распределена по закону Фишера-Снедекора.
Определение 2. Наблюдаемым значением критерия согласования называют значение соответственное критерию, вычисленное по данным выборки.
Например, если по данным выборок их двух нормальных генеральных совокупностей найдем исправленные выборочные дисперсии и , тогда наблюдаемым значением критерия согласования будет
Существует много критериев согласования. Например, наиболее точный (асимптотически) критерий Неймана - Пирсона используются неравенства или отношения функции правдоподобности.
Критическая область
После избрания первого критерия согласования, множество всех его возможных значений делят на две подмножества, что не пересекаются: одна из них содержит значения критерия, при которых основная гипотеза отклоняется, а вторая - при которых она принимается.
Определение 3. Критической областью называют совокупность значений критерия, при которых основная гипотеза отклоняется.
Определение 4. Областью принятия гипотезы (областью допустимых значений) называют множество значений критерия, при которых гипотезу принимают.
Критерий согласования - одномерная случайная величина, все ее возможные значения принадлежат некоторому интервалу. Потому критическая область и область принятия гипотезы также будут интервалами, а это означает, что существуют точки, которые эти интервалы отделяют.
Определение 5. Критическими точками критерия называют точки которые отделяют критическую область от области принятия гипотезы.
Различают одностороннюю (правостороннюю и левостороннюю) и двустороннюю критические области.
Определение 6. Правосторонней называют критическую область, что обозначается неравенством - где положительное число.
Определение 7. Левосторонней называют критическую область, что обозначается неравенством - где отрицательное число.
Нахождение критических областей
Чтобы найти одностороннюю критическую область нужно найти критическую точку Для этого задают достаточно маленькую вероятность - уровень значимости а потом ищут критическую точку с учетом условия
в случае правосторонней критической области, или
в случае левосторонней критической области
В случае двусторонней критической области должно получится тождество
Для каждого критерия согласования являются соответственные таблицы, которые позволяют находить такую точку которая удовлетворяет нудное условие.
При нахождении критической области целесообразно учитывать мощность критерия.
Определение 8. Мощность критерия называют вероятность принадлежности критерия критической области при условии, что является правильная альтернативная гипотеза.
Другими словами, мощность критерия является вероятность того, что основная гипотеза будет отклонена, если альтернативная гипотеза правильная.
Если уровень значимости уже избрано то критичную область целесообразно строить так, чтобы мощность критерия была максимальной. Выполнение этого условия обеспечивает минимальную вероятность погрешности второго рода.
Замечание 2. Единственный способ одновременного уменьшения погрешностей первого и второго рода - увеличение объема выборки.
Порядок действий при проверке статистических гипотез
Для проверки правильности основной статистической гипотезы необходимо:
- обозначить гипотезу альтернативную к гипотезе ;
- выбрать статистическую характеристику проверки;
- обозначить допустимую вероятность погрешности первого рода, то есть уровень значимости
- найти по соответственной таблице критическую область (критическую точку) для выбранной статистической характеристики.
К критической области принадлежат такие значения статистической характеристики, при которых гипотеза отклоняется в пользу альтернативной гипотезы
Подчеркнем, что между уровнем значимости и критической областью существует такая связь: если гипотеза правильная, то вероятности значения выборочной функции будут принадлежать критической области.
Так, при проверке гипотезы про равенство дисперсий двух нормальных совокупностей при альтернативной нужно найти соответственное значение критерия Фишера-Снедекора, то есть
а потом из таблицы критических точек этого распределения по заданному уровню значимости и степенях вольности и найти
если то гипотеза принимается, если то отклоняется.
Некоторые критерии проверки статистических гипотез
Проверка гипотезы про равенство математических ожиданий нормальных генеральных совокупностей:
Пусть две нормально распределенные генеральные совокупности имеют равные дисперсии, а математические ожидания могут быть разными.
Из совокупностей сделали выборку объема и нашли выборочные средние и а также исправленные дисперсии и соответственно.
Нужно проверит гипотезу : разница математических ожиданий этих совокупностей равна числу
Альтернативная гипотеза будет
Для проверки гипотезы в качества статистической характеристики (выборочной функции) возьмем функцию
которая распределена по закону Стьюдента со степенями вольности, что равны
Для заданного уровня значимости можно найти критическую область для статистической характеристики с учетом альтернативной гипотезы
Пример №76
Предприятие изготовляет одинаковые детали двумя способами. Первым способом изготовлено 10 деталей, траты сырья были такими
Вторым способом изготовлено 6 деталей, траты сырья были такими
Предположим, что дисперсия трат сырья одинаковая, при уровне значимости проверить гипотезу при альтернативной гипотезе
Решение. Нужно проверить гипотезу про равенство математических ожиданий двух нормальных генеральных совокупностей. Согласно с гипотезой критическая область будет двусторонней и обозначается условием где статистическая характеристика обозначена формулой (1). Степень вольности равна
Из таблицы критических значений для 14 степеней вольности получим
По данным выборки можно найти
Теперь по формуле (1) получим
Следовательно не принадлежит критической области, потому гипотеза может быть принята.
Критерий дисперсионного анализа
Пусть есть нормального распределения генеральных совокупностей с равными дисперсиями и , возможно, с разными математическими ожиданиями.
Из каждой совокупности делаем выборку объема
тогда - объем всей выборки.
Обозначим варианты случайной величины из -нной совокупности Тогда средняя арифметическая выборка из -нной совокупности будет
а средняя всей выборки будет
При уровне значимости нужно проверить основную гипотезу про равенство математических ожиданий рассматриваемых совокупностей
При равенстве дисперсий статистическая характеристика будет иметь распределение Фишера с и степенями вольности. Потому качество статистической характеристики для проверки этой гипотезы возьмем функцию
Критическую область в этом случае находят с учетом условия
где критическое значение распределения Фишера.
Пример №77
Есть данные про стоимость (пример приведен в тысячах гривен) проданных трех видов изделий первым магазином в некоторые дни недели
Предполагая нормальный закон распределения полученной суммы каждого дня и равенство дисперсий, проверить гипотезу : при уровне значимости
Решение. Условие примера позволяют использовать для решения задачи критерий дисперсионного анализа.
В этом случае получаем:
По формулам (2) и (3) находим:
Сделаем вычисление сумм, что исходят из формулы (4)
Теперь по формуле (4) найдем значения статистической характеристики
Из таблицы критических значений распределения значений Фишера со степенями вольности и и уровнем значимости находим
Получили, что потому, гипотеза может быть принята.
Критерий согласования Пирсона x2
Критерий согласования Пирсона
Критерий согласования Пирсона эффектно используют для проверки гипотезы про распределение генеральной совокупности, то есть распределение случайной величины имеет функциональное выражение.
Ограничимся применением этого критерия для проверки гипотезы про нормальное распределение генеральной совокупности.
Пусть выборка имеет такое распределение объема
или
нужно с уровнем значимости проверить основную гипотезу : генеральная совокупность распределена нормально.
Критерием проверки этой гипотезы берут случайную величину , которая в разных исследованиях принимает разные, изначально неизвестные значения.
Критическое значение этой случайной величины зависят от уровня значимости и степени вольности ее распределения
Эти критические значения представлены в виде таблицы (таблица 5 в приложении) для разных и
для распределения генеральной совокупности по нормальному закона степень вольности будет
где - количество вариант выборки или частотных интервалов вариант.
Правило Пирсона. Чтобы при заданном уровне значимости проверить основную гипотезу : генеральная совокупность распределена нормально, нужно
1)вычислить теоретическую частоту для вариант выборки;
2) вычислить наблюдаемое значение критерия по формуле
3) найти степень вольности по формуле (5);
4) найти из таблицы критическую точку которая соответствует заданному уровню значимости и степени вольности
5) уравнять и сделать вывод:
- если то гипотезу нужно принять;
- если то гипотезу нужно отклонить.
Пример №78
При равной значимости проверить
гипотезу про нормальное распределение генеральной совокупности, если известны эмпиричные и теоретические частоты
Решение. В данном случае теоретические частоты заданы, количество вариант выборки Потому по формуле (5) находим степень вольности
Из таблицы критических точек распределения для и находим
Для вычисления по формуле (6) используем расчетную таблицу
Таким образом, потому по правилу Пирсона гипотезу следует принять. Следовательно, данные выборки согласуются с гипотезой , потому разногласие эмпиричных и теоретических частот незначительное.
Нахождение теоретических частот нормального распределения
Согласно с классическим определением вероятности
Следовательно для нахождения теоретических частот
нужно найти вероятность
соответственно.
Вероятность можно найти, пользуясь локальной функцией Лапласа и данные выборки по формуле
где
варианты равноудалены.
Вероятность можно найти, используя интегральную функцию Лапласа по формуле
б) если число сходится с одним корнем характеристического уравнения (93), то есть является простым корнем этого уравнения, то частичное решение (91) нужно искать в виде
в) если число является двукратным корнем уравнения (93), то частичное решение уравнения (91) ищут в виде
Объединим случаи а) - в): если правая часть уравнения (91) имеет вид (92), то частичное решение этого уравнения нужно искать в виде
где - многочлен с неопределенными коэффициентами той же степени, что и многочлен а - число корней характеристического уравнения, которые равны . Если не является корнем характеристического уравнения, то принимаем
Пусть правая часть в уравнении (91) имеет вид
где - многочлен степени - многочлен степени и - действительные числа. Частичное решение уравнения (91) нужно искать виде
где и - многочлен степени с неопределенными коэффициентами; - высшая степень многочленов и то есть - число корней характеристического уравнения, которые равны
Кроме того, если правая часть уравнения (91) имеет вид
где - известные действительные числа, то частичное решение этого уравнения нужно искать в виде
где - неизвестные коэффициенты; - число корней характеристического уравнения (93), которые равны
Замечание. 1. Искомые многочлены в формулах (94), (96) и (97) могут быть полными, то есть содержат все степени от нуля до независимо от того, является ли полным заданный многочлен То же используется и к многочленам и в формуле (99), причем неопределенные коэффициенты при одних и тех же степенях в этих многочленах должны быть, как говорят, разными.
Замечание 2. Если правая часть уравнения (91) является суммой нескольких разных по структуре функций вида (92) или (98), то для поиска частичного решения нужно искать теорему про наложение решений (п. 3.4).
Замечание 3. Использованный метод подбора отдельного частичного решения уравнения (91) можно использовать только в определенных дифференциальных уравнений, а именно для линейных уравнений с постоянными коэффициентами и со специальной правой частью вида (92) или (98). В других случаях частичное решение нужно искать методом вариации произвольных постоянных.
Пример №79
Решить уравнение
Характеристическое уравнение имеет корни потому общее решение однородного уравнения имеет вид Поскольку правой частью данного уравнения является функция вида причем то по формуле (94) частичное решение ищем в виде то есть где и - неизвестные коэффициенты. Найдя производные и подставив их в уравнения, получим
Приравнивая коэффициенты при одинаковых степенях, получим систему уравнений
откуда Следует, частичное решение данного уравнения имеет вид потому
искомое общее решение.
Лекции по предметам:
- Математика
- Алгебра
- Линейная алгебра
- Векторная алгебра
- Геометрия
- Аналитическая геометрия
- Высшая математика
- Дискретная математика
- Математический анализ
- Математическая статистика
- Математическая логика
Учебник онлайн:
- Комбинаторика - правила, формулы и примеры
- Классическое определение вероятности
- Геометрические вероятности
- Теоремы сложения и умножения вероятностей
- Формула полной вероятности
- Повторные независимые испытания
- Простейший (пуассоновский) поток событий
- Случайные величины
- Числовые характеристики случайных величин
- Нормальный закон распределения
- Основные законы распределения вероятностей
- Асимптотика схемы независимых испытаний
- Функции случайных величин
- Центральная предельная теорема
- Ковариация в теории вероятности
- Функциональные преобразования двухмерных случайных величин
- Правило «трех сигм» в теории вероятности
- Производящие функции
- Теоремы теории вероятностей
- Основные законы распределения дискретных случайных величин
- Непрерывные случайные величины
- Закон больших чисел
- Генеральная и выборочная совокупности
- Интервальные оценки параметров распределения
- Алгебра событий - определение и вычисление
- Свойства вероятности
- Многомерные случайные величины
- Случайные события - определение и вычисление
- Системы случайных величин
- Вероятность и риск
- Определения вероятности событий
- Предельные теоремы теории вероятностей