Выбрать закон распределения случайной величины. Сравнение законов распределения вероятностей. Критерий согласия. Гипергеометрический закон распределения

) играет осо-бо важную роль в теории вероятностей и чаще других применяется в решении практических задач. Его главная особенность в том, что он является предельным законом, к которому приближаются дру-гие законы распределения при весьма часто встречающихся типич-ных условиях. Например, сумма достаточно большого числа неза-висимых (или слабо зависимых) случайных величин приближенно подчиняется нормальному закону, и это выполняется тем точнее, чем больше случайных величин суммируется.

Экспериментально доказано, что нормальному закону под-чиняются погрешности измерений, отклонения геометрических размеров и положения элементов строительных конструкций при их изготовлении и монтаже, изменчивость физико-механических характеристик материалов и нагру-зок, действующих на строительные конструкции.

Распределению Гаусса подчи-няются почти все случайные вели-чины, отклонение которых от сред-них значений вызывается большой совокупностью случайных факто-ров, каждый из которых в отдельности незначителен (центральная предельная теорема).

Нормальным распределением называется распределение случайной непрерывной величины, для которых плотность вероят-ностей имеет вид (рис. 18.1).

Рис. 18.1. Нормальный закон распределения при а 1 < a 2 .

(18.1)

где а и — параметры распределения.

Вероятностные характеристики случайной величины, распре-деленной по нормальному закону, равны:

Математическое ожидание (18.2)

Дисперсия (18.3)

Среднеквадратичное отклонение (18.4)

Коэффициент асимметрии А = 0 (18.5)

Эксцесс Е = 0. (18.6)

Параметр σ, входящий в распределение Гаусса равен сред-неквадратичному отношению слу-чайной величины. Величина а оп-ределяет положение центра рас-пределения (см. рис. 18.1), а величина а — ширину распределе-ния (рис. 18.2), т.е. статистический разброс вокруг средней величины.

Рис. 18.2. Нормальный закон распределения при σ 1 < σ 2 < σ 3

Вероятность попадания в заданный интервал (от x 1 до x 2) для нормального распределения, как и во всех случаях, определяется интегралом от плотности вероятности (18.1), который не выража-ется через элементарные функции и представляется специальной функцией, называется функцией Лапласа (интеграл вероятностей).

Одно из представлений интеграла вероятностей:

Величина и называется квантилем.

Видно, что Ф(х) — нечетная функция, т. е. Ф(-х) = -Ф(х). Значения этой функции вычислены и представлены в виде таблиц в технической и учебной литературе.

Функция распределения нормального закона (рис. 18.3) может быть выражена через ин-теграл вероятностей:

Рис. 18.2. Функция нормального закона распределения.

Вероятность попадания случайной величины, распределенной по нормальному закону, в интервал от х. до х, определяется выра-жением:

Следует заметить, что

Ф(0) = 0; Ф(∞) = 0,5; Ф(-∞) = -0,5.

При решении практических задач, связанных с распределе-нием, часто приходится рассматривать вероятность попадания в интервал, симметричный относительно математического ожидания, если длина этого интервала т.е. если сам интервал имеет грани-цу от до , имеем:

При решении практических задач границы отклонений слу-чайных величин выражаются через стандарт, среднеквадратичное отклонение, умноженное на некоторый множитель, определяющий границы области отклонений случайной величины.

Принимая и а также используя формулу (18.10) и таблицу Ф(х) (приложение № 1), получим

Эти формулы показывают , что если случайная величина име-ет нормальное распределение, то вероятность ее отклонения от сво-его среднего значения не более чем на σ составляет 68,27 %, не бо-лее чем на 2σ — 95,45 % и не более чем на Зσ — 99,73 %.

Поскольку величина 0,9973 близка к единице, практически считается невозможным отклонение нормального распределения случайной величины от математического ожидания более чем на Зσ. Это правило, справедливое только для нормального распределения, называется правилом трех сигм. Нарушение его имеет вероятность Р = 1 - 0,9973 = 0,0027. Этим правилом пользуются при установле-нии границ допустимых отклонений допусков геометрических ха-рактеристик изделий и конструкций.

ЗАКОН РАСПРЕДЕЛЕНИЯ И ХАРАКТЕРИСТИКИ

СЛУЧАЙНЫХ ВЕЛИЧИН

Случайные величины, их классификация и способы описания.

Случайной называется величина, которая в результате опыта может принимать то или иное значение, но какое именно заранее не известно. Для случайной величины, таким образом, можно указать только значения, одно из которых она обязательно примет в результате опыта. Эти значения в дальнейшем будем называть возможными значениями случайной величины. Так как случайная величина количественно характеризует случайный результат опыта, она может рассматриваться как количественная характеристика случайного события.

Случайные величины обычно обозначаются заглавными буквами латинского алфавита, например, X..Y..Z, а их возможные значения- соответствующими малыми буквами.

Различают три типа случайных величин:

Дискретные; Непрерывные; Смешанные.

Дискретной называется такая случайная величина, число возможных значений которой образует счетное множество. В свою очередь, счетным называется множество, элементы которого можно пронумеровать. Слово «дискретный» происходит от латинского discretus , что означает «прерывистый, состоящий из отдельных частей» .

Пример 1. Дискретной случайной величиной является число бракованных деталей Х в партии из nтук. Действительно, возможными значениями этой случайной величины является ряд целых чисел от 0 до n.

Пример 2. Дискретной случайной величиной является число выстрелов до первого попадания в цель. Здесь, как и в примере 1, возможные значения можно пронумеровать, хотя в предельном случае возможное значение является бесконечно большим числом.

Непрерывной называется случайная величина, возможные значения которой непрерывно заполняют некоторый интервал числовой оси, называемый иногда интервалом существования этой случайной величины. Таким образом, на любом конечном интервале существования число возможных значений непрерывной случайной величины бесконечно велико.

Пример 3. Непрерывной случайной величиной является расход электроэнергии на предприятии за месяц.

Пример 4. Непрерывной случайной величиной является ошибка измерения высоты с помощью высотомера. Пусть из принципа работы высотомера известно, что ошибка лежит в пределах от 0 до 2 м. Поэтому интервалом существования данной случайной величины является интервал от 0 до 2 м.

Закон распределения случайных величин.

Случайная величина считается полностью заданной, если на числовой оси указаны ее возможные значения и установлен закон распределения.

Законом распределения случайной величины называется соотношение, устанавливающее связь между возможными значениями случайной величины и соответствующими вероятностями.

Про случайную величину говорят, что она распределена по данному закону, или подчинена данному закону распределения. В качестве законов распределения используются ряд вероятностей, функция распределения, плотность вероятности, характеристическая функция.

Закон распределения дает полное вероятное описание случайной величины. По закону распределения можно судить до опыта о том какие возможные значения случайной величины будут появляться чаще, а какие – реже.

Для дискретной случайной величины закон распределения может быть задан в виде таблицы, аналитически (в виде формулы) и графически.

Простейшей формой задания закона распределения дискретной случайной величины является таблица (матрица), в которой перечислены в порядке возрастания все возможные значения случайной величины и соответствующие их вероятности, т.е.

Такая таблица называется рядом распределения дискретной случайной величины. 1

События Х 1 , Х 2 ,..., Х n , состоящие в том, что в результате испытания случайная величина X примет соответственно значения х 1 , x 2 ,...х n являются несовместными и единственно возможными (ибо в таблице перечислены все возможные значения случайной величины), т.е. образуют полную группу. Следовательно, сумма их вероятностей равна 1. Таким образом, для любой дискретной случайной величины

(Эта единица как-то распределена между значениями случайной величины, отсюда и термин «распределение»).

Ряд распределения может быть изображен графически, если по оси абсцисс откладывать значения случайной величины, а по оси ординат - соответствующие их вероятности. Соединение полученных точек образует ломаную, называемую многоугольником или полигоном распределения вероятностей (рис. 1).

Пример В лотерее разыгрывается: автомобиль стоимостью 5000 ден. ед., 4 телевизора стоимостью 250 ден. ед., 5 видеомагнитофонов стоимостью 200 ден. ед. Всего продается 1000 билетов по 7 ден. ед. Составить закон распределения чистого выигрыша, полученного участником лотереи, купившим один билет.

Решение . Возможные значения случайной величины X - чистого выигрыша на один билет - равны 0-7 = -7 ден. ед. (если билет не выиграл), 200-7 = 193, 250-7 = 243, 5000-7 = 4993 ден. ед. (если на билет выпал выигрыш соответственно видеомагнитофона, телевизора или автомобиля). Учитывая, что из 1000 билетов число невыигравших составляет 990, а указанных выигрышей соответственно 5, 4 и 1, и используя классическое определение вероятности, получим.

На практике большинство случайных величин, на которых воздействует большое количество случайных факторов, подчиняются нормальному закону распределения вероятностей. Поэтому в различных приложениях теории вероятностей этот закон имеет особое значение.

Случайная величина $X$ подчиняется нормальному закону распределения вероятностей, если ее плотность распределения вероятностей имеет следующий вид

$$f\left(x\right)={{1}\over {\sigma \sqrt{2\pi }}}e^{-{{{\left(x-a\right)}^2}\over {2{\sigma }^2}}}$$

Схематически график функции $f\left(x\right)$ представлен на рисунке и имеет название «Гауссова кривая». Справа от этого графика изображена банкнота в 10 марок ФРГ, которая использовалась еще до появления евро. Если хорошо приглядеться, то на этой банкноте можно заметить гауссову кривую и ее первооткрывателя величайшего математика Карла Фридриха Гаусса.

Вернемся к нашей функции плотности $f\left(x\right)$ и дадим кое-какие пояснения относительно параметров распределения $a,\ {\sigma }^2$. Параметр $a$ характеризует центр рассеивания значений случайной величины, то есть имеет смысл математического ожидания. При изменении параметра $a$ и неизмененном параметре ${\sigma }^2$ мы можем наблюдать смещение графика функции $f\left(x\right)$ вдоль оси абсцисс, при этом сам график плотности не меняет своей формы.

Параметр ${\sigma }^2$ является дисперсией и характеризует форму кривой графика плотности $f\left(x\right)$. При изменении параметра ${\sigma }^2$ при неизмененном параметре $a$ мы можем наблюдать, как график плотности меняет свою форму, сжимаясь или растягиваясь, при этом не сдвигаясь вдоль оси абсцисс.

Вероятность попадания нормально распределенной случайной величины в заданный интервал

Как известно, вероятность попадания случайной величины $X$ в интервал $\left(\alpha ;\ \beta \right)$ можно вычислять $P\left(\alpha < X < \beta \right)=\int^{\beta }_{\alpha }{f\left(x\right)dx}$. Для нормального распределения случайной величины $X$ с параметрами $a,\ \sigma $ справедлива следующая формула:

$$P\left(\alpha < X < \beta \right)=\Phi \left({{\beta -a}\over {\sigma }}\right)-\Phi \left({{\alpha -a}\over {\sigma }}\right)$$

Здесь функция $\Phi \left(x\right)={{1}\over {\sqrt{2\pi }}}\int^x_0{e^{-t^2/2}dt}$ - функция Лапласа. Значения этой функции берутся из . Можно отметить следующие свойства функции $\Phi \left(x\right)$.

1 . $\Phi \left(-x\right)=-\Phi \left(x\right)$, то есть функция $\Phi \left(x\right)$ является нечетной.

2 . $\Phi \left(x\right)$ - монотонно возрастающая функция.

3 . ${\mathop{lim}_{x\to +\infty } \Phi \left(x\right)\ }=0,5$, ${\mathop{lim}_{x\to -\infty } \Phi \left(x\right)\ }=-0,5$.

Для вычисления значений функции $\Phi \left(x\right)$ можно также воспользоваться мастером функция $f_x$ пакета Excel: $\Phi \left(x\right)=НОРМРАСП\left(x;0;1;1\right)-0,5$. Например, вычислим значений функции $\Phi \left(x\right)$ при $x=2$.

Вероятность попадания нормально распределенной случайной величины $X\in N\left(a;\ {\sigma }^2\right)$ в интервал, симметричный относительно математического ожидания $a$, может быть вычислена по формуле

$$P\left(\left|X-a\right| < \delta \right)=2\Phi \left({{\delta }\over {\sigma }}\right).$$

Правило трех сигм . Практически достоверно, что нормально распределенная случайная величина $X$ попадет в интервал $\left(a-3\sigma ;a+3\sigma \right)$.

Пример 1 . Случайная величина $X$ подчинена нормальному закону распределения вероятностей с параметрами $a=2,\ \sigma =3$. Найти вероятность попадания $X$ в интервал $\left(0,5;1\right)$ и вероятность выполнения неравенства $\left|X-a\right| < 0,2$.

Используя формулу

$$P\left(\alpha < X < \beta \right)=\Phi \left({{\beta -a}\over {\sigma }}\right)-\Phi \left({{\alpha -a}\over {\sigma }}\right),$$

находим $P\left(0,5;1\right)=\Phi \left({{1-2}\over {3}}\right)-\Phi \left({{0,5-2}\over {3}}\right)=\Phi \left(-0,33\right)-\Phi \left(-0,5\right)=\Phi \left(0,5\right)-\Phi \left(0,33\right)=0,191-0,129=0,062$.

$$P\left(\left|X-a\right| < 0,2\right)=2\Phi \left({{\delta }\over {\sigma }}\right)=2\Phi \left({{0,2}\over {3}}\right)=2\Phi \left(0,07\right)=2\cdot 0,028=0,056.$$

Пример 2 . Предположим, что в течение года цена на акции некоторой компании есть случайная величина, распределенная по нормальному закону с математическим ожиданием, равным 50 условным денежным единицам, и стандартным отклонением, равным 10. Чему равна вероятность того, что в случайно выбранный день обсуждаемого периода цена за акцию будет:

а) более 70 условных денежных единиц?

б) ниже 50 за акцию?

в) между 45 и 58 условными денежными единицами за акцию?

Пусть случайная величина $X$ - цена на акции некоторой компании. По условию $X$ подчинена нормальному закону распределению с параметрами $a=50$ - математическое ожидание, $\sigma =10$ - стандартное отклонение. Вероятность $P\left(\alpha < X < \beta \right)$ попадания $X$ в интервал $\left(\alpha ,\ \beta \right)$ будем находить по формуле:

$$P\left(\alpha < X < \beta \right)=\Phi \left({{\beta -a}\over {\sigma }}\right)-\Phi \left({{\alpha -a}\over {\sigma }}\right).$$

$$а)\ P\left(X>70\right)=\Phi \left({{\infty -50}\over {10}}\right)-\Phi \left({{70-50}\over {10}}\right)=0,5-\Phi \left(2\right)=0,5-0,4772=0,0228.$$

$$б)\ P\left(X < 50\right)=\Phi \left({{50-50}\over {10}}\right)-\Phi \left({{-\infty -50}\over {10}}\right)=\Phi \left(0\right)+0,5=0+0,5=0,5.$$

$$в)\ P\left(45 < X < 58\right)=\Phi \left({{58-50}\over {10}}\right)-\Phi \left({{45-50}\over {10}}\right)=\Phi \left(0,8\right)-\Phi \left(-0,5\right)=\Phi \left(0,8\right)+\Phi \left(0,5\right)=$$

Мы уже знаем (см. п. 4.1.3), что для полного описания механизма исследуемого случайного эксперимента, т. е. для полного описания вероятностного пространства (или, что то же, для исчерпывающего задания интересующей нас случайной величины), недостаточно задать лишь пространство элементарных событий (и тем самым описать множество теоретически возможных значений анализируемой случайной величины). К этому необходимо добавить также: в дискретном случае - правило сопоставления с каждым возможным значением случайной величины вероятности его появления в непрерывном случае - правило сопоставления с каждой измеримой областью возможных значений случайной величины вероятности события, заключающегося в том, что в случайном эксперименте реализуется одно из возможных значений, принадлежащих заданной области АХ. Это правило, позволяющее устанавливать соответствия вида:

принято называть законом распределения вероятностей исследуемой случайной величины .

Прозрачное пояснение такой терминологии мы получаем в рамках дискретного вероятностного пространства, поскольку в этом случае речь идет о правиле распределения суммарной единичной вероятности (т. е. вероятности достоверного события) между отдельными возможностями

Очевидно, задание закона распределения вероятностей, т. е. соответствий типа (5.2), может осуществляться с помощью таблиц и графиков (только в дискретном случае), а также с помощью функций и алгоритмически (об основных формах задания законов распределения и примерах их модельной, т. е. аналитической, записи см. гл. 6).

Приведем примеры табличного и графического задания законов распределения вероятностей.

Тщательный статистический анализ засоренности партий дефектными изделиями (пример 4.5) позволил построить следующее распределение вероятностей для случайной величины выражающей число дефектных изделий, обнаруженных при контроле партии, состоящей из N=30 изделий, случайно отобранных из продукции массового производства (табл. 5.2):

Таблица 5.2

Значения вероятностей, приведенные в табл. 5.2, даны с точностью до третьего десятичного знака, поэтому то, что суммирование представленных в таблице вероятностей дает 0,998 (вместо единицы), легко объяснимо: недостающие 0,002 как-то «размазаны» между возможными значениями 11, ..., 30, но на каждое отдельное возможное значение приходится вероятность, меньшая 0,0005.

Тот же закон распределения может быть представлен графически (рис. 5.2).

Геометрическое изображение закона распределения вероятностей дискретной случайной величины часто называют полигоном распределения или полигоном частот.

В качестве другого примера рассмотрим фрагмент табл. 5.1, выбрав из одиннадцати представленных в ней компонент только две: качество жилищных условий и среднедушевой доход Еще более упростим рассматриваемую схему, перейдя от по существу непрерывной случайной величины к ее дискретному аналогу отказываясь от точного знания среднедушевого дохода каждой семьи и ограничиваясь лишь тремя возможными градациями: семья имеет низкий доход (градация ), средний доход (градация ) и высокий доход (градация ). С учетом четырех градаций качества жилищных условий: - качество низкое - качество удовлетворительное; - качество хорошее и - качество очень хорошее, и проведенного вероятностно-статистического анализа получаем следующий закон распределения вероятностей двумерной случайной величины (данные условные):

Таблица 5.3

Соответствующий двумерный полигон распределения представлен на рис. 5.3.

Закон распределения вероятностей многомерной случайной величины называют многомерным или совместным. Если каждая из компонент ( см. (5.1)) анализируемого многомерного признака дискретна и имеет конечное число всех возможных значений, то, очевидно, общее число возможных «значений» случайного вектора будет .

Рис. 5.2. Графическое задание закона распределения вероятностей для числа дефектных изделий, обнаруженных в наугад извлеченной партии, состоящей из 30 изделий массового производства

Рис. 5.3. Полигон двумерного распределения семей по качеству жилищных условий и по уровню дохода

В этом случае вместо общей индексации всех возможных многомерных значений удобнее пользоваться -мерной индексацией вида , где первый индекс i определяет номер возможного значения по первой компоненте, второй индекс j - по второй компоненте и т. д. Тогда будет означать возможное значение , полученное сочетанием возможного значения компоненты возможного значения компоненты возможного значения компоненты а вероятности удобно обозначать . Таким образом, в табл. 5.3 представлены вероятности

При анализе многомерных (совместных) распределений часто бывает необходимо получить закон распределения лишь для какой-то части компонент анализируемого векторного признака. Так, многомерная случайная величина , рассмотренная в табл. 5.1, естественно разбивается на два подвектора: описывающий социальнодемографические и экономическую характеристики семьи, и описывающий структуру семейного потребления.

Частный (маржинальный) закон распределения

подвектора анализируемой многомерной случайной величины описывает распределение вероятностей признака в ситуации, когда на значения другой части компонент не накладывается никаких условий. В дискретном случае соответствующие вероятности определяются по формулам: