Болезни Военный билет Призыв

Чему равно математическое ожидание и дисперсия. Математическое ожидание (Population mean) - это. Практическая реализация математического ожидания

Пусть для случайной величины x возможные значения:

X1, x2, …, xk.

Измерения проводятся N раз, результат x i наблюдается N i раз, тогда

Среднее значение

(сумма результатов измерений)/(число всех измерений) =
.

При
с учетом (1.1)

получаем

. (1.5)

Для функции случайной величины

. (1.5а)

Среднее значение величины равно сумме произведений ее значений на вероятности этих значений .

При
получаем
и (1.5а) дает нормировку вероятностей

. (1.6)

Свойства среднего

Для постоянной
и независимых случайных величинx и y выполняется:

1)

– постоянный множитель выносится из под знака усреднения;

– среднее от суммы/разности равно сумме/разности средних;

3)

– среднее от произведения независимых величин равно произведению их средних.

Доказательство свойства 1

Из определения среднего (1.5а)

получаем

Доказательство свойства 2

Функция
, описывающая распределение вероятности дляслучайной величины x , одинакова для функций
и
, тогда из определения среднего (1.5а)

;

Доказательство свойства 3

Используем определение среднего и функцию распределения
независимых случайных величин x и y . Согласно теореме о независимых событиях их вероятности перемножаются

Тогда получаем

.

Основные определения

Отклонение от среднего случайной величины

.

Среднее отклонение от среднего случайной величины равно нулю

Среднее квадратичное величины

. (1.7)

Для средних значений случайных величин x и y выполняется неравенство Коши–Буняковского–Шварца

. (1.7а)

Из (1.7а) при
находим

. (1.7б)

Среднее квадратичное больше или равно квадрату среднего.

Дисперсия –­ среднее квадратичное отклонение от среднего

Из (1.7б) получаем
.

Флуктуация – корень квадратный из дисперсии

Относительная флуктуация

. (1.10)

Если x случайным образом изменяется с течением времени, то относительная флуктуация показывает долю времени, в течение которой система находится в состоянии с
.

Теорема: Относительная флуктуация аддитивной величины, характеризующей систему, уменьшается обратно пропорционально корню квадратному из числа независимых подсистем и для макроскопической системы она мала . Примером аддитивной величины (от лат. additivus – «прибавляемый») является энергия. Флуктуация энергии для макросистемы ничтожно мала, для микросистемы она существенна.

Доказательство

Аддитивная величина X для системы равна сумме значений x k для N независимых подсистем

.

По свойству 2 усреднения – среднее от суммы равно сумме средних

– пропорциональна числу подсистем.

Отклонение от среднего

,

дисперсия

.

При возведении в квадрат
и усреднении результата для перекрестных произведений учтено свойство 3 усреднения –среднее от произведения независимых величин равно произведению их средних

,
,

и использовано, что среднее отклонение от среднего равно нулю

.

Не равными нулю остаются квадраты величин. В результате флуктуация

.

Относительная флуктуация

(П.1.11)

уменьшается обратно пропорционально корню квадратному из числа независимых подсистем.

Производящая функция . Имеется случайная величина n , которая принимает дискретные значения в интервале
. Вероятность получения результатаn равна
. Определяем производящую функцию

. (П.1.14)

Если известна производящая функция, то распределение вероятности получаем из (П.1.14)

, (П.1.15)

где использовано

Условие нормировки (1.6)

требует выполнения

. (П.1.16)

Для получения средних значений случайной величины дифференцируем (П.1.14)

,

и находим

. (П.1.17)

Двукратное дифференцирование (П.1.14)

. (П.1.18)

Теорема о произведении производящих функций . Если происходят два независимых вида событий, которые описываются распределениями вероятностей с производящими функциями
и
, то распределение для суммы событий выражается произведением их производящих функций

Основные числовые характеристики дискретных и непрерывных случайных величин: математическое ожидание, дисперсия и среднее квадратическое отклонение. Их свойства и примеры.

Закон распределения (функция распределения и ряд распределения или плотность веро-ятности) полностью описывают поведение случайной величины. Но в ряде задач доста-точно знать некоторые числовые характеристики исследуемой величины (например, ее среднее значение и возможное отклонение от него), чтобы ответить на поставленный во-прос. Рассмотрим основные числовые характеристики дискретных случайных величин.

Определение 7.1. Математическим ожиданием дискретной случайной величины называ-ется сумма произведений ее возможных значений на соответствующие им вероятности:

М (Х ) = х 1 р 1 + х 2 р 2 + … + х п р п. (7.1)

Если число возможных значений случайной величины бесконечно, то , если полученный ряд сходится абсолютно.

Замечание 1. Математическое ожидание называют иногда взвешенным средним , так как оно приближенно равно среднему арифметическому наблюдаемых значений случайной величины при большом числе опытов.

Замечание 2. Из определения математического ожидания следует, что его значение не меньше наименьшего возможного значения случайной величины и не больше наибольше-го.

Замечание 3. Математическое ожидание дискретной случайной величины есть неслучай-ная (постоянная) величина. В дальнейшем увидим, что это же справедливо и для непре-рывных случайных величин.

Пример 1. Найдем математическое ожидание случайной величины Х - числа стандартных деталей среди трех, отобранных из партии в 10 деталей, среди которых 2 бракованных. Составим ряд распределения для Х . Из условия задачи следует, что Х может принимать значения 1, 2, 3. Тогда

Пример 2. Определим математическое ожидание случайной величины Х - числа бросков монеты до первого появления герба. Эта величина может принимать бесконечное число значений (множество возможных значений есть множество натуральных чисел). Ряд ее распределения имеет вид:

Х п
р 0,5 (0,5) 2 (0,5) п

+ (при вычислении дважды использовалась формула суммы бесконечно убывающей геометрической прогрессии: , откуда ).

Свойства математического ожидания.

1) Математическое ожидание постоянной равно самой постоянной:

М (С ) = С. (7.2)

Доказательство. Если рассматривать С как дискретную случайную величину, принимающую только одно значение С с вероятностью р = 1, то М (С ) = С ?1 = С .

2) Постоянный множитель можно выносит за знак математического ожидания:

М (СХ ) = С М (Х ). (7.3)

Доказательство. Если случайная величина Х задана рядом распределения


Тогда М (СХ ) = Сх 1 р 1 + Сх 2 р 2 + … + Сх п р п = С ( х 1 р 1 + х 2 р 2 + … + х п р п ) = СМ (Х ).

Определение 7.2. Две случайные величины называются независимыми , если закон распределения одной из них не зависит от того, какие значения приняла другая. В противном случае случайные величины зависимы .

Определение 7.3. Назовем произведением независимых случайных величин Х и Y случайную величину XY , возможные значения которой равны произведениям всех возможных значений Х на все возможные значения Y , а соответствующие им вероят-ности равны произведениям вероятностей сомножителей.

3) Математическое ожидание произведения двух независимых случайных величин равно произведению их математических ожиданий:

M (XY ) = M (X )M (Y ). (7.4)

Доказательство. Для упрощения вычислений ограничимся случаем, когда Х и Y принимают только по два возможных значения:

Следовательно, M (XY ) = x 1 y 1 ?p 1 g 1 + x 2 y 1 ?p 2 g 1 + x 1 y 2 ?p 1 g 2 + x 2 y 2 ?p 2 g 2 = y 1 g 1 (x 1 p 1 + x 2 p 2) + + y 2 g 2 (x 1 p 1 + x 2 p 2) = (y 1 g 1 + y 2 g 2) (x 1 p 1 + x 2 p 2) = M (X )?M (Y ).

Замечание 1. Аналогично можно доказать это свойство для большего количества возможных значений сомножителей.

Замечание 2. Свойство 3 справедливо для произведения любого числа независимых случайных величин, что доказывается методом математической индукции.

Определение 7.4. Определим сумму случайных величин Х и Y как случайную величину Х + Y , возможные значения которой равны суммам каждого возможного значения Х с каждым возможным значением Y ; вероятности таких сумм равны произведениям вероятностей слагаемых (для зависимых случайных величин - произведениям вероятности одного слагаемого на условную вероятность второго).

4) Математическое ожидание суммы двух случайных величин (зависимых или незави-симых) равно сумме математических ожиданий слагаемых:

M (X + Y ) = M (X ) + M (Y ). (7.5)

Доказательство.

Вновь рассмотрим случайные величины, заданные рядами распределения, приведен-ными при доказательстве свойства 3. Тогда возможными значениями X + Y являются х 1 + у 1 , х 1 + у 2 , х 2 + у 1 , х 2 + у 2 . Обозначим их вероятности соответственно как р 11 , р 12 , р 21 и р 22 . Найдем М (Х +Y ) = (x 1 + y 1)p 11 + (x 1 + y 2)p 12 + (x 2 + y 1)p 21 + (x 2 + y 2)p 22 =

= x 1 (p 11 + p 12) + x 2 (p 21 + p 22) + y 1 (p 11 + p 21) + y 2 (p 12 + p 22).

Докажем, что р 11 + р 22 = р 1 . Действительно, событие, состоящее в том, что X + Y примет значения х 1 + у 1 или х 1 + у 2 и вероятность которого равна р 11 + р 22 , совпадает с событием, заключающемся в том, что Х = х 1 (его вероятность - р 1). Аналогично дока-зывается, что p 21 + p 22 = р 2 , p 11 + p 21 = g 1 , p 12 + p 22 = g 2 . Значит,

M (X + Y ) = x 1 p 1 + x 2 p 2 + y 1 g 1 + y 2 g 2 = M (X ) + M (Y ).

Замечание . Из свойства 4 следует, что сумма любого числа случайных величин равна сумме математических ожиданий слагаемых.

Пример. Найти математическое ожидание суммы числа очков, выпавших при броске пяти игральных костей.

Найдем математическое ожидание числа очков, выпавших при броске одной кости:

М (Х 1) = (1 + 2 + 3 + 4 + 5 + 6)Тому же числу равно математическое ожидание числа очков, выпавших на любой кости. Следовательно, по свойству 4 М (Х )=

Дисперсия .

Для того, чтобы иметь представление о поведении случайной величины, недостаточно знать только ее математическое ожидание. Рассмотрим две случайные величины: Х и Y , заданные рядами распределения вида

Х
р 0,1 0,8 0,1
Y
p 0,5 0,5

Найдем М (Х ) = 49?0,1 + 50?0,8 + 51?0,1 = 50, М (Y ) = 0?0,5 + 100?0,5 = 50. Как видно, мате-матические ожидания обеих величин равны, но если для Х М (Х ) хорошо описывает пове-дение случайной величины, являясь ее наиболее вероятным возможным значением (при-чем остальные значения ненамного отличаются от 50), то значения Y существенно отсто-ят от М (Y ). Следовательно, наряду с математическим ожиданием желательно знать, на-сколько значения случайной величины отклоняются от него. Для характеристики этого показателя служит дисперсия.

Определение 7.5. Дисперсией (рассеянием) случайной величины называется математическое ожидание квадрата ее отклонения от ее математического ожидания:

D (X ) = M (X - M (X ))². (7.6)

Найдем дисперсию случайной величины Х (числа стандартных деталей среди отобранных) в примере 1 данной лекции. Вычислим значения квадрата отклонения каждого возможно-го значения от математического ожидания:

(1 - 2,4) 2 = 1,96; (2 - 2,4) 2 = 0,16; (3 - 2,4) 2 = 0,36. Следовательно,

Замечание 1. В определении дисперсии оценивается не само отклонение от среднего, а его квадрат. Это сделано для того, чтобы отклонения разных знаков не компенсировали друг друга.

Замечание 2. Из определения дисперсии следует, что эта величина принимает только неотрицательные значения.

Замечание 3. Существует более удобная для расчетов формула для вычисления дисперсии, справедливость которой доказывается в следующей теореме:

Теорема 7.1. D (X ) = M (X ²) - M ²(X ). (7.7)

Доказательство.

Используя то, что М (Х ) - постоянная величина, и свойства математического ожидания, преобразуем формулу (7.6) к виду:

D (X ) = M (X - M (X ))² = M (X ² - 2X?M (X ) + M ²(X )) = M (X ²) - 2M (X )?M (X ) + M ²(X ) =

= M (X ²) - 2M ²(X ) + M ²(X ) = M (X ²) - M ²(X ), что и требовалось доказать.

Пример. Вычислим дисперсии случайных величин Х и Y , рассмотренных в начале этого раздела. М (Х ) = (49 2 ?0,1 + 50 2 ?0,8 + 51 2 ?0,1) - 50 2 = 2500,2 - 2500 = 0,2.

М (Y ) = (0 2 ?0,5 + 100²?0,5) - 50² = 5000 - 2500 = 2500. Итак, дисперсия второй случайной величины в несколько тысяч раз больше дисперсии первой. Таким образом, даже не зная законов распределения этих величин, по известным значениям дисперсии мы можем утверждать, что Х мало отклоняется от своего математического ожидания, в то время как для Y это отклонение весьма существенно.

Свойства дисперсии.

1) Дисперсия постоянной величины С равна нулю:

D (C ) = 0. (7.8)

Доказательство. D (C ) = M ((C - M (C ))²) = M ((C - C )²) = M (0) = 0.

2) Постоянный множитель можно выносить за знак дисперсии, возведя его в квадрат:

D (CX ) = C ²D (X ). (7.9)

Доказательство. D (CX ) = M ((CX - M (CX ))²) = M ((CX - CM (X ))²) = M (C ²(X - M (X ))²) =

= C ²D (X ).

3) Дисперсия суммы двух независимых случайных величин равна сумме их дисперсий:

D (X + Y ) = D (X ) + D (Y ). (7.10)

Доказательство. D (X + Y ) = M (X ² + 2XY + Y ²) - (M (X ) + M (Y ))² = M (X ²) + 2M (X )M (Y ) +

+ M (Y ²) - M ²(X ) - 2M (X )M (Y ) - M ²(Y ) = (M (X ²) - M ²(X )) + (M (Y ²) - M ²(Y )) = D (X ) + D (Y ).

Следствие 1. Дисперсия суммы нескольких взаимно независимых случайных величин равна сумме их дисперсий.

Следствие 2. Дисперсия суммы постоянной и случайной величин равна дисперсии случайной величины.

4) Дисперсия разности двух независимых случайных величин равна сумме их дисперсий:

D (X - Y ) = D (X ) + D (Y ). (7.11)

Доказательство. D (X - Y ) = D (X ) + D (-Y ) = D (X ) + (-1)²D (Y ) = D (X ) + D (X ).

Дисперсия дает среднее значение квадрата отклонения случайной величины от среднего; для оценки самого отклонения служит величина, называемая средним квадратическим отклонением.

Определение 7.6. Средним квадратическим отклонением σ случайной величины Х называется квадратный корень из дисперсии:

Пример. В предыдущем примере средние квадратические отклонения Х и Y равны соответственно

Оказывается, что целый ряд практических задач можно решить с помощью немногих характеристик распределения, а знание точной функции распределения случайной величины оказывается необязательным. К таким определяющим характеристикам случайной величины относятся, например, ее среднее и среднее квадратичное значения, а также среднее квадратичное отклонение.

Находить средние значения случайных величин можно из опыта, а также зная функции распределения случайных величин. Рассмотрим, как находить эти средние значения в различных случаях.

Пусть случайная величина может принимать: значения с вероятностью или это значение выпадает раз из

значение с вероятностью или это значение выпадает раз из наконец,

значение с вероятностью или это значение выпадает раз из

Тогда сумма значений случайной величины при испытаниях будет:

Чтобы найти среднее значение случайной величины т. е. значение, приходящееся на одно испытание, нужно сумму разделить на полное число испытаний:

Если мы имеем некоторую среднюю величину найденную по формуле (2.11), то, вообще говоря, при различных значениях полного числа испытаний значения средней величины также будут различными, так как рассматриваемые величины носят случайный характер. Однако при увеличении числа среднее значение данной величины будет стремиться к определенному пределу а. И чем больше будет число испытаний, тем ближе определенное по формуле (2.11), будет приближаться к этому предельному значению:

Последнее равенство представляет собой так называемый закон больших чисел или теорему Чебышева: среднее значение случайной величины будет стремиться к постоянному числу при очень большом числе измерений.

Итак, среднее значение случайной величины равна сумме произведений случайной величины на вероятность ее появления.

Если случайная величина меняется непрерывно, то ее среднее значение можно найти с помощью интегрирования:

Средние величины обладают рядом важных свойств:

1) среднее значение постоянной величины равно самой постоянной величине т. е.

2) среднее значение некоторой случайной величины есть величина постоянная, т. е.

3) среднее значение суммы нескольких случайных величин равно сумме средних значений этих величин, т. е.

4) среднее значение произведения двух взаимно независимых случайных величин равно произведению средних значений каждой из них, т. е.

Распространяя это правило на большее число независимых величин, имеем:

Иногда по тем или иным причинам знание среднего значения случайной величины оказывается недостаточным. В таких случаях ищется не просто среднее значение случайной величины, а среднее значение квадрата этой величины (квадратичное). При этом имеют место аналогичные формулы:

для дискретных значений и

в случае непрерывного изменения случайной величины.

Среднее квадратичное значение случайной величины оказывается всегда положительным и не обращается в нуль.

Часто приходится интересоваться не только средними значениями самой случайной величины, но и с редними значениями некоторых функций от случайной величины.

Например, имея распределение молекул по скоростям, мы можем найти среднюю скорость. Но также нас может интересовать средняя кинетическая энергия теплового движения, являющаяся квадратичной функцией скорости. В таких случаях можно воспользоваться следующими общими формулами, определяющими среднее значение произвольной функции случайной величины для случая дискретного распределения

для случая непрерывного распределения

Для нахождения средних значений случайной величины или функции от случайной величины с помощью ненормированной функции распределения пользуются формулами:

Здесь везде интегрирование производится по всей области возможных значений случайной величины

Отклонение от средних. В ряде случаев знание среднего и среднего квадратичного значения случайной величины оказывается недостаточным для характеристики случайной величины. Интерес представляет также распределение случайной величины около своего среднего значения. Для этого исследуется отклонение случайной величины от среднего значения.

Однако, если мы возьмем среднее отклонение случайной величины от ее среднего значения т. е. среднее значение чисел:

то получим, как в случае дискретного, так и в случае непрерывного распределения, нуль. Действительно,

Иногда можно находить среднее значение модулей отклонений случайной величины от среднего значения, т. е. величину:

Однако вычисления с абсолютными значениями часто сложны, а иногда и невозможны.

Поэтому гораздо чаще для характеристики распределения случайной величины около своего среднего значения используют так называемое среднее квадратичное отклонение или средний квадрат отклонения. Средний квадрат отклонения иначе называют дисперсией случайной величины. Дисперсия определяется по формулам:

которые преобразуются к одному виду (см. задачи 5, 9).

где величина представляет квадрат отклонения случайной величины от ее среднего значения.

Квадратный корень из дисперсии случайной величины называется средним квадратичным отклонением случайной величины, а для физических величин - флуктуацией:

Иногда вводится относительная флуктуация, определяемая по формуле

Таким образом, зная закон распределения случайной величины, можно определить все интересующие нас характеристики случайной величины: среднее значение, среднее квадратичное, среднее значение произвольной функции от случайной величины, средний квадрат отклонения или дисперсию и флуктуацию случайной величины.

Поэтому одной из основных задач статистической физики является отыскание законов и функций распределения тех или иных физических случайных величин и параметров в различных физических системах.

Функция распределения содержит полную информацию о случайной величине. На практике функцию распределения не всегда можно установить; иногда такого исчерпывающего знания и не требуется. Частичную информацию о случайной величине дают числовые характеристики, которые в зависимости от рода информации делятся на следующие группы.
1. Характеристики положения случайной величины на числовой оси (мода Мo , медиана Мe , математическое ожидание М(Х )).
2. Характеристики разброса случайной величины около среднего значения (дисперсия D(X ), среднее квадратическое отклонение σ(х )).
3. Характеристики формы кривой y = φ(x ) (асимметрия As , эксцесс Ех ).
Рассмотрим подробнее каждую из указанных характеристик.
Математическое ожидание случайной величины Х указывает некоторое среднее значение, около которого группируются все возможные значения Х . Для дискретной случайной величины, которая может принимать лишь конечное число возможных значений, математическим ожиданием называют сумму произведений всех возможных значений случайной величины на вероятность этих значений:
. (2.4)
Для непрерывной случайной величины Х , имеющей заданную плотность распределения φ(x ) математическим ожиданием называется следующий интеграл:
. (2.5)
Здесь предполагается, что несобственный интеграл сходится абсолютно, т.е. существует.
Свойства математического ожидания:
1. М(С ) = C , где С = const ;
2. M(C Х) = С М(Х );
3. М(Х ± Y) = М(Х ) ± М(Y ), где X и Y – любые случайные величины;
4. М(Х Y )=М(Х )∙М(Y ), где X и Y – независимые случайные величины.
Две случайные величины называются независимыми , если закон распределения одной из них не зависит от того, какие возможные значения приняла другая величина.
Модой дискретной случайной величины, обозначаемой Мо , называется ее наиболее вероятное значение (рис. 2.3), а модой непрерывной случайной величины – значение, при котором плотность вероятности максимальна (рис. 2.4).



Рис. 2.3 Рис. 2.4
Медианой непрерывной случайной величины Х называется такое ее значение Ме, для которого одинаково вероятно, окажется ли случайная величина меньше или больше Ме , т.е.
Р(Х < Ме) = Р(X > Ме )
Из определения медианы следует, что Р(Х <Ме ) = 0,5, т.е. F (Ме ) = 0,5. Геометрически медиану можно истолковывать как абсциссу, в которой ордината φ(x ) делит пополам площадь, ограниченную кривой распределения (рис. 2.5). В случае симметричного распределения медиана совпадает с модой и математическим ожиданием (рис. 2.6).

Рис. 2.5 Рис. 2.6

Дисперсия.

Диспе́рсия случа́йной величины́ - мера разброса данной случайной величины, то есть её отклонения от математического ожидания. Обозначается D [X ] в русской литературе и (англ. variance ) в зарубежной. В статистике часто употребляется обозначение или . Квадратный корень из дисперсии, равный , называется среднеквадрати́чным отклоне́нием,станда́ртным отклоне́нием или стандартным разбросом. Стандартное отклонение измеряется в тех же единицах, что и сама случайная величина, а дисперсия измеряется в квадратах этой единицы измерения.

Из неравенства Чебышёва следует, что случайная величина удаляется от её математического ожидания на более чем k стандартных отклонений с вероятностью менее 1/k ². Так, например, как минимум в 75 % случаев случайная величина удалена от её среднего не более чем на два стандартных отклонения, а в примерно 89 % - не более чем на три.

Дисперсией случайной величины называется математическое ожидание квадрата ее отклонения от математического ожидания
D(X ) = M(X М(Х )) 2 .
Дисперсию случайной величины Х удобно вычислять по формуле:
а) для дискретной величины
; (2.6)
б) для непрерывной случайной величины
j(х )dx – 2 . (2.7)
Дисперсия обладает следующими свойствами:
1. D(C ) = 0, где С = const ;
2. D(C ×X ) = C 2 ∙D(X );
3. D (X ±Y ) = D (X ) + D (Y ), если X и Y независимые случайные величины.
Средним квадратическим отклонением случайной величины Х называется арифметический корень из дисперсии, т.е.
σ(X ) = .
Заметим, что размерность σ(х ) совпадает с размерностью самой случайной величины Х , поэтому среднее квадратическое отклонение более удобно для характеристики рассеяния.
Обобщением основных числовых характеристик случайных величин является понятие моментов случайной величины.
Начальным моментом k-го порядка α k случайной величины Х называется математическое ожидание величины Х k , т.е. α k = М(Х k ).
Начальный момент первого порядка – это математическое ожидание случайной величины.
Центральным моментом k-го порядка μ k случайной величины Х называется математическое ожидание величины (Х М(Х )) k , т.е. μ k = М(Х М(Х )) k .
Центральный момент второго порядка – это дисперсия случайной величины.
Для дискретной случайной величины начальный момент выражается суммой α k = , а центральный – суммой μ k = где р i = p(X = x i ). Для начального и центрального моментов непрерывной случайной величины можно получить следующие равенства:
α k = ,  μ k = ,
где φ(x ) – плотность распределения случайной величины Х.
Величина As = μ 3 / σ 3 называется коэффициентом асимметрии .
Если коэффициент асимметрии отрицательный, то это говорит о большом влиянии на величину m 3 отрицательных отклонений. В этом случае кривая распределения (рис.2.7) более полога слева от М(Х ). Если коэффициент As положительный, а значит, преобладает влияние положительных отклонений, то кривая распределения (рис.2.7) более полога справа. Практически определяют знак асимметрии по расположению кривой распределения относительно моды (точки максимума дифференциальной функции).


Рис. 2.7
Эксцессом Еk называется величина
Еk = μ 4 / σ 4 – 3.

Вопрос 24. Корреляция

Корреля́ция (корреляционная зависимость ) - статистическая взаимосвязь двух или нескольких случайных величин (либо величин, которые можно с некоторой допустимой степенью точности считать таковыми). При этом изменения значений одной или нескольких из этих величин сопутствуют систематическому изменению значений другой или других величин. Математической мерой корреляции двух случайных величин служит корреляционное отношение , либо коэффициент корреляции (или ) . В случае, если изменение одной случайной величины не ведёт к закономерному изменению другой случайной величины, но приводит к изменению другой статистической характеристики данной случайной величины, то подобная связь не считается корреляционной, хотя и является статистической .

Впервые в научный оборот термин «корреляция» ввёл французский палеонтолог Жорж Кювье в XVIII веке. Он разработал «закон корреляции» частей и органов живых существ, с помощью которого можно восстановить облик ископаемого животного, имея в распоряжении лишь часть его останков. В статистике слово «корреляция» первым стал использовать английский биолог и статистик Фрэнсис Гальтон в конце XIX века.

Некоторые виды коэффициентов корреляции могут быть положительными или отрицательными (возможна также ситуация отсутствия статистической взаимосвязи - например, для независимых случайных величин). Если предполагается, что на значениях переменных задано отношение строгого порядка, то отрицательная корреляция - корреляция, при которой увеличение одной переменной связано с уменьшением другой переменной, при этом коэффициент корреляции может быть отрицательным; положительная корреляция в таких условиях - корреляция, при которой увеличение одной переменной связано с увеличением другой переменной, при этом коэффициент корреляции может быть положительным.

Математическое ожидание и дисперсия - чаще всего применяемые числовые характеристики случайной величины. Они характеризуют самые важные черты распределения: его положение и степень разбросанности. Во многих задачах практики полная, исчерпывающая характеристика случайной величины - закон распределения - или вообще не может быть получена, или вообще не нужна. В этих случаях ограничиваются приблизительным описанием случайной величины с помощью числовых характеристик.

Математическое ожидание часто называют просто средним значением случайной величины. Дисперсия случайной величины - характеристика рассеивания, разбросанности случайной величины около её математического ожидания.

Математическое ожидание дискретной случайной величины

Подойдём к понятию математического ожидания, сначала исходя из механической интерпретации распределения дискретной случайной величины. Пусть единичная масса распределена между точками оси абсцисс x 1 , x 2 , ..., x n , причём каждая материальная точка имеет соответствующую ей массу из p 1 , p 2 , ..., p n . Требуется выбрать одну точку на оси абсцисс, характеризующую положение всей системы материальных точек, с учётом их масс. Естественно в качестве такой точки взять центр массы системы материальных точек. Это есть среднее взвешенное значение случайной величины X , в которое абсцисса каждой точки x i входит с "весом", равным соответствующей вероятности. Полученное таким образом среднее значение случайной величины X называется её математическим ожиданием.

Математическим ожиданием дискретной случайной величины называется сумма произведений всех возможных её значений на вероятности этих значений:

Пример 1. Организована беспроигрышная лотерея. Имеется 1000 выигрышей, из них 400 по 10 руб. 300 - по 20 руб. 200 - по 100 руб. и 100 - по 200 руб. Каков средний размер выигрыша для купившего один билет?

Решение. Средний выигрыш мы найдём, если общую сумму выигрышей, которая равна 10*400 + 20*300 + 100*200 + 200*100 = 50000 руб, разделим на 1000 (общая сумма выигрышей). Тогда получим 50000/1000 = 50 руб. Но выражение для подсчёта среднего выигрыша можно представить и в следующем виде:

С другой стороны, в данных условиях размер выигрыша является случайной величиной, которая может принимать значения 10, 20, 100 и 200 руб. с вероятностями, равными соответственно 0,4; 0,3; 0,2; 0,1. Следовательно, ожидаемый средний выигрыш равен сумме произведений размеров выигрышей на вероятности их получения.

Пример 2. Издатель решил издать новую книгу. Продавать книгу он собирается за 280 руб., из которых 200 получит он сам, 50 - книжный магазин и 30 - автор. В таблице дана информация о затратах на издание книги и вероятности продажи определённого числа экземпляров книги.

Найти ожидаемую прибыль издателя.

Решение. Случайная величина "прибыль" равна разности доходов от продажи и стоимости затрат. Например, если будет продано 500 экземпляров книги, то доходы от продажи равны 200*500=100000, а затраты на издание 225000 руб. Таким образом, издателю грозит убыток размером в 125000 руб. В следующей таблице обобщены ожидаемые значения случайной величины - прибыли:

Число Прибыль x i Вероятность p i x i p i
500 -125000 0,20 -25000
1000 -50000 0,40 -20000
2000 100000 0,25 25000
3000 250000 0,10 25000
4000 400000 0,05 20000
Всего: 1,00 25000

Таким образом, получаем математическое ожидание прибыли издателя:

.

Пример 3. Вероятность попадания при одном выстреле p = 0,2 . Определить расход снарядов, обеспечивающих математическое ожидание числа попаданий, равное 5.

Решение. Из всё той же формулы математического ожидания, которую мы использовали до сих пор, выражаем x - расход снарядов:

.

Пример 4. Определить математическое ожидание случайной величины x числа попаданий при трёх выстрелах, если вероятность попадания при каждом выстреле p = 0,4 .

Подсказка: вероятность значений случайной величины найти по формуле Бернулли .

Свойства математического ожидания

Рассмотрим свойства математического ожидания.

Свойство 1. Математическое ожидание постоянной величины равно этой постоянной:

Свойство 2. Постоянный множитель можно выносить за знак математического ожидания:

Свойство 3. Математическое ожидание суммы (разности) случайных величин равно сумме (разности) их математических ожиданий:

Свойство 4. Математическое ожидание произведения случайных величин равно произведению их математических ожиданий:

Свойство 5. Если все значения случайной величины X уменьшить (увеличить) на одно и то же число С , то её математическое ожидание уменьшится (увеличится) на то же число:

Когда нельзя ограничиваться только математическим ожиданием

В большинстве случаев только математическое ожидание не может в достаточной степени характеризовать случайную величину.

Пусть случайные величины X и Y заданы следующими законами распределения:

Значение X Вероятность
-0,1 0,1
-0,01 0,2
0 0,4
0,01 0,2
0,1 0,1
Значение Y Вероятность
-20 0,3
-10 0,1
0 0,2
10 0,1
20 0,3

Математические ожидания этих величин одинаковы - равны нулю:

Однако характер распределения их различный. Случайная величина X может принимать только значения, мало отличающиеся от математического ожидания, а случайная величина Y может принимать значения, значительно отклоняющиеся от математического ожидания. Аналогичный пример: средняя заработная плата не даёт возможности судить об удельном весе высоко- и низкооплачиваемых рабочих. Иными словами, по математическому ожиданию нельзя судить о том, какие отклонения от него, хотя бы в среднем, возможны. Для этого нужно найти дисперсию случайной величины.

Дисперсия дискретной случайной величины

Дисперсией дискретной случайной величины X называется математическое ожидание квадрата отклонения её от математического ожидания:

Средним квадратическим отклонением случайной величины X называется арифметическое значение квадратного корня её дисперсии:

.

Пример 5. Вычислить дисперсии и средние квадратические отклонения случайных величин X и Y , законы распределения которых приведены в таблицах выше.

Решение. Математические ожидания случайных величин X и Y , как было найдено выше, равны нулю. Согласно формуле дисперсии при Е (х )=Е (y )=0 получаем:

Тогда средние квадратические отклонения случайных величин X и Y составляют

.

Таким образом, при одинаковых математических ожиданиях дисперсия случайной величины X очень мала, а случайной величины Y - значительная. Это следствие различия в их распределении.

Пример 6. У инвестора есть 4 альтернативных проекта инвестиций. В таблице обобщены данные об ожидаемой прибыли в этих проектах с соответствующей вероятностью.

Проект 1 Проект 2 Проект 3 Проект 4
500, P =1 1000, P =0,5 500, P =0,5 500, P =0,5
0, P =0,5 1000, P =0,25 10500, P =0,25
0, P =0,25 9500, P =0,25

Найти для каждой альтернативы математическое ожидание, дисперсию и среднее квадратическое отклонение.

Решение. Покажем, как вычисляются эти величины для 3-й альтернативы:

В таблице обобщены найденные величины для всех альтернатив.

У всех альтернатив одинаковы математические ожидания. Это означает, что в долгосрочном периоде у всех - одинаковые доходы. Стандартное отклонение можно интерпретировать как единицу измерения риска - чем оно больше, тем больше риск инвестиций. Инвестор, который не желает большого риска, выберет проект 1, так как у него наименьшее стандартное отклонение (0). Если же инвестор отдаёт предпочтение риску и большим доходам в короткий период, то он выберет проект наибольшим стандартным отклонением - проект 4.

Свойства дисперсии

Приведём свойства дисперсии.

Свойство 1. Дисперсия постоянной величины равна нулю:

Свойство 2. Постоянный множитель можно выносить за знак дисперсии, возводя его при этом в квадрат:

.

Свойство 3. Дисперсия случайной величины равна математическому ожиданию квадрата этой величины, из которого вычтен квадрат математического ожидания самой величины:

,

где .

Свойство 4. Дисперсия суммы (разности) случайных величин равна сумме (разности) их дисперсий:

Пример 7. Известно, что дискретная случайная величина X принимает лишь два значения: −3 и 7. Кроме того, известно математическое ожидание: E (X ) = 4 . Найти дисперсию дискретной случайной величины.

Решение. Обозначим через p вероятность, с которой случайная величина принимает значение x 1 = −3 . Тогда вероятностью значения x 2 = 7 будет 1 − p . Выведем уравнение для математического ожидания:

E (X ) = x 1 p + x 2 (1 − p ) = −3p + 7(1 − p ) = 4 ,

откуда получаем вероятности: p = 0,3 и 1 − p = 0,7 .

Закон распределения случайной величины:

X −3 7
p 0,3 0,7

Дисперсию данной случайной величины вычислим по формуле из свойства 3 дисперсии:

D (X ) = 2,7 + 34,3 − 16 = 21 .

Найти математическое ожидание случайной величины самостоятельно, а затем посмотреть решение

Пример 8. Дискретная случайная величина X принимает лишь два значения. Большее из значений 3 она принимает с вероятностью 0,4. Кроме того, известна дисперсия случайной величины D (X ) = 6 . Найти математическое ожидание случайной величины.

Пример 9. В урне 6 белых и 4 чёрных шара. Из урны вынимают 3 шара. Число белых шаров среди вынутых шаров является дискретной случайной величиной X . Найти математическое ожидание и дисперсию этой случайной величины.

Решение. Случайная величина X может принимать значения 0, 1, 2, 3. Соответствующие им вероятности можно вычислить по правилу умножения вероятностей . Закон распределения случайной величины:

X 0 1 2 3
p 1/30 3/10 1/2 1/6

Отсюда математическое ожидание данной случайной величины:

M (X ) = 3/10 + 1 + 1/2 = 1,8 .

Дисперсия данной случайной величины:

D (X ) = 0,3 + 2 + 1,5 − 3,24 = 0,56 .

Математическое ожидание и дисперсия непрерывной случайной величины

Для непрерывной случайной величины механическая интерпретация математического ожидания сохранит тот же смысл: центр массы для единичной массы, распределённой непрерывно на оси абсцисс с плотностью f (x ). В отличие от дискретной случайной величиной, у которой аргумент функции x i изменяется скачкообразно, у непрерывной случайной величины аргумент меняется непрерывно. Но математическое ожидание непрерывной случайной величины также связано с её средним значением.

Чтобы находить математическое ожидание и дисперсию непрерывной случайной величины, нужно находить определённые интегралы . Если дана функция плотности непрерывной случайной величины, то она непосредственно входит в подынтегральное выражение. Если дана функция распределения вероятностей, то, дифференцируя её, нужно найти функцию плотности.

Арифметическое среднее всех возможных значений непрерывной случайной величины называется её математическим ожиданием , обозначаемым или .