Доверительный интервал для математического ожидания формула. Доверительный интервал для математического ожидания
Для начала напомним следующее определение:
Будем рассматривать следующую ситуацию. Пусть варианты генеральной совокупности имеет нормальное распределение с математическим ожиданием $a$ и среднем квадратическим отклонением $\sigma $. Выборочное среднее в данном случае будет рассматриваться как случайная величина. Когда величина $X$ распределена нормально, выборочное среднее будет также иметь нормальное распределение с параметрами
Найдем доверительный интервал, который покрывает величину $a$ с надежностью $\gamma $.
Для этого нам необходимо, чтобы выполнялось равенство
Из нее получим
Отсюда мы можем легко найти $t$ по таблицы значений функции $Ф\left(t\right)$ и, как следствие, найти $\delta $.
Напомним таблицу значений функции $Ф\left(t\right)$:
Рисунок 1. Таблица значений функции $Ф\left(t\right).$
Доверительный интеграл для оценки математического ожидания при неизвестном ${\mathbf \sigma }$
В этом случае мы будем пользоваться значением исправленной дисперсии $S^2$. Заменяя в выше выведенной формуле $\sigma $ на $S$, получим:
Пример задач на нахождение доверительного интервала
Пример 1
Пусть величина $X$ имеет нормальное распределение с дисперсией $\sigma =4$. Пусть объем выборки $n=64$, а надежность равна $\gamma =0,95$. Найти доверительный интервал для оценки математического ожидания данного распределения.
Нам необходимо найти интервал ($\overline{x}-\delta ,\overline{x}+\delta)$.
Как мы видели выше
\[\delta =\frac{\sigma t}{\sqrt{n}}=\frac{4t}{\sqrt{64}}=\frac{\ t}{2}\]
Параметр $t$ найдем из формулы
\[Ф\left(t\right)=\frac{\gamma }{2}=\frac{0,95}{2}=0,475\]
Из таблицы 1 получаем, что $t=1,96$.
Пусть случайая величина Х генеральной совокупности распределена нормально, учитывая, что дисперсия и среднее квадратическое отклонение s этого распределения известны. Требуется оценить неизвестное математическое ожидание по выборочной средней. В данном случае задача сводится к нахождению доверительного интервала для математического ожидания с надёжностью b. Если задаться значением доверительной вероятности (надёжности) b, то можно найти вероятность попадания в интервал для неизвестного математического ожидания, используя формулу (6.9а):
где Ф(t ) – функция Лапласа (5.17а).
В результате можно сформулировать алгоритм отыскания границ доверительного интервала для математического ожидания, если известна дисперсия D = s 2:
- Задать значение надёжности – b .
- Из (6.14) выразить Ф(t) = 0,5× b. Выбрать значение t из таблицы для функции Лапласа по значению Ф(t) (см. Приложение 1).
- Вычислить отклонение e по формуле (6.10).
- Записать доверительный интервал по формуле (6.12) такой, что с вероятностью b выполняется неравенство:
|
Пример 5 .
Случайная величина Х имеет нормальное распределение. Найти доверительные интервалы для оценки с надежностью b = 0,96 неизвестного математического ожидания а, если даны:
1) генеральное среднее квадратическое отклонение s = 5;
2) выборочная средняя ;
3) объём выборки n = 49.
В формуле (6.15) интервальной оценки математического ожидания а с надёжностью b все величины, кроме t, известны. Значение t можно найти, используя (6.14): b = 2Ф(t) = 0,96. Ф(t) = 0,48.
По таблице Приложения 1 для функции Лапласа Ф(t) = 0,48 находят соответствующее значение t = 2,06. Следовательно, . Подставив в формулу (6.12) вычисленное значение e, можно получить доверительный интервал: 30-1,47 < a < 30+1,47.
Искомый доверительный интервал для оценки с надёжностью b = 0,96 неизвестного математического ожидания равен: 28,53 < a < 31,47.
Пусть произведена выборка из генеральной совокупности, подчиненной закону нормального распределения X N(m ; ). Это основное предположение математической статистики основано на центральной предельной теореме. Пусть известно генеральное среднее квадратическое отклонение , но неизвестно математическое ожидание теоретического распределения m (среднее значение ).
В
таком случае среднее выборочное
,
полученное в ходе эксперимента (п.3.4.2),
также будет являться случайной величиной
m
;
).
Тогда «нормализованное» отклонение
N(0;1)
– является стандартной нормальной
случайной величиной.
Задача состоит в поиске интервальной оценки для m . Построим двусторонний доверительный интервал для m так, чтобы истинное математическое ожидание принадлежало ему с заданной вероятностью (надежностью) .
Установить
такой интервал для величины
– это значит найти максимальное значение
этой величины
и минимальное
,
которые являются границам критической
области:
.
Т.к.
такая вероятность равна
,
то корень этого уравнения
можно найти с помощью таблиц функции
Лапласа (Таблица 3, приложение 1).
Тогда
с вероятностью
можно утверждать, что случайная величина
,
то есть искомое генеральное среднее
принадлежит интервалу
.
(3.13)
Величину(3.14)
называют точностью оценки.
Число
– квантиль
нормального распределения – можно
найти как аргумент функции Лапласа
(Таблица 3, приложение 1), учитывая
соотношение 2Ф(u
)=
, т.е. Ф(u
)=
.
Обратно,
по заданному значению отклонения
можно найти, с какой вероятностью,
неизвестное генеральное среднее
принадлежит интервалу
.
Для этого нужно вычислить
.
(3.15)
Пусть
из генеральной совокупности извлечена
случайная выборка методом повторного
отбора. Из уравнения
можно найти минимальный
объем
повторной выборки n
,
необходимый для того, чтобы доверительный
интервал с заданной надежностью
не превышал наперед заданного значения
.
Оценку требуемого объема выборки
производят по формуле:
.
(3.16)
Исследуем
точность
оценки
:
1) При возрастании объема выборки n величина уменьшается , и значит, точность оценки увеличивается .
2)
С увеличением
надежности оценки
увеличивается значение аргументаu
(т.к. Ф
(u
)
монотонно возрастает) и значит
увеличивается
.
В таком случае увеличение надежности
уменьшает
точность ее оценки
.
Оценку
(3.17)
называют
классической
(где
t
- некий параметр, зависящий от
и n
),
т.к. она характеризует наиболее часто
встречающиеся законы распределения.
3.5.3 Доверительные интервалы для оценки математического ожидания нормального распределения при неизвестном среднем квадратическом отклонении
Пусть
известно, что генеральная совокупность
подчинена закону нормального распределения
X
N(m
;
),
где величина среднего
квадратического
отклонения
неизвестна.
Для
построения доверительного интервала
оценки генерального среднего в этом
случае используется статистика
,
имеющая распределение Стъюдента с k
=
n
–1
степенями свободы. Это следует из того,
что
N(0;1)
(см. п.3.5.2), а
(см. п.3.5.3) и из определения распределения
Стъюдента (ч.1.п.2.11.2).
Найдем
точность классической оценки распределения
Стъюдента: т.е. найдем t
из формулы (3.17). Пусть вероятность
выполнения неравенства
задана надежностью
:
. (3.18)
Поскольку
T
St(n
-1),
очевидно, что t
зависит от
и n
,
поэтому обычно пишут
.
(3.19)
где
– функция распределения Стъюдента сn
-1
степенями свободы.
Решая
это уравнение относительно m
,
получим интервал
который с надежностью
покрывает неизвестный параметр m
.
Величина t , n -1 , служащая для определения доверительного интервала случайной величины T (n -1), распределенной по Стъюденту с n -1 степенями свободы, называется коэффициентом Стъюдента . Его следует находить по заданным значениям n и из таблиц «Критические точки распределения Стьюдента». (Таблица 6, приложение 1), которые и представляют собой решения уравнения (3.19).
В итоге получаем следующее выражение точности доверительного интервала для оценки математического ожидания (генерального среднего), если неизвестна дисперсия:
(3.20)
Т.о., существует общая формула построения доверительных интервалов для математического ожидания генеральной совокупности:
где точность доверительного интервала в зависимости от известной или неизвестной дисперсии находится по формулам соответственно 3.16. и 3.20.
Задача 10. Проведены некоторые испытания, результаты которых занесены в таблицу:
x i |
Известно,
что они подчиняются закону нормального
распределения с
.
Найти оценкуm
*
для математического ожидания m
,
построить для него 90% доверительный
интервал.
Решение:
Итак, m (2.53;5.47).
Задача 11. Глубина моря измеряется прибором, систематическая ошибка которого равна 0, а случайные ошибки распределяются по нормальному закону, со средним квадратическим отклонением =15м. Сколько надо сделать независимых измерений, чтобы определить глубину с ошибками не более 5м при доверительной вероятности 90%?
Решение:
По условию задачи имеем X N(m ; ), где =15м, =5м, =0.9. Найдем объем n .
1) С заданной надежностью = 0.9 найдем по таблицам 3 (Приложение 1) аргумент функции Лапласа u = 1.65.
2)
Зная заданную точность оценки
=u
=5,
найдем
.
Имеем
.
Поэтому число испытаний n
25.
Задача 12. Выборка температуры t за первые 6 дней января представлена в таблице:
Найти
доверительный интервал для математического
ожидания m
генеральной совокупности с доверительной
вероятностью
и оценить
генеральное стандартное отклонение s
.
Решение:
![](https://i2.wp.com/studfiles.net/html/2706/938/html_hUwwLSnYlc.C9nf/img-4BaCDf.png)
и
.
2)
Несмещённую оценку
найдем по формуле
:
|
|
||||||
| |||||||
|
|
;
;
|
|
||||||
| |||||||
|
|
.
3) Поскольку генеральная дисперсия неизвестна, но известна ее оценка, то для оценки математического ожидания m используем распределение Стъюдента (Таблица 6, приложение 1) и формулу (3.20).
Т.к.
n
1 =n
2 =6,
то
,
,
s
1 =6.85
имеем:
,
отсюда -29.2-4.1<m
1 <
-29.2+4.1.
Поэтому -33.3<m 1 <-25.1.
Аналогично
имеем,
,
s
2 =
4.8,
,
поэтому
–34.9< m 2 < -29.1. Тогда доверительные интервалы примут вид: m 1 (-33.3;-25.1) и m 2 (-34.9;-29.1).
В прикладных науках, например, в строительных дисциплинах, для оценки точности объектов используются таблицы доверительных интервалов, которые приведены в соответствующей справочной литературе.
Пусть CB X образуют генеральную совокупность и в — неизвестный параметр CB X. Если статистическая оценка в * является состоятельной, то чем больше объем выборки, тем точнее получаем значение в. Однако на практике мы имеем выборки не очень большого объема, поэтому не можем гарантировать большую точность.
Пусть в* — статистическая оценка для в. Величина |в* - в| называется точностью оценки. Ясно, что точность является CB, т. к. в* — случайная величина. Зададим малое положительное число 8 и потребуем, чтобы точность оценки |в* - в| была меньше 8, т. е. | в* - в | < 8.
Надежностью g или доверительной вероятностью оценки в по в * называется вероятность g, с которой осуществляется неравенство |в * - в| < 8, т. е.
Обычно надежность g задают наперед, причем, за g берут число, близкое к 1 (0,9; 0,95; 0,99; ...).
Так как неравенство |в * - в| < S равносильно двойному неравенству в* - S < в < в* + 8, то получаем:
Интервал (в * - 8, в* + 5) называется доверительным интервалом, т. е. доверительный интервал покрывает неизвестный параметр в с вероятностью у. Заметим, что концы доверительного интервала являются случайными и изменяются от выборки к выборке, поэтому точнее говорить, что интервал (в * - 8, в * + 8) покрывает неизвестный параметр в, а не в принадлежит этому интервалу.
Пусть генеральная совокупность задана случайной величиной X, распределенной по нормальному закону, причем, среднее квадратическое отклонение а известно. Неизвестным является математическое ожидание а = М (X). Требуется найти доверительный интервал для а при заданной надежности у.
Выборочная средняя
является статистической оценкой для хг = а.
Теорема. Случайная величина хВ имеет нормальное распределение, если X имеет нормальное распределение, и М (ХВ) = а,
А (XВ) = а, где а = у/Б (X), а = М (X). л/и
Доверительный интервал для а имеет вид:
Находим 8.
Пользуясь соотношением
где Ф(г) — функция Лапласа, имеем:
Р { | XВ - а | <8} = 2Ф
таблице значений функции Лапласа находим значение t.
Обозначив
T, получим F(t) = g Так как g задана, то по
Из равенстваНаходим— точность оценки.
Значит, доверительный интервал для а имеет вид:
Если задана выборка из генеральной совокупности X
нГ | к" | X2 | Xm |
n. | n1 | n2 | nm |
n = U1 + ... + nm, то доверительный интервал будет:
Пример 6.35. Найти доверительный интервал для оценки математического ожидания а нормального распределения с надежностью 0,95, зная выборочную среднюю Xb = 10,43, объем выборки n = 100 и среднее квадратическое отклонение s = 5.
Воспользуемся формулой
Вы можете использовать данную форму поиска, чтобы найти нужную задачу. Вводите слово, фразу из задачи или ее номер, если он вам известен.
Доверительные интервалы: список решений задач
Доверительные интервалы: теория и задачи
Общие сведения о доверительных интервалах
Введем кратко понятие доверительного интервала, который
1) оценивает некоторый параметр числовой выборки непосредственно по данным самой выборки,
2) накрывает значение этого параметра с вероятностью γ.
Доверительным интервалом
для параметра X
(при вероятности γ) называется интервал вида , такой что , а значения вычисляются некоторым образом по выборке .
Обычно в прикладных задачах доверительную вероятность берут равной γ = 0,9; 0,95; 0,99.
Рассмотрим некоторую выборку объема n, сделанную из генеральной совокупности, распределенной предположительно по нормальному закону распределения . Покажем, по каким формулам находятся доверительные интервалы для параметров распределения - математического ожидания и дисперсии (среднего квадратического отклонения).
Доверительный интервал для математического ожидания
Случай 1.
Дисперсия распределения известна и равна . Тогда доверительный интервал для параметра a
имеет вид: t
определяется из таблицы распределения Лапласа по соотношению
Случай 2.
Дисперсия распределения неизвестна, по выборке вычислена точечная оценка дисперсии . Тогда доверительный интервал для параметра a
имеет вид:, где - выборочное среднее, вычисленное по выборке, параметр t
определяется из таблицы распределения Стьюдента
Пример. По данным 7 измерений некоторой величины найдены средняя результатов измерений, равная 30 и выборочная дисперсия, равная 36. Найдите границы, в которых с надежностью 0,99 заключено истинное значение измеряемой величины.
Решение.
Найдем . Тогда доверительные границы для интервала, заключающего истинное значение измеряемой величины можно найти по формуле:
, где - выборочное среднее, - выборочная дисперсия. Подставляем все величины и получаем:
Доверительный интервал для дисперсии
Считаем, что вообще говоря, математическое ожидание неизвестно, а известна только точечная несмещенная оценка дисперсии . Тогда доверительный интервал имеет вид:, где
- квантили распределения , определяемые из таблиц.
Пример. По данным 7 испытаний найдено значение оценки для среднеквадратического отклонения s=12 . Найти с вероятностью 0,9 ширину доверительного интервала, построенного для оценки дисперсии.
Решение.
Доверительный интервал для неизвестной дисперсии генеральной совокупности можно найти по формуле:
Подставляем и получаем:
Тогда ширина доверительного интервала равна 465,589-71,708=393,881.
Доверительный интервал для вероятности (доли)
Случай 1.
Пусть в задаче известен объем выборки и выборочная доля (относительная частота) . Тогда доверительный интервал для генеральной доли (истинной вероятности) имеет вид:, где параметр t
определяется из таблицы распределения Лапласа по соотношению .
Случай 2.
Если в задаче дополнительно известен общий объем совокупности , из которой была сделана выборка, доверительный интервал для генеральной доли (истинной вероятности) можно найти по скорректированной формуле:.
Пример. Известно, что Найти границы, в которых с вероятностью заключена генеральная доля.
Решение.
Используем формулу:
Найдем параметр из условия , получим
Подставляем в формулу:
Другие примеры задач по математической статистике вы найдете на странице