Как найти доверительный интервал в статистике. Доверительный интервал для оценки среднего (дисперсия известна) в MS EXCEL

Примером интервальной оценки является доверительный интервал. Доверительный интервал - это отрезок, центром которого является точечная оценка числовой характеристики, включающий истинное значение данной числовой характеристики с заданной вероятностью. Эта вероятность называется доверительной вероятностью. Таким образом, доверительный интервал является мерой точности оценки, а доверительная вероятность характеризует ее достоверность. Размер доверительного интервала зависит от того, каким значением доверительной вероятности задается экспериментатор. Чем больше доверительная вероятность, тем шире должен быть интервал, чтобы с заданной вероятностью включать в себя истинное значение числовой характеристики. Часто выбирают значение доверительной вероятности Р д = 0,95, полагая таким образом, что это значение достаточно велико, чтобы считать, что доверительный интервал “практически всегда” накрывает истинное значение. Только иногда, в случае ответственных и очень ответственных исследований полагают Р д = 0,99 и 0,999 соответственно.

Процедура построения доверительного интервала включает в себя два этапа:

Запись вероятностного утверждения относительно некоторой случайной функции, включающей в себя разность или отношение оценки и числовой характеристики. Такая функция несет информацию о степени близости упомянутых величин. Необходимо, чтобы закон распределения функции был известен;

Вероятностное утверждение преобразуется к виду, при котором границы доверительного интервала числовой характеристики представлены в явном виде.

Примерами функций с известным распределением, которые удовлетворяют необходимым требованиям, являются следующие:

имеющая нормальное распределение, если величина X распределена нормально, а значение s[X] известно;

2) (3.25)

имеющая распределение Стьюдента c m = N-1, если величина X распределена нормально, а значение s[X] заранее неизвестно, но его оценка может быть получена из опытных данных при помощи формулы (3.23);

3) (3.26)

имеющая распределение Пирсона с m = N-1, если величина Х распределена нормально.

Напомним, что параметры распределений m являются числами степеней свободы. Кроме того здесь использованы обозначения: - cреднее арифметическое значение, - среднее квадратическое значение, равное корню квадратному из дисперсии, [X] - оценка среднего кадратического значения, определяемая как корень квадратный из несмещенной оценки дисперсии, N - объем выборки.

Функции Z и t могут быть использованы при построении доверительного интервала для математического ожидания, тогда как при помощи функции c 2 строится доверительный интервал для дисперсии.


Построим доверительный интервал для математического ожидания при условии, что в нашем распоряжении имеются результаты N наблюдений нормально распределенной величины Х, а среднее квадратическое значение заранее известно из независимых наблюдений. Поскольку функция Z распределена нормально, можно использовать соответствующую таблицу для определения значения z a , такого, что за пределами - z a и + z a остается часть площади под кривой распределения в сумме равная a, тогда как в пределах [- z a ,+ z a ] заключена часть площади, равная 1 - a . Только что сказанное соответствует следующему вероятностному утверждению:

Р{- z a ££+z a }= 1-a. (3.27)

(Вероятность выполнения неравенства, заключенного в фигурных скобках, равна 1-a.). Преобразуем выражение в скобках:

Р{- z a }= 1 - a

Назовем величину 1-a = Р д доверительной вероятностью Р д. Согласно (3.28) при этой доверительной вероятности доверительный интервал для М[X] задается пределами:

. (3.29)

Замечание: К сожалению таблицы нормального распределения в разных книгах строятся неодинаково. Иногда приводится интеграл вероятности

Ф(z) =

Свои способности человек может узнать, только попытавшись приложить их. (Сенека)

Доверительные интервалы

Общий обзор

Взяв выборку из популяции, мы получим точечную оценку интересующего нас параметра и вычислим стандартную ошибку для того, чтобы указать точность оценки.

Однако, для большинства случаев стандартная ошибка как такова не приемлема. Гораздо полезнее объединить эту меру точности с интервальной оценкой для параметра популяции.

Это можно сделать, используя знания о теоретическом распределении вероятности выборочной статистики (параметра) для того, чтобы вычислить доверительный интервал (CI - Confidence Interval, ДИ - Доверительный интервал) для параметра.

Вообще, доверительный интервал расширяет оценки в обе стороны некоторой величиной, кратной стандартной ошибке (данного параметра); два значения (доверительные границы), определяющие интервал, обычно отделяют запятой и заключают в скобки.

Доверительный интервал для среднего

Использование нормального распределения

Выборочное среднее имеет нормальное распределение, если объем выборки большой, поэтому можно применить знания о нормальном распределении при рассмотрении выборочного среднего.

В частности, 95% распределения выборочных средних находится в пределах 1,96 стандартных отклонений (SD) среднего популяции.

Когда у нас есть только одна выборка, мы называем это стандартной ошибкой среднего (SEM) и вычисляем 95% доверительного интервала для среднего следующим образом:

Если повторить этот эксперимент несколько раз, то интервал будет содержать истинное среднее популяции в 95% случаев.

Обычно это доверительный интервал как, например, интервал значений, в пределах которого с доверительной вероятностью 95% находится истинное среднее популяции (генеральное среднее).

Хотя это не вполне строго (среднее в популяции есть фиксированное значение и поэтому не может иметь вероятность, отнесённую к нему) таким образом интерпретировать доверительный интервал, но концептуально это удобнее для понимания.

Использование t- распределения

Можно использовать нормальное распределение, если знать значение дисперсии в популяции. Кроме того, когда объем выборки небольшой, выборочное среднее отвечает нормальному распределению, если данные, лежащие в основе популяции, распределены нормально.

Если данные, лежащие в основе популяции, распределены ненормально и/или неизвестна генеральная дисперсия (дисперсия в популяции), выборочное среднее подчиняется t-распределению Стьюдента .

Вычисляем 95% доверительный интервал для генерального среднего в популяции следующим образом:

Где - процентная точка (процентиль) t- распределения Стьюдента с (n-1) степенями свободы, которая даёт двухстороннюю вероятность 0,05.

Вообще, она обеспечивает более широкий интервал, чем при использовании нормального распределения, поскольку учитывает дополнительную неопределенность, которую вводят, оценивая стандартное отклонение популяции и/или из-за небольшого объёма выборки.

Когда объём выборки большой (порядка 100 и более), разница между двумя распределениями (t-Стьюдента и нормальным) незначительна. Тем не менее всегда используют t- распределение при вычислении доверительных интервалов, даже если объем выборки большой.

Обычно указывают 95% ДИ. Можно вычислить другие доверительные интервалы, например 99% ДИ для среднего.

Вместо произведения стандартной ошибки и табличного значения t- распределения, которое соответствует двусторонней вероятности 0,05, умножают её (стандартную ошибку) на значение, которое соответствует двусторонней вероятности 0,01. Это более широкий доверительный интервал, чем в случае 95%, поскольку он отражает увеличенное доверие к тому, что интервал действительно включает среднее популяции.

Доверительный интервал для пропорции

Выборочное распределение пропорций имеет биномиальное распределение. Однако если объём выборки n разумно большой, тогда выборочное распределение пропорции приблизительно нормально со средним .

Оцениваем выборочным отношением p=r/n (где r - количество индивидуумов в выборке с интересующими нас характерными особенностями), и стандартная ошибка оценивается:

95% доверительный интервал для пропорции оценивается:

Если объём выборки небольшой (обычно когда np или n(1-p) меньше 5 ), тогда необходимо использовать биномиальное распределение для того, чтобы вычислить точные доверительные интервалы.

Заметьте, что если p выражается в процентах, то (1-p) заменяют на (100-p) .

Интерпретация доверительных интервалов

При интерпретации доверительного интервала нас интересуют следующие вопросы:

Насколько широк доверительный интервал?

Широкий доверительный интервал указывает на то, что оценка неточна; узкий указывает на точную оценку.

Ширина доверительного интервала зависит от размера стандартной ошибки, которая, в свою очередь, зависит от объёма выборки и при рассмотрении числовой переменной от изменчивости данных дают более широкие доверительные интервалы, чем исследования многочисленного набора данных немногих переменных.

Включает ли ДИ какие-либо значения, представляющие особенный интерес?

Можно проверить, ложится ли вероятное значение для параметра популяции в пределы доверительного интервала. Если да, то результаты согласуются с этим вероятным значением. Если нет, тогда маловероятно (для 95% доверительного интервала шанс почти 5%), что параметр имеет это значение.

Запишите задачу. Например: средний вес студента мужского пола в университете АВС составляет 90 кг . Вы будете тестировать точность предсказания веса студентов мужского пола в университете АВС в пределах данного доверительного интервала.

Составьте подходящую выборку. Вы будете использовать ее для сбора данных для тестирования гипотезы. Допустим, вы уже случайно выбрали 1000 студентов мужского пола.

Рассчитайте среднее значение и стандартное отклонение этой выборки. Выберите статистические величины (например, среднее значение и стандартное отклонение), которые вы хотите использовать для анализа вашей выборки. Вот как вычислить среднее значение и стандартное отклонение:

  • Для расчета среднего значения выборки сложите значения весов 1000 выбранных мужчин и разделите результат на 1000 (число мужчин). Допустим, получили средний вес, равный 93 кг.
  • Для расчета стандартного отклонения выборки необходимо найти среднее значение. Затем нужно вычислить дисперсию данных или среднее значение квадратов разностей от среднего. Найдя это число, просто возьмите квадратный корень из него. Допустим, в нашем примере стандартное отклонение равно 15 кг (заметим, что иногда эта информация может быть дана вместе с условием статистической задачи).
  • Выберите нужный доверительный уровень. Наиболее часто используемые доверительные уровни: 90 %, 95 % и 99 %. Он также может быть дан вместе с условием задачи. Допустим, вы выбрали 95 %.

  • Рассчитайте предел погрешности. Вы можете найти предел погрешности с помощью следующей формулы: Z a/2 * σ/√(n). Z a/2 = коэффициент доверия (где а = доверительный уровень), σ = стандартное отклонение, а n = размер выборки. Это формула показывает, что вы должны умножить критическое значение на стандартную ошибку. Вот как вы можете решить эту формулу, разбив ее на части:

    • Вычислите критическое значение или Z a/2 . Доверительный уровень равен 95 %. Преобразуйте проценты в десятичную дробь: 0,95 и разделите ее на 2, чтобы получить 0,475. Затем посмотрите в таблицу Z-оценок , чтобы найти соответствующее значение для 0,475. Вы найдете значение 1,96 (на пересечении строки 1,9 и столбца 0,06).
    • Возьмите стандартную ошибку (стандартное отклонение): 15 и разделите ее на квадратный корень из размера выборки: 1000. Вы получите: 15/31,6 или 0,47 кг.
    • Умножьте 1,96 на 0,47 (критическое значение на стандартную ошибку), чтобы получить 0,92 - предел погрешности.
  • Запишите доверительный интервал. Чтобы сформулировать доверительный интервал, просто запишите среднее значение (93) ± погрешность. Ответ: 93 ± 0,92. Вы можете найти верхнюю и нижнюю границы доверительного интервала, прибавляя и вычитая погрешность к/от средней величины. Итак, нижняя граница составляет 93 - 0,92 или 92,08, а верхняя граница составляет 93 + 0,92 или 93,92.

    • Вы можете использовать следующую формулу для вычисления доверительного интервала: x̅ ± Z a/2 * σ/√(n) , где x̅ - среднее значение.
  • Доверительный интервал – предельные значения статистической величины, которая с заданной доверительной вероятностью γ будет находится в этом интервале при выборке большего объема. Обозначается как P(θ - ε . На практике выбирают доверительную вероятность γ из достаточно близких к единице значений γ = 0.9 , γ = 0.95 , γ = 0.99 .

    Назначение сервиса . С помощью этого сервиса определяются:

    • доверительный интервал для генерального среднего, доверительный интервал для дисперсии;
    • доверительный интервал для среднего квадратического отклонения, доверительный интервал для генеральной доли;
    Полученное решение сохраняется в файле Word . Ниже представлена видеоинструкция, как заполнять исходные данные.

    Пример №1 . В колхозе из общего стада в 1000 голов овец выборочной контрольной стрижке подверглись 100 овец. В результате был установлен средний настриг шерсти 4,2 кг на одну овцу. Определить с вероятностью 0,99 среднюю квадратическую ошибку выборки при определении среднего настрига шерсти на одну овцу и пределы, в которых заключена величина настрига, если дисперсия равна 2,5 . Выборка бесповторная.
    Пример №2 . Из партии импортируемой продукции на посту Московской Северной таможни было взято в порядке случайной повторной выборки 20 проб продукта «А». В результате проверки установлена средняя влажность продукта «А» в выборке, которая оказалась равной 6 % при среднем квадратическом отклонении 1 %.
    Определите с вероятностью 0,683 пределы средней влажности продукта во всей партии импортируемой продукции.
    Пример №3 . Опрос 36 студентов показал, что среднее количество учебников, прочитанных ими за учебный год, оказалось равным 6. Считая, что количество учебников, прочитанных студентом за семестр, имеет нормальный закон распределения со средним квадратическим отклонением, равным 6, найти: А) с надежностью 0,99 интервальную оценку для математического ожидания этой случайной величины; Б) с какой вероятностью можно утверждать, что среднее количество учебников, прочитанных студентом за семестр, вычисленное по данной выборке, отклонится от математического ожидания по абсолютной величине не больше, чем на 2.

    Классификация доверительных интервалов

    По виду оцениваемого параметра:

    По типу выборки:

    1. Доверительный интервал для бесконечной выборки;
    2. Доверительный интервал для конечной выборки;
    Выборка называется повторной , если отобранный объект перед выбором следующего возвращается в генеральную совокупность. Выборка называется бесповторной , если отобранный объект в генеральную совокупность не возвращается. На практике обычно имеют дело с бесповторными выборками.

    Расчет средней ошибки выборки при случайном отборе

    Расхождение между значениями показателей, полученных по выборке, и соответствующими параметрами генеральной совокупности называется ошибкой репрезентативности .
    Обозначения основных параметров генеральной и выборочной совокупности.
    Формулы средней ошибки выборки
    повторный отбор бесповторный отбор
    для средней для доли для средней для доли
    Соотношение между пределом ошибки выборки (Δ), гарантируемым с некоторой вероятностью Р(t), и средней ошибкой выборки имеет вид: или Δ = t·μ, где t – коэффициент доверия, определяемый в зависимости от уровня вероятности Р(t) по таблице интегральной функции Лапласа .

    Формулы расчета численности выборки при собственно-случайном способе отбора

    Способ отбора Формулы определения численности выборки
    для средней для доли
    Повторный
    Бесповторный
    Найти численность выборки можно, использовав калькулятор.

    Метод доверительных интервалов

    Алгоритм нахождения доверительного интервала включает следующие шаги:
    1. задается доверительная вероятность γ (надежность).
    2. по выборке определяется оценка параметра a .
    3. из соотношения P(α 1 рассчитывается доверительный интервал (a - ε ; a + ε).

    Пример №1 . При проверке годности партии таблеток (250 шт.) оказалось, что средний вес таблетки 0,3 г, а СКО веса 0,01 г. Найти доверительный интервал, в который с вероятностью 90% попадает норма веса таблетки.
    Решение .

    Пример . По результатам выборочного наблюдения (выборка В приложение) вычислите несмещенные оценки среднего значения, дисперсии и среднего квадратического отклонения генеральной совокупности.
    Скачать решение

    Пример . Найдите доверительные интервалы для оценки среднего значения и среднего квадратического отклонения генеральных совокупностей при доверительной вероятности y, если из генеральных совокупностей сделана выборка В и y.
    Скачать решение

    Пример .

    1. Используя результаты расчетов, выполненных в задании № 2 и полагая, что эти данные получены при помощи собственно-случайного 10-ти процентного бесповторного отбора, определить:
    а) пределы, за которые с доверительной вероятностью 0,954 не выйдет среднее значение признака, рассчитанное по генеральной совокупности;
    б) как нужно изменить объем выборки, чтобы снизить предельную ошибку средней величины на 50%.
    2. Используя результаты расчетов, выполненных в задании № 2 и полагая, что эти данные получены при помощи повторного отбора, определить:
    а) пределы, за которые в генеральной совокупности не выйдет значение доли предприятий, у которых индивидуальные значения признака превышают моду с доверительной вероятностью 0,954;
    б) как изменить объем выборки, чтобы снизить предельную ошибку доли на 20 %.
    Методические указания

    Задание . Поточная линия по производству однотипных деталей подвергалась реконструкции Заданы две выборки отображающие процент брака в партиях деталей выпускаемых на данной линии до и после реконструкции Можно ли достоверно утверждать, что после реконструкции процент брака в партиях деталей снизился?

    Пример . Ниже приведены данные по затратам на бурение (у.е.) для 49 скважин Западно-Сибирской нефтяной базы России:

    129 142 132 61 96 96 142 17 135 32
    77 58 37 132 79 15 145 64 83 120
    11 54 48 100 43 25 67 25 140 130
    48 124 29 107 135 101 93 147 112 121
    89 97 60 84 46 139 43 145 29
    В целях оценки затрат на бурение новой скважины:
    1. провести выборку собственно случайным способом объемом n=5;
    2. определить интервальные значения среднего генеральной совокупности (X) по рассчитанным выборочным показателям (X, s 2) с помощью функции t-распределения Стьюдента при уровне значимости α=0.05;
    3. определить точечное значение среднего генеральной совокупности (X) по исходным данным;
    4. оценить правильность интервальных расчетов, сравнивая точечное значение (X) с интервальным значением, рассчитанным по выборке;
    Решение проводим с помощью этого калькулятора :

    1. Выбираем 5 значений из таблицы. Пусть это будет 3 столбец: 132, 37, 48, 29, 60.
    В разделе «Вид статистического ряда» выбираем Дискретный ряд. В поле Количество строк указываем 5.

    2. Вводим исходные данные.

    В поле Количество групп выбираем пункт «не делать группировку ».

    Поле «Доверительный интервал генерального среднего, дисперсия и среднеквадратическое отклонения » указываем значение γ = 0.95 (что соответствует α=0.05).

    В поле « Выборка » указываем значение 10 (поскольку из 49 значений выбрали 5, что соответствует 10,2% (5/49x100%)).

    В разделе «Выводит в отчет» отмечаем первый пункт «Доверительный интервал для генерального среднего» .

    3. Полученное решение сохраняется в формате Word (скачать).
    Перед расчетами создается предварительная таблица, в которой подсчитывается количество повторений значений Х.

    x (x - x ср) 2
    29 1036.84
    37 585.64
    48 174.24
    60 1.44
    132 5012.64
    306 6810.8
    В данном случае все значения X встречаются ровно один раз. Интервальные значения среднего генеральной совокупности рассчитываются в разделе «Интервальное оценивание центра генеральной совокупности» .
    Примечание : в данном случае в расчетах используется Оценка среднеквадратического отклонения.

    Задание №2 : В целях изучения затрат времени на изготовление одной детали рабочими завода проведена 10% -ная случайная бесповторная выборка, в результате которой получено распределение деталей по затратам времени, представленное в прил. Б.
    На основании этих данных вычислите:
    а) средние затраты времени на изготовление одной детали;
    б) средний квадрат отклонений (дисперсию) и среднее квадратическое отклонение;
    в) коэффициент вариации;
    г) с вероятностью 0,954 предельную ошибку выборочной средней и возможные границы, в которых ожидаются средние затраты времени на изготовление одной детали на заводе;
    д) с вероятностью 0,954 предельную ошибку выборочной доли и границы удельного веса числа деталей с минимальными затратами времени на их изготовление. Перед тем как производить расчеты, необходимо записать условия задачи и заполнить табл. 2.1

    Решение .
    Для получения решения указываем следующие параметры:

    • Вид статистического ряда: Задан дискретный ряд;
    • Количество групп: не делать группировку;
    • Для построения доверительного интервала генерального среднего, дисперсии и среднеквадратического отклонения: y= 0.954 ;
    • Для построения доверительного интервала генеральной доли: y= 0.954 ;
    • Выборка: 10 ;
    • Выводить в отчет: Доверительный интервал для генерального среднего, Доверительный интервал для генеральной доли;

    Задание №3 : Используя результаты расчетов, выполненных в задании №2 и полагая, что эти данные получены при помощи повторного отбора, определить:

    б) как изменить объем выборки, чтобы снизить предельную ошибку доли на 20% .

    Решение .
    Используя результаты расчетов, выполненных в задании № 2 и полагая, что эти данные получены при помощи повторного отбора, определить:
    а) пределы, за которые в генеральной совокупности не выйдет значение доли предприятий, у которых индивидуальные значения признака превышают моду с доверительной вероятностью 0.954 ;
    б) как изменить объем выборки, чтобы снизить предельную ошибку доли на 20%.

    Задание №4 : Из партии электроламп взята 20% -ная случайная бесповторная выборка для определения среднего веса спирали. Результаты выборки следующие. Вес, мг:38-40;40-42;42-44;44-46. Число спиралей:15;30;45;10. Определить с вероятностью 0.95 доверительные пределы, в которых лежит средний вес спирали, для всей партии электроламп.

    Решение .
    Вводим следующие параметры:

    • Вид статистический ряда: Задан интервальный ряд;
    • Для построения доверительного интервала генерального среднего, дисперсии и среднеквадратического отклонения: y = 0.95 ;
    • Выборка: 20 ;
    • Выводить в отчет: Доверительный интервал для генерального среднего.

    Задание №5 : На заводе электроламп из партии продукции в количестве 16000 шт. ламп взято на выборку 1600 шт. (случайный, бесповторный отбор), из которых 40 шт. оказались бракованными. Определить с вероятностью 0.997 пределы, в которых будет находиться процент брака для всей партии продукции.

    Решение .
    Здесь N = 16000 , n = 1600 , w = d / n = 40/1600 = 0.025.

    Построим в MS EXCEL доверительный интервал для оценки среднего значения распределения в случае известного значения дисперсии.

    Разумеется, выбор уровня доверия полностью зависит от решаемой задачи. Так, степень доверия авиапассажира к надежности самолета, несомненно, должна быть выше степени доверия покупателя к надежности электрической лампочки.

    Формулировка задачи

    Предположим, что из генеральной совокупности имеющей взята выборка размера n. Предполагается, что стандартное отклонение этого распределения известно. Необходимо на основании этой выборки оценить неизвестное среднее значение распределения (μ, ) и построить соответствующий двухсторонний доверительный интервал .

    Точечная оценка

    Как известно из , статистика (обозначим ее Х ср ) является несмещенной оценкой среднего этой генеральной совокупности и имеет распределение N(μ;σ 2 /n).

    Примечание : Что делать, если требуется построить доверительный интервал в случае распределения, которое не является нормальным? В этом случае на помощь приходит , которая гласит, что при достаточно большом размере выборки n из распределения не являющемся нормальным , выборочное распределение статистики Х ср будет приблизительно соответствовать нормальному распределению с параметрами N(μ;σ 2 /n).

    Итак, точечная оценка среднего значения распределения у нас есть – это среднее значение выборки , т.е. Х ср . Теперь займемся доверительным интервалом.

    Построение доверительного интервала

    Обычно, зная распределение и его параметры, мы можем вычислить вероятность того, что случайная величина примет значение из заданного нами интервала. Сейчас поступим наоборот: найдем интервал, в который случайная величина попадет с заданной вероятностью. Например, из свойств нормального распределения известно, что с вероятностью 95%, случайная величина, распределенная по нормальному закону , попадет в интервал примерно +/- 2 от среднего значения (см. статью про ). Этот интервал, послужит нам прототипом для доверительного интервала .

    Теперь разберемся,знаем ли мы распределение, чтобы вычислить этот интервал? Для ответа на вопрос мы должны указать форму распределения и его параметры.

    Форму распределения мы знаем – это нормальное распределение (напомним, что речь идет о выборочном распределении статистики Х ср ).

    Параметр μ нам неизвестен (его как раз нужно оценить с помощью доверительного интервала ), но у нас есть его оценка Х ср, вычисленная на основе выборки, которую можно использовать.

    Второй параметр – стандартное отклонение выборочного среднего будем считать известным , он равен σ/√n.

    Т.к. мы не знаем μ, то будем строить интервал +/- 2 стандартных отклонения не от среднего значения , а от известной его оценки Х ср . Т.е. при расчете доверительного интервала мы НЕ будем считать, что Х ср попадет в интервал +/- 2 стандартных отклонения от μ с вероятностью 95%, а будем считать, что интервал +/- 2 стандартных отклонения от Х ср с вероятностью 95% накроет μ – среднее генеральной совокупности, из которого взята выборка . Эти два утверждения эквивалентны, но второе утверждение нам позволяет построить доверительный интервал .

    Кроме того, уточним интервал: случайная величина, распределенная по нормальному закону , с вероятностью 95% попадает в интервал +/- 1,960 стандартных отклонений, а не+/- 2 стандартных отклонения . Это можно рассчитать с помощью формулы =НОРМ.СТ.ОБР((1+0,95)/2) , см. файл примера Лист Интервал .

    Теперь мы можем сформулировать вероятностное утверждение, которое послужит нам для формирования доверительного интервала :
    «Вероятность того, что среднее генеральной совокупности находится от среднего выборки в пределах 1,960 «стандартных отклонений выборочного среднего» , равна 95%».

    Значение вероятности, упомянутое в утверждении, имеет специальное название , который связан с уровнем значимости α (альфа) простым выражением уровень доверия =1 . В нашем случае уровень значимости α=1-0,95=0,05 .

    Теперь на основе этого вероятностного утверждения запишем выражение для вычисления доверительного интервала :

    где Z α/2 стандартного нормального распределения (такое значение случайной величины z , что P (z >=Z α/2 )=α/2 ).

    Примечание : Верхний α/2-квантиль определяет ширину доверительного интервала в стандартных отклонениях выборочного среднего. Верхний α/2-квантиль стандартного нормального распределения всегда больше 0, что очень удобно.

    В нашем случае при α=0,05, верхний α/2-квантиль равен 1,960. Для других уровней значимости α (10%; 1%) верхний α/2-квантиль Z α/2 можно вычислить с помощью формулы =НОРМ.СТ.ОБР(1-α/2) или, если известен уровень доверия , =НОРМ.СТ.ОБР((1+ур.доверия)/2) .

    Обычно при построении доверительных интервалов для оценки среднего используют только верхний α /2-квантиль и не используют нижний α /2-квантиль . Это возможно потому, что стандартное нормальное распределение симметрично относительно оси х (плотность его распределения симметрична относительно среднего, т.е. 0 ). Поэтому, нет нужды вычислять нижний α/2-квантиль (его называют просто α/2-квантиль ), т.к. он равен верхнему α /2-квантилю со знаком минус.

    Напомним, что, не смотря на форму распределения величины х, соответствующая случайная величина Х ср распределена приблизительно нормально N(μ;σ 2 /n) (см. статью про ). Следовательно, в общем случае, вышеуказанное выражение для доверительного интервала является лишь приближенным. Если величина х распределена по нормальному закону N(μ;σ 2 /n), то выражение для доверительного интервала является точным.

    Расчет доверительного интервала в MS EXCEL

    Решим задачу.
    Время отклика электронного компонента на входной сигнал является важной характеристикой устройства. Инженер хочет построить доверительный интервал для среднего времени отклика при уровне доверия 95%. Из предыдущего опыта инженер знает, что стандартное отклонение время отклика составляет 8 мсек. Известно, что для оценки времени отклика инженер сделал 25 измерений, среднее значение составило 78 мсек.

    Решение : Инженер хочет знать время отклика электронного устройства, но он понимает, что время отклика является не фиксированной, а случайной величиной, которая имеет свое распределение. Так что, лучшее, на что он может рассчитывать, это определить параметры и форму этого распределения.

    К сожалению, из условия задачи форма распределения времени отклика нам не известна (оно не обязательно должно быть нормальным ). , этого распределения также неизвестно. Известно только его стандартное отклонение σ=8. Поэтому, пока мы не можем посчитать вероятности и построить доверительный интервал .

    Однако, не смотря на то, что мы не знаем распределение времени отдельного отклика , мы знаем, что согласно ЦПТ , выборочное распределение среднего времени отклика является приблизительно нормальным (будем считать, что условия ЦПТ выполняются, т.к. размер выборки достаточно велик (n=25)).

    Более того, среднее этого распределения равно среднему значению распределения единичного отклика, т.е. μ. А стандартное отклонение этого распределения (σ/√n) можно вычислить по формуле =8/КОРЕНЬ(25) .

    Также известно, что инженером была получена точечная оценка параметра μ равная 78 мсек (Х ср). Поэтому, теперь мы можем вычислять вероятности, т.к. нам известна форма распределения (нормальное ) и его параметры (Х ср и σ/√n).

    Инженер хочет знать математическое ожидание μ распределения времени отклика. Как было сказано выше, это μ равно математическому ожиданию выборочного распределения среднего времени отклика . Если мы воспользуемся нормальным распределением N(Х ср; σ/√n), то искомое μ будет находиться в интервале +/-2*σ/√n с вероятностью примерно 95%.

    Уровень значимости равен 1-0,95=0,05.

    Наконец, найдем левую и правую границу доверительного интервала .
    Левая граница: =78-НОРМ.СТ.ОБР(1-0,05/2)*8/КОРЕНЬ(25)= 74,864
    Правая граница: =78+НОРМ.СТ.ОБР(1-0,05/2)*8/КОРЕНЬ(25)=81,136

    Левая граница: =НОРМ.ОБР(0,05/2; 78; 8/КОРЕНЬ(25))
    Правая граница: =НОРМ.ОБР(1-0,05/2; 78; 8/КОРЕНЬ(25))

    Ответ : доверительный интервал при уровне доверия 95% и σ =8 мсек равен 78+/-3,136 мсек.

    В файле примера на листе Сигма известна создана форма для расчета и построения двухстороннего доверительного интервала для произвольных выборок с заданным σ и уровнем значимости .

    Функция ДОВЕРИТ.НОРМ()

    Если значения выборки находятся в диапазоне B20:B79 , а уровень значимости равен 0,05; то формула MS EXCEL:
    =СРЗНАЧ(B20:B79)-ДОВЕРИТ.НОРМ(0,05;σ; СЧЁТ(B20:B79))
    вернет левую границу доверительного интервала .

    Эту же границу можно вычислить с помощью формулы:
    =СРЗНАЧ(B20:B79)-НОРМ.СТ.ОБР(1-0,05/2)*σ/КОРЕНЬ(СЧЁТ(B20:B79))

    Примечание : Функция ДОВЕРИТ.НОРМ() появилась в MS EXCEL 2010. В более ранних версиях MS EXCEL использовалась функция ДОВЕРИТ() .

    Читайте также: