Расчет доверительного интервала в excel
Пример использования функции MS EXCEL ДОВЕРИТ для расчёта доверительный интервала единичного и среднего
Функция ДОВЕРИТ(рис. 6.1) по данным выборкиопределяет половину доверительного интервала для единичного значения xi генеральной совокупности (аргумент «Размер» = 1, см. рис. 6.1) или для среднего значения выборки (аргумент «Размер» равен объёму выборки n).
Рис. 6.1. Аргументы функции ДОВЕРИТ
Выборочное среднее является серединой этого интервала, следовательно, доверительный интервал определяется как (
±
), где
— результат расчёта с использованием функции ДОВЕРИТ. Например, если
— выборочное среднее значение размера детали, то математическое ожидание генеральной совокупности размера этой детали μ (или единичное значение
, см ниже) с заданной доверительной вероятностью (например, 95%, что соответствует уровню значимости α = 0,05) принадлежит интервалу (
±
). Для любого математического ожидания μ, не принадлежащего интервалу (
±
), вероятность того, что выборочное среднее
(или единичное значение
, см ниже) отличается от μ более чем на
, меньше заданной доверительной вероятности (
Величина ДОВЕРИТ зависит от величины СКО, заданной вероятности и размера выборки. Зависимость от n определяется выражением:
(6.3)
где — результат расчёта функции ДОВЕРИТ для выборки размером n,
— результат расчёта функции ДОВЕРИТ для единичного значения.
То есть результат расчёта функции ДОВЕРИТ для единичного значения в
раз больше, чем ДОВЕРИТ для среднего значения выборки, т.к. таким же образом различаются их стандартные отклонения, см. формулу 3.7.
Пример 1.Выполнить расчёт величины доверительного интервала единичного и выборочного среднего размера детали с использованием функции MS EXCEL ДОВЕРИТ по данным примера предыдущего параграфа: σ = 0,03 мм, g = 0,95 (α =0,05), n = 36.
Подставляем в аргументы функции ДОВЕРИТ (см. рис. 6.1) σ, α и «размер»
Получаем для единичного (размер n = 1) и среднего (размер n = 36) следующие значения величины доверительного интервала:
Как рассчитать доверительный интервал в Excel
Алгоритм расчета доверительного интервала
Основной задачей данного расчета является избежать погрешностей точечной оценки. Более целесообразно находить возможный интервал данных, в которых может находиться искомая величина. То есть с помощью доверительного интервала можно сделать более точный статистический вывод о вероятности нахождения определенного параметра в определенном массиве данных.
Программа Excel предоставляет возможность определить, какой будет доверительный интервал при известной дисперсии, путем применения алгоритма функции ДОВЕРИТ. НОРМ, а также с помощью ДОВЕРИТ. СТЮДЕНТ функции вычислить доверительный интервал при неизвестной дисперсии. В этих двух вариантах и заключаются возможности Excel решать подобные задачи.
Рассмотрим вариант с известной дисперсией.
Следует сказать, что в более ранних версиях Excel существовала только одна функция под названием ДОВЕРИТ, и все ниже описанные функции являются производными от этой функции, которые стало возможно применять только в Excel версии 2010 года.
Рассматриваемая формула решения призвана решать задачи по определению доверительного интервала в условиях нормального распределения средней генеральной совокупности.
Ниже на рисунке показан синтаксис аргумента функции, а также расшифровка данных.
Если посмотреть синтаксис функции ДОВЕРИТ и сравнить его с синтаксисом ДОВЕРИТ.НОРМ, то мы увидим, что разница между ними только в названии. Основные аргументы предложенных к сравнению функций одни и те же.
Пример расчета доверительного интервала
В нашем примере количество испытаний равно 12, у всех испытаний различные данные результата. Все они отображены в табличной форме. Эти данные и есть та самая совокупность данных. Значение стандартного отклонения равно восьми.
Уровень доверия при расчете доверительного интервала берем в процентах и оно равно 97%.
Теперь переходим к манипуляциям в Excel. Нам необходимо определится с ячейкой в которой будет зафиксирован результат вычислений. Выделяем эту ячейку и делаем как показано на рисунке. В окне рядом со значком «функция» вставляем нужную функцию.
Перед нашим взором появится окно. В котором нам необходимо заполнить необходимые и обязательные данные.
На рисунке показано куда вставлять необходимые данные. В первые две строки вставляем значения Альфа=0.003, в станд_откл вставляем 8. Со следующей строкой вроде тоже все понятно – ставим число двенадцать и вроде все сделано.Однако, что бы постоянно не менять в будущих расчетах эту переменную, а она постоянно меняется, предлагаем автоматизировать установку переменного значения.
Для этого в поле «Размер» вставим функцию «СЧЕТ», которая будет определять нужные нам данные автоматически.
Что бы завести «СЧЕТ» и настроить данную функцию, совершаем следующие действия.
1.Курсор мышки наводим на строку «размер» и активируем треугольник, расположенный с левой стороны от формул. После этих действий вы увидите окно с перечнем определенных функций. Нам нужны «другие»
На этом описание создания доверительного интервала с помощью функции ДОВЕРИТ.НОРМ заканчивается.
Другой способ основанный на применении фикции ДОВЕРИТ.СТЮДЕН будет описан в другой статье:
Как рассчитать доверительный интервал в Excel при не известной дисперсии
Функция ДОВЕРИТ
Примечание: Мы стараемся как можно оперативнее обеспечивать вас актуальными справочными материалами на вашем языке. Эта страница переведена автоматически, поэтому ее текст может содержать неточности и грамматические ошибки. Для нас важно, чтобы эта статья была вам полезна. Просим вас уделить пару секунд и сообщить, помогла ли она вам, с помощью кнопок внизу страницы. Для удобства также приводим ссылку на оригинал (на английском языке).
В этой статье описаны синтаксис формулы и использование функции ДОВЕРИТ в Microsoft Excel.
Возвращает доверительный интервал для среднего генеральной совокупности с нормальным распределением.
Доверительный интервал — это диапазон значений. Примерное среднее значение x — это центр этого диапазона, а диапазон — x ± достоверности. Например, если x — это выборочное среднее время доставки продуктов, заказанных по почте, то ДОВЕРИТЕЛЬный интервал x ± является диапазоном Генеральной совокупности. Для любого математического ожидания Генеральной совокупности, μ0 в этом диапазоне, вероятность получения выборочного среднего из μ0, чем x, больше альфа-канала; для любого математического ожидания Генеральной совокупности, μ0, а не в этом диапазоне, вероятность получения выборочного среднего из μ0, чем x, меньше альфа-канала. Другими словами, предположим, что мы используем x, стандартное_откл и size для создания двустороннего теста на уровне значимости предположения о том, что среднее Генеральной совокупности — μ0. Затем мы не будем отклонять эту гипотезу, если μ0 находится в пределах доверительного интервала и отклонили эту гипотезу, если μ0 не находится в пределах доверительного интервала. Доверительный интервал не позволяет нам определить вероятность 1 – альфа-канала, после которого наш следующий пакет займет время доставки в течение доверительного интервала.
Важно: Эта функция была заменена одной или несколькими новыми функциями, которые обеспечивают более высокую точность и имеют имена, лучше отражающие их назначение. Хотя эта функция все еще используется для обеспечения обратной совместимости, она может стать недоступной в последующих версиях Excel, поэтому мы рекомендуем использовать новые функции.
Чтобы узнать больше о новых функциях, см. в разделах Функция ДОВЕРИТ.НОРМ и Функция ДОВЕРИТ.СТЬЮДЕНТ.
Аргументы функции ДОВЕРИТ описаны ниже.
Альфа — обязательный аргумент. Уровень значимости, используемый для вычисления доверительного уровня. Доверительный уровень равен 100*(1 — альфа) процентам или, иными словами, значение аргумента «альфа», равное 0,05, означает 95-процентный доверительный уровень.
Стандартное_откл — обязательный аргумент. Стандартное отклонение генеральной совокупности для диапазона данных, предполагается известным.
Размер — обязательный аргумент. Размер выборки.
Если какой-либо из аргументов не является числом, функция доВЕРИТ возвращает #VALUE! значение ошибки #ЧИСЛО!.
Если альфа-канал ≤ 0 или ≥ 1, то функция доВЕРИТ Возвращает #NUM! значение ошибки #ЧИСЛО!.
Если стандартное_откл ≤ 0, то функция доВЕРИТ Возвращает #NUM! значение ошибки #ЧИСЛО!.
Если значение аргумента «размер» не является целым числом, оно усекается.
Если размер _Лт_ 1, то функция доВЕРИТ Возвращает #NUM! значение ошибки #ЧИСЛО!.
Если предположить, что альфа = 0,05, то нужно вычислить область под стандартной нормальной кривой, которая равна (1 — альфа), или 95 процентам. Это значение равно ± 1,96. Следовательно, доверительный интервал определяется по формуле:
Скопируйте образец данных из следующей таблицы и вставьте их в ячейку A1 нового листа Excel. Чтобы отобразить результаты формул, выделите их и нажмите клавишу F2, а затем — клавишу ВВОД. При необходимости измените ширину столбцов, чтобы видеть все данные.
Функция ДОВЕРИТ и нормальный доверительный интервал в Excel
Функция ДОВЕРИТ в Excel предназначена для определения доверительного интервала для среднего значения, найденного для генеральной совокупности, которая имеет нормальное распределение.
Другими словами, рассматриваемая функция позволяет определить допустимые отклонения для найденного среднего значения с учетом известных уровня значимости (заданная вероятность того, что некоторое значение находится в доверительном интервале) и стандартного отклонения (меры степени разброса значений относительно среднего значения для генеральной совокупности).
Как построить доверительный интервал нормального распределения в Excel
Поскольку интервал значений, в котором находится некоторая неизвестная величина, совпадает с областью, в которой могут изменяться значения этой величины, то вероятность правильности оценки данной величины стремится к нулю. Поэтому, принято устанавливать определенное значение вероятности для нахождения границ изменения некоторой величины. Значения, находящиеся между этими границами, называют доверительным интервалом.
Рассматриваемая функция была заменена функцией ДОВЕРИТ.НОРМ с версии Excel 2010. Функция ДОВЕРИТ была оставлена для обеспечения совместимости с документами, созданными в более ранних версиях табличного редактора.
Пример расчета доверительного интервала в Excel
Пример 1. В заводском цехе производят деталь, длина которой должна составлять 200 мм. Стандартное отклонение от длины – 3,6 мм. Для контроля качества деталей из партии (генеральная совокупность) делают выборку из 25 деталей. Определить интервал с доверительный уровнем 95%.
Вид таблицы данных:
Для определения доверительного интервала используем функцию:
- 1-B2 – уровень значимости (рассчитан с учетом зависимости от доверительного уровня);
- B3 – значение стандартного отклонения;
- B4 – количество деталей в выборке.
То есть, границы доверительного интервала соответствуют: (Xср-1,4112;Xср+1,4112). Допустим, было определено среднее значение выборки – 199,5 мм. Тогда доверительный интервал примерно определяется как (198,1;200,9), при этом номинальная длина детали (200 мм) находится в доверительном диапазоне, то есть производственный процесс не нарушен.
Как найти границы доверительного интервала в Excel
Пример 2. Были проведены опыты по определению скорости распространения звуковой волны в воздухе. Результаты 10 опытов записаны в таблицу. Определить левую и правую границы доверительного интервала для среднего значения.
Вид таблицы данных:
Для нахождения левой границы используем формулу:
В данном случае выборка и генеральная совокупность приняты как имеющиеся данные для 10 проведенных опытов. Среднее выборочное значение рассчитано с помощью функции СРЗНАЧ. Для получения левой границы доверительного интервала из данного значения вычитаем число, полученное в результате выполнения функции ДОВЕРИТ, в которой значение второго аргумента определено с помощью функции СТАНДОТКЛОН.Г, а число опытов – подсчетом количества ячеек функцией СЧЁТЗ.
Поскольку уровень значимости не задан, используем стандартное значение – 0,05.
Правая граница определяется аналогично с разницей в том, что к среднему значению выборки прибавляется результат расчета функции ДОВЕРИТ:
Как посчитать доверительный интервал по функции ДОВЕРИТ в Excel
Функция имеет следующую синтаксическую запись:
- альфа – обязательный, принимает числовое значение, характеризующее уровень значимости – вероятность отклонения нулевой (неверной) гипотезы в том случае, когда она на самом деле верна. Определяется как 1-, где — уровень доверия (вероятность нахождения истинного значения некоторой оцениваемой величины в определенном интервале, называемом доверительным).
- стандартное_откл – обязательный, принимает значение стандартного отклонения величины для генеральной совокупности значений (в Excel предусмотрена функция для определения этой величины — СТАНДОТКЛОН.Г).
- размер – обязательный, принимает числовое значение, характеризующее количество точек данных в анализируемой выборке (ее размер).
- Все аргументы функции должны указываться в виде числовых значений или данных, которые могут быть преобразованы в числа (например, текстовые строки с числами, логические ИСТИНА, ЛОЖЬ). В противном случае результатом выполнения функции ДОВЕРИТ будет код ошибки #ЧИСЛО!
- Аргумент альфа должен быть указан числовым значением из диапазона от 0 до 1 (оба включительно). Иначе функция ДОВЕРИТ вернет код ошибки #ЧИСЛО! Аналогичная ошибка возникает в случаях, когда аргумент стандартное_откл задан числом, взятым из диапазона отрицательных значений или нулем.
- Диапазон допустимых значений для аргумента размер – от 1 до бесконечности со знаком плюс.
Расчет доверительного интервала в excel
Из данной статьи вы узнаете:
Что такое доверительный интервал?
Как его самостоятельно рассчитать в Excel? Инструкция с пошаговым описанием и файл с примером!
В чем суть правила 3-х сигм?
Как можно применить эти знания на практике?
В наше время из-за переизбытка информации, связанного с большим ассортиментом товаров, направлений продаж, сотрудников, направлений деятельности и т.д., бывает трудно выделить главное, на что, в первую очередь, стоит обратить внимание и приложить усилия для управления. Определение доверительного интервала и анализ выхода за его границы фактических значений — методика, которая поможет вам выделить ситуации, влияющие на изменение тенденций. Вы сможете развивать позитивные факторы и снизить влияние негативных. Данная технология применяется во многих известных мировых компаниях.
Существуют так называемые «оповещения», которые информируют руководителей о том, что очередное значение в определенном направлении вышло за доверительный интервал. Что это означает? Это сигнал, что произошло какое-то нестандартное событие, которое, возможно, изменит существующую тенденцию в данном направлении. Это сигнал к тому, чтобы разобраться в ситуации и понять, что на неё повлияло.
Например, рассмотрим несколько ситуаций. Мы рассчитали прогноз продаж с границами прогноза по 100 товарным позициям на 2011 год по месяцам и в марте фактические продажи:
- По «Подсолнечному маслу» пробили верхнюю границу прогноза и не попали в доверительный интервал.
- По «Сухим дрожжам» вышли за нижнюю границу прогноза.
- По «Овсяным Кашам» пробили верхнюю границу.
По остальным товарам фактические продажи оказались в рамках заданных границ прогноза. Т.е. их продажи оказались в рамках ожиданий. Итак, мы выделили 3 товара, которые вышли за границы, и начали разбираться, что же повлияло на выход за границы:
- По «Подсолнечному маслу» мы вошли в новую торговую сеть, которая дала нам дополнительный объем продаж, что привело к выходу за верхнюю границу. Для этого товара стоит пересчитать прогноз до конца года с учетом прогноза продаж в данную сеть.
- По «Сухим дрожжам» машина застряла на таможне, и образовался дефицит в рамках 5 дней, что повлияло на снижение продаж и выход за нижнюю границу. Возможно, стоит разобраться, что послужило причиной и постараться не повторять данную ситуацию.
- По «Овсяным Кашам» было запущено мероприятие по стимулированию сбыта, которое дало значительный прирост продаж и привело к выходу за границы прогноза.
Мы выделили 3 фактора, которые повлияли на выход за границы прогноза. В жизни их может быть гораздо больше.Для повышения точности прогнозирования и планирования факторы, которые приводят к тому, что фактические продажи могут выйти за границы прогноза, стоит выделить и строить прогнозы и планы по ним отдельно. А затем учитывать их влияние на основной прогноз продаж. Также можно регулярно оценивать влияние данных факторов и менять ситуацию к лучшему за счет уменьшения влияния негативных и увеличения влияния позитивных факторов.
С помощью доверительного интервала мы можем:
- Выделить направления, на которые стоит обратить внимание, т.к. в этих направлениях произошли события, которые могут повлиять на изменение тенденции.
- Определить факторы, которые реально влияют на изменение ситуации.
- Принять взвешенное решение (например, о закупках, при планировании и т.д.).
Теперь рассмотрим, что такое доверительный интервал и как его рассчитать в Excel на примере.
Что такое доверительный интервал?
Доверительный интервал – это границы прогноза (верхняя и нижняя), в рамки которых с заданной вероятностью (сигма) попадут фактические значения.
Т.е. мы рассчитываем прогноз — это наш основной ориентир, но мы понимаем, что фактические значения вряд ли на 100% будут равны нашему прогнозу. И возникает вопрос, в какие границы могут попасть фактические значения, если существующая тенденция сохранится? И на этот вопрос нам поможет ответить расчет доверительного интервала, т.е. — верхней и нижней границы прогноза.
Что такое заданная вероятность сигма?
При расчете доверительного интервала мы можем задать вероятность попадания фактических значений в заданные границы прогноза. Как это сделать? Для этого мы задаем значение сигма и, если сигма будет равна:
3 сигма — то, вероятность попадания очередного фактического значения в доверительный интервал составят 99,7%, или 300 к 1, или существует 0,3% вероятности выхода за границы.
2 сигма — то, вероятность попадания очередного значения в границы составляет ≈ 95,5 %, т.е. шансы примерно 20 к 1, или существует 4,5% вероятности выхода за границы.
1 сигма — то, вероятность ≈ 68,3%, т.е. шансы примерно 2 к 1, или существует 31,7% вероятность того, что очередное значение выйдет за пределы доверительного интервала.
Мы сформулировали правило 3 сигм, которое гласит, что вероятность попадания очередного случайного значения в доверительный интервал с заданным значением три сигма составляет 99.7%.
Великим русским математиком Чебышевым была доказана теорема о том, что существует 10% вероятность выхода за границы прогноза с заданным значением три сигма. Т.е. вероятность попадания в доверительный интервал 3 сигма составит минимум 90%, в то время как попытка рассчитать прогноз и его границы «на глазок» чревата куда более существенными ошибками.
Как самостоятельно рассчитать доверительный интервал в Excel?
Расчет доверительного интервала в Excel (т.е. верхней и нижней границы прогноза) рассмотрим на примере. У нас есть временной ряд — продажи по месяцам за 5 лет. См. Вложенный файл.
Для расчета границ прогноза рассчитаем:
- Прогноз продаж (см. статью «Как самостоятельно рассчитать прогноз продаж с учетом роста и сезонностью»).
- Сигма — среднеквадратическое отклонение модели прогноза от фактических значений.
- Три сигма.
- Доверительный интервал.
1. Прогноз продаж.
О том, «как рассчитать прогноз продаж с учетом роста и с сезонностью» подробно описано в данной статье. Поэтому для тех, кто еще не изучал данный материал и не знает, как самостоятельно рассчитать прогноз продаж по месяцам с учетом роста и сезонности, рекомендуем для понимания последующих действий изучить данную статью, а затем перейти к дальнейшему изучению данного материала.
2. Для определения сигма рассчитаем среднеквадратическое отклонение модели прогноза от фактических значений.
Для расчета сигма рассчитаем среднеквадратическое отклонение для каждого месяца.
1. Для этого на 7-м шаге во вложенном файле рассчитаем значения прогнозной модели, в нашем случае это прогноз с линейным трендом и сезонностью.
Значение модели = Значение тренда умножим на коэффициент сезонности соответствующего месяца.
В Excel введем формулу:
=RC[-11] (ссылка на тренд) *ВПР(RC[-1];R8C9:R19C10;2;0) (формула ВПР со ссылкой на коэффициент сезонности соответствующего месяца)
2. Рассчитаем квадрат разницы фактических значений и прогнозной модели (Xi-Ximod)^2 (8 этап во вложенном файле)
=(RC[-14] (данные во временном ряду) — RC[-1] (значение модели) )^2 (в квадрате)
3. Просуммируем для каждого месяца значения отклонений из 8 этапа Сумма((Xi-Ximod)^2), т.е. просуммируем январи, феврали. для каждого года.
Для этого воспользуемся формулой =СУММЕСЛИ()
=СУММЕСЛИ(массив с номерами периодов внутри цикла (для месяцев от 1 до 12);ссылка на номер периода в цикле; ссылка на массив с квадратами разницы исходных данных и значений периодов)
4. Рассчитаем среднеквадратическое отклонение для каждого периода в цикле от 1 до 12 (10 этап во вложенном файле).
Для этого из значения рассчитанного на 9 этапе мы извлекаем корень и делим на количество периодов в этом цикле минус 1 = КОРЕНЬ((Сумма(Xi-Ximod)^2/(n-1))
Воспользуемся формулами в Excel =КОРЕНЬ(R8 (ссылка на (Сумма(Xi-Ximod)^2) /(СЧЁТЕСЛИ($O$8:$O$67 (ссылка на массив с номерами цикла) ; O8 (ссылка на конкретный номер цикла, которые считаем в массиве) )-1))
С помощью формулы Excel = СЧЁТЕСЛИ мы считаем количество n
Рассчитав среднеквадратическое отклонение фактических данных от модели прогноза, мы получили значение сигма для каждого месяца — этап 10 во вложенном файле.
3. Рассчитаем 3 сигма.
На 11 этапе задаем количество сигм — в нашем примере «3» (11 этап во вложенном файле):
Также удобные для практики значения сигма:
1,64 сигма — 10% вероятность выхода за предел (1 шанс из 10);
1,96 сигма — 5% вероятность выхода за пределы (1 шанс из 20);
2,6 сигма — 1% вероятность выхода за пределы (1 шанс из 100).
5) Рассчитываем три сигма, для этого мы значения «сигма» для каждого месяца умножаем на «3».
3.Определяем доверительный интервал.
- Верхняя граница прогноза — прогноз продаж с учетом роста и сезонности + (плюс) 3 сигма;
- Нижняя граница прогноза — прогноз продаж с учетом роста и сезонности – (минус) 3 сигма;
Для удобства расчета доверительного интервала на длительный период (см. вложенный файл) воспользуемся формулой Excel =Y8+ВПР(W8;$U$8:$V$19;2;0) , где
Y8 — прогноз продаж;
W8 — номер месяца, для которого будем брать значение 3-х сигма;
$U$8:$V$19 — таблица, из которой с помощью функции =ВПР извлекаем значение 3-х сигма, соответствующее данному месяцу, фиксируем ссылку на таблицу с помощью F4, подробнее в статье «Как зафиксировать ссылку в Excel».
Т.е. Верхняя граница прогноза = «прогноз продаж» + «3 сигма» (в примере, ВПР(номер месяца; таблица со значениями 3-х сигма; столбец, из которого извлекаем значение сигма равное номеру месяца в соответствующей строке;0)).
Нижняя граница прогноза = «прогноз продаж» минус «3 сигма».
Итак, мы рассчитали доверительный интервал в Excel.
Теперь у нас есть прогноз и диапазон с границами в пределах, которого с заданной вероятностью сигма попадут фактические значения.
В данной статье мы рассмотрели, что такое сигма и правило трёх сигм, как определить доверительный интервал и для чего вы можете использовать данную методику на практике.
Точных вам прогнозов и успехов!
Чем Forecast4AC PRO может вам помочь при расчете доверительного интервала?:
Forecast4AC PRO автоматически рассчитает верхнюю или нижнюю границы прогноза для более чем 1000 временных рядов одновременно;
Возможность анализа границ прогноза в сравнении с прогнозом, трендом и фактическими продажами на графике одним нажатием клавиши;
+ В программе Forcast4AC PRO есть возможность задать значение сигма от 1 до 3.
Присоединяйтесь к нам!
Скачивайте бесплатные приложения для прогнозирования и бизнес-анализа:
- Novo Forecast Lite — автоматический расчет прогноза в Excel .
- 4analytics — ABC-XYZ-анализ и анализ выбросов в Excel.
- Qlik Sense Desktop и QlikView Personal Edition — BI-системы для анализа и визуализации данных.
Тестируйте возможности платных решений:
- Novo Forecast PRO — прогнозирование в Excel для больших массивов данных.
Получите 10 рекомендаций по повышению точности прогнозов до 90% и выше.