Рассмотрим вычисление квантилей для некоторых функций распределений, представленных в MS EXCEL .
Понятие Квантиля основано на определении Функции распределения . Поэтому, перед изучением Квантилей рекомендуем освежить в памяти понятия из статьи Функция распределения вероятности .
Сначала дадим формальное определение квантиля, затем приведем примеры их вычисления в MS EXCEL.
Определение
Пусть случайная величина X , имеет функцию распределения F ( x ). α-квантилем ( альфа- квантиль, x a , квантиль порядка α, нижний α- квантиль ) называют решение уравнения x a =F -1 (α), где α — вероятность, что случайная величина х примет значение меньшее или равное x a , т.е. Р(х файл примера Лист Определение ):
Примечание : О построении графиков в MS EXCEL можно прочитать статью Основные типы диаграмм в MS EXCEL .
Например, с помощью графика вычислим 0,21-ю квантиль , т.е. такое значение случайной величины, что Р(X Примечание : При вычислении квантилей в MS EXCEL используются обратные функции распределения : НОРМ.СТ.ОБР() , ЛОГНОРМ.ОБР() , ХИ2.ОБР(), ГАММА.ОБР() и т.д. Подробнее о распределениях, представленных в MS EXCEL, можно прочитать в статье Распределения случайной величины в MS EXCEL .
Точное значение квантиля в нашем случае можно найти с помощью формулы =НОРМ.СТ.ОБР(0,21)
СОВЕТ : Процедура вычисления квантилей имеет много общего с вычислением процентилей выборки (см. статью Процентили в MS EXCEL ).
Квантили специальных видов
Часто используются Квантили специальных видов:
В качестве примера вычислим медиану (0,5-квантиль) логнормального распределения LnN(0;1) (см. файл примера лист Медиана ).
Это можно сделать с помощью формулы =ЛОГНОРМ.ОБР(0,5; 0; 1)
Квантили стандартного нормального распределения
Необходимость в вычислении квантилей стандартного нормального распределения возникает при проверке статистических гипотез и при построении доверительных интервалов.
Примечание : Про проверку статистических гипотез см. статью Проверка статистических гипотез в MS EXCEL . Про построение доверительных интервалов см. статью Доверительные интервалы в MS EXCEL .
В данных задачах часто используется специальная терминология:
- Нижний квантиль уровняальфа ( α percentage point) ;
- Верхний квантиль уровня альфа (upper α percentage point) ;
- Двусторонние квантили уровняальфа .
Нижний квантиль уровня альфа — это обычный α-квантиль. Чтобы пояснить название « нижний» квантиль , построим график плотности вероятности и функцию вероятности стандартного нормального распределения (см. файл примера лист Квантили ).
Выделенная площадь на рисунке соответствует вероятности, что случайная величина примет значение меньше α-квантиля . Из определения квантиля эта вероятность равна α . Из графика функции распределения становится понятно, откуда происходит название " нижний квантиль" — выделенная область расположена в нижней части графика.
Для α=0,05, нижний 0,05-квантиль стандартного нормального распределения равен -1,645. Вычисления в MS EXCEL можно сделать по формуле:
Однако, при проверке гипотез и построении доверительных интервалов чаще используется "верхний" α-квантиль. Покажем почему.
Верхним α — квантилем называют такое значение x α , для которого вероятность, того что случайная величина X примет значение больше или равное x α равна альфа: P(X>= x α )= α . Из определения понятно, что верхний альфа — квантиль любого распределения равен нижнему (1- α) — квантилю. А для распределений, у которых функция плотности распределения является четной функцией, верхний α — квантиль равен нижнему α — квантилю со знаком минус . Это следует из свойства четной функции f(-x)=f(x), в силу симметричности ее относительно оси ординат.
Действительно, для α=0,05, верхний 0,05-квантиль стандартного нормального распределения равен 1,645. Т.к. функция плотности вероятности стандартного нормального распределения является четной функцией, то вычисления в MS EXCEL верхнего квантиля можно сделать по двум формулам:
Чтобы пояснить название « верхний» квантиль , построим график плотности вероятности и функцию вероятности стандартного нормального распределения для α=0,05.
Выделенная площадь на рисунке соответствует вероятности, что случайная величина примет значение больше верхнего 0,05-квантиля , т.е. больше значения 1,645. Эта вероятность равна 0,05.
На графике плотности вероятности площадь выделенной области равна 0,05 (5%) от общей площади под графиком (равна 1). Из графика функции распределения становится понятно, откуда происходит название "верхний" квантиль — выделенная область расположена в верхней части графика. Если Z больше верхнего квантиля , т.е. попадает в выделенную область, то нулевая гипотеза отклоняется.
Также при проверке двухсторонних гипотез и построении соответствующих доверительных интервалов иногда используется понятие "двусторонний" α-квантиль. В этом случае условие отклонения нулевой гипотезы звучит как |Z |>Z α /2 , где Z α /2 – верхний α/2-квантиль . Чтобы не писать верхний α/2-квантиль , для удобства используют "двусторонний" α-квантиль. Почему двусторонний? Как и в предыдущих случаях, построим график плотности вероятности стандартного нормального распределения и график функции распределения .
Невыделенная площадь на рисунке соответствует вероятности, что случайная величина примет значение между нижним квантилем уровня α /2 и верхним квантилем уровня α /2, т.е. будет между значениями -1,960 и 1,960 при α=0,05. Эта вероятность равна в нашем случае 1-(0,05/2+0,05/2)=0,95. Если Z попадает в одну из выделенных областей, то нулевая гипотеза отклоняется.
Вычислить двусторонний 0,05 — квантиль это можно с помощью формул MS EXCEL: =НОРМ.СТ.ОБР(1-0,05/2) или =-НОРМ.СТ.ОБР(0,05/2)
Другими словами, двусторонние α-квантили задают интервал, в который рассматриваемая случайная величина попадает с заданной вероятностью α.
Квантили распределения Стьюдента
Аналогичным образом квантили вычисляются и для распределения Стьюдента . Например, вычислять верхний α/2- квантиль распределения Стьюдента с n -1 степенью свободы требуется, если проводится проверка двухсторонней гипотезы о среднем значении распределения при неизвестной дисперсии ( см. эту статью ).
Для верхних квантилей распределения Стьюдента часто используется запись t α/2,n-1 . Если такая запись встретилась в статье про проверку гипотез или про построение доверительного интервала , то это именно верхний квантиль .
Примечание : Функция плотности вероятности распределения Стьюдента , как и стандартного нормального распределения , является четной функцией.
Чтобы вычислить в MS EXCEL верхний 0,05/2 — квантиль для t-распределения с 10 степенями свободы (или тоже самое двусторонний 0,05-квантиль ), необходимо записать формулу =СТЬЮДЕНТ.ОБР.2Х(0,05; 10) или =СТЬЮДРАСПОБР(0,05; 10) или =СТЬЮДЕНТ.ОБР(1-0,05/2; 10) или =-СТЬЮДЕНТ.ОБР(0,05/2; 10)
.2X означает 2 хвоста, т.е. двусторонний квантиль .
Квантили распределения ХИ-квадрат
Вычислять квантили распределения ХИ-квадрат с n -1 степенью свободы требуется, если проводится проверка гипотезы о дисперсии нормального распределения (см. статью Проверка статистических гипотез в MS EXCEL о дисперсии нормального распределения ).
При проверке таких гипотез также используются верхние квантили. Например, при двухсторонней гипотезе требуется вычислить 2 верхних квантиля распределения ХИ 2 : χ 2 α/2,n-1 и χ 2 1- α/2,n-1 . Почему требуется вычислить два квантиля , не один, как при проверке гипотез о среднем , где используется стандартное нормальное распределение или t-распределение ?
Дело в том, что в отличие от стандартного нормального распределения и распределения Стьюдента , плотность распределения ХИ 2 не является четной (симметричной относительно оси х). У него все квантили больше 0, поэтому верхний альфа-квантиль не равен нижнему (1-альфа)-квантилю или по-другому: верхний альфа-квантиль не равен нижнему альфа-квантилю со знаком минус.
Чтобы вычислить верхний 0,05/2 — квантиль для ХИ 2 -распределения с числом степеней свободы 10, т.е. χ 2 0,05/2,n-1 , необходимо в MS EXCEL записать формулу =ХИ2.ОБР.ПХ(0,05/2; 10) или =ХИ2.ОБР(1-0,05/2; 10)
Результат равен 20,48. .ПХ означает правый хвост распределения, т.е. тот который расположен вверху на графике функции распределения .
Чтобы вычислить верхний (1-0,05/2)- квантиль при том же числе степеней свободы , т.е. χ 2 1-0,05/2,n-1 и необходимо записать формулу =ХИ2.ОБР.ПХ(1-0,05/2; 10) или =ХИ2.ОБР(0,05/2; 10)
Результат равен 3,25.
Квантили F-распределения
Вычислять квантили распределения Фишера с n 1 -1 и n 2 -1 степенями свободы требуется, если проводится проверка гипотезы о равенстве дисперсий двух нормальных распределений (см. статью Двухвыборочный тест для дисперсии: F-тест в MS EXCEL ).
При проверке таких гипотез используются, как правило, верхние квантили. Например, при двухсторонней гипотезе требуется вычислить 2 верхних квантиля F -распределения: F α/2,n1-1, n 2 -1 и F 1-α/2,n1-1, n 2 -1 . Почему требуется вычислить два квантиля , не один, как при проверке гипотез о среднем ? Причина та же, что и для распределения ХИ 2 – плотность F-распределения не является четной . Эти квантили нельзя выразить один через другой как для стандартного нормального распределения . Верхний альфа-квантиль F -распределения не равен нижнему альфа-квантилю со знаком минус.
Чтобы вычислить верхний 0,05/2-квантиль для F -распределения с числом степеней свободы 10 и 12, необходимо записать формулу =F.ОБР.ПХ(0,05/2;10;12) =FРАСПОБР(0,05/2;10;12) =F.ОБР(1-0,05/2;10;12)
Результат равен 3,37. .ПХ означает правый хвост распределения, т.е. тот который расположен вверху на графике функции распределения .
Квантили распределения Вейбулла
Иногда обратная функция распределения может быть представлена в явном виде с помощью элементарных функций, например как для распределения Вейбулла . Напомним, что функция этого распределения задается следующей формулой:
После логарифмирования обеих частей выражения, выразим x через соответствующее ему значение F(x) равное P:
Примечание : Вместо обозначения α-квантиль может использоваться p — квантиль. Суть от этого не меняется.
Это и есть обратная функция, которая позволяет вычислить P — квантиль ( p — quantile ). Для его вычисления в формуле нужно подставить известное значение вероятности P и вычислить значение х p (вероятность того, что случайная величина Х примет значение меньше или равное х p равна P).
Квантили экспоненциального распределения
Задача : Случайная величина имеет экспоненциальное распределение :
Требуется выразить p -квантиль x p через параметр распределения λ и заданную вероятность p .
Примечание : Вместо обозначения α-квантиль может использоваться p-квантиль . Суть от этого не меняется.
Строит график плотности вероятности и функции плотности распределения для нормального распределения.
Нормальное распределение — занимает особую роль в теории вероятностей. Это наиболее общее непрерывное распределение вероятностей, часто использующееся для представления случайных величин, закон распределения которых не известен.
Функция плотности вероятности
Плотность нормального распределения выражается функцией Гаусса:
где μ — математическое ожидание,
σ — среднеквадратическое отклонение,
σ ² — дисперсия,
медиана и мода нормального распределения равны математическому ожиданию μ.
Калькулятор ниже вычисляет значения функции плотности вероятности и функции распределения в заданной точке при для нормального распределения, определяемого заданной дисперсией и математическим ожиданием:
Нормальное распределение
Функция распределения
Функция распределения для нормального распределения задается формулой:
где, erf(x) — функция ошибок (Лапласа) или интеграл вероятности, определяемый как:
Квантильная функция
Квантильная функция нормального распределения выражается через обратную функцию ошибок:
p может принимать значения в диапазоне [0,1].
Квантильная функция стандартного нормального распределения (нормального распределения с σ =1, μ=0) упрощается до:
Эту функцию называют пробит функцией, применяется она в различных областях, для анализа зависимости качественных переменных от множества факторов.
Калькулятор ниже вычисляет значение квантильной функции нормального распределения ( можно задать дисперсию = 1 и мат ожидание=0, чтобы получить значение пробит функции).
Коэффициент вариации рэкв напряжения оэкв равен коэффициенту вариации ир давления на посадочной поверхности соединения.
Вероятность безотказной работы р„ по критерию прочности деталей определяем в зависимости от квантиля
где п — коэффициент запаса прочности по средним значениям предела текучести о,2 и напряжения аэкв, п„ = а,2 /ожв; v, — коэффициент вариации предела текучести.
Надежность соединения с натягом, характеризуемую вероятностью безотказной работы р, определяют как произведение вероятностей рс и рп, т.е. р = рср„.
Пример 13.1. Соединение зубчатого колеса со сплошным валом диаметром d = 48 мм соответствует посадке Н8/х8. Соединение нагружено вращающим моментом Т, заданным случайной нормально распределенной величиной со средним значением Т = 1050 Н м и коэффициентом вариации vT— 0,12. Определить вероятность безотказной работы соединения по критерию прочности сцепления, если известно, что диаметр ступицы зубчатого колеса D — 85 мм, длина посадочной поверхности / = 60 мм, высота микронеровностей посадочных поверхностей Rz] = 4 мкм, Яг2 = = 6 мкм, модуль упругости материала (сталь) деталей Е — 2,1 10 5 МПа, среднее значение и коэффициент вариации коэффициента трения соответственно равны / = 0,12, Ч/ = 0,1, коэффициент К, учитывающий уменьшение со временем давления, К = 1,5.
Решение. Среднее значение N и коэффициент вариации uN натяга определяем в зависимости от допусков диаметров вала и отверстия t = = te = /?= 39 мкм, а также нижнего отклонения диаметра вала ei = 97 мкм (значения выбраны по таблицам допусков):
Поправка на обмятие микронеровностей, мкм:
Коэффициент v = 1 + д > 2 = » + W8 5 > 2 = ,,936.
1 -(d/D) 2 1 — (48/8S) 2
Среднее значение давления на посадочной поверхности, МПа:
Коэффициент вариации давления р
Среднее значение и коэффициент вариации предельного по прочности сцепления момента:
Коэффициент запаса прочности сцепления определяется по средним значениям:
Вероятность безотказной работы Рс по критерию прочности сцепления, определенная по табл. 1.1 в зависимости от значения ир равна Рс = = 0,9995.
Пример 13.2. Определить вероятность безотказной работы соединения с натягом по критерию прочности охватывающей детали (ступицы колеса). Характеристики соединения приведены в предыдущем примере. Среднее значение предела текучести материала охватывающей детали
= 580 МПа, коэффициент вариации V, = 0,06.
Среднее значение и коэффициент вариации эквивалентного напряжения у посадочной поверхности ступицы колеса
Коэффициент запаса прочности по средним напряжениям
Квантиль нормированного нормального распределения
Вероятность безотказной работы р„ по критерию прочности охватывающей детали соединения (см. табл. 1.1) рп > 0,9999.