Кванти́ль в математической статистике — значение, которое заданная случайная величина не превышает с фиксированной вероятностью. Если вероятность задана в процентах, то квантиль называется процентилем или перцентилем (см. ниже).
Например, фраза «90-й процентиль массы тела у новорожденных мальчиков составляет 4 кг»[1] означает, что 90 % мальчиков рождаются с весом, меньшим либо равным 4 кг, а 10 % мальчиков рождаются с весом, большим либо равным 4 кг.
Определение
правитьРассмотрим вероятностное пространство и — вероятностная мера, задающая распределение некоторой случайной величины . Пусть фиксировано . Тогда -квантилем (или квантилью уровня (порядка) ) распределения называется число такое, что[2]
В некоторых источниках (например, в англоязычной литературе) -м -квантилем называется квантиль уровня , то есть -квантиль в предыдущих обозначениях.
Замечания
править- Если распределение непрерывно, то -квантиль однозначно задаётся уравнением
- где — функция распределения .
- Очевидно, для непрерывных распределений справедливо следующее широко использующееся при построении доверительных интервалов равенство:
- Для эмпирического распределения -квантиль можно задать следующим способом:
- составляем вариационный ряд значений (выборка имеет объём ), а также считаем, что (это необходимо при вычислении 100 % квантили по приводимым ниже формулам);
- находим величину ;
- сравниваем и :
- a) если , то полагаем ;
- б) если , то полагаем ;
- в) если , то полагаем .
- Заданный таким образом -квантиль удовлетворяет приведенному выше определению.
- В некоторых случаях (при большом объёме выборки и эмпирическом распределении, близком к непрерывному) вместо равенства можно использовать приближённое сравнение (это позволит, например, квантиль уровня 1/3 представлять как 0,33…333 при компьютерной обработке данных).
Медиана и квантили
править- 0,25-квантиль называется первым (или нижним) кварти́лем (от лат. quarta — четверть);
- 0,5-квантиль называется медианой (от лат. mediāna — середина) или вторым кварти́лем;
- 0,75-квантиль называется третьим (или верхним) кварти́лем.
Интеркварти́льным размахом (англ. Interquartile range) называется разность между третьим и первым квартилями, то есть . Интерквартильный размах является характеристикой разброса распределения величины и является робастным аналогом дисперсии. Вместе, медиана и интерквартильный размах могут быть использованы вместо математического ожидания и дисперсии в случае распределений с большими выбросами, либо при невозможности вычисления последних.
Дециль
правитьДеци́ль характеризует распределение величин совокупности, при котором девять значений дециля делят её на десять равных частей. Любая из этих десяти частей составляет 1/10 всей совокупности. Так, первый дециль отделяет 10 % наименьших величин, лежащих ниже дециля, от 90 % наибольших величин, лежащих выше дециля.
Так же, как в случае моды и медианы, у интервального вариационного ряда распределения каждый дециль (и квартиль) принадлежит определённому интервалу и имеет вполне определённое значение[3].
Процентиль
править-м проценти́лем называют квантиль уровня . Соответственно, медиана является 50-м процентилем, а первый и третий квартиль — 25-м и 75-м процентилями соответственно.
В целом, понятия квантиль и процентиль взаимозаменяемы, так же, как и шкалы исчисления вероятностей — абсолютная и процентная.
Процентили также называются перцентилями или центилями.
Квантили стандартного нормального распределения
правитьВероятность (уровень квантили), % | 99,99 | 99,90 | 99,00 | 97,72 | 97,50 | 95,00 | 90,00 | 84,13 | 50,00 |
Квантиль (округлённый до тысячных)[4] | 3,719 | 3,09 | 2,326 | 1,999 | 1,96 | 1,645 | 1,282 | 1 | 0 |
См. также
правитьПримечания
править- ↑ Руководство участкового педиатра. — ГЭОТАР-Медиа, 2008. — С. 44. — 354 с.
- ↑ Фролов А. Н.. Краткий курс теории вероятностей и математической статистики: учебное пособие для СПО. — СПб.: Лань, 2021. — С. 189. — 316 с. — ISBN 978-5-8114-8343-3.
- ↑ Шмойлова Р. А., Минашкин В. Г., Садовникова Н. А. Практикум по теории статистики. — 3-е изд. — М.: Финансы и статистика, 2011. — С. 130—131. — 416 с. — ISBN 9785279032969.
- ↑ Большев Л. Н., Смирнов Н. В. Таблицы математической статистики. — 3-е изд.. — М.: Наука, 1983. — С. 136. — 416 с.
Ссылки
правитьВ статье не хватает ссылок на источники (см. рекомендации по поиску). |