Квантиль

(перенаправлено с «Перцентиль»)

Кванти́ль в математической статистике — значение, которое заданная случайная величина не превышает с фиксированной вероятностью. Если вероятность задана в процентах, то квантиль называется процентилем или перцентилем (см. ниже).

Например, фраза «90-й процентиль массы тела у новорожденных мальчиков составляет 4 кг»[1] означает, что 90 % мальчиков рождаются с весом, меньшим либо равным 4 кг, а 10 % мальчиков рождаются с весом, большим либо равным 4 кг.

Определение

править

Рассмотрим вероятностное пространство   и   — вероятностная мера, задающая распределение некоторой случайной величины  . Пусть фиксировано  . Тогда  -квантилем (или квантилью уровня (порядка)  ) распределения   называется число   такое, что[2]

 
 

В некоторых источниках (например, в англоязычной литературе)   -квантилем называется квантиль уровня  , то есть  -квантиль в предыдущих обозначениях.

Замечания

править
 
где   — функция распределения  .
  • Очевидно, для непрерывных распределений справедливо следующее широко использующееся при построении доверительных интервалов равенство:
 
  1. составляем вариационный ряд значений   (выборка имеет объём  ), а также считаем, что   (это необходимо при вычислении 100 % квантили по приводимым ниже формулам);
  2. находим величину  ;
  3. сравниваем   и  :
a) если  , то полагаем  ;
б) если  , то полагаем  ;
в) если  , то полагаем  .
Заданный таким образом  -квантиль удовлетворяет приведенному выше определению.
В некоторых случаях (при большом объёме выборки и эмпирическом распределении, близком к непрерывному) вместо равенства   можно использовать приближённое сравнение   (это позволит, например, квантиль уровня 1/3 представлять как 0,33…333 при компьютерной обработке данных).

Медиана и квантили

править
 
Квантили нормального распределения
  • 0,25-квантиль называется первым (или нижним) кварти́лем (от лат. quarta — четверть);
  • 0,5-квантиль называется медианой (от лат. mediāna — середина) или вторым кварти́лем;
  • 0,75-квантиль называется третьим (или верхним) кварти́лем.

Интеркварти́льным размахом (англ. Interquartile range) называется разность между третьим и первым квартилями, то есть  . Интерквартильный размах является характеристикой разброса распределения величины и является робастным аналогом дисперсии. Вместе, медиана и интерквартильный размах могут быть использованы вместо математического ожидания и дисперсии в случае распределений с большими выбросами, либо при невозможности вычисления последних.

Дециль

править

Деци́ль характеризует распределение величин совокупности, при котором девять значений дециля делят её на десять равных частей. Любая из этих десяти частей составляет 1/10 всей совокупности. Так, первый дециль отделяет 10 % наименьших величин, лежащих ниже дециля, от 90 % наибольших величин, лежащих выше дециля.

Так же, как в случае моды и медианы, у интервального вариационного ряда распределения каждый дециль (и квартиль) принадлежит определённому интервалу и имеет вполне определённое значение[3].

Процентиль

править

 проценти́лем называют квантиль уровня  . Соответственно, медиана является 50-м процентилем, а первый и третий квартиль — 25-м и 75-м процентилями соответственно.

В целом, понятия квантиль и процентиль взаимозаменяемы, так же, как и шкалы исчисления вероятностей — абсолютная и процентная.

Процентили также называются перцентилями или центилями.

Квантили стандартного нормального распределения

править
Вероятность (уровень квантили), % 99,99 99,90 99,00 97,72 97,50 95,00 90,00 84,13 50,00
Квантиль (округлённый до тысячных)[4] 3,719 3,09 2,326 1,999 1,96 1,645 1,282 1 0

См. также

править

Примечания

править
  1. Руководство участкового педиатра. — ГЭОТАР-Медиа, 2008. — С. 44. — 354 с.
  2. Фролов А. Н.. Краткий курс теории вероятностей и математической статистики: учебное пособие для СПО. — СПб.: Лань, 2021. — С. 189. — 316 с. — ISBN 978-5-8114-8343-3.
  3. Шмойлова Р. А., Минашкин В. Г., Садовникова Н. А. Практикум по теории статистики. — 3-е изд. — М.: Финансы и статистика, 2011. — С. 130—131. — 416 с. — ISBN 9785279032969.
  4. Большев Л. Н., Смирнов Н. В. Таблицы математической статистики. — 3-е изд.. — М.: Наука, 1983. — С. 136. — 416 с.

Ссылки

править