Квантиль
Квантиль в математической статистике — значение, которое заданная случайная величина не превышает с фиксированной вероятностью. Если вероятность задана в процентах, то квантиль называется процентилем или перцентилем (см. ниже).
Например, фраза «90-й процентиль массы тела у новорожденных мальчиков составляет 4 кг» означает, что 90 % мальчиков рождаются с весом, меньшим либо равным 4 кг, а 10 % мальчиков рождаются с весом, большим 4 кг.
Определение
Рассмотрим вероятностное пространство ( Ω , F , P ) {displaystyle (Omega ,;{mathcal {F}},;mathbb {P} )} и P X {displaystyle mathbb {P} ^{X}} — вероятностная мера, задающая распределение некоторой случайной величины X {displaystyle X} . Пусть фиксировано α ∈ ( 0 , 1 ) {displaystyle alpha in (0,;1)} . Тогда α {displaystyle alpha } -квантилем (или квантилем уровня α {displaystyle alpha } ) распределения P X {displaystyle mathbb {P} ^{X}} называется число x α ∈ R {displaystyle x_{alpha }in mathbb {R} } , такое что
P ( X ⩽ x α ) ⩾ α {displaystyle mathbb {P} (Xleqslant x_{alpha })geqslant alpha } , P ( X ⩾ x α ) ⩾ 1 − α . {displaystyle mathbb {P} (Xgeqslant x_{alpha })geqslant 1-alpha .}В некоторых источниках (например, в англоязычной литературе) k {displaystyle k} -м q {displaystyle q} -квантилем называется квантиль уровня k / q {displaystyle k/q} , то есть ( k / q ) {displaystyle (k/q)} -квантиль в предыдущих обозначениях.
Замечания
- Если распределение непрерывно, то α {displaystyle alpha } -квантиль однозначно задаётся уравнением
где F X {displaystyle F_{X}} — функция распределения P X {displaystyle mathbb {P} ^{X}} .
- Очевидно, для непрерывных распределений справедливо следующее широко использующееся при построении доверительных интервалов равенство:
- Для эмпирического распределения α {displaystyle alpha } -квантиль можно задать следующим способом:
Заданный таким образом α {displaystyle alpha } -квантиль удовлетворяет приведенному выше определению.
В некоторых случаях (при большом объёме выборки и эмпирическом распределении, близком к непрерывному) вместо равенства K + 1 = α N {displaystyle K+1=alpha N} можно использовать приближённое сравнение | K + 1 − α N | < 1 / N {displaystyle |K+1-alpha N|<1/N} (это позволит, например, квантиль уровня 1/3 представлять как 0,33…333 при компьютерной обработке данных).
Медиана и квартили
- 0,25-квантиль называется первым (или нижним) квартилем (от лат. quarta — четверть);
- 0,5-квантиль называется медианой (от лат. mediāna — середина) или вторым квартилем;
- 0,75-квантиль называется третьим (или верхним) квартилем.
Интерквартильным размахом (англ. Interquartile range) называется разность между третьим и первым квартилями, то есть x 0 , 75 − x 0 , 25 {displaystyle x_{0{,}75}-x_{0{,}25}} . Интерквартильный размах является характеристикой разброса распределения величины и является робастным аналогом дисперсии. Вместе, медиана и интерквартильный размах могут быть использованы вместо математического ожидания и дисперсии в случае распределений с большими выбросами, либо при невозможности вычисления последних.
Дециль
Дециль характеризует распределение величин совокупности, при котором девять значений дециля делят её на десять равных частей. Любая из этих десяти частей составляет 1/10 всей совокупности. Так, первый дециль отделяет 10 % наименьших величин, лежащих ниже дециля, от 90 % наибольших величин, лежащих выше дециля.
Так же, как в случае моды и медианы, у интервального вариационного ряда распределения каждый дециль (и квартиль) принадлежит определённому интервалу и имеет вполне определённое значение.
Процентиль
p {displaystyle p} -м процентилем называют квантиль уровня α = p / 100 {displaystyle alpha =p/100} . Соответственно, медиана является 50-м процентилем, а первый и третий квартиль — 25-м и 75-м процентилями соответственно.
В целом, понятия квантиль и процентиль взаимозаменяемы, так же, как и шкалы исчисления вероятностей — абсолютная и процентная.
Процентили также называются перцентилями или центилями.