ГОСТ Р 50779.24-2005
(ИСО 8595:1990)
НАЦИОНАЛЬНЫЙ СТАНДАРТ РОССИЙСКОЙ ФЕДЕРАЦИИ
Статистические методы
СТАТИСТИЧЕСКОЕ ПРЕДСТАВЛЕНИЕ ДАННЫХ
Оценка медианы
Statistical methods. Statistical interpretation of data. Estimation of a median
ОКС 03.120.10
Дата введения 2005-07-01
Предисловие
1 ПОДГОТОВЛЕН Техническим комитетом по стандартизации ТК 125 "Статистические методы в управлении качеством продукции" на основе собственного перевода на русский язык англоязычной версии стандарта, указанного в пункте 4
2 ВНЕСЕН Управлением технического регулирования и стандартизации Федерального агентства по техническому регулированию и метрологии
3 УТВЕРЖДЕН И ВВЕДЕН В ДЕЙСТВИЕ Приказом Федерального агентства по техническому регулированию и метрологии от 31 мая 2005 г. N 112-ст
4 Настоящий стандарт является модифицированным по отношению к международному стандарту ИСО 8595:1990* "Статистические методы. Статистическое представление данных. Оценка медианы" (ISO 8595:1990 "Interpretation of statistical data - Estimation of a median", MOD), путем включения отдельных фраз, которые выделены в тексте курсивом, с целью гармонизации с национальными стандартами.
__________________
* Доступ к международным и зарубежным документам, упомянутым в тексте, можно получить, обратившись в Службу поддержки пользователей. - .
Наименование настоящего стандарта изменено относительно наименования указанного международного стандарта для приведения в соответствие с ГОСТ Р 1.5-2012 (пункт 3.5)
5 ВВЕДЕН ВПЕРВЫЕ
6 ПЕРЕИЗДАНИЕ. Июль 2020 г.
Правила применения настоящего стандарта установлены в статье 26 Федерального закона от 29 июня 2015 г. N 162-ФЗ "О стандартизации в Российской Федерации". Информация об изменениях к настоящему стандарту публикуется в ежегодном (по состоянию на 1 января текущего года) информационном указателе "Национальные стандарты", а официальный текст изменений и поправок - в ежемесячном информационном указателе "Национальные стандарты". В случае пересмотра (замены) или отмены настоящего стандарта соответствующее уведомление будет опубликовано в ближайшем выпуске ежемесячного информационного указателя "Национальные стандарты". Соответствующая информация, уведомление и тексты размещаются также в информационной системе общего пользования - на официальном сайте Федерального агентства по техническому регулированию и метрологии в сети Интернет (www.gost.ru)
1 Область применения
Настоящий стандарт устанавливает процедуру определения точечной оценки и доверительного интервала для медианы распределения вероятностей случайной величины. Оценки основаны на случайной выборке объема
2 Нормативные ссылки
В настоящем стандарте использованы нормативные ссылки на следующие стандарты:
ГОСТ Р 50779.10 (ИСО 3534-1-93) Статистические методы. Вероятность и основы статистики. Термины и определения (ИСО 3534-1:1993, IDT)
________________
ГОСТ Р 50779.22 (ИСО 2602:1980) Статистические методы. Статистическое представление данных. Точечная оценка и доверительный интервал для среднего (ИСО 2602:1980 "Статистическое представление результатов испытаний. Оценка среднего. Доверительный интервал", MOD)
Примечание - При пользовании настоящим стандартом целесообразно проверить действие ссылочных стандартов в информационной системе общего пользования - на официальном сайте Федерального агентства по техническому регулированию и метрологии в сети Интернет или по ежегодному информационному указателю "Национальные стандарты", который опубликован по состоянию на 1 января текущего года, и по выпускам ежемесячного информационного указателя "Национальные стандарты", за текущий год. Если заменен ссылочный стандарт, на который дана недатированная ссылка, то рекомендуется использовать действующую версию этого стандарта с учетом всех внесенных в данную версию изменений. Если заменен ссылочный стандарт, на который дана датированная ссылка, то рекомендуется использовать версию этого стандарта с указанным выше годом утверждения (принятия). Если после утверждения настоящего стандарта в ссылочный стандарт, на который дана датированная ссылка, внесено изменение, затрагивающее положение, на которое дана ссылка, то это положение рекомендуется применять без учета данного изменения. Если ссылочный стандарт отменен без замены, то положение, в котором дана ссылка на него, рекомендуется применять в части, не затрагивающей эту ссылку.
3 Термины и определения
В настоящем стандарте применены термины по ГОСТ Р 50779.10, а также следующие термины с соответствующими определениями:
3.1 k-я порядковая статистика в выборке объема n (k-th order statistic of a sample of size n): k-e значение
3.2 медиана непрерывного распределения вероятностей (median of a continuous probability distribution),
где
4 Условия применения метода
Метод, представленный в настоящем стандарте, может быть применен для любых непрерывных распределений при условии, что выборка является случайной.
Примечание - Если распределение генеральной совокупности близко к нормальному, то медиана совпадает со средним значением. Доверительные границы в этом случае могут быть рассчитаны в соответствии с ГОСТ Р 50779.22.
Если условия корректного применения метода выполняются, число k выборочных значений, которое не превышает заданного процентиля генеральной совокупности, является реализацией случайной переменной
где n - объем выборки;
p - вероятность появления выборочного значения, не превышающего заданного процентиля;
P - вероятность появления k выборочных значений, не превышающих заданного процентиля, в выборке объема n.
В случае медианы, для p=0,5, биномиальное распределение имеет вид
5 Точечная оценка
Точечной оценкой медианы генеральной совокупности является выборочная медиана. Выборочную медиану находят путем нумерации элементов выборки, расположенной в порядке неубывания, и выбора значения:
-
- среднего арифметического
Примечание - Эта оценка обычно смещенная; в общем случае произвольной генеральной совокупности несмещенной оценки не существует.
6 Доверительный интервал
6.1 Общие положения
Двусторонний доверительный интервал для медианы генеральной совокупности является закрытым интервалом вида
где
Односторонние доверительные интервалы могут быть двух видов:
или
где
Практическое значение применения доверительных интервалов состоит в том, что использование доверительного интервала позволяет экспериментатору с высокой степенью достоверности утверждать, что неизвестный оцениваемый параметр
6.2 Стандартный метод
Верхнюю и нижнюю границы двустороннего доверительного интервала с доверительной вероятностью
В случае одностороннего доверительного интервала
Решения неравенств для различных значений n приведены в таблице 1.
Таблица 1 - Точные значения k для объема выборки n
n | Односторонний доверительный интервал | Двусторонний доверительный интервал | ||
Доверительная вероятность | ||||
0,95 | 0,99 | 0,95 | 0,99 | |
5 | 1 | 0 | 0 | 0 |
6 | 1 | 0 | 1 | 0 |
7 | 1 | 1 | 1 | 0 |
8 | 2 | 1 | 1 | 1 |
9 | 2 | 1 | 2 | 1 |
10 | 2 | 1 | 2 | 1 |
11 | 3 | 2 | 2 | 1 |
12 | 3 | 2 | 3 | 2 |
13 | 4 | 2 | 3 | 2 |
14 | 4 | 3 | 3 | 2 |
15 | 4 | 3 | 4 | 3 |
16 | 5 | 3 | 4 | 3 |
17 | 5 | 4 | 5 | 3 |
18 | 6 | 4 | 5 | 4 |
19 | 6 | 5 | 5 | 4 |
20 | 6 | 5 | 6 | 4 |
21 | 7 | 5 | 6 | 5 |
22 | 7 | 6 | 6 | 5 |
23 | 8 | 6 | 7 | 5 |
24 | 8 | 6 | 7 | 6 |
25 | 8 | 7 | 8 | 6 |
26 | 9 | 7 | 8 | 7 |
27 | 9 | 8 | 8 | 7 |
28 | 10 | 8 | 9 | 7 |
29 | 10 | 8 | 9 | 8 |
30 | 11 | 9 | 10 | 8 |
Примечание - Знак "0" показывает, что доверительный интервал и доверительные границы для данного объема выборки и данной доверительной вероятности не могут быть определены. |
Для
где
Для малых значений n доверительные границы могут не существовать.
6.3 Приближенный метод
Для тех значений n, которые не приведены в таблице 1, приближенное значение k можно получить, используя формулу
тогда k - целая часть
Это приближение является весьма точным для обычно используемых значений
При компьютерных расчетах для получения приближенного значения k применяют формулу (10), согласованную с таблицей 1 и с более простой формулой (9), и используют для значений n, превышающих значения, представленные в таблице 1:
тогда k - это целая часть
Примеры
1 Электрический шнур небольшого электрического прибора испытывают на испытательной машине на многократный изгиб до отказа. Испытания моделируют реальную эксплуатацию шнура. Испытания являются ускоренными. Ниже представлена выборка, состоящая из 24 наработок до отказа в часах; семь значений выборки, отмеченных звездочками, являются цензурированными:
57,5; 77,8; 88,0; 96,9; 98,4; 100,3; 100,8; 102,1; 103,3;
103,4; 105,3; 105,4; 122,6; 139,3; 143,9; 148,0; 151,3;
161,1*; 161,2*; 161,2*; 162,4*; 162,7*; 163,1*; 176,8*.
На основании представленной выборки получают точечную оценку медианы распределения наработки до отказа
Нижнюю доверительную границу одностороннего доверительного интервала для доверительной вероятности 0,95 находят следующим образом: сначала из таблицы 1 для n=24 определяют значение k=8, а затем в представленной выше упорядоченной выборке находят значение
2 Наработки до отказа 34 транзисторов, полученные по результатам ускоренных испытаний и измеренные в неделях, представлены ниже. Три значения, отмеченные звездочками, являются цензурированными:
3; 4; 5; 6; 6; 7; 8; 8; 9; 9; 9; 10; 10; 11; 11; 11; 13; 13; 13; 13; 13;
17; 17; 19; 19; 25; 29; 33; 42; 42; 52; 52*; 52*; 52*.
На основании представленной выборки вычисляют точечную оценку медианы распределения наработки до отказа
Начиная с n>30 для получения нижней границы одностороннего доверительного интервала для медианы вынужденно используют приближенный метод; для доверительной вероятности 0,95 получают
k - целая часть y, следовательно, k=12 и искомая доверительная граница
Можно показать, что найденное таким образом значение k совпадает со значением, полученным точным методом.
Для двусторонних доверительных границ:
тогда k=11; n-k+1=24 и получают доверительный интервал
УДК 519.25:620.113:006.354 | ОКС 03.120.10 |
Ключевые слова: статистический анализ, случайная выборка, оценивание, доверительный интервал, порядковая статистика, медиана |
Электронный текст документа
и сверен по:
, 2020