allgosts.ru03.120 Качество03 УСЛУГИ. ОРГАНИЗАЦИЯ ФИРМ И УПРАВЛЕНИЕ ИМИ. АДМИНИСТРАЦИЯ. ТРАНСПОРТ. СОЦИОЛОГИЯ

ГОСТ Р 50779.24-2005 Статистические методы. Статистическое представление данных. Оценка медианы

Обозначение:
ГОСТ Р 50779.24-2005
Наименование:
Статистические методы. Статистическое представление данных. Оценка медианы
Статус:
Действует
Дата введения:
07.01.2005
Дата отмены:
-
Заменен на:
-
Код ОКС:
03.120.10

Текст ГОСТ Р 50779.24-2005 Статистические методы. Статистическое представление данных. Оценка медианы

ГОСТ Р 50779.24-2005
(ИСО 8595:1990)

НАЦИОНАЛЬНЫЙ СТАНДАРТ РОССИЙСКОЙ ФЕДЕРАЦИИ


Статистические методы

СТАТИСТИЧЕСКОЕ ПРЕДСТАВЛЕНИЕ ДАННЫХ

Оценка медианы

Statistical methods. Statistical interpretation of data. Estimation of a median

ОКС 03.120.10

Дата введения 2005-07-01

Предисловие

1 ПОДГОТОВЛЕН Техническим комитетом по стандартизации ТК 125 "Статистические методы в управлении качеством продукции" на основе собственного перевода на русский язык англоязычной версии стандарта, указанного в пункте 4

2 ВНЕСЕН Управлением технического регулирования и стандартизации Федерального агентства по техническому регулированию и метрологии

3 УТВЕРЖДЕН И ВВЕДЕН В ДЕЙСТВИЕ Приказом Федерального агентства по техническому регулированию и метрологии от 31 мая 2005 г. N 112-ст

4 Настоящий стандарт является модифицированным по отношению к международному стандарту ИСО 8595:1990* "Статистические методы. Статистическое представление данных. Оценка медианы" (ISO 8595:1990 "Interpretation of statistical data - Estimation of a median", MOD), путем включения отдельных фраз, которые выделены в тексте курсивом, с целью гармонизации с национальными стандартами.

__________________

* Доступ к международным и зарубежным документам, упомянутым в тексте, можно получить, обратившись в Службу поддержки пользователей. - .

Наименование настоящего стандарта изменено относительно наименования указанного международного стандарта для приведения в соответствие с ГОСТ Р 1.5-2012 (пункт 3.5)

5 ВВЕДЕН ВПЕРВЫЕ

6 ПЕРЕИЗДАНИЕ. Июль 2020 г.

Правила применения настоящего стандарта установлены в статье 26 Федерального закона от 29 июня 2015 г. N 162-ФЗ "О стандартизации в Российской Федерации". Информация об изменениях к настоящему стандарту публикуется в ежегодном (по состоянию на 1 января текущего года) информационном указателе "Национальные стандарты", а официальный текст изменений и поправок - в ежемесячном информационном указателе "Национальные стандарты". В случае пересмотра (замены) или отмены настоящего стандарта соответствующее уведомление будет опубликовано в ближайшем выпуске ежемесячного информационного указателя "Национальные стандарты". Соответствующая информация, уведомление и тексты размещаются также в информационной системе общего пользования - на официальном сайте Федерального агентства по техническому регулированию и метрологии в сети Интернет (www.gost.ru)

1 Область применения

Настоящий стандарт устанавливает процедуру определения точечной оценки и доверительного интервала для медианы распределения вероятностей случайной величины. Оценки основаны на случайной выборке объема из генеральной совокупности. Представленная процедура дает метод оценки, свободный от вида распределения, и может быть применена для оценки квартилей и других процентилей (квантилей).

2 Нормативные ссылки

В настоящем стандарте использованы нормативные ссылки на следующие стандарты:

ГОСТ Р 50779.10 (ИСО 3534-1-93) Статистические методы. Вероятность и основы статистики. Термины и определения (ИСО 3534-1:1993, IDT)

________________

Действует ГОСТ Р ИСО 3534-1-2019.

ГОСТ Р 50779.22 (ИСО 2602:1980) Статистические методы. Статистическое представление данных. Точечная оценка и доверительный интервал для среднего (ИСО 2602:1980 "Статистическое представление результатов испытаний. Оценка среднего. Доверительный интервал", MOD)

Примечание - При пользовании настоящим стандартом целесообразно проверить действие ссылочных стандартов в информационной системе общего пользования - на официальном сайте Федерального агентства по техническому регулированию и метрологии в сети Интернет или по ежегодному информационному указателю "Национальные стандарты", который опубликован по состоянию на 1 января текущего года, и по выпускам ежемесячного информационного указателя "Национальные стандарты", за текущий год. Если заменен ссылочный стандарт, на который дана недатированная ссылка, то рекомендуется использовать действующую версию этого стандарта с учетом всех внесенных в данную версию изменений. Если заменен ссылочный стандарт, на который дана датированная ссылка, то рекомендуется использовать версию этого стандарта с указанным выше годом утверждения (принятия). Если после утверждения настоящего стандарта в ссылочный стандарт, на который дана датированная ссылка, внесено изменение, затрагивающее положение, на которое дана ссылка, то это положение рекомендуется применять без учета данного изменения. Если ссылочный стандарт отменен без замены, то положение, в котором дана ссылка на него, рекомендуется применять в части, не затрагивающей эту ссылку.

3 Термины и определения

В настоящем стандарте применены термины по ГОСТ Р 50779.10, а также следующие термины с соответствующими определениями:

3.1 k-я порядковая статистика в выборке объема n (k-th order statistic of a sample of size n): k-e значение в выборке из n значений, расположенных в неубывающем по величине порядке.

. (1)

3.2 медиана непрерывного распределения вероятностей (median of a continuous probability distribution), (или ): Значение , удовлетворяющее соотношению

, (2)

где - функция распределения генеральной совокупности.

4 Условия применения метода

Метод, представленный в настоящем стандарте, может быть применен для любых непрерывных распределений при условии, что выборка является случайной.

Примечание - Если распределение генеральной совокупности близко к нормальному, то медиана совпадает со средним значением. Доверительные границы в этом случае могут быть рассчитаны в соответствии с ГОСТ Р 50779.22.

Если условия корректного применения метода выполняются, число k выборочных значений, которое не превышает заданного процентиля генеральной совокупности, является реализацией случайной переменной , которую можно описать биномиальным законом распределения:

, (3)

где n - объем выборки;

p - вероятность появления выборочного значения, не превышающего заданного процентиля;

P - вероятность появления k выборочных значений, не превышающих заданного процентиля, в выборке объема n.

В случае медианы, для p=0,5, биномиальное распределение имеет вид

. (4)

5 Точечная оценка

Точечной оценкой медианы генеральной совокупности является выборочная медиана. Выборочную медиану находят путем нумерации элементов выборки, расположенной в порядке неубывания, и выбора значения:

- -й порядковой статистики, если n - нечетное;

- среднего арифметического -й и -й порядковой статистики, если n - четное.

Примечание - Эта оценка обычно смещенная; в общем случае произвольной генеральной совокупности несмещенной оценки не существует.

6 Доверительный интервал

6.1 Общие положения

Двусторонний доверительный интервал для медианы генеральной совокупности является закрытым интервалом вида

,

где ;

и называются нижней и верхней доверительными границами соответственно.

Односторонние доверительные интервалы могут быть двух видов:


или ,

где и называются нижней и верхней доверительными границами соответственно.

Практическое значение применения доверительных интервалов состоит в том, что использование доверительного интервала позволяет экспериментатору с высокой степенью достоверности утверждать, что неизвестный оцениваемый параметр лежит внутри доверительного интервала и вероятность нахождения вне интервала незначительна. Вероятность того, что найденный по случайной выборке доверительный интервал накрывает истинное значение медианы генеральной совокупности, называется доверительной вероятностью.

6.2 Стандартный метод

Верхнюю и нижнюю границы двустороннего доверительного интервала с доверительной вероятностью определяют с помощью двух порядковых статистик , где целочисловое находят из условий:

; (5)



. (6)

В случае одностороннего доверительного интервала необходимо заменить на .

Решения неравенств для различных значений n приведены в таблице 1.

Таблица 1 - Точные значения k для объема выборки n

n

Односторонний доверительный интервал

Двусторонний доверительный интервал

Доверительная вероятность

0,95

0,99

0,95

0,99

5

1

0

0

0

6

1

0

1

0

7

1

1

1

0

8

2

1

1

1

9

2

1

2

1

10

2

1

2

1

11

3

2

2

1

12

3

2

3

2

13

4

2

3

2

14

4

3

3

2

15

4

3

4

3

16

5

3

4

3

17

5

4

5

3

18

6

4

5

4

19

6

5

5

4

20

6

5

6

4

21

7

5

6

5

22

7

6

6

5

23

8

6

7

5

24

8

6

7

6

25

8

7

8

6

26

9

7

8

7

27

9

8

8

7

28

10

8

9

7

29

10

8

9

8

30

11

9

10

8

Примечание - Знак "0" показывает, что доверительный интервал и доверительные границы для данного объема выборки и данной доверительной вероятности не могут быть определены.

Для и для обычно используемых значений (и для односторонних и для двусторонних доверительных интервалов) значение k определяют из условий:

, (7)

, (8)

где , , …, - упорядоченная выборка.

Для малых значений n доверительные границы могут не существовать.

6.3 Приближенный метод

Для тех значений n, которые не приведены в таблице 1, приближенное значение k можно получить, используя формулу

, (9)

тогда k - целая часть , а - квантиль стандартного нормального распределения, который определяют как

- для одностороннего интервала;

- для двустороннего интервала.

Это приближение является весьма точным для обычно используемых значений .

При компьютерных расчетах для получения приближенного значения k применяют формулу (10), согласованную с таблицей 1 и с более простой формулой (9), и используют для значений n, превышающих значения, представленные в таблице 1:

, (10)

тогда k - это целая часть .

Примеры

1 Электрический шнур небольшого электрического прибора испытывают на испытательной машине на многократный изгиб до отказа. Испытания моделируют реальную эксплуатацию шнура. Испытания являются ускоренными. Ниже представлена выборка, состоящая из 24 наработок до отказа в часах; семь значений выборки, отмеченных звездочками, являются цензурированными:

57,5; 77,8; 88,0; 96,9; 98,4; 100,3; 100,8; 102,1; 103,3;

103,4; 105,3; 105,4; 122,6; 139,3; 143,9; 148,0; 151,3;

161,1*; 161,2*; 161,2*; 162,4*; 162,7*; 163,1*; 176,8*.

На основании представленной выборки получают точечную оценку медианы распределения наработки до отказа

. (11)

Нижнюю доверительную границу одностороннего доверительного интервала для доверительной вероятности 0,95 находят следующим образом: сначала из таблицы 1 для n=24 определяют значение k=8, а затем в представленной выше упорядоченной выборке находят значение =102,1, которое принимают в качестве искомой нижней доверительной границы.

2 Наработки до отказа 34 транзисторов, полученные по результатам ускоренных испытаний и измеренные в неделях, представлены ниже. Три значения, отмеченные звездочками, являются цензурированными:

3; 4; 5; 6; 6; 7; 8; 8; 9; 9; 9; 10; 10; 11; 11; 11; 13; 13; 13; 13; 13;

17; 17; 19; 19; 25; 29; 33; 42; 42; 52; 52*; 52*; 52*.

На основании представленной выборки вычисляют точечную оценку медианы распределения наработки до отказа

. (12)

Начиная с n>30 для получения нижней границы одностороннего доверительного интервала для медианы вынужденно используют приближенный метод; для доверительной вероятности 0,95 получают

; (13)


k - целая часть y, следовательно, k=12 и искомая доверительная граница =10.

Можно показать, что найденное таким образом значение k совпадает со значением, полученным точным методом.

Для двусторонних доверительных границ:

, (14)


тогда k=11; n-k+1=24 и получают доверительный интервал

. (15)

УДК 519.25:620.113:006.354

ОКС 03.120.10

Ключевые слова: статистический анализ, случайная выборка, оценивание, доверительный интервал, порядковая статистика, медиана

Электронный текст документа

и сверен по:

, 2020