allgosts.ru03. УСЛУГИ. ОРГАНИЗАЦИЯ ФИРМ, УПРАВЛЕНИЕ И КАЧЕСТВО. АДМИНИСТРАЦИЯ. ТРАНСПОРТ. СОЦИОЛОГИЯ.03.120. Качество

ГОСТ ИСО 11453-2005 Статистические методы. Статистическое представление данных. Проверка гипотез и доверительные интервалы для пропорций

Обозначение:
ГОСТ ИСО 11453-2005
Наименование:
Статистические методы. Статистическое представление данных. Проверка гипотез и доверительные интервалы для пропорций
Статус:
Действует
Дата введения:
01.09.2006
Дата отмены:
-
Заменен на:
-
Код ОКС:
03.120.30

Текст ГОСТ ИСО 11453-2005 Статистические методы. Статистическое представление данных. Проверка гипотез и доверительные интервалы для пропорций


ГОСТ ИСО 11453-2005

Группа Т59


МЕЖГОСУДАРСТВЕННЫЙ СТАНДАРТ

Статистические методы

СТАТИСТИЧЕСКОЕ ПРЕДСТАВЛЕНИЕ ДАННЫХ

Проверка гипотез и доверительные интервалы для пропорций

Statistical methods. Statistical interpretation of data.
Tests and confidence intervals relating to proportions



ОКС 03.120.30

Дата введения 2006-09-01

Предисловие

Цели, основные принципы и основной порядок проведения работ по межгосударственной стандартизации установлены ГОСТ 1.0-92 "Межгосударственная система стандартизации. Основные положения" и ГОСТ 1.2-97 "Межгосударственная система стандартизации. Стандарты межгосударственные, правила, рекомендации по межгосударственной стандартизации. Порядок разработки, принятия, применения, обновления и отмены"

Сведения о стандарте

1 РАЗРАБОТАН Открытым акционерным обществом "Научно-исследовательский центр контроля и диагностики технических систем"(ОАО НИЦКД), Межгосударственным техническим комитетом по стандартизации МТК 125 "Статистические методы в управлении качеством продукции"

2 ВНЕСЕН Федеральным агентством по техническому регулированию и метрологии Российской Федерации

3 ПРИНЯТ Межгосударственным советом по стандартизации, метрологии и сертификации (протокол N 28 от 9 декабря 2005 г.)

За принятие проголосовали:

Краткое наименование страны
по МК (ИСО 3166) 004-97

Код страны
по МК (ИСО 3166) 004-97

Сокращенное наименование национального органа по стандартизации

Азербайджан

AZ

Азстандарт

Армения

AM

Армстандарт

Беларусь

BY

Госстандарт Республики Беларусь

Казахстан

KZ

Госстандарт Республики Казахстан

Кыргызстан

KG

Кыргызстандарт

Молдова

MD

Молдова-Стандарт

Российская Федерация

RU

Федеральное агентство по техническому регулированию и метрологии

Таджикистан

TJ

Таджикстандарт

Туркменистан

TM

Главгосслужба "Туркменстандартлары "

Узбекистан

UZ

Узстандарт

Украина

UA

Госпотребстандарт Украины

4 Настоящий стандарт идентичен международному стандарту ИСО 11453:1996* "Статистическое представление данных. Проверка гипотез и доверительные интервалы для пропорций" (ISO 11453:1996 "Statistical interpretation of data - Tests and confidence intervals relating to proportions").
________________
* Доступ к международным и зарубежным документам, упомянутым здесь и далее по тексту, можно получить, перейдя по ссылке на сайт . - .


Наименование настоящего стандарта изменено относительно наименования указанного международного стандарта для приведения в соответствие с ГОСТ 1.5. Степень соответствия - идентичная (IDТ).

5 Приказом Федерального агентства по техническому регулированию и метрологии от 29 июня 2006 г. N 125-ст межгосударственный стандарт ГОСТ ИСО 11453-2005 введен в действие с 1 сентября 2006 г.

6 ВВЕДЕН ВПЕРВЫЕ


Информация о введении в действие (прекращении действия) настоящего стандарта публикуется в указателе "Национальные стандарты".

Информация об изменениях к настоящему стандарту публикуется в указателе (каталоге) "Национальные стандарты", а текст изменений - в информационных указателях "Национальные стандарты". В случае пересмотра или отмены настоящего стандарта соответствующая информация будет опубликована в информационном указателе "Национальные стандарты"


1 Область применения

1 Область применения

Настоящий стандарт содержит описание статистических методов, предназначенных для решения следующих задач:

a) Дана совокупность элементов, из которых отобрана выборка из элементов, и у элементов выборки обнаружена некоторая характеристика. Какая доля (пропорция) совокупности имеет эту характеристику (см. 8.1)?

b) Отличается ли пропорция, определенная в соответствии с задачей а), от номинального указанного значения (см. 8.2)?

c) Даны две различные совокупности. Различаются ли доли элементов с заданной характеристикой в этих двух совокупностях (см. 8.3)?

d) Выборки какого объема следует отбирать для решения задач b) и с), чтобы быть достаточно уверенным в правильности решения (см. 7.2.3 и 7.3.3)?

Важно, чтобы метод отбора выборок не оказывал заметного влияния на совокупность. Если взятая случайным образом выборка составляет менее 10% совокупности, как правило, это является приемлемым. Если выборка составляет более 10% совокупности, надежные результаты можно получить только возвращая каждый отобранный элемент перед отбором следующего элемента.

2 Нормативные ссылки

В настоящем стандарте использована нормативная ссылка на следующий стандарт*:
________________
* Таблицу соответствия национальных стандартов международным см. по ссылке. - .


ИСО 3534.1:1993 Статистика. Словарь и условные обозначения. Часть 1: Вероятность и основы статистики

3 Определения

В настоящем стандарте применены термины по ИСО 3534.1, а также следующий термин с соответствующим определением:

3.1 целевой элемент (target item): Элемент, в котором обнаружена указанная характеристика.

4 Символы

В настоящем стандарте использованы следующие символы:

- выбранный уровень значимости;

- достигнутый уровень значимости;

()

- выбранный уровень доверия;

- вероятность ошибки второго вида;

- объем выборки; объем выборки 1; объем выборки 2;

- число целевых элементов в выборке (случайная величина);

- значение ;

- доля (пропорция) целевых элементов совокупности;

- верхняя граница одностороннего доверительного интервала для ;

- нижняя граница одностороннего доверительного интервала для ;

- верхняя граница двустороннего доверительного интервала для ;

- нижняя граница двустороннего доверительного интервала для ;

- значение, используемое для определения доверительных границ;

- критическое значение при проверке нулевой гипотезы ;

- критическое значение при проверке нулевой гипотезы ;

- нижняя граница критической области при проверке нулевой гипотезы ;

- верхняя граница критической области при проверке нулевой гипотезы ;

- заданное значение для ;

- значение , для которого определяется вероятность неотклонения нулевой гипотезы ;

- вероятность неотклонения нулевой гипотезы;

- числа степеней свободы -распределения;

- тестовые статистики;

- квантиль уровня -распределения с и степенями свободы;

- тестовые статистики;

- квантиль уровня стандартного нормального распределения;

- вспомогательные величины.

5 Точечная оценка пропорции p

Оценку по выборке из элементов с целевыми элементами определяют по формуле


.

Эта оценка является несмещенной, если выборка отбиралась случайным образом, независимо от объема выборки и размера совокупности, даже если выборка составляет заметную часть совокупности.

6 Доверительные границы для пропорции p

Процедуры определения границ доверительного интервала для приведены в 8.1 (формы А-1 - А-3).

Границы доверительного интервала зависят от объема выборки , числа целевых элементов в выборке и выбранного уровня доверия (). Невозможно точно достичь заданного уровня доверия из-за дискретности . Приведенная в стандарте процедура дает минимальное значение уровня доверия, не превосходящее ().

В настоящем стандарте при определении границ двустороннего доверительного интервала для заданного уровня доверия () используется процедура определения нижних границ одностороннего доверительного интервала для уровня доверия (). Это гарантирует, что вероятность ошибки меньше или равна с каждой стороны интервала.

7 Проверка гипотез для пропорции p

7.1 Общие требования

Для решения практических задач в формах В-1 - В-3 (8.2) и С-1 - С-3 (8.3) приведены нулевые гипотезы для пропорций и схемы их проверки. Сначала должны быть выбраны соответствующая нулевая гипотеза, объем выборки (объемы выборок и ) и уровень значимости. Поскольку основные используемые распределения дискретны, процедуры разработаны так, чтобы достичь самого близкого к выбранному значению уровня значимости, который меньше или равен этому значению. В формах не приведены альтернативные гипотезы, так как в каждом случае неявно предполагается, что альтернативная гипотеза является дополнительной к нулевой гипотезе.

Пример - При работе с формами В (процедура сравнения пропорции с заданным значением) вначале необходимо выбрать одну из следующих трех нулевых гипотез (с дополнительной альтернативной гипотезой ), где - заданное значение:

a) односторонний критерий с и ;

b) односторонний критерий с и ;

c) двусторонний критерий с и .

Результатом проверки гипотезы является отклонение или неотклонение нулевой гипотезы.

Отклонение нулевой гипотезы означает, что принимается альтернативная гипотеза. Неотклонение нулевой гипотезы не означает, что принимается нулевая гипотеза (см. 7.2.2).


7.2 Сравнение пропорции с заданным значением p(0)

7.2.1 Процедура проверки гипотез

Процедуры проверки нулевых гипотез:

;

;

.

где - заданное значение; описаны в формах В-1 - В-3. Эти процедуры особенно просты для применения, если известны критические значения для заданных значений и . Если критические значения неизвестны, их можно определить при выполнении процедуры в соответствии с формами В (8.2).

7.2.2 Оперативные характеристики

Вычисление оперативных характеристик (включая вероятность ошибки первого рода, достигнутого уровня значимости и вероятности ошибки второго рода) описано в приложении А. Для вычисления этих характеристик критические значения должны быть известны (см. 7.2.1) и должна быть выбрана альтернативная гипотеза , для которой определяется вероятность ошибки второго рода.

7.2.3 Определение объема выборки

Если объем выборки не определен (например, по экономическим или техническим причинам), его минимальное значение должно быть задано таким, чтобы для выбранной нулевой гипотезы (см. 7.2.1) достигнутое значение уровня значимости не превосходило выбранного или заданного значения. Кроме того, достигнутое значение ошибки второго рода (вероятность ) должно быть приблизительно равно выбранному или заданному значению , если равно выбранному значению . Для этой цели и должны быть отмечены на шкале , а , (), , () - на шкале и прямых линиях 1 и 2 в соответствии с таблицей 1 и номограммой Ларсона (рисунок 2).


Таблица 1 - Процедура определения объема выборок по номограмме Ларсона (рисунок 2)

Нулевая гипотеза

Заданное значение

Прямая линия 1 из точки в точку

Прямая линия 2 из точки в точку


Точка пересечения прямых линий 1 и 2, указанных в таблице 1, дает значения () на шкале . Если - не целое число, его следует округлить до ближайшего целого числа.

7.3 Сравнение двух пропорций

7.3.1 Процедура проверки гипотез

Процедуры проверки для нулевых гипотез:

;

;

.

где - доля (пропорция) целевых элементов в совокупности 1, а - доля (пропорция) целевых элементов в совокупности 2, описаны в формах С-1 - С-3 (8.3). Эти процедуры можно использовать для анализа независимости двух атрибутов (дихотомических характеристик) элементов совокупности

.

7.3.2 Оперативные характеристики

Предположения:

a) для одностороннего критерия мощность () определяют для заданной пары пропорций и , где ;

b) для проверки гипотез используют две выборки одного и того же объема, то есть .

Если - уровень значимости, то достаточно точное приближенное значение мощности может быть получено обратным преобразованием по [1]:

,

где - функция распределения стандартного нормального распределения;

- квантиль стандартного нормального распределения уровня ();

.

Это приближение может также использоваться и для двустороннего критерия с альтернативной гипотезой , если заменить в формуле на .

7.3.3 Определение объема выборки

Если объемы выборок и не заданы, их минимальные значения должны быть выбраны такими, чтобы мощность критерия была не менее (), а уровень значимости - не менее .

Предполагается, что нулевая гипотеза является односторонней . Однако приведенные процедуры применимы также для двустороннего критерия с альтернативной гипотезой , если заменить на .

Точные значения объема выборок приведены в таблицах 5 и 6 и в [2] для выбранных значений и . Эти таблицы предполагают, что объемы выборок равны, т.е. .

Для сочетаний и (), не приведенных в таблицах 5 и 6, может использоваться следующее приближение, которое учитывает неравные объемы выборок, однако необходимо, чтобы отношение объемов выборок было выбрано заранее.

;

;

;

;

.

8 Формы

Для простоты применения форм необходимо отметить квадратики, представляющие активизированную часть формы, а затем выполнить необходимые действия, вводя необходимые данные.

8.1 Формы А. Доверительный интервал для пропорции p

8.1.1 ФормаА-1 - Односторонний доверительный интервал с верхней границей для пропорции

Характеристика:

Процедура определения:

Элементы:

Критерий для идентификации целевых элементов:

Примечания:

Выбранный уровень доверия

Объем выборки

Число целевых элементов в выборке

Определение границы доверительного интервала

а) Процедура для

1) Случай


2) Случай


По таблице 2 для известных значений , и определяют


b) Процедура для 30

1) Случай



2) Случай


3) Случай

По таблице 3 для определяют

Значение , соответствующее выбранному уровню доверия, определяют по следующей таблице.

0,90

0,95

0,99


0,411

0,677

1,353




где .

Результат (искомый доверительный интервал):



8.1.2 Форма А-2. Односторонний доверительный интервал с нижней границей для пропорции

Характеристика:

Процедура определения:

Элементы:

Критерий для идентификации целевых элементов:

Примечания:

Выбранный уровень доверия

Объем выборки

Число целевых элементов в выборке

Определение границы доверительного интервала

а) Процедура для

1) Случай


2) Случай

По таблице 2 для известных значений , и определяют:




b) Процедура для 30

1) Случай



2) Случай


3) Случай

По таблице 3 для определяют

Значение , соответствующее выбранному уровню доверия, определяют по следующей таблице.

0,90

0,95

0,99


0,411

0,677

1,353




где .

Результат (искомый доверительный интервал):



8.1.3 Форма А-3. Двусторонний доверительный интервал для пропорции

Характеристика:

Процедура определения:

Элементы:

Критерий для идентификации целевых элементов:

Примечания:

Выбранный уровень доверия

Объем выборки

Число целевых элементов в выборке

Определение границ доверительного интервала

а) Процедура для

1) Определение верхней границы доверительного интервала:

- Случай


- Случай


По таблице 2 для известных значений , и определяют:


2) Определение нижней границы доверительного интервала:

- Случай

- Случай

По таблице 2 для известных значений , и определяют:




b) Процедура для 30

1) Определение верхней границы доверительного интервала:

- Случай


- Случай


- Случай

По таблице 3 для определяют

Значение , соответствующее выбранному уровню доверия, определяют по следующей таблице.

0,90

0,95

0,99


0,677

0,960

1,659




где .

2) Определение нижней границы доверительного интервала:

- Случай


- Случай


- Случай