База ГОСТовallgosts.ru » 67. ПРОИЗВОДСТВО ПИЩЕВЫХ ПРОДУКТОВ » 67.240. Органолептический анализ

ГОСТ ISO 11136-2017 Органолептический анализ. Методология. Общее руководство по проведению гедонических испытаний потребителями в контролируемой зоне

Обозначение: ГОСТ ISO 11136-2017
Наименование: Органолептический анализ. Методология. Общее руководство по проведению гедонических испытаний потребителями в контролируемой зоне
Статус: Принят

Дата введения: 01/01/2019
Дата отмены: -
Заменен на: -
Код ОКС: 67.240
Скачать PDF: ГОСТ ISO 11136-2017 Органолептический анализ. Методология. Общее руководство по проведению гедонических испытаний потребителями в контролируемой зоне.pdf
Скачать Word:ГОСТ ISO 11136-2017 Органолептический анализ. Методология. Общее руководство по проведению гедонических испытаний потребителями в контролируемой зоне.doc


Текст ГОСТ ISO 11136-2017 Органолептический анализ. Методология. Общее руководство по проведению гедонических испытаний потребителями в контролируемой зоне



МЕЖГОСУДАРСТВЕННЫЙ СОВЕТ ПО СТАНДАРТИЗАЦИИ, МЕТРОЛОГИИ И СЕРТИФИКАЦИИ

(МГС)

INTERSTATE COUNCIL FOR STANDARDIZATION, METROLOGY AND CERTIFICATION

(ISC)

МЕЖГОСУДАРСТВЕННЫЙ

СТАНДАРТ

ГОСТ

ISO 11136— 2017

Органолептический анализ МЕТОДОЛОГИЯ

Общее руководство по проведению гедонических испытаний потребителями в контролируемой зоне

(ISO 11136:2014,

Sensory analysis — Methodology — General guidance for conducting hedonic tests

with consumers in a controlled area,

IDT)

Издание официальное

Москва

Стандартииформ

2017

ГОСТ ISO 11136—2017

Предисловие

Цели, основные принципы и основной порядок проведения работ ло межгосударственной стан* дартизации установлены в ГОСТ 1.0—2015 «Межгосударственная система стандартизации. Основные положения» и ГОСТ 1.2—2015 «Межгосударственная система стандартизации. Стандарты межгосудар* ственные. правила и рекомендации по межгосударственной стандартизации. Правила разработки, при* нятия. обновления и отмены»

Сведения о стандарте

1    ПОДГОТОВЛЕН Акционерным обществом «Всероссийский научно-исследовательский институт сертификации» (АО «ВНИИС») на основе официального перевода на русский язык англоязычной версии указанного в пункте 5 стандарта, который выполнен ФГУП «Стандартинформ»

2    ВНЕСЕН Федеральным агентством по техническому регулированию и метрологии

3    ПРИНЯТ Межгосударственным советом по стандартизации, метрологии и сертификации (про* токол от 1 июня 2017 г. Isle 51)

За принятие проголосовали:

Краткое наименование страны по МК (ИСОЭ!в6) 004-97

Код страны no МК (ИСО 31*0> 004-97

Сокращенное и*именование национального органа по стандартизации

Армения

AM

Минэкономики Республики Армения

Беларусь

BY

Госстандарт Республики Беларусь

Казахстан

KZ

Госстандарт Республики Казахстан

Киргизия

KG

Кыргыэстандарг

Молдова

MD

Молдова-Стандарт

Россия

RU

Росстандэрг

Украина

UA

Минэкономразвития Украины

4 Приказом Федерального агентства по техническому регулированию и метрологии от 19 сентября 2017 г. № 1159-ст межгосударственный стандарт ГОСТ ISO 11136—2017 введен в действие в качестве национального стандарта Российской Федерации с 1 января 2019 г.

5    Настоящий стандарт идентичен международному стандарту ISO 11136:2014 «Сенсорный анализ. Методология. Общее руководство по проведению гедонических испытаний потребителями в кон* тролируемой зоне» («Sensory analysis — Methodology — General guidance for conducting hedonic tests with consumers in a controlled area». IDT).

Наименование настоящего стандарта изменено относительно наименования указанного между* народного стандарта для увязки с наименованиями, принятыми в существующем комплексе межгосударственных стандартов.

Международный стандарт разработан Подкомитетом ISO ТС 34/SC 12 «Сенсорный анализ» Технического комитета по стандартизации ISO/TC 34 «Пищевые продукты» Международной организации по стандартизации (ISO).

При применении настоящего стандарта рекомендуется использовать вместо ссылочных международных стандартов соответствующие им межгосударственные стандарты, сведения о которых приведены в дополнительном приложении ДА

6    ВВЕДЕН ВПЕРВЫЕ

7    Некоторые элементы настоящего стандарта могут являться объектами латентных прав

II

ГОСТ ISO 11136—2017

Информация об изменениях к настоящему стандарту публикуется в ежегодном информационном указателе «Национальные стандарты», а текст изменений и поправок — в ежемесячном информационном указателе "Национальные стандарты». В случае пересмотра (замены) или отмены настоящего стандарта соответствующее уведомление будет опубликовано в ежемесячном информационном указателе «Национальные стандарты». Соответствующая информация, уведомление и тексты размещаются также в информационной системе общего пользования — на официальном сайте Федерального агентства по техническому регулированию и метрологии в сети Интернет ()

© Стандартинформ, 2017

8 Российской Федерации настоящий стандарт не может быть полностью или частично воспроизведен. тиражирован и распространен в качестве официального издания без разрешения Федерального агентства по техническому регулированию и метрологии

III

ГОСТ ISO 11136—2017

Содержание

1    Область применения....................................................................................................................................1

2    Нормативные ссылки....................................................................................................................................1

3    Термины и определения...............................................................................................................................2

4    Подготовительные мероприятия...................................................... 3

4.1    Предложение о проведении испытания...............................................................................................3

4.2    Параметры целевой совокупности.......................................................................................................4

4.3    Дополнительные параметры................................................................................................................4

5    Выборка потребителей.................................................................................................................................4

5.1    Общие положения.................................................................................................................................4

5.2    Набор потребителей..............................................................................................................................5

5.3    Составление выборки потребителей...................................................................................................5

5.4    Сегментация выборки...........................................................................................................................6

6    Объем выборки потребителей....................................................................................................................6

6.1    Решение об измерении.........................................................................................................................6

6.2    Определение объема выборки.............................................................................................................7

6.3    Работа с подгруппами...........................................................................................................................7

6.4    Количество образцов продуктов и план эксперимента......................................................................8

6.5    Надежность набора участников...........................................................................................................8

7    Зона проведения испытания........................................................................................................................8

8    Продукты.......................................................................................................................................................8

8.1    Анонимное представление продуктов.................................................................................................8

8.2    Подготовка и представление продуктов..............................................................................................9

9    Методы.........................................................................................................................................................9

9.1    Две группы гедонических испытаний...................................................................................................9

9.2    Рейтинговый метод (метод шкал).......................................................................................................10

9.3    Метод парного сравнения образцов..................................................................................................10

9.4    Метод ранжирования...........................................................................................................................11

9.5    Дополнительные вопросы...................................................................................................................11

9.6    Инструкции для испытателей.............................................................................................................12

10    Организация испытательных сессий.......................................................................................................12

10.1    Общие положения.............................................................................................................................12

10.2    Планы ................................................................................................................................................13

10.3    Количество продуктов, оцениваемых за одну сессию....................................................................13

10.4    Характер продуктов, оцениваемых за одну сессию........................................................................14

10.5    Продолжительность сессии..............................................................................................................14

10.6    Повторение оценки продукта в одном испытании..........................................................................14

10.7    Предварительное испытание............................................................................................................14

11    Анализ результатов...................................................................................................................................15

11.1    Общие положения..............................................................................................................................15

11.2    Анализ выводов.................................................................................................................................15

11.3    Рейтинги (см. 9.2)...............................................................................................................................15

11.4    Парные сравнения (9.3)....................................................................................................................15

11.5    Ранжирование (9.4)............................................................................................................................15

12    Отчет об испытании..................................................................................................................................16

12.1    Общие положения.............................................................................................................................16

12.2    Продукты............................................................................................................................................16

12.3    Метод испытания...............................................................................................................................17

12.4    Испытатели (потребители)................................................................................................................17

12.5    Результаты.........................................................................................................................................17

12.6    Приложения к отчету.........................................................................................................................17

Приложение А (справочное) Пример анкеты для набора участников.......................................................19

Приложение В (справочное) Методы оценивания подгрупп при сегментации.........................................22

Приложение С (справочное) Планы распределения продуктов по испытателям....................................24

Приложение D (справочное) Влияние объема выборки на точность одного среднего значения...........25

Приложение Е (справочное) Минимальный размер выборки для рейтинговых тестов...........................26

IV

ГОСТ ISO 11136—2017

Приложение F (справочное) Минимальный объем выборки для ранжирования.....................................29

Приложение G (справочное) Примеры анализа данных для рейтингов...................................................31

Приложение Н (справочное) Примеры анализа данных для ранжирования................_..........................34

Приложение ДА (справочное) Сведения о соответствии ссылочных международных

стандартов межгосударственным стандартам...............................................................36

Библиография................................................................................................................................................37

V

ГОСТ ISO 11136—2017

МЕЖГОСУДАРСТВЕННЫЙ СТАНДАРТ

Органолептический анализ МЕТОДОЛОГИЯ

Общее руководство по проведению гедонических испытаний потребителями

в контролируемой зоне

Sensory analysis. Methodology.

General guidance for conducting hedonic tests with consumers in a controlled area

Дата введения — 2019—01—01

1    Область применения

Настоящий стандарт описывает подходы к определению, в пределах контролируемой зоны, степени, е которой потребителям нравится или относительно нравится предлагаемая продукция.

8 стандарте описаны испытания, основанные на сборе ответов на вопросы, обычно представленных в бумажном виде или посредством клавиатуры, или сенсорной панели. Испытания поведенческого характера (например, параметры записей, использованные потребителями по своему усмотрению) не попадают под настоящий стандарт.

Гедонические испытания, описанные в настоящем стандарте, можно использовать при:

•    сравнении предложенного продукта с конкурирующими продуктами;

•    оптимизации продукта с целью получения высокой гедонической оценки или с целью понравиться большому количеству потребителей;

•    определении ассортимента продуктов, соответствующих конкретной целевой совокупности потребителей;

•    определении срока годности (продукта);

•    оценке воздействия изменения состава продукта на удовольствие, доставляемое этим продуктом:

- изучении воздействия органолептических характеристик продукта на степень, в которой этот

продукт нравится, независимо от косвенных характеристик, таких как бренд, цена или реклама;

•    изучении влияния коммерческой переменной или формы преподнесения продукции, например, упаковки.

Описанные методы являются эффективными для определения:

•    существуют или нет предпочтения в восприятии (различие в степени предпочтительности), или

•    существуют или нет отрицательные предпочтения (тест на проверку подобия методом парного сравнения).

2    Нормативные ссылки

Следующие документы, на которые приводится ссылка, являются обязательными для применения настоящего стандарта. В отношении датированных ссылок применимо только указанное издание. В отношении недатированных ссылок действительно только последнее издание ссылочного документа, включая любые изменения к нему

ISO 4121. Sensory analysis— Guidelines for the use of quantitative response scales (Органолептический анализ. Руководящие указания по применению шкалы количественных результатов)

ISO 5492. Sensory analysis — Vocabulary (Органолептический анализ. Словарь)

ISO 5495, Sensory analysis — Methodology — Paired comparison test (Сенсорный анализ. Методология. Метод парного сравнения)

Издание официальное

1

ГОСТ ISO 11136—2017

ISO 8587. Sensory analysis — Methodology — Ranking (Сенсорный анализ. Методологий. Ранжирование)

ISO 8589. Sensory analysis — General guidance for the design of test rooms (Органолептический анализ. Общее руководство по проектированию помещений для исследований)

ISO 29842. Sensory analysis — Methodology — Balanced incomplete block designs {Органолептический анализ. Методология. Неполностью сбалансированные блочные конструкции)

3 Термины и определения

В данном документе используются термины с соответствующими определениями, приведенные в ISO 5492. а также следующие.

3.1    группа испытателей (access panel): Примерная база данных потенциальных респондентов, которые заявили о своем желании сотрудничать в планируемых сборах данных, если будут выбраны.

[ИСТОЧНИК: ISO 20252]

Примечание — Респонденты могут выбираться из базы на более или менее регулярной основе.

3.2    вопрос, предусматривающий стереотипные альтернативные ответы (closed-ended question): Вопрос, который требует от респондента выбрать из предварительно составленного перечня возможные ответы.

3.3    сторона-инициатор (commissioning party): Лицо, орган или служба, которые уполномочивают третью сторону на проведение испытания.

Примечания

1    Понятие «сторона-инициатор» соответствует концепции «покупатель» или «заказчик» в области контроля качества и противоположно концепции «поставщик», «поставщик услуг» или «лаборатория».

2    Обычно сторона-инициатор и поставщик услуг принадлежат к разным предприятиям. Там. где они принадлежат к двум департаментам одного и того же предприятия, соответствующие обязанности этих двух департаментов должны четко дифференцироваться и разъясняться в предложении о проведении испытания.

3.4    потребитель (испытатель) (consumer), респондент (respondent): Лицо, использующее продукт.

Примечание — В настоящем стандарте это значение ограничено лицом, которое не является экспертом, специалистоы-дегустатором или экспертом по оценке, выбранным в соответствии с ISO 5492.

3.5    выборка потребителей (испытателей) (consumer sample): Группа потребителей, набранных на основе критериев, установленных е соответствии с характером целевой совокупности.

3.6    контролируемая зона (controlled area): Место, обеспечивающее:

-    контролируемую подготовку и представление продуктов.

• комфортабельные условия для потребления продуктов и опроса потребителей.

-    отсутствие обмена информацией (вербальною и невербального) между потребителями (испытателями). гарантирующее независимость ответов.

3.7    гедоническое восприятие (hedonic perception): Количество удовольствия, доставляемого органолептическими свойствами продукта.

3.8    гедоническое испытание (hedonic test): Испытание, целью которого является определение общего гедонического восприятия продукта потребителями.

3.9    вопрос, допускающий неограниченное число ответов, открытый вопрос (open-ended question): Вопрос, который не предусматривает готовые альтернативные ответы для респондентов, а просит дать ответ собственными словами.

Примечание —Он может касаться каждого из продуктов, представленных потребителям (испытателям), или только некоторых из них (например, когда задается вопрос, почему определенный продукт является наиболее (наименее) привлекательным для потребителя (испытателя).

3.10    необъективность, связанная с положением (position bias): Косвенное влияние, связанное с расположением продукта в наборе оцениваемых продуктов.

3.11    семейство продуктов (product family): Группа продуктов, которые могут быть взаимозаменяемыми в нормальных условиях потребления.

Примечание — Семейства продуктов могут зависеть от культуры и привычек потребителей.

3.12    репрезентативность (representativeness) <выборки>: Степень, е которой качественные признаки выборки согласуются с соответствующими качественными признаками совокупности, из которой эта выборка получена.

2

ГОСТ ISO 11136—2017

3.13    необъективность, связанная с последовательностью (sequential bias): Косвенное влияние временного положения или положения в последовательности продукта в наборе оцениваемых продуктов.

3.14    сессия (session): Заседание потребителей (испытателей), работающих одновременно по одному и тому же протоколу в течение определенного периода времени.

Примечание — Сессию можно разделить на несколько сеансов, между которыми дается определенное время на отдых. Например, свссюо лродолжигегъностъю 1 ч 30 мин можно разделить на два сеанса с 10-минугным перерывом между ними.

3.15    целевая совокупность (target population): Совокупность потребителей, чей гедонический отзыв на продукт предполагается оценить.

4 Подготовительные мероприятия

4.1 Предложение о проведении испытания

Предложение о проведении испытания выдвигается предоставляющей услуги лабораторией на основе информации (обычно касающейся цели испытания и целевой совокупности), выданной стороной-инициатором. как письменный документ, который связывает лабораторию и сторону-инициатора договором. Он включает следующие элементы:

•    цель испытания:

-    подлежащие оценке продукты (и процедуры для их закупки, особенно в тех случаях, когда лаборатории требуется обеспечить один или более продуктов);

•    целевая совокупность для испытания:

•    размер выборки потребителей (объем выборки) и способ набора участников;

•    любые ограничения в отношении потребителей, ранее участвовавших в подобных испытаниях;

•    любые ограничения на другие продукты, которые предполагается оценить, за одну и ту же сессию испытаний;

•    условия оценивания;

•    тип интервью (самостоятельное заполнение форм или интервьюеры);

•    вопросник (анкета);

-    место проведения оценивания;

•    количество продуктов для оценивания на сессию в предлагаемом испытании, наряду с указанием других продуктов для оценивания, там. где сессия охватывает несколько семейств продуктов (там. где эти продукты неизвестны на момент составления предложения, лаборатории следует взять на себя обязательство связаться с испытателями, как только лаборатория узнает о характере продуктов);

•    условия подготовки, конкретно для оцениваемых продуктов (если они известны на данном этапе);

•    любые инструкции, конкретно для оцениваемых продуктов (если они известны на данном этапе) наряду с конкретной информацией, предоставляемой о продуктах или испытании в начале сессии;

•    наименование статистических критериев, которые предполагается использовать для интерпретации результатов; тип использованных рисков и их допустимых значений; величина минимального различия. которое предполагается обнаружить в тестах на проверку различия или максимально допустимого различия в тестах на проверку подобия:

•    любое предусмотренное разделение (сегментация) совокупности потребителей на основе характеристик. известных до получения данных оценивания или на основании полученных ответов;

•    метод изучения и получения итогов по вопросам, допускающим неограниченное число ответов:

•    любые рекомендации, которые сторона-инициатор желает, чтобы лаборатория разработала на основе результатов испытания:

-    данные, предусмотренные для тестов и предоставления отчета.

Если какие-либо из указанных выше элементов неизвестны на момент внесения предложения об испытании, это предложение включает для каждого рассматриваемого элемента следующее заявление: «Данный элемент будет установлен стороной-инициатором посредством... (задание этапа испытания]».

Примечание — Если спецификация уже существует, предложение о проведении испытания дает на нее ссыпку, не повторяя технические пункты, описанные в рабочем порядке в этой спецификации.

3

ГОСТ ISO 11136—2017

4.2    Параметры целевой совокупности

Чтобы установить целевую совокупность, необходимо ответить на следующие вопросы. Эти во* просы должны быть рассмотрены для каждого испытания, которое предполагается осуществить, потому что целевая группа потребителей, участвующая в одном испытании, может отличаться от группы для другого испытания, даже при испытании одного и того же продукта.

*    Представлен ли уже подлежащий испытаниям продукт на рынке? Если да. то можно ли отличить реальных потребителей от потенциальных?

-    Являются ли представляющие интерес потребители реально использующими представленный продукт потенциальными потребителями, которые еще не использовали зтот продукт, или группа будет смешанной?

•    Будут ли результаты, полученные от установленных подгрупп, изучаться и сравниваться?

-    Будут ли результаты всей выборки потребителей проанализированы с намерением идентификации подгрупп?

•    Представляют ли интерес расхождения между результатами отдельных представляющих интерес потребителей?

4.3    Дополнительные параметры

После задания параметров целевой совокупности, необходимо установить следующие аспекты:

-    место проведения испытания (см. раздел 7):

-    ожидаемая прецизионность измерения (см. 6.1);

-    метод испытания (см. раздел 9);

•    план представления продукта для выбранных методов испытания (см. 10.2):

-    спецификации для проверяемой гипотезы (см. 6.1).

Для проверяемой гипотезы затем должны быть установлены следующие аспекты:

*    состав выборки потребителей (см. раздел 5):

-    объем выборки потребителей (см. раздел 6).

5 Выборка потребителей

5.1 Общие положения

Целью гедонического испытания является определение приемлемости продуктов и/или определение предпочтений по отношению к двум или более продуктам установленной совокупностью потребителей.

Состав выборки потребителей является решающим для любого гедонического испытания, поскольку рассматривают, сможет или нет результат ответить на интересующие вопросы стороны-инициатора.

Потребители должны быть добровольцами, что означает запрет на получение вознаграждения или оплаты за участие в испытаниях.

Важно получить спонтанную реакцию.

Подготовленные потребители должны быть исключены из таких испытаний, поскольку они будут систематически отличаться от целевой совокупности потребителей.

Обычно не рекомендуется набирать потребителей из персонала компании, производящей испытуемый продукт. Если используют группу внутренних потребителей, то среди факторов, наиболее неблагоприятно сказывающихся на результатах, будет:

-    риск узнавания испытуемых продуктов.

*    тенденция вынести суждение в пользу узнанных продуктов, и

-    хорошая осведомленность в отношении испытуемых продуктов.

Эти факторы несут серьезный риск нарушения репрезентативности результатов для целевой совокупности потребителей.

Все критерии, которым следуют при выборе потребителей (например, можно или нет набирать их из штата компании-изготовителя или ее конкурентов или из конкретного социально-экономического сектора), должны быть согласованы с клиентом, заказавшим проведение испытания, независимо от используемого метода набора.

4

ГОСТ ISO 11136—2017

5.2 Набор потребителей

5.2.1    Общие положения

ПРЕДУПРЕЖДЕНИЕ — Необходимо соблюдать:

•    конфиденциальность и соответствующие законы при создании и оформлении файлов с персональными данными.

- законодательство в отношении возрастных ограничений.

Потребителей можно набирать либо на основе конкретной задачи (там. где потребителей набирают заново непосредственно под конкретное испытание) или из группы ожидания (перечень потенциальных потребителей с известными характеристиками). Набор под конкретную задачу часто считают средством набора потребителей, которые активно не участвовали в подобных испытаниях, но эта идея может стать ошибочной, когда происходит значительное увеличение мест, где организуют гедонические испытания квазистационарным образом.

5.2.2    Набор под конкретную задачу

Набор под конкретную задачу можно проводить в общественном месте, в торговой точке, по телефону. по обычной или электронной почте или по объявлению в местной газете или на радиостанции, или в социальных сетях, или иными путями через Интернет. В большинстве случаев необходимо достичь предварительного соглашения с корпорацией или организацией, несущей ответственность за участок, на котором ведется набор.

Способ набора и время подхода к потребителю (в частности, когда контакт происходит в общественном месте или по телефону и при распространении информации через средства массовой информации) может в значительной степени повлиять на состав выборки потребителей.

5.2.3    Набор из группы ожидания

Для эффективности набора также можно укомплектовать группу ожидания, участников которой внести в файл описания потребителей. Перед каждым испытанием и после установления целевой совокупности. можно сделать предварительный выбор на основе критериев, записанных в этом файле.

Описание потребителей может включать следующие данные о потребителе:

•    идентификационные данные рассматриваемого лица, контактные данные;

•    возраст, пол;

•    семейное положение, состав семьи;

-социальное положение, профессия, доход;

•    возможные проблемы со здоровьем (например, аллергия, диабет, проблемы со зрением, и т. д.) в отношении испытываемых продуктов;

•    другая информация, связанная с испытываемыми продуктами (например, привычки в еде и питье. религиозные запреты, образ жизни, бытовое оборудование);

•    информация о доступности потребителя для участия в испытаниях;

•    информация о случаях предыдущего участия в испытаниях потребителем.

Описание каждого потребителя необходимо регулярно актуализировать.

Описанная база данных позволит эффективно работать в диалоге между стороной-инициатором и поставщиком услуг в такой мере, в какой это позволит последнему обеспечить удовлетворение основных пожеланий стороны-инициатора в отношении целевых потребителей.

5.2.4    Частота привлечения потребителей

По сравнению с набором под конкретную задачу существует большой риск «профессионализации потребителя», при наборе из существующей совокупности потребителей.

важно избежать эффекта обучения отдельного потребителя в отношении испытуемой группы продуктов. поэтому нельзя привлекать одних и тех же потребителей слишком часто. В качестве руководства рекомендуется проводить отдельные испытания одного и того же продукта не менее чем с трехмесячным интервалом.

Лаборатория должна сохранять записи частоты участия каждого потребителя в испытаниях каждого продукта и каждого семейства продуктов. История участия потребителей должна быть включена в отчет об испытании, возможно наряду с информацией о семействе продуктов по запросу стороны-инициатора.

5.3 Составление выборки потребителей

5.3.1 выбор потребителей с помощью анкеты

Когда потребителей набирают с помощью анкеты, относящейся к критериям, установленным для состава выборки потребителей, потребитель не должен иметь возможность идентифицировать, какие критерии в анкете являются решающими в выборе для участия в испытаниях.

5

ГОСТ ISO 11136—2017

Примеры возможных критериев:

-    предыдущее участие в испытаниях рассматриваемой группы продуктов;

•    частота использования рассматриваемого продукта;

-    обычно используемый бренд, описание продукта, место приобретения и т. д.;

•    привычки в использовании или потреблении рассматриваемого продукта.

Могут подойти другие критерии, такие как возраст, пол, социальный слой, группа занятости или географическое местоположение. Из соображений практичности следует установить классы для каж-дого из этих критериев. Для каждого класса следует установить процент, которым этот класс будет представлен в выборке потребителей.

Для каждого потребителя, выбранного для участия в испытании, анкета должна быть заполнена полностью.

Можно проверить требуемые детали набора.

Пример анкеты для набора участников приведен в приложении А.

Анкету или информацию из этой анкеты необходимо хранить, чтобы обеспечить прослеживав* мость параметров набора участников испытания.

5.3.2 Репрезентативность выборки потребителей

Репрезентативность в отношении целевой совокупности является главным свойством, требуемым от выборки. Определение такой совокупности обычно вытекает из взаимодействия между стороной* инициатором испытания, которая предлагает целевую совокупность, и лабораторией, которая оценивает осуществимость этого предложения.

Для выбора потребителей, которые будут представительными для целевой совокупности, необходимо использовать следующие критерии:

•    частота использования или потребления продукта (этот критерий зачастую считается основным в отношении его предполагаемого влияния на различающую способность испытания);

•    возраст, пол. социально-экономический статус, занятие, географическое местоположение:

•    бренд продукта, обычно используемого или потребляемого;

-    место приобретения этого продукта.

5.4 Сегментация выборки

Существует два пути возможной сегментации выборки (потребителей):

a)    Сегментация на начальной стадии, чтобы получить ответы на вопросы:

1)    Отвечают женщины и мужчины одинаково или по-разному?

2)    Одинаковы или нет ответы разных возрастных групп?

3)    Зависят ли ответы от привычек потребления?

В этом случае каждую подгруппу анализируют по отдельности и сравнивают результаты.

b)    Сегментация может быть выведена на основе собранных данных, если имеется подтверждение (например, мультимодальность) наличия различных подгрупп.

В приложении В приведено руководство в отношении того, как обращаться с данными сегментации.

6 Объем выборки потребителей

6.1 Решение об измерении

Численная прецизионность любых средних значений или оценок, полученных по результатам, увеличивается с увеличением численности выборки. В то же время повышенная прецизионность измерения сама по себе не обеспечивает релевантность и достоверность полученных заключений. Большое значение имеет также правильный выбор потребителей и методов.

Приложение О содержит некоторые особенности влияния объема выборки потребителей на прецизионность измерения.

Прецизионность также зависит от вариантности ответов потребителей в отношении одного продукта. Чем больше разброс, тем больше должен быть размер выборки, чтобы получить заданную прецизионность. Знание данного параметра вытекает из опыта как лаборатории, так и стороны-инициатора.

Прецизионность результатов зависит также от метода испытания. Например, при прочих равных условиях различие между двумя продуктами устанавливается более прецизионно, если каждый потребитель оценивает оба продукта, а не в случае оценки продуктов разными потребителями.

6

ГОСТ ISO 11136—2017

Требующаяся прецизионность зависит от цели испытания. При прочих равных условиях на прецизионность влияет.

•    наименьшее различие между двумя средними оценками удовольствия, которое считается достаточно большим, чтобы использоваться, когда целью испытания является демонстрация различия (чем различие меньше, тем больше надо брать размер выборки);

•    наибольшее различие между двумя средними оценками удовольствия, которое считается достаточно малым, чтобы им пренебречь, когда целью испытания является демонстрация равноценности (чем равноценность меньше, тем больше надо брать размер выборки);

•    риск а (альфа), выбираемый стороной-инициатором на принятие ошибочного заключения о наличии различия (чем меньше риск а. тем больше надо брать размер выборки);

•    мощность Р, которую сторона-инициатор желает для критерия. (Р - 1 - р. где р представляет собой риск ошибочного заключения, что различие отсутствует); чем больше желательная мощность, тем больше надо брать размер выборки);

•    направленность предполагаемого статистического критерия. Если сторона-инициатор заинтересована только в повторном подтверждении, что продукт В не уступает продукту А, направленный критерий подходит и мощность этого критерия больше, чем. если заключения, что В уступает А или что в превосходит А, представляют одинаковый интерес.

6.2    Определение объема выборки

Определение объема выборки является критическим этапом в разработке испытания и требует помощи специалиста в области статистики. 8 приложении Е даны формулы (сопровождаемые примерами). которые можно использовать для расчетов в тестах на проверку различия, либо на проверку подобия на основе рейтингов. Приложение F дает то же самое для испытаний, основанных на предпочтениях.

во всех случаях не допускается объем выборки потребителей, соответствующий настоящему стандарту, меньше 60.

Там. где лаборатория не имеет данных, требующихся для методов, описанных в приложении Е или приложении F. настоящий стандарт фиксирует минимальный размер выборки —100.

Там. где лаборатория использует методы, описанные в приложении Е или приложении F. размер выборки задается результатом расчета, который:

•    может быть снижен до 100. когда рассчитанное количество потребителей более 100. но лаборатория и/или сторона-инициатор не имеет средств для опроса большего количества потребителей. Если это происходит, лаборатория должна рассчитать оцененную мощность критерия для количества потребителей. равного 100, и получить согласие стороны-инициатора на принятие более низкой мощности, и

•    должен быть увеличен до 60. если рассчитанное количество меньше 60.

Значения 100 и 60 предполагают, что сторона-инициатор не надеется на заключения, сегментированные согласно характеристикам потребителей, таким как возраст и пол. Там. где решение о разделении принято до испытания, минимальное число потребителей на сегмент составляет 60.

6.3    Работа с подгруппами

6.3.1    Общие положения

Подгруппы выборки потребителей можно сформировать до сбора данных испытания или используя эти данные. Для любых вариантов, перечисленных ниже, необходимо получить рекомендации у статистиков на стадии планирования испытания.

6.3.2    Отдельные испытания с использованием заранее сформированных групп потребителей

Сторона-инициатор может пожелать изучить отдельные подгруппы, сформированные с учетом характеристик потребителей (таких как возраст и пол), которые известны до начала испытаний. Один вариант заключается в независимом анализе полученных результатов. В этом случае каждая подгруппа должна состоять как минимум из 60 испытателей.

6.3.3    Унифицированное испытание с использованием заранее сформированных групп потребителей

Процедура 6.3.2 менее эффективна, чем уравнивающие презентации для всей выборки потребителей с последующим комплексным анализом всех результатов с учетом количества членов в подгруппах. Такая же степень доверия обычно достигается с меньшим, чем 60. количеством потребителей в каждой подгруппе. Такой стиль анализа в высшей степени эффективен, когда все подгруппы одинаковы или очень схожи по размеру.

7

ГОСТ ISO 11136—2017

6.3.4    Сегментация потребителей

Количество членов в подгруппе может быть результатом, выведенным по результатам испыта* ний на большой выборке потребителей. Подгруппы тогда классифицируют по оценке всех имеющихся данных (результаты измерений и/или социально-демографические данные). Такая сегментация служит для описания выборки потребителей и может использоваться для разработки новых гипотез. Число сформированных групп, их характеристики и их размеры зависят от количества и характера полученных результатов.

6.4    Количество образцов продуктов и план эксперимента

Количество образцов и план эксперимента влияют на размер выборки потребителей. Если для презентации продукта используется полный план, то количество потребителей, необходимое для испытания. будет равно числу полученных отзывов на продукт. Если используется неполный план, количество потребителей должно быть больше.

6.5    Надежность набора участников

Реально полученное число отзывов обычно меньше числа набранных для испытания потребителей. поскольку некоторые потребители в выборке могут отсутствовать, а некоторые участники неправильно использовать анкету. Чтобы компенсировать это. следует включить резерв при расчете требующегося количества потребителей.

7    Зона проведения испытания

Настоящий стандарт касается гедонических испытаний, проводимых в контролируемой зоне согласно 3.6. Это отличается от гедонических испытаний, проводимых, например, в торговой точке или на дому у потребителей, что выходит за рамки области применения настоящего стандарта. Описано три примера соответствующих зон испытания.

a)    Стационарная лаборатория органолептической оценки, специально оборудованная в соответствии с ISO 8569 для проведения органолептических испытаний. Она имеет приемную для встречи участников, помещение для подготовки продуктов и помещение, оснащенное боксами для испытаний, температурным контролем и системой вентиляции для периодического обновления воздуха. Такая зона обеспечивает наилучшую подготовку продуктов, представление продуктов и условия протоколирования ответов.

b)    Передвижная лаборатория органолептической оценки, установленная на транспортном средстве. которое специально переоборудовано для проведения органолептических испытаний. Обычно такая лаборатория имеет меньше площадей, чем стационарная. Зоны для приема испытателей и подготовки продуктов очень ограничены.

c)    Комната или комнаты, оснащаемые на время в соответствии с «конфетной задачей» для оценивания продуктов, которые требуют минимум подготовки. Эту зону разбивают на две отдельные части, одну для проведения испытаний, другую для подготовки и кодирования продуктов. Планировка зоны испытания позволяет потребителям работать в физической изоляции друг от друга. Условия испытания (температура, комнатное освещение, вентиляция, хранение и подготовка образцов) можно отслеживать. В отличие от стационарных и передвижных лабораторий в данном примере подготовку продуктов и систему презентации каждый раз определяют заново, адаптируя помещение под конкретную задачу.

8    Продукты

8.1 Анонимное представление продуктов

Подлежащие испытанию продукты представляют испытателям после того, как их максимально лишают индивидуальности и единственным средством идентификации остается произвольный код (например. трехзначное случайное число), присвоенный лабораторией. Все ссылки на бренд или знак качества должны быть удалены или зафыты. за исключением двух случаев:

a)    когда удаление или маскировка невозможны:

b)    когда целью является определение влияния бренда или знака качества.

Примечание — В настоящем стандарте под знаком качества подразумевают любой знак, который потребитель мажет воспринять как влияние на оценку. Например, тип упаковки мажет представлять собой знак качества.

8

ГОСТ ISO 11136—2017

8.2 Подготовка и представление продуктов

8.2.1    Общие положения

Подлежащие оценке продукты должны быть подготовлены согласно методам, рекомендованным изготовителями, или. если такие методы неизвестны, то согласно методу, официально оформленному по предварительным испытаниям. Допуская надлежащим образом обоснованные ожидания, условия подготовки должны приближаться к обычным условиям использования и потребления.

То же самое правило применяется к представлению продуктов (температура, сопутствующие продукты. посуда и способ подачи).

ПРЕДУПРЕЖДЕНИЕ — Любой продукт меняется от партии к партии и вследствие хранения. Такая изменчивость может представлять интерес для стороны-инициатора и в некоторых случаях может стать основной задачей испытания. Во всех других случаях изменчивость следует минимизировать, используя продукты из одной и той же партии, которые хранились в одинаковых условиях и в течение одинакового времени.

8.2.2    Количество представляемых продуктов

Количество продукта, представленного испытателю, должно соответствовать обычно потребляемой порции продукта, установленной стороной-инициатором. Испытателя необходимо информировать о минимальном количестве образца для испытания и. при необходимости, о максимальном количестве образца для испытания или потребления. Необходимо следить за тем. чтобы порция образца не была слишком маленькой (риск получить только мимолетное исчезающее начальное впечатление) или слишком большой (риск добиться пресыщения или отвращения).

Представленное количество может потребовать уменьшения по сравнению с обычно потребляемым количеством, в тех случаях, когда участники пробуют несколько продуктов одного и того же семейства. В то же время, представленного количества всегда должно быть достаточно, чтобы избежать проведения оценки на слишком малом количестве, спровоцировав, таким образом, получение мимолетного исчезающего начального впечатления.

Порция готовой рыбы, предоставленная каждому участнику, должна пропорционально включать все составляющие испытуемого продукта.

8.2.3    Форма представленных продуктов

Иногда существует два варианта представления продукта: продукт в состоянии непосредственно после закупки и продукт в форме, готовой к употреблению.

Пример 1 — Примеры включают хлеб (целиком или нарезанные/), сосиску (целиком или нарезанную), сыр (целиком или нарезанный, пиццу (целиком или порциями), растворимый кофе (в чашке до или после добавления воды).

Лаборатория и сторона-инициатор могут считать, что обе формы имеют одну и ту же цель: наилучшим образом оценить удовольствие, вызываемое продуктом. Нет необходимости знать, провоцируется или нет эффект ореола той или иной формой. Если да. то две формы представляют одновременно (целиком/кусочками) или последовательно (растворимый кофе). Потребитель дает отдельную оценку обеим формам представления, причем потребители не знают, что один и тот же продукт представлен в двух формах. Такой подход соответствует нормальному поведению потребителя, которому в повседневной жизни не требуется разделять свои восприятия.

Пример 2 — Слова инструкции и вопроса могут звучать так: Вам дают сосиску под кодом 148. Вам следуа/n осмотреть ее. понюхать, съесть несколько кусочков и затем сообщить свою оценку с помощью указанной ниже шкалы.

Если лаборатория и сторона-инициатор согласны, что обе формы вносят вклад в удовольствие, получаемое от продукта, они не нуждаются в обработке как разные продукты. Наоборот обе эти формы можно представить вместе или по очереди и получить один рейтинг.

Примечание — Пол настоящий стандарт не подпадает случай, когда лаборатория и сторона-инициатор считают необходимым узнать эффект ожидания, создаваемый визуальной информацией. Такая ситуация попадает в рамки области применения специальных планов испытания, включающих конкретные концепции и методы анализа.

9 Методы

9.1 Две группы гедонических испытаний

Две основные группы гедонических испытаний устанавливают разные задачи для потребителя (испытателя):

9

ГОСТ ISO 11136—2017

a)    проверка приемлемости, используемая для измерения глубины удовлетворения (удовольствия) при потреблении. В настоящем стандарте единственным описанным типом проверки приемлемости является рейтинговый метод (метод шкал);

b)    методы предпочтения, используемые для измерения степени получаемого удовольствия от разных продуктов (например. «Какой образец Вам нравится больше?» или «Пожалуйста, расположите представленные образцы в порядке от менее понравившегося до более понравившегося»). Информация. полученная методом оценки моментального предпочтения, имеет относительный характер. Она ничего не говорит о приемлемости продуктов, поскольку можно отдать предпочтение одному продукту перед другим, хотя оба они неприемлемы. Методы предпочтения подразделяются:

-    на методы парного сравнения, когда сравнивают два образца.

-    методы ранжирования, когда работают с несколькими образцами.

9.2 Рейтинговый метод (метод шкал)

9.2.1    Общие положения

Рейтинговые методы различаются:

• по шкале: шкала может быть структурированной, не структурированной, числовой, семантической или графической в соответствии с ISO 4121.

-    методом представления продуктов.

Когда число продуктов два или более, можно использовать три метода представления продуктов:

a)    строгое монадическое представление (отдельная оценка), когда каждый испытатель оценивает один продукт:

b)    последовательное монадическое представление (неполный или полный план), когда несколько продуктов оцениваются испытателем за одну или несколько сессий. Испытатель получает один продукт за один раз. при этом информации об уже оцененных продуктах или полученных при оценке ответах ему не дается; необходимо обеспечить невозможность для испытателя вернуться к оценке ранее испытанного продукта;

c)    сравнительное представление (неполный или полный план), когда несколько продуктов оцениваются испытателем одновременно, и испытателям позволяется пересмотреть оценки, которые они дали другим продуктам.

Наиболее общей формой представления является последовательная монадическая. Она менее затратная, чем первая, но требует полностью освоить способ распределения продуктов по испытателям (см. приложение С). Сравнительное представление применяют редко, поскольку имеет тенденцию к преувеличению различий между продуктами, а также затрудняет сравнение между результатами испытания. когда условия испытания не строго идентичны.

9.2.2    Планы представления продуктов

Образцы следует представлять испытателям в соответствии с планом представления (см. 10.2).

9.3 Метод парного сравнения образцов

9.3.1 Общие положения

Методы парного сравнения образцов должны осуществляться в соответствии с ISO 5495.

Принцип парного сравнения образцов заключается в сравнении продуктов, представленных парами. Испытатель оценивает образцы в установленном порядке и указывает, какой из двух образцов предпочтительнее.

Парное сравнение образцов с указанием предпочтения в отношении одного из двух продуктов можно проводить в два разных дня. а именно с принудительным выбором (вариант А ниже) или с допустимым ответом «предпочтения нет» (вариант В ниже).

a)    Вариант А: Испытатели отвечают на вопрос, предполагающий только один ответ:

«Попробуйте два представленных Вам продукта, начиная с продукта слева, и затем отметьте крестиком код продукта, который для Вас предпочтительнее».

Продукт ххх    Продукт ууу

□ □

Здесь испытателям предстоит решить, какому продукту отдать предпочтение.

b)    Вариант В: Испытатели отвечают на вопрос, предполагающий только один ответ:

«Попробуйте два представленных Вам продукта, начиная с продукта слева, и затем отметьте крестиком код продукта, который для Вас предпочтительнее. Если продукты Вам нравятся в равной степени. поставьте крестик в клетку «предпочтения нет».

10

ГОСТ ISO 11136—2017

Продукт ххх Предпочтения нет    Продукт ууу

□ □ □

Для сравнения одной пары образцов вариант А имеет преимущество большего потенциала для проверки различия, чем вариант В.

8 анкетах не должно содержаться вопросов, способных повлиять на решение испытателей в пользу того или иного продукта или оценку продуктов в отношении конкретных качественных характеристик. Например, если испытателей просят высказать замечания в отношении флейвора продуктов, то испытателям следует сконцентрироваться именно на этом аспекте при оценке приемлемости.

Разрешается, в то же время, задать вопрос, допускающий неограниченное количество ответов, в конце испытания, давая испытателям возможность прокомментировать, какие продукты понравились и какие не понравились.

9.3.2 Планы представления образцов

Порядок представления образцов А и 8 должен уравновешиваться парами АВ и ВА одинаково часто, предлагая их испытателям случайным образом.

9.4 Метод ранжирования

9.4.1    Общие положения

Методы ранжирования проводят в соответствии с ISO 8587.

Принцип метода ранжирования заключается в представлении нескольких образцов одновременно и просьбе отсортировать их в соответствующем порядке.

Метод рангового порядка довольно требователен к испытателю, и его сложность увеличивается с числом образцов для сравнения, поскольку испытатель должен попробовать продукты несколько раз. чтобы отсортировать и расположить их в соответствующем порядке.

Допускается задавать порядок испытания образцов (обычно слева направо) только для первоначальной оценки каждого образца испытателем. После этого испытателю позволяется пробовать образцы в любом порядке. Более того, нельзя задавать метод принятия решения испытателем в отношении порядка распределения.

Метод рангового порядка может быть выполнен либо с принудительным выбором, либо, позволяя испытателю классифицировать два или более продуктов как равные. В то же время анализ второю из этих вариантов не подпадает подданный стандарт.

9.4.2    Анкетирование

Испытатели получают задание следующею типа:

«Необходимо попробовать четыре продукта, один за другим, начиная с продукта, расположенною в крайней левой позиции, и заканчивая продуктом, расположенным в крайней правой позиции. Затем можно пробовать любой из продуктов еще раз. сколько требуется, чтобы составить о нем свое мнение. Затем, внесите коды продуктов по порядку от наименее понравившегося до наиболее понравившегося»

Понравился меньше всех

Понравился больше всех

9.5 Дополнительные вопросы

9.5.1    Общие положения

8 дополнение к любому из описанных методов стороне-инициатору может понадобиться дополнительная информация, помогающая понять общую оценку продуктов или характеристик испытателей. Например, набирая потребителей из базы данных, лаборатории может потребоваться проверка, что все испытатели выбраны действительно из целевой совокупности. Для этого можно задать вопрос о конкретной привычке потребления.

9.5.2    Вопросы о потребителях

8ыбор вопросов и этапа, на котором их задавать, требует пристального внимания лаборатории.

Если вопрос задается после сессии, необходимо остерегаться, что на ответы могут повлиять уже проведенные слепые испытания. Например, после испытания сначала томатного соуса, а потом риса, испытатели могут скорее склониться к заявлению, что в действительности они пробовали рис с соусом.

С другой стороны, вопросы, задаваемые до сессии, могут спровоцировать испытателей рассматривать продукты особым образом или уделить особое внимание некоторым аспектам.

11

ГОСТ ISO 11136—2017

9.5.3 вопросы о продуктах

Для этой цели можно использовать вопросы, предусматривающие один или неограниченное число ответов. Эти вопросы должны задаваться после всех вопросов, касающихся общей оценки и на листе (или экране), отличающемся от других, касающихся общей оценки, чтобы снизить риск, что испытатели ответят таким образом, что их ответы окажутся единообразными.

Количество таких вопросов следует максимально сократить.

Примечания

1    Дополнительные вопросы не предназначены ставить под сомнение результаты основной оценки. Если существует какое-либо несоответствие между общей оценкой и сообщением о намерении потреблять (лродухт), предполагается найти причину этого, возможно посредством дололнигвгъного испытания.

2    Дополнительные вопросы часто дают мало сведений. Руководитель лаборатории органолептической оценки должен информировать сгорону-иницмвтора о существовании методов (например, составление карт предпочтений или декомбинационный анализ), разработанных специально для комбинирования гедонических данных и данных органолептического профиля и для определения, почему испытателям нравится или не нравится продукт.

9.6 Инструкции для испытателей

Инструкции могут быть даны в письменной или устной форме. Их значение для соответствия полученных результатов нельзя недооценивать. Особое внимание должно уделяться инструкциям, они должны составить предмет конкретного раздела в отчете об испытании. Инструкции должны фокусироваться на следующем:

a)    минимальные и максимальные величины, которые каждый испытатель должен оценить до выставления оценки. Эти величины зависят от типа продукта, числа продуктов, оцененных в ходе сессии, и пожеланий стороны-инициатора. Лаборатория должна не только давать инструкции в отношении минимальных и максимальных величин, но также должна определять рабочий протокол, чтобы обеспечить выполнение этих инструкций:

b)    что необходимо сделать после заполнения опросного листа. При проведении последовательной моиадичесхой оценки лаборатория должна использовать систему, которая не допускает, чтобы испытатели ссылались на ответы ранее оцененного продукта;

c)    продолжительность перерывов и любая деятельность во время этих перерывов (очистка рецепторов с помощью хлеба, яблока или воды, выход из помещения, где проводилась оценка, чтение журналов и т. д.);

d)    формат и смысл задаваемых вопросов.

Примечание — Формулировка вопросов не бывает нейтральной. Например, чтобы предложить испытателям возможность пояснения своей общей оценки продукта внешим видом, запахом, вкусом, ароматом или причинами. связанными с текстурой, ведет к повышению рациональности ответов, чем наличие простого раздела: Замечания.

Лицо, проводящее испытание, обычно дает испытателям в начале сессии информацию о количестве продуктов, количестве, которое необходимо попробовать и вопросах, на которые необходимо ответить. Он/ока могут также представить другую информацию, чтобы выполнить оценку менее обезличенную или чтобы выполнить другие задачи испытания. Поскольку такая информация может вызвать ожидания у испытателей, способ ее выражения должен тщательно рассматриваться и включаться дословно в отчет испытания. Там. где испытание включает несколько сессий, в каждой сессии формулировки должны быть строго одинаковыми.

10 Организация испытательных сессий

10.1 Общие положения

Испытательные сессии организуют с целью достижения оптимального баланса среди ряда задач, требования которых в некоторой степени противоречат друг другу. Они включают обеспечение:

-    чтобы сравнение продуктов было действительным, полученным от эквивалентных испытателей;

-чтобы сравнение продуктов было действительным, и необъективность за счет положения и за

счет последовательности была минимальной;

• чтобы условия испытаний были максимально репрезентативными для нормального потребления:

-    чтобы испытатели не были перегружены, что ведет к более случайным ответам.

Чтобы объединить эти разные задачи, существует три способа, которыми испытателей можно связать с продуктами:

12

ГОСТ ISO 11136—2017

a)    полный план: каждый испытатель оценивает все продукты:

b)    неполный план: каждый испытатель оценивает подгруппу продуктов:

c)    отдельная оценка: каждый испытатель оценивает только один продукт.

10.2 Планы

10.2.1    Полный план

Оценивание всех продуктов гарантирует их оценку одними и теми же испытателями (поэтому нет проблем эквивалентности), но несет огромный риск перегрузки испытателей.

Существует также опасность эффектов порядка и переноса, в которых положение в последова-тельности представления продукта влияет на среднее и/или изменчивость его оценки.

Порядок представления продуктов каждому испытателю играет значительную роль. Один способ заключается в использовании строго случайного порядка, распределяя образцы независимо для каждого испытателя. Альтернативно, можно принять систематический план представления, чтобы скомпенсировать эффекты порядка и переноса. В то же время, если эффекты переноса представляют проблему. тогда применение периодов отмывания или других методов снижения вероятности эффектов переноса обычно наиболее важны.

10.2.2    Неполный план

Эффекты порядка и меры против них аналогичны полным планам. Здесь опасность перегрузки испытателей представляет меньшую опасность, но недостатками являются возможные эффекты контекста и дополнительная сложность в планировании и анализе эксперимента. Особые проекты существуют для сбалансированных неполных планов (см. [9]).

10.2.3    Отдельная оценка

Чтобы устранить эффекты порядка, переноса и контекста полностью можно набрать отдельную выборку потребителей на каждый продукт. Этот подход ведет к наиболее простым методикам и наиболее простому анализу; в то же время, необходимо составлять выборки очень внимательно, чтобы обеспечить их эквивалентность и репрезентативность для целевой совокупности.

Более того, поскольку этот план делает невозможным учет в анализе индивидуальных различий, прецизионность оценок ниже, чем в других планах. Равноценно, при прочих равных условиях, выборки потребителей должны быть больше, чтобы достичь той же степени доверия и прецизионности в результатах.

10.3    Количество продуктов, оцениваемых за одну сессию

10.3.1    Общие положения

Количество продуктов, которое можно оценить эффективно за одну сессию, зависит от следующего:

•    характера лредставленных продуктов. Не все продукты обеспечивают чувство сытости; некоторые продукты (агрессивные) могут изменить чувствительные рецепторы; другие (такие, которые содержат спирт) могут повлиять на корковую интеграцию; некоторые продукты представляют собой один элемент, в состав других (например, готовые блюда) входят различные элементы.

•    продолжительности сессии. Длительную лабораторную сессию можно подразделить на сеансы; но потребители, набранные без определения на должность, обычно имеют очень мало времени в распоряжении:

•    количества каждого потребленного продукта;

- чувств, задействованных для оценивания продукта (по внешнему виду или тактильным ощущениям можно оценить больше продуктов, чем по вкусу);

•    числа задаваемых вопросов, особенно, если какие-либо из них требуют представления продуктов заново.

Следовательно, настоящий стандарт не устанавливает конкретные пределы. Он требует только, чтобы лаборатория была способна обосновать свой выбор перед стороной-инициатором.

10.3.2    Слишком много продуктов для одной сессии

Там. где количество продукции слишком велико, для всех позиций, которые предполагается оценить в отдельной сессии, возможны два подхода:

а) организовать несколько сессий, при этом каждый испытатель примет участие во всех сессиях (полный план);

bорганизовать одну сессию, причем каждый испытатель получит только некоторые продукты (неполный план или отдельная оценка).

13

ГОСТ ISO 11136—2017

10.3.3    Несколько сессий

Если есть возможность организовать несколько сессий, все испытатели могут оценить все про* дукты в процессе всего испытания. В идеале, все продукты представляют на каждой сессии, но не все испытатели в конкретной сессии получают одинаковые продукты.

Если ограничения, связанные с подготовкой этих продуктов, или количество имеющихся продуктов сделают такой вариант невозможным, продукты распределяют случайным образом по сессиям. Все испытатели получают за сессию одинаковый набор продуктов, но в различном порядке. Такой выбор обычно требует более сложного статистического анализа.

При возможности в начале каждой сессии следует представлять идентичный продукт (известный как «продукт для разминки») всем испытателям, так чтобы на каждой сессии все испытатели имели одинаковый «отправной пункт».

В один и тот же день не допускается проведение двух сессий с участием одних и тех же испытателей.

10.3.4    Отдельная сессия

Сбалансированный неполноблочный план (BIB) позволяет при каждой сессии использовать меньшее число наименований, чем общее число наименований, и сравнивать каждую пару образцов продуктов с равной прецизионностью. При возможности следует также исключить или скомпенсировать влияние порядка и переноса в испытании в целом. Такой выбор обычно требует большего числа испытателей и более сложного анализа (см. [9)). На стадии планирования следует предусмотреть консультации специалистов в области статистики, если такой вариант рассматривается.

Метод применения сбалансированного неполноблочного плана должен выполняться в соответствии с ISO 29842.

10.4    Характер продуктов, оцениваемых за одну сессию

В одной и той же сессии можно оценивать продукты из разных семейств, если выполняются следующие условия:

- сочетание продуктов соответствует установившейся практике в области пищевых продуктов;

•    целевой потребитель для всех семейств один и тот же.

Потребителей, про которых заранее известно, что они не принадлежат к целевой совокупности в отношении рассматриваемого продукта, обычно не выбирают для оценки этого продукта.

Лаборатория должна обеспечить конфиденциальность оценок, независимо от лиц. присутствующих на оценке. Сторона-инициатор при желании может присутствовать на сессии, но ей не сообщают имен других заказчиков, участвующих в сессии.

10.5    Продолжительность сессии

Рекомендуется организовывать сессию во время, соответствующее обычному потреблению продуктов. так чтобы потребители (испытатели) находились в условиях, близких к привычному в реальной жизни.

10.6    Повторение оценки продукта в одном испытании

Если оценивание продукта необходимо повторить в том же самом испытании, считается, что число продуктов увеличилось на единицу. Тогда план испытания будет включать вместо продукта А продукты А1 и А2. к которым относятся как к двум разным продуктам, как при определении порядка представления. так и для анализа результатов.

10.7    Предварительное испытание

Перед основным испытанием можно провести предварительное испытание только с небольшой группой испытателей, чтобы:

•    опробовать анкеты для проверки, например, насколько соответствующие отличительные характеристики продукта понятны и воспринимаются испытателями и насколько пригодны оценочные шкалы.

•    опробовать приготовления к управлению испытанием.

•    обеспечить соответствие продолжительности испытания, количества вопросов и объема выборки.

Испытатели на предварительные испытания должны выбираться из той же совокупности, что и на

основное испытание, но не должны входить в выборку испытателей для основного испытания.

14

ГОСТ ISO 11136—2017

11 Анализ результатов

11.1    Общие положения

Каждый анализ данных должен начинаться проверкой внутренней согласованности данных и рас* четами элементарной описательной статистики. Должен быть как минимум один параметр дисперсии (стандартное отклонение, диапазон изменчивости, и т. д.) для каждого параметра положения (среднее, медиана и т. д.), указанного в отчете.

Очень полезно пользоваться графическими методами. Для каждой выборки продуктов следует со* ставить гистограмму поставленных оценок. Она покажет, является ли распределение одновершинным или нет и велики ли расхождения между выборками.

Чтобы получить визуальное представление о согласованности и противоречиях между ислытате* лями. можно использовать Метод главных компонент [Principal Components Analysis (РСА)) или Восхо* дящую иерархическую классификацию [Ascending Hierarchical Classification (АНС)].

Может потребоваться дополнительная статистика вывода, чтобы ответить на вопросы, такие как: «Ощущают ли испытатели заметное различие между продуктами, которые они оценивают?»

Можно использовать параметрические и непараметрические методы, причем непараметрические методы особенно подходят в случае отсутствия нормальных распределений.

11.2    Анализ выводов

Анализ выводов экстраполирует результаты, полученные от выборки испытателей к совокупности, из которой они набраны. Метод, который необходимо использовать, будет зависеть от цели испытания и от количества испытываемых продуктов. Если несколько из испытуемых продуктов имеют особый статус, являясь, например, контрольными образцами, это тоже повлияет на анализ.

Применение плана представления продуктов с целью компенсации систематических погрешностей не устраняет систематические погрешности, но обеспечивает только, чтобы ни одному из продуктов при представлении не были несправедливо предоставлены более благоприятные или более невыгодные условия. В то же время анализ выводов может воспользоваться систематическим планом, чтобы улучшить метод оценки и допуска систематических погрешностей и. таким образом, повысить доверие к основным выводам. Однако такой анализ, в общем, не является простым и прямым (см. [4] и [5]).

Стандартные компьютерные пакеты предоставляют все анализы, которые могут потребоваться, но выбор и применение соответствующего анализа требует консультаций со специалистами в области статистики.

11.3    Рейтинги (см. 9.2)

Для рейтинговых методов подойдет дисперсионный анализ (ANOVA).

В приложении G описано несколько различных методов анализа данных.

11.4    Парные сравнения (см. 9.3)

Если допускается ответ испытателей «предпочтений нет» в парном сравнении (вариант В), одним способом анализа данных является сообщение ряда ответов «предпочтений нет» и выполнение теста на значимость, который использует только предпочтения, которые были выражены. Для выборки уменьшенного размера можно использовать такие же методы, как в случае принудительного выбора. Эти методы приведены в ISO 5495.

11.5    Ранжирование (см. 9.4)

Можно использовать различные анализы, касающиеся различных аспектов данных, которые описаны в ISO 8587 (см. также приложение Н).

Можно использовать параметрические и непараметрические методы, при этом непараметрические методы практичнее в тех случаях, когда нормальность ответов не внушает доверия. Можно пользоваться методами, приведенными в таблице 1.

15

ГОСТ ISO 11136—2017

Таблица 1 — Методы анализа данных

Ситуация

Метод

Непэраыетрмчесхий

Параметрическим

Два продукта

Продукты были оценены разными группами испытателей

1Атест Манна-Уитни (Mann-Whd-леу'з lAtest) также известный как критерий Уилкоксона-Маннэ-Уит-ни {W4coxon-Mann-Whitrvey test)

f-тест для независимых выборок

Каждый из продуктов был оценен всеми испытателями

Знаковый (ранговый) критерий Уилкоксона Wilcoxon signed-rank test

t- тест для парных выборок

Болев двух продуктов

Продукты были оценены разными группами испытателей

Критерий Крэскела-Уоллиса (Кги-skat-Wailis test)

Дисперсионный анализ {ANOVA)

Каждый испытатель оценил не менее двух из этих продуктов. а в идеале, все продукты

Критерий Фридмана (Friedmann) (ANOVA по рангам), при необходимости в варианте для неполных блоков

Дисперсионный анализ (ANOVA) с эффектом испытателя и эффектом продукта

12 Отчет об испытании

12.1    Общие положения

На первой странице отчета можно разместить краткий обзор результатов и наиболее важные выводы.

Отчет необходимо составить так, чтобы он был понятен без ссылки на план испытания. Кроме того, рекомендуется, чтобы каждая таблица и диаграмма результатов были пронумерованы и имели заголовок и емкое пояснение, чтобы можно было разобраться в нем самостоятельно.

Рекомендации, основанные на испытании и запрашиваемые стороной-инициатором, можно привести в разделе, названном «рекомендации» или в отдельном документе.

В дополнение к результатам отчет может включать следующую информацию:

-    название испытания и ссылки;

*    даты проведения испытания;

-дата составления отчета;

-    идентификация стороны-инициатора;

*    полная идентификация лаборатории и ответственного за испытание лица (наряду с идентификацией субподрядчиков, если использовались);

-    цель испытания (подведение итогов е соответствии с планом испытания);

*    процедуры получения доступа к необработанным данным для стороны-инициатора;

•    единая идентификация отчета и каждой страницы, включая общее число страниц;

-    ссылка на настоящий стандарт.

12.2    Продукты

Информация о продукции должна содержать следующее:

-    описание продуктов, наряду с указанием полного или частичного состава, если известно от испытательных лабораторий. (Описание может сопровождаться фотографией каждого продукта);

•    вся информация, предоставленная стороной-инициатором в отношении образцов, представленных на испытание:

-дата производства образцов, дата «годен до» или «использовать до», номер партии изготовителя или серийный номер;

-    дата получения в лаборатории; температура, продолжительность и условия хранения (особенно в случае свежих или замороженных продуктов};

•    метод отбора проб, если отбор проб осуществлялся поставщиком услуг. (Если выбирают контрольные или референтные образцы, метод должен быть описан очень точно);

-    метод подготовки продуктов для оценки;

16

ГОСТ ISO 11136—2017

•    температура продуктов при представлении испытателям;

•    количество, предоставленное каждому испытателю, и инструкции, касающиеся минимального и максимального количества для испытания, включая протокол всех отклонений от инструкций;

•    сопутствующие материалы или уничтожение;

•    все другие продукты, оцененные во время сессии, и порядок их представления на сессию.

12.3    Метод испытания

Описание метода испытания должно включать следующее;

•    метод испытания со ссылкой на соответствующий стандарт или. в случае нестандартиэованных методов, с полным описанием:

•    задаваемые вопросы и использованные шкалы ответов;

•    метод сбора данных;

. рабочие процедуры для испытания;

•    количество сессий и сеансов;

•    даты, время и продолжительность сессий;

•    условия окружающей среды, например, помещение, температура или освещение;

•    использованная столовая посуда;

•    инструкции и информация, предоставленные испытателям, и способ представления: на бумаге, на экране или в устной форме.

12.4    Испытатели (потребители)

12.4.1    Общие положения

Информация об испытателях должка включать следующее:

•    описание целевой совокупности потребителей;

•    описание выборки потребителей, включая объем и количество в каждой из категорий, установленных стороной-инициатором:

•    заявление о том. производился набор испытателей специально для поставленной задачи или из совокупности потребителей.

12.4.2    Набор под поставленную задачу Информация о наборе должна включать следующее:

•    место или метод набора.

•    выполняемые процедуры;

- метод отбора подходящих потребителей.

12.4.3    Набор из имеющейся совокупности

Если набор выполняется из совокупности потребителей, отчет должен включать следующее:

•    описание частоты участия в испытаниях данной выборкой потребителей;

•    таблица с указанием всех семейств продуктов, которые были предварительно оценены членами этой совокупности;

•    таблица с указанием частоты участия в предварительных испытаниях, включающих оцениваемый продукт или семейство продуктов, к которому рассматриваемый продукт принадлежит.

Вся информация, требующаяся в данном подразделе, относится к предшествующим 12 мес. Если частота участия равна нулю для всех потребителей, это единственный факт, который требуется внести в отчет.

12.5    Результаты

Результаты испытаний должны включать следующее:

•    указание о предоставлении необработанных данных и описание их предоставления. Краткое описание необработанных данных с помощью таблиц и графиков;

•    численные сводки о результатах, включая прецизионность и все оценки или средние значения:

•    методы, используемые для анализа, и интерпретации результатов;

•    статистические выводы, сделанные на основе результатов;

•    заключения по результатам со ссылкой на цели испытания.

12.6    Приложения к отчету

Следующая дополнительная информация может быть приложена в форме приложений к отчету:

17

ГОСТ ISO 11136—2017

образец анкеты или форма для внесения ответов, использованная в испытании; образец анкеты, использованной для набора потребителей;

стенограммы ответов на любые открытые вопросы (допускающие неограниченное количество от* вегов).

18

ГОСТ ISO 11136—2017

Приложение А

(справочное)

Пример анкеты для набора участников

1*

Проект контактного интервью XY 0410S

Фильтр

Код

1

Здравствуйте. Сегодня мы проводим анализ и просим Вас ответить на несколько вопросов. Принимали Вы когда-нибудь участие в опросе с иелью изучения рынка?

Да 1

► 2

Нет 2

► 3

2

Когда Вы последний раз принимали участие в испытании?

► 3

Информация для интервьюера: ЕСЛИ ЭТО БЫЛО МЕНЕЕ ПОЛУГОДА НАЗАД ► КОНЕЦ: В ДРУГОМ ВАРИАНТЕ ПРОДОЛЖАЮТ С ВОПРОСА 3

3

Работали Вы. Ваши друзья или родственники в одной из следующих отраслей промышленности?

Информация для интервьюера: ПРЕДОСТАВИТЬ ПЕРЕЧЕНЬ «ОТРАСЛЕЙ»

Отрасль 1

1

► 4

Отрасль 2

2

► 4

Изучение рынка

3

КОНЕЦ

Отрасль 3

4

► 4

Отрасль 4

5

КОНЕЦ

Отрасль 5

6

► 4

Реклама

7

КОНЕЦ

Журналистика

8

КОНЕЦ

Маркетинг

9

КОНЕЦ

Ни в одной из вышеперечисленных

10

► 4

4

Можно узнать Ваш возраст?

QUOT.

От 20 до 39 пет

1

► 5

От 40 до 60 пет

2

► 5

Ваш пол:

Мужской

1

► 5

Женский

2

► 5

5

У нас есть перечень различных пищевых продуктов ежедневного пользования. Который из этих продуктов Вы покупали недавно?

Информация для интервьюера: ПРЕДОСТАВИТЬ ПЕРЕЧЕНЬ «ПИЩЕВЫЕ ПРОДУКТЫ»

Пищевой продукт 1

1

Пищевой продукт 2

2

Пищевой продукт 3

3

► 6

Пищевой продукт 4

4

Пищевой продукт 5

5

Пищевой продукт 6

6

Пищевой продукт 7

7

Пищевой продукт 8

8

Информация для интервьюера: ЕСЛИ <г3» НЕ УПОМЯНУТО ► КОНЕЦ

19

ГОСТ ISO 11136—2017

Продолжение таблицы

6

Nt

Проект контактною интервью XY 04/05

Фильтр

Вы только что сказали, что используете пищевой продукт No 3. Примерно как часто Вы используете пищевой продукт No 3?

Информация для интервьюера: ПРЕДОСТАВИТЬ ПЕРЕЧЕНЬ «ЧАСТОТА

Код

ИСПОЛЬЗОВАНИЯ»

7

Более одного раза в день    1

Ежедневно_2

Более одного раза в неделю    3

Примерно раз в неделю    4

Примерно раз в две недели    5

Примерно раз в месяц    6

Примерно раз в три месяца    7

Реже указанного выше_8

Каких брендов пищевой продукт No 3 вы регулярно покупаете для дома. т. е. не реже раза в месяц?

Информация для интервьюера: ЗАДАТЬ ВОПРОС ОБ ИЗГОТОВИТЕЛЕ И ПРОДУКТЕ! ЕСЛИ УПОМЯНУТ ТОЛЬКО ИЗГОТОВИТЕЛЬ, ЗАДАТЬ ВОПРОС СНОВА!

► 7

► КОНЕЦ

Бренд изготовителя 1»

Продукт ► 1)

2)

► 2)

3)

► 3}

4)

►4)

5)

►5>

У нас есть различные бренды пищевого продукта No 3 8 этом перечне. Какой из этих брендов Вы используете дома, даже если только случайно? Информация для интервьюера: ПРЕДОСТАВИТЬ ПЕРЕЧЕНЬ «БРЕНДЫ»

► 8А

► 68

И ОБВЕСТИ НУЖНОЕ В 8А!

Ответьте, пожалуйста, как часто Вы используете каждый из указанных брендов? Информация для интервьюера: ПРЕДОСТАВИТЬ ПЕРЕЧЕНЬ «ЧАСТОТА ИСПОЛЬЗОВАНИЯ» И, ТОЛЬКО В ТОМ СЛУЧАЕ. ЕСЛИ ОБВЕДЕН ВОПРОС

8А, СДЕЛАТЬ ПОМЕТКУ В СХЕМЕ ПОД ВОПРОСОМ 8В!_

Какие из этих брендов Вы используете наиболее часто?_

Информация для интервьюера: ВОЗМОЖЕН ТОЛЬКО ЕДИНСТВЕННЫЙ ВЫБОР; ОБВЕСТИ НУЖНОЕ В 8С)!_

Бренд 1

8А 8В 1

1

Бренд 2

2

2

Бренд 3

3

3

Бренд 4

4

4

Бренд 5

5

5

Бренд 6

6

6

Бренд 7

7

7

Бренд 8

8

8

Бренд 9

9

9

Бренд 10

10

10

Бренд 11

11

11

Другая информация, а именно 12

12

►8С

►9

20

ГОСТ ISO 11136—2017

Окончание таблицы

Проект контактного интервью XY 04/05

Фильтр

Код

9

Есть пи у Вас аллергия на какие-либо пищевые прздукты? Да 1

► КОНЕЦ

Нет 2

► 10

10

Страдаете ли Вы от диабета? Да 1

► КОНЕЦ

Нет 2

ОК

21

ГОСТ ISO 11136—2017

Приложение В

(справочное)

Методы оценивания подгрупп при сегментации

В.1 Общие положения

В зависимости от типа испытания полезно сравнивать подгруппы целевой совокутмости. Например, иногда интересно определить, имеются ли различия между подгруппами и. если да. то на каких уровнях приемлемости.

На основе всей выборки потребителей возможны два пути сегментации:

a)    Подгруппы совокупности: подгруппы представляют собой части выборки, для которых должны проверяться или отвергаться представляющие интерес гипотезы. Эти подгруппы следует установить до набора потребителей. Для каждого установленного критерия и для каждой части выборки необходимо установить размер, так чтобы отдельные подгруппы включали достаточное количество потребителей (не менее 60 человек), чтобы получить желаемую точность измерения при оценивании данных.

Примечание — В зависимости от критериев выбора подгруппы необязательно должны быть одинакового размера.

b)    Сегментация потребителей: подгруппы должны формироваться по оценке всех имеющихся данных (результаты измерений и/или социально-демографические данные). Такая сегментация служит для описания выборки потребителей и может использоваться для разработки новой гипотезы. Последующая сегментация будет целесообразна только в случае, когда выборка потребителей имела достаточный объем.

В обоих случаях необходимое количество потребителей в испытании зависит от количества сегментов, выбранных или ожидаемых, соответственно, и согласно принимаемой дисперсии (разброса) внутри отдельных сегментов.

В.2 Подгруппы совокупности

Сравнение подгрупп используется для получения информации в отношении вопросов следующего типа.

-    «Имеют ли одинаковые предпочтения мужчины и женщины?»

•    «Зависят ли предпочтения от возрастной группы?»

-    «Зависят ли предпочтения от страны?»

•    «Зависят ли предпочтения от традиций потребления?»

В случае, если используется дисперсионный анализ и каждый из испытателей оценивал каждый образец, применяется следующая модель:

Ответ = группа + испытатель (группа) + образец • группа * погрешность

Подгруппы тестируют по факторному потребителю в группе, тогда как другие факторы тестируются е отношении погрешности (это равно влияющий образец, испытатель (группа)].

В данную модель можно включить эффект порядка, если необходимо, а также эффект переноса. При включении эффекта порядка модель выглядит следующим образом:

Ответ = группа * испытатель (группа) + образец + порядок + образец • группа * порядок • группа + образец • порядок * погрешность

С помощью такого анализа можно определить, располагают ли разные группы образцы по-разному (влияющий образец • группа), если эффект порядка одинаков для всех групп (влияющий порядок • группа) и для всех образцов (влияющий образец • группа).

Если существует заметное различие между группами в отношении образцов (влияющий образец • группа), то каждую из подгрупп оценивают по отдельности.

В.З Сегментация потребителей

Последовательная сегментация имеет целью объяснить выявленные типы предпочтений, если имеются.

Это. в частности, применимо, если, при проверке гистограмм были обнаружены бимодальности.

Внутреннее отображение предпочтений дает возможность анализа данных без учета средних по образцам по потребителям. Это. фактически, анализ основных компонентов матрицы градаций, а которой строки представляют продукты, а столбцы потребителей.

Примечание — Анализ основных компонентов: метод для анализа многомерных данных с целью выражения их изменчивости 8 минимальном количестве основных компонентов игы линейных комбинаций исходных или частично скоррелированных переменных.

«Одновременное» представление позволяет совмещать испытателей и продукты.

В то же время информация, предоставленная первыми несколькими компонентами достоверна только е том случае, если эти компоненты объясняют высокий процент исходной вариации. Эта процедура, в общем.

22

ГОСТ ISO 11136—2017

применима только тогда, когда используются полные планы (см. (11]). В то же время, предложен метод для неполных планов испытаний (см. |10]}.

Таким образом, при визуальном изучении первых компонентов в анализе основных компонентов, можно различить группы потребителей (кластеры), если они присутствуют. Чтобы идентифицировать кластеры потребителей. можно использовать методы классификации.

23

ГОСТ ISO 11136—2017

Приложение С

(справочное)

Планы распределения продуктов по испытателям

Полностью достоверным и даже рекомендуемым предложением по распределению продуктов по испытателям является рандомизированный лолноблочный план. Это означало бы. что каждый испытатель испытывает каждый продукт в точности один раз. Порядок представления рандомизирован независимо для каждого испытателя. Преимущество этого предложения заключается в том. что оно подтверждает правильность анализа в простой блок-модели.

Существуют, однако, причины, почему 8 большинстве случаев экспериментатор может пожелать использовать другой, более сложный план.

• Неполноблочные планы: Если число образцов слишком велико, то иногда невозможно каждому испытателю оценить каждый продукт. Число образцов, которые может испытать один испытатель, зависит от характера продукции. В таком случав, предпочтительно использовать сбалансированный нелолноблочный план, см. ISO 29842. И снова порядок следования продуктов обычно рандомизируют, независимо для каждого потребителя.

- Эффекты порядка (представления): Зачастую экспериментаторы обеспокоены присутствием эффекта порядка. Хороша известно, что продукты, которые опробовали раньше, обычно получают лучшую оценку, чем продукты. представленные позже. Одной из причин, по которой полноблочный план и сбалансированный нелолноблочный план требуют рандомизации, является этот эффект порядка: При рандомизации порядка представления продуктов на испытание можно избежать систематических погрешностей за счет эффектов порядка. Рандомизация гарантирует каждому продукту рваные шансы быть представленным раньше.

Если экспериментатор опасается, что эффекты порядка могут оказаться слишком сильными, подходящей агътарнативой рандомизированному полноблочному плану будет обобщенный латинский квадрат. Здесь, представление продуктов испытателям организовано таким образом, чтобы каждый продукт одинаково часто попадал на оценку первым, вторым и т. д.

В случав нвполноблочного плана, также можно организовать порядок представления продуктов таким образом. чтобы каждый продукт одинаково часто попадал в каждую позтщию в очереди. Планы такой структуры называют обобщенными планами Юдена (Youden).

Следует отметить, однако, что применение обобщенного латинского квадрата или обобщенного плана Юдена не подтверждает анализ в простой блок-модели. Вместо этого следует использовать модель строк-столбцов, которая учитывает эффекты порядка.

Эффекты переноса: несмотря на применение периодов отмывки, может оказаться, что опробуемый продукт влияет на вкус продукта, который испытывают следующим. Если испытатель обеспокоен эффектами переноса, имеет смысл использовать так называемый план «сбалансирования ближнего соседа», см., например. [2]. Некоторые возможности анализа планов “сбалансирования ближнего соседа» описаны в (2] и [9].

Организационные вопросы: в некоторых случаях существует организационные вопросы, которые требуют более сложной структуры плана. Например, может случиться, что имеется восемь продуктов для сравнения и только четыре нагревательные плитки, так что в любой сессии можно представить только четыре продукта. Подобные ситуации требуют более сложного, нестандартного плана, и. соответственно, более сложного, нестандартного анализа. В таких случаях испытатель должен обратиться за помощью к специалисту в области статистики.

24

ГОСТ ISO 11136—2017

Приложение О

(справочное)

влияние объема выборки на точность одного среднего значения

Каждая группа испытателей должна иметь определенный минимальный размер, так чтобы различия могли стать очевидными при оценке продуктов и. что более важно, чтобы позволить среднему значению оценок, данных группой испытателей для опробуемого продукта, иметь определенную точность. То же самое применимо к полной выборке потребителей или к классу выборок, или к сегменту, выявленному при изучении индивидуальных различий.

Точность зависит от размера выборки и от изменчивости оценок, выставленных в группе.

При допущении, что оцемси. выставленные продукту, распределятся нормально со стандартным отклонением. о. минимальный размер выборки испытателей, требующихся для оценки среднего значения с желательной точностью. можно определить по формуле (0.1):

(D-1)

где Ас равно половине доверительного интервала при Р = 0.95 от среднего.

Например. Ас = 0.2 означает, что доверительный интервал от среднего значения составляет от (т - 0.2) до (т + 0,2). В таблице D.1 приведены взаимосвязь между о. п. и Ас.

Таблица 0.1 — Размер выборки, требующийся для получения желаемой точности

Точность Ле

Стандартное отклонение о

1.5

2.0

2.5

0.2

225

400

625

0.3

100

178

276

0.4

56

100

156

0.5

36

64

100

о и Ас должны выражаться в одинаковых единицах.

Но чтобы определить число потребителей, которых необходимо набрать, рекомендуется учитывать 8-риск (см. приложения Е и F).

Примечание — Анализ статистической мощности следует проводить, когда принимают решение о требующемся объеме выборки перед испытанием: п определено не будет, пока не будет зафиксирована величина аффекта (ES) (CohenW).

25

ГОСТ ISO 11136—2017

Приложение Е

(справочное)

Минимальный размер выборки для рейтинговых тестов

Е.1 Общие положения

Разумное требование к объему выборки в испытаниях с привлечением потребителей предусматривает получение не менее 60 оценок. а предпочтительно порядка 100 оценок, на продукт. В том случае, когда каждый испытатель испытывает только один продукт, потребуется п = 100 - р испытателей, где р — количество продуктов в испытании. Если, однако, каждый испытатель испытает к продуктов, то грубо-эмпирическим методом можно подсчитать. что потребуется л = 100 - (p/к) потребителей.

Однако это правило грубого приближения. Существуют более сложные методы. Если экспериментатор желает ими воспользоваться, ему нужно ответить на ряд вопросов.

-    Какова цель испытания? Продемонстрировать, что существуют некоторые различия между одним продуктом и одним опорным значением или между двумя или более продуктами? Или показать, что существует подобие между одним испытуемым продуктом и контрольным продуктом или между двумя и более продуктами?

•    Сколько продуктов предложено на испытание? Один? Два? Три и болев?

•    Сколько продуктов предполагается представить одному испытателю?

•    Какое выбранный о-рисх?

•    Какова желаемая мощность Р или (4-риск для испытания? (или: Каков приемлемый (4-риск? (Р » 1 - (4-риск)]

-    Каково значение различия 8, которое предполагается выявить в тесте на проверку различия? Чему равно неприемлемое значение разности А в тесте на проверку подобия?

•    Какое разброс оценок е рамках испытания продукта (продуктов)?

-    Является ли альтернативная гипотеза односторонней или двухсторонней?

-    Какова взаимосвязь между рейтингами, присвоенными разным продуктам испытателями, когда испытатели оценивают несколько продуктов?

Данное приложение может не охватить все возможные случаи. Оно рассматривает только испытание на двух продуктах. Для других случаев, более простого (только один продукт) или более сложного (три или более продуктов). читатель (пользователь данного стандарта) должен проконсультироваться со специалистом по статистике или использовать соответствующую компьютерную программу. Читатель также может обратиться к документу [2].

Данное приложение рассматривает четыре случая: два случая проверки различия и два случая проверки подобия.

Е.2 Случай 1: Цель — продемонстрировать различие при оценке испытателями только продукта А

или только продукта В

«отчество испытателей на каждый продукт л задается формулой (Е.1):

л = 2

(Un>2 + Ujj}'Owa»IA>p/0dlKtt

S

(Е.1)

где и|(£ — квантиль (1 - а/2) нормального распределения для о-рисха и для двухсторонней альтернативной гипотезы: равен 1.960 для а-риска = 5 %. Для односторонней альтернативной гипотезы,    заменяют на и«:

для а-риска = 5 %: он равен 1.645:

Up — квантиль (1 - р) нормального распределения для допустимого р (желаемая мощность Р = 1 -р); о wi|hn — стандартное отклонение в рамках испытания продуктов: предполагается однородное стандартное отклонение для рассматриваемых двух продуктов:

5 — различие, выявляемое между двумя продуктами.

Примечание — Omitiin products и 8 измеряются по одной шкале, например, категориальной шкале от 1 до 9. Категории от 1 до 9 категориальной шкалы дают оценки приблизительно согласующиеся с нормальным распределением.

Пример —Для следующих условий;

Л

иаг

(Р-Т р.

%

ФпЛЫп products

$

0,05

1,960

0,10

(0,90)

1,282

1,50

0,50

Формула (Е.1) дает п = 189,2, использование 190 испытателей на продукт и 380 испытателей на деа продукпта.

Примечание — Для односторонней гипотезы при А > В, ua т f од (для ся= 5 %) формула (Е. 1) дает п = 154,2. а именно 155 испытателей.

26

ГОСТ ISO 11136—2017

Е.З Случай 2: Цель: продемонстрировать различие при оценке испытателями обоих продуктов, продукта А и продукта В

Количество испытателей задается формулой (Е.2):

п-2-

K/2 + Ufl

protfuCM

ь

(Е.2)

где u(t/2 — квантиль {1 - а/2) нормального распределения для a-риска для двухсторонней альтернативной гипотезы: равен 1.960 для «-риска ■ 5 %. Для односторонней альтернативной гипотезы, заменяют на (/а: дпя «-риска = 5 %. равен 1.645:

— квантиль (1 - р) нормального распределения для допустимого p-риска {желаемая мощность. Р ■ 1 - р); a*vtfwi p»duds—стандартное отклонение е рамках испытания продуктов: предполагается однородное стандартное отклонение дпя рассматриваемых двух продуктов: б— различие, выявляемое между двумя продуктами:

р — корреляция в совокупности между оценками, присвоенными двум рассматриваемым продуктам испытателями.

Примечание — 0we*npredbcis и $ выражаются в единицах одной шкалы, например по категориальной шкапе от 1 до 9 категории.

Поскольку = 2 amAhmpmJucls-    . где является стандартным отклонением различий между рей

тингами. присвоенными двум рассматриваемым продуктам каждым испытателем совокупности, формула (Е.2) принимает вид:

п

(Е.З)

Возможно формула (Е.З) является наиболее часто используемым выражением. Пример — Для следующих условий

А

9

II

I

Ь

0,05

1.960

0,10

(0,90)

1,282

1.70

0.50

Формула (Е.З) дает п = 121,5; используют 122 испытателя.

Примечание — Для односторонней гипотезы при А > В, и я 1,645 (для as 5%) формула (Е.З) дает п = 99.0.

Е.4 Случай 3: Цель: продемонстрировать, что продукт А не уступает продукту В (не хуже), причем каждый испытатель оценивает только продукт А или продукт В

Количество испытателей для каждого продукта задается формулой (Е.4):

о = 2-

(°0 + ^ ) '    pfOduCt)

Д

(Е.4)

где и0 — квантиль (1 - «) нормального распределения для о-риска для односторонней альтернативной гипотезы (испытание типа «не хуже»):

Up — квантиль (1 - р) нормального распределения для допустимого Д-р иска (желаемая мощность Р » 1 - р); "wThinprodvef—стандартное отклонение в рамках испытания продукта: предполагается однородное стандартное отклонение для рассматриваемых двух продуктов:

Д — различие, не приемлемое дпя того, чтобы считать два продукта подобными (взаимозаменяемыми).

Примечание — СмМи products и Л выражают в единицах одной шкалы, например категориальной шкалы от 1 до 9 категории.

Пример — Для следующих условий

a

9

(Р=1-Р>

н

Owithin ого ducts

Л

0,05

1.645

0,10

(0.90)

1,282

1.40

0.30

Формула (Е.4) даст л = 373,2; используют 374 испытателя на продукт и 748 испытателей для двух продуктов.

27

ГОСТ ISO 11136—2017

Е.5 Случай 4: Цель: продемонстрировать, что продукт А не уступает продукту В (не хуже), причем каждый испытатель оценивает оба продукта — и продукт А. и продукт В.

Количество испытателей задается формулой (Е.5):

л = 2

Кй )•

>яиЛ1п pretfucr*

(Е.5)

где иа — квантиль (1 - а) нормального распределения для «-риска для односторонней гипотезы (испытание типа «не хуже»);

i/p — квантиль (1 - р) нормального распределения для p-риска (желаемая мощность Р - 1 - 6);

— стандартное отклонение различий между рейтингами, присвоенными двум рассматриваемым продуктам каждым испытателем совокупности:

Д — различие, не приемлемое для того, чтобы считать два продукта подобными (взаимозаменяемыми).

Примечание — и Д выражают в единицах одной шкалы, например, категориальной шкалы от 1 до 9. Пример —Для следующих условий

Р

(Р=1-р)

«а

А

0.05

1.645

0,10

(0.90)

1,282

1J0

0,30

Формула (Е.5) дает п = 275,1: используют 276 испытателей.

Примечание — Случаи 3 и 4 являются испытаниями типа «не хуже». Проверки на строгое подобие, в которых лаборатория должна подтвердить, что продукт А не хуже или лучше продукта В. не рассматриваются. Расчет количества испытателей для таких испытаний является сложным (не существует выражения, которое непосредственно даст это количество) и дает высокие значения для числа испытателей. Например, число испытателей равно 480 на продукт для условий, например, случая 3 (960 испытателей для двух продуктов) и 698 для примера в случае 4. соответственно. Для испытаний на строгое подобие предполагают, что лаборатория использует соответствующие компьютерные программы. Необходимо отметить, что (3] рассматривает проверку на строгое подобие, только если они выполняются методом парного сравнения, когда каждый испытатель получает оба продукта. А и В.

28

ГОСТ ISO 11136—2017

Приложение F

(справочное)

Минимальный объем выборки для ранжирования

F.1 Общие положения

Метод ранжирования мажет включать два или более продуктов. По аналогии с приложением Е. рассматривающим рейтинговые тесты, приложение F ограничено представлением выражений для расчетов количества испытателей в случае ранжирования относительно двух продуктов. В отношении ранжирования для трех и более продуктов лаборатория может проконсультироваться со специалистами в области статистики.

В сфере гедонических измерений метод ранжирования для двух продуктов называют методом предпочтения. Каждый испытатель получает два продукта. А и 8: он должен определить тот продукт, который ему нравится больше: А или 8.

F.2 Случай 1: Продемонстрировать предпочтение в отношении двух продуктов — А и в

Количество испытателей п задается формулой (F.1):

п =

в>2    (1‘А)) + Ч• Vpj

{Ы2)‘

(F.1)

|де Ugft — квантиль (1 - aJ2) нормального распределения, соответствующий риску о. выбранному в случае двусторонней альтернативной гипотезы. Для и = 5 %, и|(£ = 1,960. В случав односторонней гипотезы, заменяют на иа {где: и„ ■ 1.645 для а = 5 %);

— квантиль (1 - р) нормального распределения, соответствующий требуемой мощности Р. где Р - 1 - р;

р0— вероятность предпочтения, соответствующая нулевой гипотезе Hq. всегда равна 0.50 в тесте на предпочтение;

ра— вероятность предпочтения более понравившегося продукта, соответствующая ап>тернативной гипотезе Нг равна Pq * 6/2:

5— различие е предпочтении между двумя продуктами, считающееся заметным.

Примечания

1    Формула (F.1) основана на аппроксимации биномиального распределения нормальным распределением: такая аппроксимация двйствигетъна постольку, поскольку две величины п ■ ра и п • (1 - ра) как минимум равны 5.

2    В настоящем стандарте значение 6 равно разности между вероятностями предпочтения более понравившегося продукта и менее понравившегося продукта. Некоторые авторы выражают значение б в отношении к среднему от этих двух вероятностей, т. е. в отношении pQ. Читатель должен обратить внимание, чтобы не спутать зги два способе выражения.

Пример — Для следующих условий

Ро

б

Р,

А

fi

р

0,50

0.20

1.U

0.05

1.960

о.ю

0.90

1,282

Формула (F.1) дает п = 261.8, т. е. 262 испытателя.

Если лаборатория анкетирует 262 потребителя и существует расхождение в частоте предпочтения, равное 0,20 между двумя продуктами А и 8. можно с определенностью сделать вывод, что различив в предпочтении происходит в среднем в 9 из 10 испытаний.

Примечание — В случае односторонней гипотезы при А > 8. формула (F.1) дает п = 235.6. Если лаборатория опрашивает 236 испытателей и. если истинное предпочтение для А равно 0.60. можно с определенностью сделать заключение о значимом предпочтении в среднем 8 9 из 10 исподний.

F.3 Случай 2: Продемонстрировать, что частота предпочтения для продукта А не меньше частоты предпочтения для продукта 8

Количество испытателей задается формулой (F.2):

п =

(Д/2 f

(Г-2)

где и„ — квантиль (1 - а) центрированного и приведенного нормального распределения, соответствующий выбранному риску, а. В испытании по типу «не хуже* гипотеза односторонняя, поэтому а = 5 %, иа = 1.645:

29

ГОСТ ISO 11136—2017

t/p— квантиль (1 - p) нормального распределения, соответствующий мощности Р. требуемой для испытания, где р = 1 - Р

4 — разность вероятностей предпочтения, которая не позволяет считать продукт А «не хуже», чем продукт В: ра — вероятность предпочтения продукта А в случае нулевой гипотезы в испытании по типу «не хуже»: равная Р0-4/2;

Pq — вероятность предпочтения для обоих продуктов, когда не имеется разницы в предпочтении между ними: она равна 0.50.

Примечания

1    Формула (F.2J основана на аппроксимации биномиального распределения норматъным распределением.

2    В настоящем стандарте значение Л равно разности двух вероятностей ра и (1 - ра). Некоторые авторы выражают значение Л по отношению к среднему от двух этих величин, т. е. по отношению к вероятности р0. Читатель должен быть внимательным, чтобы не спутать два эти способа выражения.

Пример —Для следующих условий

Д = 1Рш-(1-Р.Я

р»

Ро

А

Р

и6

о.м

0.45

0,50

0.05

1.645

0.10

0.90

1,282

Формула (F.2) дает п = 851,9, т. е. 852 испытателя.

30

ГОСТ ISO 11136—2017

Приложение G

(справочное)

Примеры анализа данных для рейтингов

G.1 Общие положения

Данное приложение использует примеры, описанные в приложена Е. Первые два примера касаются проверки различия, где нулевую гипотезу Н0. можно опредегыть как: два продукта Айв извлекают из двух множеств, которые имеют одинаковое среднее.

Последние два примера касаются испытания по типу «не хуже», где нулевая гипотеза HQ. может быть определена как: продукт А хуже лродухга В на величину, по крайней мере, равную Д; следовательно, продукт А не равноценен продукту В.

Для проверки различия данные примеры рассматриваются в двухсторонней гипотезе. В случае односторонней гипотезы необходимо консультироваться со специалистом в области статистики.

G.2 Пример 1 (случай 1 приложения Е): подтвердить, что два продукта Айв воспринимаются

по-разному; каждый испытатель дает оценку только одному продукту

•    После обсуждения с заказчиком лаборатория опросила 230 потребителей: 110 потребителей в отношении продукта А (лд в 110) и 120 потребителей 8 отношении продукта В (ns = 120). Для двух продуктов лаборатория получила средние значения и стандартные отклонения, а именно: тл- 7,23. sA = 1.65, /ле = 6,87, and se = 1.65.

•    Значение tcal задается формулой (G.1):

teat — ■

тА “тв

Ш

S«r<W>tn fifOdUСП '

где Smtonprodbctt— стандартное отклонение 8 пределах испытанных продуктов. 5тМп products рассчитывают по формуле (G.2):

produdt ~

2_S* (np-lj + sl-tne-l}

Лд-пв-2

Следовательно, в данном примере:

(G.1)

(G.2)

1.85г(110-1) + 1.65г |120-1) 110-120-2

Swim products -    1*748.

л    .    7.23-6.87    0.36    .

Значение^    -—= — =1.558.

1.748 -.1 ——+—— I

Ц100 120/

Это значение сравнивают с заданным значением ( ^ для выбранного а-рискэ. Это значение ( ^ задается квантилем (1 - о/2) (-распределения с пд + па - 2 степенями свободы. Для а-риска = 5 %. в данном примере оно равно 1.970.

Чтобы отвергнуть Н^, (^должно быть > (Поскольку 1.558 < 1,970. это условие не подтверждается в данном примере: лаборатория не может сделать заключение о том, что существует заметное различие между двумя средними значениями продуктов Айв.

• Поэтому лаборатория рассчитывает эффективную мощность критерия по формуле (G.3):

р= 1 -р.

Значение (р рассчитывают по формуле (G.3):

(G.3)

(G.4)

^ — значение, ведущее к отвержению Н^.

>— различие, выявляемое между двумя продуктами; — знаменатель (^ [формула (G.1)J.

(р= 1.970-(0.50/0.231) = -0.195.

31

ГОСТ ISO 11136—2017

Если (р < 0, значение £ задается функцией распределения (-распределения при пА + пд - 2 степенях свободы при fp. Функция распределения (-распределения с 110 + 120 - 2 степенями свободы при -0.195 равна 0.423.Таким образом, мощность критерия будет равна 1 - р = 1 - 0,423 * 0,58. Эго неудовлетворительное значение гораздо меньше, чем требуемое значение: 90 %.

Примечание — Если (д > 0. то значение мощности напрямую задается функцией распределения (-распределения при (-1)'(р- Например, для 5 = 0,30. (р = 1,970 - (0.30/0,231) = + 0.671; расчет функции (•распределения дает Р = 0.251 * 0.25.

G.3 Пример 2 (случай 2 приложения Е): подтвердить, что два продукта А и В воспринимаются

по-разному; каждый испытатель дает оценку обоим продуктам

Лаборатория опросила 120 потребителей (л = 120). Получено тА = 6.33. /ле = 6.66 и * 1.92. где — стандартное отклонение разностей между рейтингами, присвоенными двум продуктам каждым потребителем.

• Значение (^ задается формулой (G.5):

_ тА - тв чы -■-

Ж

. тА -тд 6.33 - 6,66    0.33

•cat =-=-1    = - — =

0,175

t&86.

(G.5)

• Это значение сравнивают со значением (^ для выбранного о-риска. Это значение    задается квантилем

(1 - а/2) (-распределения с п - 1 степенями свободы. В этом примере для сг-риска = 0.05 оно равно 1.980.

Чтобы отвергнуть и сделать вывод, что существует заметное различив между А и В. необходимо, чтобы абсолютное значение (са( было > (^ Поскольку это условие не подтверждается в данном примере (аЬб{-1,886) < < 1,980). лаборатория не может прийти к заключению о заметном различии между двумя рейтингами продуктов А и В. - Поэтому лаборатория рассчитывает эффективную мощность критерия, который она применила, по формуле

*li ■    •7——•    (G.6)

‘cjWsi*

где (е— значение, ведущее к отвержению HQ:

5 — различие, выявляемое между Двумя продуктами:

( ^ —знаменатель (^[формула (G.5)).

(р= 1.980 - (0,50/0,175) = -0.873.

Поскольку правила, касающиеся расчета (J. одинаковы для формул (G.4) и (G.6). значение задается функцией (-распределения с 120 - 1 степенями свободы при -0.873; оно равно 0,192. Мощность критерия поэтому близка к 1 - 0,192 = 0.808, т. е. 81 %. значение обычно считается удовлетворительным, поскольку оно выше 80%.

G.4 Пример 3 (случай 3 из приложения Е): подтвердить, что продукт А не хуже продукта в; каждый потребитель оценивает только один продукт

Расчет, выполненный в приложении Е. дает л = 374 потребителя на продухг. Лаборатория опросила только 300 потребителей для А (пА = 300) и 316 потребителей для В (ле = 316). Получилось: тА = 7,01. = 1,95. т6 = 6,67 и$в- 1.80.

• В испытании типа «не хуже» значение (са) задается формулой (G.7):

/Пд — ГПд + Л

Ratlin products '

(G.7)

где a*«hui products

s/-K-W-(na-1)

лдв-2

В нашем примере. Vm* 2 =

1.952 <300 -1) +1.80* {316 +-1)

300 + 316 -2

= 3.514.

Следовательно: «вы-

.514 *1875. 7.01-6.87 + 0.30

0.44

1.875

к 1 . 1    0.151

Y300+316I

* 2.914.

32

ГОСТ ISO 11136—2017

•    Это значение сравнивают со значением (^ для выбранного о-рисха. Это значение (^ задается квантилем (1 - «) {-распределения с пА + пе - 2 степенями свободы. Для «-риска = 5 % в данном примере оно равно 1,647.

Чтобы отвергнуть HQ и сделать вывод о том. что продукт А не хуже продукта в. /^ должен быть > t|he. Поскольку эго условие в данном примере верно (2,914 > 1,647), лаборатория может отвергнуть Н0 и сделать вывод, что продукт А подобен продукту В в отношении качества.

•    Если лаборатория не может сделать заключение о заметном подобии 8 отношении критерия «не хуже», она должна рассчитать мощность этого критерия. Он задается формулой (6.6):

1    (G.6)

V ‘слиал }

где Ifhg— значение, ведущее к отвержению Hg;

А — разность, неприемлемая для того, чтобы считать два рассматриваемых продухга подобными (т. е. взаимозаменяемыми):

*са>аео — знаменатель!^(формула G.7).

Например, при тл = 6.67.    = 1,95. тв = 7,01, и sfl = 1,60:

(cel

6,87-7,01 + 0.30

0,16

0,161

«1.060.

Это значение не ведет к отвержению Н$. поскольку 1.060 < 1.647. Значение (g: (g = 1.647 - (0.30/0,151) = = 1.647- 1.987 *-0,340.

Правила, касающиеся расчета р. одинаковы для формул (G.4), (G.6) и (G.8). Поскольку /р < 0, значение JJ задается функцией распределения /-распределения спл* пв-2 степенями свободы при (g. Функция распределения (-распределения с 300+316-2 степенями свободы при -0.340 равна 0.367. Таким образом, мощность критерия равна 1 - р * 1 - 0.367 = 0.633 * 0.63. Это неудовлетворительное значение гораздо ниже, чем требуемое значение 90 %.

G.5 Пример 4 (случай 4 из приложения Е): подтвердить, что продукт А не хуже продукта в; каждый потребитель оценивает оба продукта

•    Расчет, сделанный в приложении Е. дает л = 374 потребителя. Но лаборатория опросила только 200 потребителей (л = 200). Получила: тА = 7.26. те = 7.31. и * 2,08. где srf — стандартное отклонение совокупности разностей между двумя рейтингами, присвоенными каждым потребителем двум рассматриваемым продуктам.

•    В испытании типа «не хуже», значение (^задается формулой (G.9)

=

/Пд — Шд + Л

В нашем примере это (Сй/ =

7.26-7.31 + 0.30

ни

0.25

0.208

* -1.20Z

(G.9)

•    Это значение сравнивают со значением /№в для выбранного «-риска. Это значение (^ задается квантилем (t - а) (-распределения с л - 1 степенями свободы. В данном примере и для о-рисха = 0.05. оно равно 1.653.

Чтобы отвергнуть и сделать вывод о заметном подобии между А и В, /са) должно быть > W* Поскольку это условие несправедливо 8 данном примере (1.202 < 1.653). лаборатория не может отвергнуть Hq и сделать вывод, что продукт А подобен продукту В в испытании по типу «не хуже».

•    Тогда необходимо рассчитать мощность критерия по формуле (G.10)

(G.10)

где (fa— значение, ведущее к отвержению Hq,

д — разность, неприемлемая для того, чтобы считать два рассматриваемых продукта подобными (т. е. взаимозаменяемыми):

*сдеел — знаменатель (формула (G.9)].

В нашем примере (^ = 1.653 - (0,30/0.208) = 0.211.

Правила расчета £ одинаковы для формул (G.4). (G.6). (G.8) и (G.10). Поскольку !g > 0. мощность непосредственно задается функцией распределения /-распределения с 200 — 2 степенями свободы при (-1)-(р = - 0,211. Следовательно, она равна 0,417 * 0.42. Это значение является исключительно неудовлетворительным.

33

ГОСТ ISO 11136—2017

Приложение Н

(справочное)

Примеры анализа данных для ранжирования

Н.1 Общие положения

Данное приложение использует примеры приложения F: поэтому оно имеет дело только с двумя продуктами.

Для полноблочных планов (Св) с тремя и более продуктами лаборатория может пользоваться ISO 29842. В ISO 29842 используют критерий Фридмана (Friedman), чтобы определить, существуют ли заметные различия в ранжировании между продуктами и в случае положительного ответа предлагает множественное сравнение для каждой пары. Для сбалансированных неполноблочных планов используют критерий Дарбина (Durbin) для определения. заметны или не заметны различия между продуктами.

Н.2 Пример 1 (случай 1 из приложения F): продемонстрировать, что существует разное предпочтение в отношении двух продуктов. А и 8

- Лаборатория хочет продемонстрировать, что существует предпочтение между двумя продуктами. А и 8. Нулевая гипотеза Hq, следующая:

Два продукта А и 8 выбирают из двух множеств, которые имеют одинаковое среднее.

Если экспериментальные значения ведут к отвержению М0. лаборатория должна сделать вывод о заметном различии между средними обоих продуктов А и 8.

•    Количество потребителей, подлежащих опросу, вычисленное в приложении F. было равно 262 потребителя. После обсуждения с заказчиком лаборатория опросила только 200 потребителей. Она получила 82 ответа в пользу А и 118 ответов в пользу 8. Относительная частота предпочтения поэтому равна fA = 0,41 для А и iA - 0.59 для 8.

•    Значение иса1 задается формулой (Н.1)

««г*

X -0,5-п (п-О.б-О.б)05

(Н.1)

где X — наивысшее число ответов: п — общее число ответов.

Следовательно, для данного примера

118 - 0.5 200    18

ueai =    „2 = 7 п7 = 2.55,

(0.50 0.5 200)”2    7-07

Это значение сравнивают со значением для выбранного о-риска. Для о-риска = 5 % и двусторонней альтернативной гипотезы, оно равно 1.960.

Чтобы сделать вывод о заметном предпочтении для одного из двух продуктов, должно быть > о№е. Поскольку это условие удовлетворяется в данном примере, лаборатория может сделать вывод о заметном различии е предпочтении в пользу А.

• Если бы это условие удовлетворено не было, все равно гипотезу нельзя было бы отвергнуть. Тогда лаборатории следовало бы рассчитать мощность критерия, поскольку она опросила меньше, чем 264 потребителя, установленных по формуле (F.1).

Н.З Пример 2 (случай 2 из приложения F): продемонстрировать, что частота предпочтения для продукта А не хуже, чем для продукта 8

• Нулевую гипотезу Hq можно сформулировать следующим образом:

Продукт А хуже продухта 8 на величину, равную не менее Д: следовательно, продукт А не равноценен продукту 8.

Если экспериментальные значения приводят к отвержению Hq, необходимо сделать заключение о подобии продухгов. т. е. продукт А не хуже продукта 8.

-    Число потребителей, которых предполагается опросить, данное в приложении F равно 853. Эго число очень высоко. Это объясняется низким значением А (равным 0,10). на основании которого заказчик больше не считает, что продукт А не хуже 8.

После обсуждения с заказчиком лаборатория опросила 300 потребителей и получила 147 ответов в пользу А и 153 ответа в пользу 8. Следовательно, 1А = 0.49 и /е = 0,51. Следовательно. iA - fs = 0.49 - 0.51 = -0,02.

-    Значение иса) задается формулой (Н.2):

(Н.2)

34

ГОСТ ISO 11136—2017

где Л — разность частот, считающаяся неприемлемой;

sa — стандартное опслонение разности при Н0; равно 2    /в);

л — число потребителей.

В данном примере:

fB) *2-^(0.55 -0.45) * 2*0.4975 = 0.9950 «1.

Тогда:

иса<

0,49-0.51+0.10

ш

0.08

0.0577

= 1,386.

Это значение сравнивают со значением для а » 5 % и односторонней гипотезы, т. е. 1,645. Поскольку иса)< иъо' набора тория не может отвергнуть Нй. Следовательно. не существует заметного подобия в том, что продукт А не хуже продукта В.

• Поскольку значение не позволяет отвергнуть Н0, лаборатории следует рассчитать мощность критерия по формуле (F.2).

35

ГОСТ ISO 11136—2017

Приложение ДА

(справочное)

Сведения о соответствии ссылочных международных стандартов межгосударственным стандартам

Таблица ДА.1

Обозначение ссылочного международного стандарта

Степень

соответствия

Обозначение и ноиыеповэнио соответствующего межгосударственного стандарта

ISO 4121

ЮТ

ГОСТ ISO 4121—2016 «Органолептический анализ. Руководящие указания по применению шкал количественных характеристик»

ISO 5492

ЮТ

ГОСТ ISO 5492—2014 «Органолептический анализ. Словарь»

ISO 5495

*(

ISO 8587

ЮТ

ГОСТ ISO 8587—2015 «Органолептический анализ. Методология. Ранжирование»

ISO 8589

ют

ГОСТ ISO 8589—2014 «Органолептический анализ. Общее руководство по проектированию лабораторных помещений»

ISO 29842

е

‘ Соответствующий межгосударственный стандарт отсутствует. До его принятия рекомендуется использовать перевод на русский язык международного стандарта. Официальный перевод данного международного стандарта находится в Федеральном информационном фонде стандартов.

Примечание — В настоящей таблице использовано следующее условное обозначение степени соответствия стандартов:

- ЮТ — идентичные стандарты.

В Российской Федерации действует ГОСТ Р 53161—2008 (ИСО 5495:2005) «Органолептический анализ. Методология. Метод парного сравнения».

36

ГОСТ ISO 11136—2017

Библиография

[1]    ABDI Н.. EDELMAN В.. VALENTIN D.. DOWLING W.G. Experimental Design and Analysis for Psychology. Oxford University Press, 2009, pp. 1—538.

[2]    AFNOR NF V09-500. Directives G6n6ra)es pour la realisation d'ipreuves h^domques effectives avec des con-sommateurs dans un espace contr6!6. 2012

[3]    ASTM E1958-12, Guide for Sensory Claim Substantiation. 2012

[4]    BALL R. Incomplete block designs for the minimization of order and carry-over effects in sensory analysis. Food Qual. Prefer. 1997. 18pp. 111—11B

[5]    Bl J. Similarity testing using paired comparison method. Food Оoat. Prefer. 2007, 18 pp. 500—507

[6]    BLACKWELDER W.C. Proving the null hypothesis» in clinical trials. Control. Clin. Trials. 1982, 3 pp. 345—353

[7]    COCHRAN W.G.. COX G.M. Experimental Designs. Wiley. New York. Second Edition. 1957

[8]    COHEN J. Statistical Power Analysis for the Behavioural Sciences. Elsevier-Academic Press. New York, Second Edition. 1988

[9]    GACULAM.C. Singh J.. BiJ.. Allan S.. Statistical methods in food and consumer research. Academe Press. New York. Second Edition. 2009, pp. 1—853

[10]    GREEHOUSE S.W., GEISSER S. On methods in the analysts of profile data. Psychometrika. 1959. 24 pp. 98— 112

[11]    HOWELL O.C. Statistical Methods for Psychology. Duxbury. Pacific Grove. Fifth Edition, 2002, pp. 1— 802

[12]    KUNERT J.. SAILER O. On Nearly Balanced Designs for Sensory Trials. Food 0oat. Prefer. 2006, 17 pp. 219— 227

[13]    KUNERT J. Sensory Experiments as Crossover Studies. Food Qual. Prefer. 1998.9 pp. 243—253

[14]    LAWLESS H.T.. HEYMANN H. Sensory Evaluation of Food — Principles and Practices. Springer. New York. Second Edition, 2010, pp. 1—596

[15]    MAC FIE H.J., BRATCHELL N.. GREENHOFF K.. VALLIS L.V. Designs to balance the efTect of order of presentation and first-order carry-over effects in halt tests. J. Sens. Stud. 1989, 4 pp. 129—148

[16]    MEILGAARD M.C., CfVILLE G.V.. CARR B.T. Sensory evaluation techniques. CRC Press. Boca Raton. Fourlh Edition. 2007. pp. 1—448

[17]    MEYNERS M. Least equivalent allowable differences in equivalence testing. Food Qual. Prefer. 2007. 18 pp. 541—547

[18]    MEYNERS M. Equivalence tests —A review. Food Ouaf. Prefer. 2012, 26 pp. 231—245

[19]    NAEST., BROCKHOFF P.B., TOMIC B. Statistics for Sensory and Consumer Science. Wiley. Chichester. Second Edition. 2010. pp. 1—287

[20]    SCHUIRMANN D. A comparison of the Two One Sided Tests procedure and the Power Approach for assessing the equivalence of average bioavailability. J. Pharmacokinet. Biopharm. 1987.15 pp. 657—680

[21]    SIEGELS.. CASTELLAN N. Nonparametric systems for the behavioural sciences. 2nded., 1988. Singapour. Me Graw-Hitl International Editions

[22]    TEN KLEIJF F.. MUSTERS PAD.. Texf analysis of open-ended survey responses: a complementary method to preference mapping. Food Dual. Prefer., Vol. 14.2003, pp. 43—52

[23]    WAKELING I.N.. MACFIE H.J.H. Designing consumer trials balanced for first and higher orders of carryover effect when only a subset of к samples from t may be tested. Food Qual. Prefer. 1995. 6 pp. 299—308

[24]    WAKELING I.N.. HASTED A.. BUCK D. Cyclic presentation order designs for consumer research. Food Qual. Prefer. 2001.12 pp. 39—46

[25]    ISO 20252. Market, opinion and social research — Vocabulary and service requirements (Исследование рынка, общественного мнения и социальных проблем. Словарь и сервисные требования)

37

ГОСТ ISO 11136—2017

УДК 543.92:006.35    МКС 67.240    ЮТ

Ключевые слова: органолептический анализ, методология, пищевая продукция, общее руководство, гедоническое восприятие, гедоническое испытание, контролируемая зона, целевая совокупность, по* требители (испытатели)

БЗ в—2017/173

Редактор Л. В. Коретникова Технический редактор В.Н. Прусакова Корректор С.И. Фирсова Компьютерная верстка Е.О. Асташина

Сдано в иабор21.09.2017. Подписано а печать 03.10.2017. Формат 60»&4'/g Гарнитура Ариап. Уел. леч. л. 5.12. Уч.*иад. л. 4.54. Тираж 25 эм. Зак. 1916.

Подготовлено на основе электронной версии, предоставленной разработчиком стандарта

Издано и отпечатано во ФГУП «СТАНДАРТИНФОРМ», 123001 Москва, Гранатный лер.. 4 wwi*r.gostinlb.ni infbQgoslinfo.ru