ФЕДЕРАЛЬНОЕ АГЕНТСТВО
ПО ТЕХНИЧЕСКОМУ РЕГУЛИРОВАНИЮ И МЕТРОЛОГИИ
НАЦИОНАЛЬНЫЙ СТАНДАРТ РОССИЙСКОЙ ФЕДЕРАЦИИ
ГОСТ Р
71672—
2024
СИСТЕМЫ ПРОГНОЗНОЙ АНАЛИТИКИ НА ОСНОВЕ ИСКУССТВЕННОГО ИНТЕЛЛЕКТА В КЛИНИЧЕСКОЙ МЕДИЦИНЕ
Основные положения
Издание официальное
Москва Российский институт стандартизации 2024
ГОСТ Р 71672—2024
Предисловие
1 РАЗРАБОТАН Государственным бюджетным учреждением здравоохранения города Москвы «Научно-практический клинический центр диагностики и телемедицинских технологий Департамента здравоохранения города Москвы» (ГБУЗ «НПКЦ ДиТ ДЗМ»)
2 ВНЕСЕН Техническим комитетом по стандартизации ТК 164 «Искусственный интеллект»
3 УТВЕРЖДЕН И ВВЕДЕН В ДЕЙСТВИЕ Приказом Федерального агентства по техническому регулированию и метрологии от 7 октября 2024 г. № 1385-ст
4 ВВЕДЕН ВПЕРВЫЕ
Правила применения настоящего стандарта установлены в статье 26 Федерального закона от 29 июня 2015 г. № 162-ФЗ «О стандартизации в Российской Федерации». Информация об изменениях к настоящему стандарту публикуется в ежегодном (по состоянию на 1 января текущего года) информационном указателе «Национальные стандарты», а официальный текст изменений и поправок — в ежемесячном информационном указателе «Национальные стандарты». В случае пересмотра (замены) или отмены настоящего стандарта соответствующее уведомление будет опубликовано в ближайшем выпуске ежемесячного информационного указателя «Национальные стандарты». Соответствующая информация, уведомление и тексты размещаются также в информационной системе общего пользования — на официальном сайте Федерального агентства по техническому регулированию и метрологии в сети Интернет (www.rst.gov.ru)
©Оформление. ФГБУ «Институт стандартизации», 2024
Настоящий стандарт не может быть полностью или частично воспроизведен, тиражирован и распространен в качестве официального издания без разрешения Федерального агентства по техническому регулированию и метрологии
II
ГОСТ Р 71672—2024
Содержание
1 Область применения..................................................................1
2 Нормативные ссылки..................................................................1
3 Термины и определения...............................................................1
4 Цели и задачи создания и внедрения систем прогнозной аналитики в сфере здравоохранения на основе искусственного интеллекта....................................................3
5 Общие требования...................................................................4
6 Классификация.......................................................................6
Библиография.........................................................................7
III
ГОСТ Р 71672—2024
Введение
Внедрение систем прогнозной аналитики на основе искусственного интеллекта для поддержки принятия клинических и управленческих решений является одним из перспективных направлений цифровой трансформации здравоохранения (см. [1], [2]).
Управление на основе данных и на базе современных методов анализа данных, включая технологии искусственного интеллекта и машинного обучения, пользуется все большим спросом у руководителей здравоохранения и лечащих врачей, помогая им понять будущие события и принимать решения с учетом полученных прогнозов (см. [3]).
Управленческая прогнозная аналитика востребована руководителями различного уровня как инструмент для оценки возможных сценариев развития заболеваний, оптимизации нагрузки на медицинские организации и определения потребности в ресурсах, способствуя в конечном счете повышению эффективности управления здравоохранением (см. [4]).
Клиническая прогнозная аналитика помогает персонализировать назначение обследования, выбор оптимальной маршрутизации и тактики лечения пациента (см. [5]).
IV
ГОСТ Р 71672—2024
НАЦИОНАЛЬНЫЙ СТАНДАРТ РОССИЙСКОЙ ФЕДЕРАЦИИ
СИСТЕМЫ ПРОГНОЗНОЙ АНАЛИТИКИ НА ОСНОВЕ ИСКУССТВЕННОГО ИНТЕЛЛЕКТА В КЛИНИЧЕСКОЙ МЕДИЦИНЕ
Основные положения
Predictive analytics systems based on artificial intelligence in clinical medicine.
General provisions
Дата введения — 2025—01—01
1 Область применения
Настоящий стандарт устанавливает общие положения комплекса национальных стандартов «Системы прогнозной аналитики на основе искусственного интеллекта», включая:
- термины и определения;
- цели и задачи;
- общие требования;
- классификацию.
2 Нормативные ссылки
В настоящем стандарте использованы нормативные ссылки на следующие стандарты:
ГОСТ 33707—2016 (ISO/IEC 2382:2015) Информационные технологии. Словарь
ГОСТ Р 59898 Оценка качества систем искусственного интеллекта. Общие положения.
Примечание — При пользовании настоящим стандартом целесообразно проверить действие ссылочных стандартов в информационной системе общего пользования — на официальном сайте Федерального агентства по техническому регулированию и метрологии в сети Интернет или по ежегодному информационному указателю «Национальные стандарты», который опубликован по состоянию на 1 января текущего года, и по выпускам ежемесячного информационного указателя «Национальные стандарты» за текущий год. Если заменен ссылочный стандарт, на который дана недатированная ссылка, то рекомендуется использовать действующую версию этого стандарта с учетом всех внесенных в данную версию изменений. Если заменен ссылочный стандарт, на который дана датированная ссылка, то рекомендуется использовать версию этого стандарта с указанным выше годом утверждения (принятия). Если после утверждения настоящего стандарта в ссылочный стандарт, на который дана датированная ссылка, внесено изменение, затрагивающее положение, на которое дана ссылка, то это положение рекомендуется применять без учета данного изменения. Если ссылочный стандарт отменен без замены, то положение, в котором дана ссылка на него, рекомендуется применять в части, не затрагивающей эту ссылку.
3 Термины и определения
В настоящем стандарте применены следующие термины с соответствующими определениями:
3.1 прогноз (prognosis): Суждение о будущем состоянии объекта исследования.
3.2 прогнозирование (prediction): Процесс разработки (формирования) прогноза.
3.3 прогнозная аналитика в сфере здравоохранения (predictive analytics in healthcare): Комплекс технологических решений, позволяющий анализировать исторические данные для получения прогнозов, используемых в организации работы системы здравоохранения.
3.4 система прогнозной аналитики в сфере здравоохранения на основе искусственного интеллекта (predictive analytics system in healthcare based on artificial intelligence): Программное и инфор-
Издание официальное
1
ГОСТ Р 71672—2024
мационное обеспечение, позволяющее внедрить и применять автоматизированное получение прогнозной аналитики в сфере здравоохранения, в том числе созданное и/или работающее с использованием технологий искусственного интеллекта.
3.5 модель прогнозирования (predictive model): Конечное упорядоченное множество точно определенных правил для решения задач в системах прогнозной аналитики в сфере здравоохранения на основе искусственного интеллекта.
Примечание — Модель прогнозирования может быть представлена моделью машинного обучения, математической моделью (формулой), последовательностью инструкций по обработке входных данных или иной программной реализацией. Данное определение основано на определении «алгоритма», предусмотренного ГОСТ 33707—2016 (пункт 4.39).
3.6
искусственный интеллект (artificial intelligence): Комплекс технологических решений, позволяющий имитировать когнитивные функции человека (включая самообучение, поиск решений без заранее заданного алгоритма и достижение инсайта) и получать при выполнении конкретных практически значимых задач обработки данных результаты, сопоставимые, как минимум, с результатами интеллектуальной деятельности человека.
Примечание — Комплекс технологических решений включает в себя информационно-коммуникационную инфраструктуру, программное обеспечение (в том числе в котором используются методы машинного обучения), процессы и сервисы по обработке данных, анализу и синтезу решений.
[ГОСТ Р 59277—2020, пункт 3.18]
3.7
знания (knowledge): Совокупность фактов, событий, убеждений, а также правил, организованных для систематического применения.
Примечание — Данное определение термина относится к области искусственного интеллекта.
[ГОСТ Р 59869—2021, пункт 3.1.5]
3.8
инженерия знаний: Дисциплина, рассматривающая получение знаний от специалистов в области знаний и из других источников знаний и включения их в базу знаний.
Примечание — Инженерию знаний иногда относят к конкретному умению проектировать, создавать и поддерживать экспертные системы, основанные на знаниях.
[ГОСТ Р 59869—2021, пункт 3.1.8]
3.9
машинное обучение (machine learning): Процесс автоматического обучения и совершенствования поведения системы искусственного интеллекта на основе обработки массива обучающих данных без явного программирования.
[ГОСТ Р 59895—2021, пункт 2.1.7]
3.10
данные (data): Предоставление информации в формальном виде, пригодном для передачи, интерпретации или обработки людьми или компьютерами.
[ГОСТ Р 59869—2021, пункт 3.1.1]
3.11
программное обеспечение (программа, программное средство) (software): Упорядоченная последовательность инструкций (кодов) для вычислительного средства, находящаяся в памяти этого средства и представляющая собой описание алгоритма управления вычислительными средствами и действий с данными.
[ГОСТ Р 53622—2009, пункт 3.8]
2
ГОСТ Р 71672—2024
3.12
событие; A (event): Подмножество пространства элементарных событий.
Примечание — Предположительно в результате эксперимента произошло некоторое событие, если получен исход, принадлежащий данному событию. События принадлежат сигма-алгебре событий — второму компоненту вероятностного пространства. События естественным образом возникают в контексте азартных игр (покер, рулетка и т. д.), в которых число исходов определяет планы на выигрыш.
[ГОСТ Р ИСО 3534-1—2019, пункт 2.2]
3.13
вероятность события А, Р(А) (probability of an event A\. Действительное число из замкнутого промежутка [0, 1], приписываемое событию.
Примечание 1 — Вероятностная мера обеспечивает присвоение действительного числа каждому рассматриваемому событию, заданному на пространстве элементарных исходов. Для отдельного события вероятностная мера задает вероятность, связанную с этим событием. Другими словами, задает полный набор назначений для всех событий, тогда как вероятность представляет собой одно конкретное значение, приписанное отдельному событию.
Примечание 2 — В данном определении вероятность рассматривают как вероятность отдельного события. Вероятность может быть связана с относительной частотой реализации события в длинной серии наблюдений или со степенью уверенности в возможной реализации события. Как правило, вероятность события А обозначают символом Р(А). Запись р(А), использующая рукописную букву р, применяют в том случае, когда необходимо подробно рассмотреть формальное описание вероятностного пространства.
[ГОСТ Р ИСО 3534-1—2019, пункт 2.5]
3.14
точность (accuracy): Степень близости результата измерений к принятому опорному значению.
Примечание — Термин «точность», когда он относится к серии результатов измерений (испытаний), включает сочетание случайных составляющих и общей систематической погрешности (ИСО 3534-1 [1]).
[ГОСТ Р ИСО 5725-1—2002, пункт 3.6]
4 Цели и задачи создания и внедрения систем прогнозной аналитики в сфере здравоохранения на основе искусственного интеллекта
4.1 Основными целями создания и внедрения систем прогнозной аналитики в сфере здравоохранения на основе искусственного интеллекта являются:
- развитие профилактической медицины, направленной на предупреждение заболеваний, осложнений и смертельных исходов;
- повышение эффективности использования ресурсов здравоохранения, в том числе кадрового и финансового обеспечения;
- персонализация диагностики и лечения, в том числе за счет учета персональных особенностей пациентов, условий их жизни и других факторов;
- сокращение заболеваемости и смертности;
- повышение удовлетворенности населения качеством оказываемой медицинской помощи.
4.2 Данные (прогнозы), полученные с помощью систем прогнозной аналитики в сфере здравоохранения на основе искусственного интеллекта, могут применяться для корректирующих действий и поддержки принятия решений.
4.3 Системы прогнозной аналитики в сфере здравоохранения на основе искусственного интеллекта могут решать одну или несколько следующих задач:
- формирование индивидуальных прогнозов различных событий в состоянии здоровья пациента (возникновение заболевания, развитие осложнения, риск внезапной смерти);
- выявление и оценка факторов риска;
- выявление и оценка рисков, связанных со здоровьем пациента, с присвоением группы риска (риск-стратификация);
3
ГОСТ Р 71672—2024
- оценка риска осложнений и смерти больного;
- формирование популяционных прогнозов, включая прогнозирование смертности, заболеваемости, обращаемости и т. д.;
- формирование рекомендаций для поддержки принятия клинических и управленческих решений на основе полученных прогнозов.
5 Общие требования
5.1 Система прогнозной аналитики в сфере здравоохранения на основе искусственного интеллекта может представлять собой программный продукт, включающий модели, созданные с помощью методов машинного обучения, а также различные алгоритмы, правила и иные программные реализации (функции, процедуры, сервисы и т. д.), которые обобщенно называются термином «модель прогнозирования».
Примечание — Следует различать термины «метод прогнозирования» и «модель прогнозирования». Под методом прогнозирования понимается последовательность действий, которые нужно совершить для получения модели, таким образом, результатом применения метода прогнозирования является модель прогнозирования. Под моделью прогнозирования понимаются конкретная модель машинного обучения, алгоритм, формула или иная последовательность и правила выполнения действий и/или вычислений, результатом работы которых является прогноз.
5.2 Объектом модели прогнозирования могут быть:
- событие в будущем, например оценка вероятности развития заболеваний, осложнений имеющихся заболеваний, смерти пациента от каких-либо причин и других событий;
- количественный признак, например прогнозирование числа обращений пациентов за медицинской помощью в определенном регионе или медицинской организации, прогнозирование числа смертельных исходов и т. д.;
- категориальный, в т. ч. бинарный, признак, например прогнозирование состояния медицинского оборудования, включая его выход из строя, прогнозирование доступности лекарств в аптечной сети, включая дефицит, и т. д.
5.3 Модель прогнозирования включает следующие характеристики:
- условия прогноза, указывающие, для каких условий может быть применена модель прогнозирования.
Примечание — Как правило, модели прогнозирования разрабатываются для определенных условий, например: прогнозирование числа зараженных во время эпидемии (а не в любой ситуации, в том числе при отсутствии эпидемии), прогнозирование смерти пациента, имеющего определенное установленное заболевание (а не для любых пациентов без каких-либо ограничений), и т. д. Ограничение применимости модели прогнозирования конкретными условиями позволяет обеспечить необходимые метрики качества прогноза;
- горизонт прогнозирования, определяемый от даты формирования прогноза до даты окончания периода, на который он был дан (например, горизонтом прогнозирования могут быть 24 часа, 1 месяц, 1 год, 10 лет и т. д.).
Примеры моделей прогнозной аналитики
1 Прогнозирование смерти от сердечно-сосудистого заболевания у пациентов от 40 до 65 лет в ближайшие 10 лет (шкала SCORE).
2 Прогнозирование госпитализации в течение ближайших 12 месяцев у пациентов с сердечно-сосудистыми заболеваниями.
3 Прогнозирование смертности на основе первичных медицинских данных по всем причинам в течение 30 дней.
5.4 Модель прогнозирования может учитывать в своей работе разнообразные входные данные, включая:
- индивидуальные данные о здоровье пациента, в том числе извлеченные из систем ведения электронных медицинских карт, полученные с носимых устройств или систем дистанционного мониторинга здоровья и т. д.;
- агрегированные данные о работе и показателях системы здравоохранения, например заболеваемость, обращаемость, число вызовов скорой медицинской помощи и т. д.;
- демографические данные, например рождаемость, смертность, данные о миграции, половозрастном составе населения, данные об этническом составе и т. д.;
4
ГОСТ Р 71672—2024
- данные о количестве и структуре медицинских услуг;
- данные о работе медицинских изделий, включая диагностическое оборудование;
- данные о лекарственном обеспечении;
- данные об оснащенности и обеспеченности ресурсами, включая данные о числе медицинских организаций, численности медицинского персонала и его образовании, уровне подготовки и т. д.;
- данные окружающей среды;
- прочие данные.
5.5 Результатом работы модели прогнозирования могут быть:
- вероятность наступления прогнозируемого события или наличия диагностической находки в значении от 0 до 1;
- бинарное значение прогнозируемого события или наличие диагностической находки, например значение True (верно) или False (неверно) в модели прогнозирования смерти пациента от сердечно-сосудистого заболевания в течение ближайших 12 месяцев;
- количественное значение, например число зараженных пациентов на определенной территории, прогноз обращаемости за медицинской помощью и т. д.;
- категориальные значения, например список возможных заболеваний пациента.
Примечание — Оценка вероятности прогнозируемого события, бинарное или категориальное значение, а также количественное значение могут быть получены только при использовании методов прогнозирования на основе анализа данных;
- интерпретация, осуществленная по определенным правилам (алгоритму) на основе анализа вероятности прогнозируемого события или прогнозируемого значения, а также дополнительных характеристик, например — оценки риска прогнозируемого события.
Пример — Шкала SCORE дает оценку риска смерти пациента в течение ближайших 10 лет от сердечно-сосудистых заболеваний и включает два результата: вероятность данного события, а также интерпретацию в виде группы риска — низкий, умеренный, высокий или очень высокий.
5.6 Для оценки функциональной корректности модели прогнозирования в соответствии с ГОСТ Р 59898 должны быть использованы следующие метрики, включая (но не ограничиваясь):
а) в задачах классификации и обнаружения:
- чувствительность (sensitivity, Se, recall),
- специфичность (specificity, Sp),
- прогностическую ценность положительного результата (ПЦПР, англ, positive predictive value, PPV, precision),
- прогностическую ценность отрицательного результата (ПЦОР, англ, negative predictive value, NPV),
- точность (accuracy),
- площадь под характеристической кривой (AUC ROC) и другие;
б) в задачах регрессии:
- среднюю абсолютную ошибку (МАЕ, Mean Absolute Error), рассчитываемую как среднее по всем ошибкам (отклонениям);
- среднюю абсолютную ошибку в процентах (МАРЕ, Mean Absolute Percentage Error), рассчитываемую как средний процент отклонения от правильных ответов.
5.7 Для создания моделей прогнозирования должны быть использованы методы обработки данных, например:
- экстраполяция;
- статистические методы, например линейная или нелинейная регрессия, авторегрессионные модели (ARIMAX, GARCH, ARDLM), модель экспоненциального сглаживания, модель по выборке максимального подобия;
- анализ временных рядов;
- вероятностные методы;
- методы машинного обучения, например искусственные нейронные сети, модели на базе классификационно-регрессионных деревьев и т. д.;
- методы на основе математического моделирования и теории массового обслуживания.
5.8 Система прогнозной аналитики в сфере здравоохранения на основе искусственного интеллекта может быть создана не только с использованием машинного обучения на основе данных, но и с
5
ГОСТ Р 71672—2024
использованием методов инженерии знаний. В этом случае считается, что такая система создана на основании гибридного подхода.
5.9 Система прогнозной аналитики в сфере здравоохранения на основе искусственного интеллекта может быть представлена как:
- самостоятельный законченный продукт; в этом случае в ней должен быть реализован пользовательский интерфейс для ввода данных и соответствующий интерфейс вывода результатов работы;
- сервис; в этом случае в ней должен быть реализован интерфейс для автоматического получения данных для анализа и прогнозирования от других информационных систем, а также интерфейс для передачи результатов работы в ту информационную систему, которая к данному сервису обратилась;
- компонент; в этом случае она может представлять собой встроенную часть какой-либо информационной системы, включая медицинскую информационную систему медицинской организации или государственную информационную систему в сфере здравоохранения.
6 Классификация
6.1 Системы прогнозной аналитики в сфере здравоохранения на основе искусственного интеллекта подразделяются на следующие группы:
- клиническая прогнозная аналитика — позволяет формировать персональные прогнозы состояния здоровья пациента, предназначена для поддержки принятия клинических решений;
- управленческая прогнозная аналитика — позволяет формировать эпидемиологические прогнозы изменения показателей здравоохранения, а также демографические, медико-демографические, ресурсные прогнозы, предназначенные для поддержки принятия управленческих решений.
6.2 Клиническая прогнозная аналитика может включать прогнозирование:
- развития заболевания, например прогнозирование развития инфаркта миокарда;
- течения заболевания;
- осложнений заболеваний, например прогнозирование осложнений после оперативных вмешательств, прогнозирование госпитализации пациента в связи с осложнением имеющегося заболевания и т. д.;
- фатального исхода, например прогнозирование внезапной смерти у пациентов с сердечно-сосудистыми заболеваниями, прогнозирование фатальных сердечно-сосудистых событий и т. д.
6.3 Управленческая прогнозная аналитика может включать прогнозирование:
- смертности, включая прогнозирование от различных причин, в разных половозрастных разрезах, различных группах пациентов и т. д.;
- заболеваемости, включая прогнозирование развитие эпидемий и пандемий, прогнозирование числа зараженных пациентов при инфекционных заболеваниях и т. д.;
- обращаемости пациентов за медицинской помощью;
- потребности в ресурсах, включая прогнозирование потребности в кадровом обеспечении, прогнозирование увольнения или нехватки кадров, прогнозирование потребности в лекарственном обеспечении или расходных материалах, прогнозирование потребности в медицинских изделиях и т. д.
6
ГОСТ Р 71672—2024
Библиография
[1] Soyiri IN, Reidpath DD. An overview of health forecasting. Environmental Health and Preventive Medicine. 2013 Jan;18(1):1—9
[2] Пугачев П.С., Гусев A.B., Кобякова О.С., Кадыров Ф.Н., Гаврилов Д.В., Новицкий Р.Э., Владзимирский А.В. Мировые тренды цифровой трансформации отрасли здравоохранения // Национальное здравоохранение. 2021; 2(2):5—12
[3] Карпов О.Э., Храмов А.Е. Информационные технологии, вычислительные системы и искусственный интеллект в медицине. — М.: ДПК Пресс, 2022. — 480 с.
[4] Прогнозная аналитика в системе здравоохранения. Аналитический отчет. — URL: https://evercare.ru/news/ prognoznaya-analitika-v-sisteme-zdravookhraneniya (дата обращения: 04.09.2024)
[5] Borges do Nascimento I., Abdulazeem H., Vasanthan L., Martinez E., Zucoloto M., Ostengaard L., Azzopardi-Muscat N., Zapata T., Novillo-Ortiz D. The global effect of digital health technologies on health workers’ competencies and health workplace: an umbrella review of systematic reviews and lexical-based and sentence-based meta-analysis. The Lancet Digital Health, Volume 5, Issue 8, 2023, P. e534-e544
7
ГОСТ Р 71672—2024
УДК 615.841:006.354
ОКС 11.040.01
Ключевые слова: прогнозная аналитика, искусственный интеллект
Редактор М.В. Митрофанова Технический редактор И.Е. Черепкова Корректор Р.А. Ментова Компьютерная верстка И.А. Налейкиной
Сдано в набор 08.10.2024. Подписано в печать 11.10.2024. Формат 60x847s. Гарнитура Ариал. Усл. печ. л. 1,40. Уч.-изд. л. 1,20.
Подготовлено на основе электронной версии, предоставленной разработчиком стандарта
Создано в единичном исполнении в ФГБУ «Институт стандартизации» , 117418 Москва, Нахимовский пр-т, д. 31, к. 2.