ПНСТ 867-2023
ПРЕДВАРИТЕЛЬНЫЙ НАЦИОНАЛЬНЫЙ СТАНДАРТ РОССИЙСКОЙ ФЕДЕРАЦИИ
ПРИЛОЖЕНИЯ И СЕРВИСЫ ДЛЯ ИНТЕЛЛЕКТУАЛЬНОГО ПРОИЗВОДСТВА НА ОСНОВЕ МАШИННОГО ЗРЕНИЯ
Требования
Applications and services for smart manufacturing based on machine vision. Requirements
ОКС 35.240
Срок действия с 2024-01-01
до 2027-01-01
Предисловие
1 РАЗРАБОТАН Федеральным государственным бюджетным учреждением "Российский институт стандартизации" (ФГБУ "Институт стандартизации")
2 ВНЕСЕН Техническим комитетом по стандартизации ТК 164 "Искусственный интеллект"
3 УТВЕРЖДЕН И ВВЕДЕН В ДЕЙСТВИЕ Приказом Федерального агентства по техническому регулированию и метрологии от 3 ноября 2023 г. N 49-пнст
4 Настоящий стандарт разработан с учетом основных нормативных положений международного стандарта ITU F.748.16(2022)* "Требования к приложениям и услугам в интеллектуальном производстве на основе машинного зрения" (ITU F.748.16(2022) "Requirements for applications and services in smart manufacturing based on machine vision", NEQ)
Правила применения настоящего стандарта и проведение его мониторинга установлены в ГОСТ Р 1.16-2011 (разделы 5 и 6).
Федеральное агентство по техническому регулированию и метрологии собирает сведения о практическом применении настоящего стандарта. Данные сведения, а также замечания и предложения по содержанию стандарта можно направить не позднее чем за 4 мес до истечения срока его действия разработчику настоящего стандарта по адресу: 117418 Москва, Нахимовский проспект, д.31, к.2 и/или в Федеральное агентство по техническому регулированию и метрологии по адресу: 123112 Москва, Пресненская набережная, д.10, стр.2.
В случае отмены настоящего стандарта соответствующая информация будет опубликована в ежемесячном информационном указателе "Национальные стандарты" и также будет размещена на официальном сайте Федерального агентства по техническому регулированию и метрологии в сети Интернет (www.rst.gov.ru)
1 Область применения
Настоящий стандарт определяет требования к услугам и приложениям для интеллектуального производства на основе машинного зрения.
Настоящий стандарт предназначен для сбора данных, их предварительной обработке и реконструкции объектов в интеллектуальном производстве на основе машинного зрения.
2 Термины и определения
В настоящем стандарте применены следующие термины с соответствующими определениями:
2.1
алгоритм: Конечное упорядоченное множество точно определенных правил для решения конкретной задачи. [ГОСТ 33707-2016, статья 4.39] |
2.2
машинное зрение: Применение компьютерного зрения к машинам, роботам, процессам или для контроля качества. Примечание - Термин "машинное зрение" применяется в инженерной области, его не следует путать с "компьютерным зрением". [ГОСТ 33707-2016, статья 4.663] |
2.3
эталонная модель: Модель, имеющая рекомендательный характер и которую обычно используют и признают приемлемой для получения конкретных моделей. [ГОСТ Р 59799-2021, пункт 3.1.12] |
3 Требования к приложениям и сервисам на основе машинного зрения
3.1 Сбор данных
Требования к сбору данных:
- обеспечение высокого разрешения собранных данных в виде изображений или видео;
- представление собранных изображений или видео в режиме реального времени;
- обеспечение частоты сбора данных.
Примечания
1 Частота сбора данных зависит от fps (frames per second) или числа кадров в секунду. Выбор значения частоты сбора данных может быть увязан с технологической задачей. Для быстрых процессов необходимо выбрать высокое значение fps, для медленных - нет. Например, на стане горячего проката полоса металла разгоняется от 5 км/ч на первой клети до 60 км/ч на последней.
2 Значения характеристик сбора данных должны быть установлены в технической документации на объективы конкретных типов. В технической документации могут быть установлены и другие параметры, связанные с особенностями конструкции, технологических и области применения объективов.
3 Цветовая модель сбора видеоданных Red-Green-Blue (RGB color model) представляет цветовую информацию в виде трехкомпонентного кортежа чисел - красного (R), зеленого (G) и синего (В). Красная (R), зеленая (G) и синяя (В) цветовые компоненты соответствуют длинам электромагнитных волн 700 нм; 546,1 нм и 435,8 нм соответственно.
4 Цветовая модель сбора видеоданных Grayscale (Grayscale color model) содержит только один канал яркости изображения. Приведение изображения к модели Grayscale из модели RGB осуществляется по формуле: Grayscale=0,299R+0,587G+0,114В.
3.2 Предварительная обработка данных
Предварительная обработка данных - это начальный этап преобразования данных в формат, который будет более легко и эффективно обрабатываться. Следовательно, важно иметь эффективную стадию предварительной обработки.
Требования к предварительной обработке данных:
- поддержка свойств улучшения изображения, например, удаление шума или коррекция контраста изображения;
- поддержка объектов (символов) в изображении, например отделение объектов друг от друга;
- обеспечение предварительной морфологической обработки текстов, для подавления тусклого изображения и подчеркивания целевых особенностей в изображении.
3.3 Обработка данных
3.3.1 Распознавание данных
Распознавание относится к набору связанных задач (классификация, обнаружение) для идентификации объектов. Требования к распознаванию данных (изображения объекта):
- поддержка функции выбора существенной информации, устранения избыточной информации, завершения классификации изображений и распознавания объекта;
- поддержка значений основных параметров при изменении местонахождения объекта, масштаба и наличия дефектов изображения объекта;
- обеспечение функции прогнозирования точных значений изображения объекта.
3.3.2 Контроль
Под контролем понимается обнаружение различного рода дефектов вследствие проверки деталей по соблюдению технических параметров (геометрия, допуски и посадки, линейные и угловые отклонения) и подтверждения качества. Требования к контролю приложений и сервисов машинного зрения:
- поддержка характеристик изображения, включая текстуру, геометрическую форму, цветовое разрешение и т.д.;
- поддержка отбора унифицированных технических изображений.
3.3.3 Расположение детали
Расположение детали относится к набору родственных задач для определения узлов и элементов конструкции изделия в пределах указанных допусков и посадок, линейных и угловых значений. Расположение детали в приложениях и сервисах машинного зрения:
- поддержка параметров расположения детали в приспособлении для сборки изделия;
- обеспечение требуемого расположения детали при быстрой переналадке производства.
3.3.4 Измерение
При измерении объектов технология обработки визуальной информации в основном зависит от обработки изображений, которая включает в себя улучшение изображения, калибровку, уточнение, определение унифицированных признаков, распознавание изображений.
Требования для поддержки измерения свойств в приложениях и сервисах машинного зрения:
- поддержка в обнаружении искажений измерения объекта;
- поддержка измерения, включая, помимо прочего, измерение прямой длины, диаметра, угла, радиана и площади.
3.3.5 Обучение алгоритму
Требования для обучения алгоритму в части приложений и сервисов машинного зрения:
- поддержка обучения алгоритму на полностью размеченном (маркированном) наборе данных;
- поддержка обучения алгоритму на немаркированном наборе данных по кластеризации, обнаружению предельных отклонений, обнаружению интересующих связей между переменными в большой базе данных, автокодировщиков и т.д. (полностью без присмотра);
- поддержка обучения алгоритму на размеченном и неразмеченном наборе данных для повышения точности и эффективности процесса обучения алгоритму.
Примечания
1 Обучение алгоритму включает представление подготовленных данных для использования в машинном обучении (МО). Перед предоставлением организация должна убедиться, что данные соответствуют всем указанным требованиям. Предоставление данных может включать передачу или перемещение данных из одной системы в другую. Организации следует обеспечить сохранение качества данных, если такая передача или перемещение необходимы.
2 При обучении с учителем обучающие данные используются алгоритмом МО для создания модели МО. Затем модель МО применяется к имеющимся данным для получения соответствующих выводов.
3 Хотя некоторые методы МО без учителя включают обучение (например, кластеризация K-средних), как правило, модель создается из исходных данных, а затем с помощью модели можно сделать выводы об этих данных (например, данные образуют центроид).
4 Машинное обучение с подкреплением представляет собой гибрид обучения с учителем и без учителя и использует немаркированные обучающие данные в дополнение к размеченным обучающим данным.
3.3.6 Оценка приложений и сервисов машинного зрения
Требования к оценке приложений и сервисов машинного зрения:
- поддержка возможности определения взаимосвязей и закономерностей между переменными (точность);
- поддержка способности понимать и измерять релевантность (точность);
- поддержка способности обрабатывать новые данные и делать прогнозы (обобщение);
- обеспечение возможности хранить знания, полученные при решении одной проблемы, и применения их к другой, но связанной проблеме (передача знаний).
3.3.7 Оценка систем машинного зрения
Современный этап развития систем машинного зрения позволяет разделить создаваемые решения на несколько категорий, среди которых: создание отдельных алгоритмов (обработка изображений, машинное обучение) и прикладные системы, построенные из известных алгоритмов. Оценку качества алгоритма машинного обучения принимают как отношение правильно распознанных образцов к общему объему коллекции. Более глубокий подход предполагает использование не только базовых статистических оценок, но и специальных протоколов для тестирования разработанного или существующего алгоритма. Для тестирования системы машинного зрения необходимо получить оценку эффективности распознавания с учетом следующих требований:
- производительность (решение допускает временные задержки или имеет жесткие ограничения по времени работы, а также требования к распараллеливанию вычислений и обработке информации);
- точность (важен как процент правильно принятых решений, так и ограничение по допустимому уровню ошибок);
- поддержка способности обрабатывать новые данные, относящиеся к тому же типу, что и были в обучающей выборке, и делать прогнозы (обобщение);
- требования по передаче и хранению фото- и видеоинформации (в том числе с использованием облачных технологий).
Примечание - Оценка систем машинного зрения позволяет определять не только эффективность распознавания приложений и сервисов машинного зрения в промышленной эксплуатации, которая может быть сопоставимой между сравниваемыми системами, а именно удобство эксплуатации целостного решения, возможность его поддержки и масштабирования, т.е. именно архитектурная составляющая [1].
3.3.8 Безопасность
Приложения и сервисы машинного зрения должны быть защищены от несанкционированного доступа, включая предотвращение или снижение вероятности несанкционированного доступа, использования, раскрытия, нарушения, удаления, искажения, модификации, проверки или записи. Требования к безопасности для приложений и сервисов машинного зрения:
- поддержка механизма защиты от угроз безопасности, например обнаружение и регистрация неавторизованных конечных точек, приложений и услуг;
- поддержка параметров политики организации (например, политики взимания платы и политики защиты данных) по любому запросу пользователей;
- обеспечение защиты от угроз безопасности, таких как ненужная обработка услуг и/или мошенническое использование ресурсов;
- обеспечение защиты своей инфраструктуры от вредоносных атак, таких как отказ в обслуживании, прослушивание и фальсификация сообщений;
- поддержка механизмов конфиденциальности данных;
- поддержка механизмов целостности данных;
- защита пользовательских данных, например, данные пользователя должны быть защищены путем раскрытия информации только при предоставлении действительной авторизации.
3.3.9 Идентификация, аутентификация и авторизация
Идентификация, аутентификация и авторизация - это методы контроля доступа пользователей к своим учетным записям. Эти методы обеспечивают прослеживаемость поведения и предотвращают несанкционированный доступ. Требования к идентификации, аутентификации и авторизации для приложений и сервисов машинного зрения:
- наличие объекта в оптическом диапазоне, сигнал от которого воспринимается оптоэлектронной системой и преобразуется в электрический сигнал, определяющий скалярное поле отклика на изображение данного объекта;
- поддержка конвертации фиксируемого кадра из RGB в пространство HSV и их сравнение с диапазоном идентифицируемых цветов;
- поддержка аутентификации и авторизации конечных точек, осуществляющих доступ к системе;
- поддержка аутентификации и авторизации приложений, использующих ресурсы;
- поддержка только авторизованных пользователей, которым разрешено управлять системой;
- предоставление доступа к услугам аутентифицированным пользователям на основе их прав доступа;
- рекомендуется, чтобы аутентификация и авторизация, выполняемые поставщиком услуг, обрабатывались безопасным образом.
3.3.10 Открытая сервисная среда
Открытая среда разработки и применения приложений и сервисов машинного зрения направлена на эффективную и недорогую их разработку. Требования к открытой сервисной среде для приложений и сервисов машинного зрения:
- поддержка гибкой разработки приложений поставщиками услуг для машинного зрения, поставщиками приложений;
- раскрытие возможностей через стандартные прикладные интерфейсы;
- интеграция существующих услуг друг с другом и с существующими системами;
- поддержка свойства обнаружения новых приложений;
- поддержка интерфейсов с внутренними системами (например, начисление платы, учет, обеспечение, операции и управление и т.д.);
- поддержка свойства внедрения любой службой организации, любым авторизованным поставщиком услуг;
- расширение функциональных свойств для будущих приложений и сервисов, а также совместимость между ними.
3.3.11 Сеть
Сети, передающие визуальные данные, должны соответствовать требованиям качества обслуживания приложений и сервисов машинного зрения. Требования к сети:
- обеспечение поддержки для различных категорий трафика, включая трафик пакетного типа;
- поддержка измерений производительности.
4 Эталонная модель для поддержки приложений и услуг на основе машинного зрения
4.1 Эталонная модель высокого уровня
Эталонная модель машинного зрения состоит из семи функциональных доменов: домена управления, домена сбора видео, домена алгоритма, домена обслуживания, домена раскрытия возможностей, домена безопасности и домена разработки. Эталонная модель машинного зрения рекомендована к применению с учетом особенностей производства.
Рисунок 1 - Эталонная модель для поддержки приложений и услуг на основе машинного зрения
4.2 Требования к функциональному домену
Функции, показанные на рисунке 1, обеспечиваются приложениями на платформе машинного зрения. Ожидается, что для сокращения затрат и времени на разработку приложений платформа машинного зрения будет обеспечивать базовые и общие подфункции для приложений. Например, программные функции платформы машинного зрения могут включать в себя сжатие видеоданных и управление камерой, а аппаратные функции могут включать хранение видеоданных (жесткий диск или SSD), камеру и интерфейс LAN для отправки данных камеры в другие системы.
4.2.1 Домен управления
Домен управления обеспечивает управление видеооборудованием и камерами. Требования к домену управления платформы машинного зрения:
- поддержка дистанционного управления, технического обслуживания, обновления, настройки и диагностики видеооборудования;
- обеспечение дистанционного управления, обслуживания, обновления, настройки и диагностики камер.
4.2.2 Домен сбора видео
Домен сбора видео отвечает за доступ к оборудованию, сбор данных, получаемых с помощью оборудования, хранение и управление данными оборудования, а также управление комплектом разработки программного обеспечения (SDK) для промышленных камер. Выходной видеосигнал устройства камеры преобразуется в двоичную цифровую информацию с помощью специального устройства аналогового и цифрового преобразования. Для получения видео используется несколько типов протоколов, а платформа поддерживает управление доступом к видеопотоку для таких протоколов, как общий протокол для обмена информацией между сетевыми видеоустройствами (ONVIF) и протокол потоковой передачи в реальном времени (RTSP). Изображения, сохраненные на этапе сбора видео, и загруженные видео могут использоваться в качестве источников расчетных данных для других этапов сбора видео. Требования к домену сбора видео платформы машинного зрения:
- поддержка программируемого управления устройством видеосъемки;
- поддержка настройки информации о дискретизации видео, такой как частота, разрешение и т.д.;
- обеспечение предварительной обработки видео, такой как сжатие, удаление шума и т.д.
4.2.3 Домен алгоритма
Приложения машинного зрения основаны на анализе видеоданных и данных изображения. Для приложений необходимо применять разные модели анализа и сопоставлять разные алгоритмы. Домен алгоритма обеспечивает управление библиотекой алгоритмов и управление моделями, поддерживает распространенные модели алгоритмов нейронных сетей глубокого обучения, такие как VSSNet, ResNet и YOLO, а также поддерживает библиотеки сторонних алгоритмов MV. Требования к домену алгоритма платформы машинного зрения:
- поддержка мультиалгоритмической структуры, такой как VSSNet, ResNet, YOLO;
- поддержка управления различными алгоритмами, такими как встроенное управление, управление полным жизненным циклом и т.д.;
- обеспечение подключаемых сторонних алгоритмов.
4.2.4 Домен обслуживания
Домен обслуживания обеспечивает управление такими услугами, как услуга алгоритма сортировки объектов, услуга алгоритма проверки качества и услуга алгоритма управления роботом, при наличии робота. Платформа настраивает пакет шаблонов задач анализа для сценариев машинного зрения, таких как шаблоны службы анализа объектов и шаблоны службы проверки объектов. Пользователям нужно только установить параметры шаблона, чтобы создать задачу анализа, которая будет проанализирована и обработана платформой. Задача анализа обеспечивает управление источниками данных, механизмом анализа, управление хранилищем, функциями анализа видео и анализа изображений. Домен обслуживания может поддерживать параллельное планирование и интеллектуальное управление потоком, чтобы обеспечить своевременную обработку больших кодовых потоков, а также оптимальное рабочее состояние коэффициентов расчета для обеспечения быстрого отклика всего канала. Задача анализа поддерживает хранение неструктурированных данных и структурированных данных после анализа, а также предоставляет функции управления и контроля для вычислительных задач. Требования для домена обслуживания платформы машинного зрения:
- поддержка алгоритмов служб сортировки объектов (OBS);
- поддержка алгоритмов услуг проверки качества (QV);
- поддержка алгоритмов для услуг управления роботом (RG);
- поддержка алгоритмов для услуг измерения объекта (OM);
- обеспечение алгоритмов расширенных услуг машинного зрения.
4.2.5 Домен раскрытия возможностей
В зависимости от возможностей платформы применимы несколько интерфейсов. Типы открытых интерфейсов могут включать в себя интерфейс модели алгоритма, интерфейс службы обучения, интерфейс задачи анализа и интерфейс службы данных. Требования для домена раскрытия возможностей платформы машинного зрения:
- поддержка алгоритма (модели), вызываемого сторонними приложениями машинного зрения;
- обеспечение вызова алгоритма (модели) со сторонней платформы машинного зрения;
- поддержка услуги по обучению алгоритму, внедряемой сторонним поставщиком услуг машинного зрения.
4.2.6 Домен безопасности
Домен безопасности гарантирует безопасность данных, безопасность приложений, безопасность платформы, безопасность доступа и безопасность оборудования. Требования к домену безопасности платформы машинного зрения:
- поддержка защиты данных машинного зрения;
- поддержка защиты приложений машинного зрения;
- обеспечение собственной защиты безопасности.
4.2.7 Домен разработки
Домен предоставлен набором инструментов для разработки моделей на основе машинного зрения, таких как сжатие модели и алгоритм визуализации моделирования, включая маркировку, обучение, конфигурацию и оценку. Требования к домену разработки платформы машинного зрения:
- поддержка маркировки обучающего набора данных;
- поддержка оптимизации модели;
- поддержка сжатия модели;
- поддержка визуализации разработки модели;
- поддержка конфигурации модели;
- обеспечение оценки производительности модели.
Библиография
[1] | Фролов И.И. Протоколы оценки систем машинного зрения//Информационные технологии и системы 2015 (ИТС 2015): материалы международной научной конференции (БГУИР, Минск, Беларусь, 28 октября 2015) |
УДК [006.05+006.07]:004.08:006.354 | ОКС 35.240 | |
Ключевые слова: искусственный интеллект, машинное зрение, приложения и сервисы, стандарты искусственного интеллекта |