allgosts.ru33. ТЕЛЕКОММУНИКАЦИИ.АУДИО-И ВИДЕОТЕХНИКА33.160. Аудио-, видео- и аудиовизуальная техника

ГОСТ Р 58245-2018 Системы и оборудование мультимедиа. Оценка качества. Системы аудио-, видеосвязи

Обозначение:
ГОСТ Р 58245-2018
Наименование:
Системы и оборудование мультимедиа. Оценка качества. Системы аудио-, видеосвязи
Статус:
Принят
Дата введения:
04/01/2019
Дата отмены:
-
Заменен на:
-
Код ОКС:
33.160.60

Текст ГОСТ Р 58245-2018 Системы и оборудование мультимедиа. Оценка качества. Системы аудио-, видеосвязи

ФЕДЕРАЛЬНОЕ АГЕНТСТВО

ПО ТЕХНИЧЕСКОМУ РЕГУЛИРОВАНИЮ И МЕТРОЛОГИИ


НАЦИОНАЛЬНЫЙ

СТАНДАРТ

РОССИЙСКОЙ

ФЕДЕРАЦИИ


ГОСТР

58245—

2018/

IEC/TR 62251:2003


СИСТЕМЫ И ОБОРУДОВАНИЕ МУЛЬТИМЕДИА

Оценка качества. Системы аудио-, видеосвязи

(IEC/TR 62251:2003, IDT)

Издание официальное

Москва

Стандартииформ

2018


Предисловие

1 ПОДГОТОВЛЕН Автономной некоммерческой организацией «Научно-технический центр сертификации электрооборудования «ИСЭП» (АНО «НТЦСЭ «ИСЭП») на основе собственного перевода на русский язык англоязычной версии международного документа, указанного в пункте 4

2 ВНЕСЕН Техническим комитетом по стандартизации ТК 452 «Безопасность аудио*, видео-, электронной аппаратуры, оборудования информационных технологий и телекоммуникационного оборудования»

3 УТВЕРЖДЕН И ВВЕДЕН В ДЕЙСТВИЕ Приказом Федерального агентства по техническому регулированию и метрологии от 17 октября 2018 г. № 801-ст

4 Настоящий стандарт идентичен международному документу IEC/TR 62251:2003 «Системы и оборудование мультимедиа. Оценка качества. Системы аудио-, видеосвязи» (IEC/TR 62251:2003 «Multimedia systems and equipment — Quality assessment — Audio-video communication systems». IDT).

Международный документ разработан Техническим комитетом ТС 100 «Аудио-, видео- и мультимедийные системы и оборудование» Международной электротехнической комиссии (IEC).

При применении настоящего стандарта рекомендуется использовать вместо ссылочных международных стандартов соответствующие им национальные стандарты, сведения о которых приведены в дополнительном приложении ДА

5 ВВЕДЕН 8ПЕРВЫЕ

Правила применения настоящего стандарта установлены в статье 26 Федерального закона от 29 июня 2015 г. N? 162-ФЗ «О стандартизации в Российской Федерации». Информация об изменениях к настоящему стандарту публикуется в ежегодном (по состоянию на 1 января текущего года) информационном указателе «Национальные стандарты», а официальный текст изменений и поправок — в ежемесячном информационном указателе «Национальные стандарты». В случае пересмотра (замены) или отмены настоящего стандарта соответствующее уведомление будет опубликовано в ближайшем выпуске информационного указателя «Национальные стандарты». Соответствующая информация, уведомление и тексты размещаются также в информационной системе общего пользования — на официальном сайте Федерального агентства по техническому регулированию и метрологии в сети Интернет (www.gost.fu)

© Стандартинформ, оформление. 2018

Настоящий стандарт не может быть полностью или частично воспроизведен, тиражирован и распространен в качестве официального издания без разрешения Федерального агентства по техническому регулированию и метрологии

Содержание

1 Область применения....................................................................................................................................1

2 Нормативные ссылки....................................................................................................................................1

3 Термины и определения...............................................................................................................................2

4 Конфигурация для оценки качества............................................................................................................2

4.1 Входные и выходные каналы.................................................................................................................2

4.2 Точки входных и выходных оконечных устройств................................................................................3

5 Качество видеосигнала................................................................................................................................3

5.1 Введение.................................................................................................................................................3

5.2 Сквозное воспроизведение тонов.........................................................................................................4

5.3 Сквозное воспроизведение цвета.........................................................................................................6

5.4 Сквозные цветовые разности................................................................................................................7

5.5 Сквозное отношение максимального сигнала к шуму (PSNR)..........................................................10

5.6 Сквозная объективная оценка качества видеосигнала.....................................................................13

6 Качество аудиосигнала..............................................................................................................................14

6.1 Воспринимаемое качество аудиосигнала по отношению к полным эталонным сигналам.............14

6.2 Частота дискретизации и разрешение квантования.........................................................................17

6.3 Задержка...............................................................................................................................................17

7 Качество видео- и аудиосигналов в целом...............................................................................................18

7.1 Синхронизация аудио- и видеосигнала {синхронизация изображения и речевых сигналов}........18

7.2 Масштабируемость...............................................................................................................................19

7.3 Общее качество испытуемых сигналов..............................................................................................19

Приложение А (справочное) PSNR. определенные в трехмерных пространствах, применяемые

к гипотетическому ухудшению испытуемых сигналов по отношению к исходным эталонным видеосигналам.............................................................................20

Приложение В (справочное) Сквозная объективная оценка качества видеосигнала

в пространственно-частотной области..............................................................................24

Приложение С (справочное) Описание метода объективного измерения PEAQ.....................................28

Приложение ДА (справочное) Сведения о соответствии ссылочных международных

стандартов национальным стандартам..........................................................................32

Библиография................................................................................................................................................33

Введение к международному стандарту

Международная электротехническая комиссия (МЭК) — всемирная организация по стандартизации. включающая в себя все национальные комитеты (национальные комитеты МЭК). Цель МЭК заключается в развитии международного сотрудничества по всем вопросам стандартизации в области электрики и электроники. Для этого, кроме осуществления других видов деятельности. МЭК публикует международные стандарты, технические требования, технические отчеты, технические требования открытого доступа (ТТОД) и руководства (далее — публикации МЭК). Их подготовка возлагается на технические комитеты. Любой национальный комитет МЭК. заинтересованный в объекте рассмотрения. может принять участие в этой подготовительной работе. Международные, правительственные и неправительственные организации, сотрудничающие с МЭК. также принимают участие в этой подготовительной работе. МЭК тесно сотрудничает с Международной организацией по стандартизации (ИСО) на условиях, определенных в соглашении между этими двумя организациями.

Официальные решения или соглашения МЭК по техническим вопросам выражают, насколько это возможно, международное согласованное мнение по относящимся к проблеме вопросам, так как каждый технический комитет имеет представителей от всех заинтересованных национальных комитетов МЭК.

Выпускаемые документы имеют форму рекомендаций для международного использования, публикуются в форме стандартов, технических условий, технических отчетов или руководств и принимаются национальными комитетами МЭК именно в таком качестве.

В целях содействия международной унификации национальные комитеты МЭК обязуются максимально ясно и понятно использовать Публикации МЭК в своих национальных и региональных публикациях. Любое расхождение между стандартами МЭК и соответствующими национальными или региональными стандартами должно быть ясно обозначено в последних.

МЭК не предоставляет никакой маркировки соответствия и не несет ответственности за любое оборудование, заявленное как соответствующее одному из ее стандартов.

Необходимо обратить внимание на то. что некоторые элементы данного технического отчета могут быть предметом патентного права. МЭК не несет ответственности за идентификацию частично или полностью такого патентного права.

Основная задача технических комитетов МЭК заключается в подготовке международных стандартов. Тем не менее технический комитет может внести предложение о публикации технического отчета в том случае, когда он собрал данные, отличные от тех. которые обычно публикуются в качестве между* народного стандарта, например данные, относящиеся к последним техническим достижениям.

Технические комитеты МЭК не обязаны пересматривать технические отчеты до тех пор. пока предоставляемые ими данные не перестанут считаться действительными или полезными для разработчиков документа.

IEC/TR 62251, который является техническим отчетом, был подготовлен Техническим комитетом ТС 100 «Аудио-, видео- и мультимедийные системы и оборудование».

Текст настоящего технического отчета основан на следующих документах:

Проект документа для голосования

Отчет о голосовании

100/561/DTR

100/662/RVC

Полную информацию о голосовании по одобрению настоящего технического отчета можно найти в вышеуказанном отчете о голосовании.

Настоящая публикация была составлена в соответствии с Директивами ИСО/МЭК, часть 2.

ГОСТ Р 58245—2018/IEC/TR 62251:2003

НАЦИОНАЛЬНЫЙ СТАНДАРТ РОССИЙСКОЙ ФЕДЕРАЦИИ

СИСТЕМЫ И ОБОРУДОВАНИЕ МУЛЬТИМЕДИА

Оценка качества. Системы аудио*, видеосвязи Multimedia systems and equipment. Quality assessment. Audio-video communication systems

Дата введения — 2019—04—01

1 Область применения

Настоящий стандарт устанавливает параметры, которые должны быть измерены объективными методами, а также методы и условия измерений, процедуры обработки измеренных данных и пред* ставления полученной информации для объективной сквозной (здесь и далее по тексту термин «сквозной» обозначает «от начала и до конца») оценки качества систем аудио*, видеосвязи, осуществляемой посредством цифровых сетей. Измерения следует проводить при двухстороннем и полном эталонном сигнале. Предполагается, что системы обеспечены каналами электрических интерфейсов на входе и выходе аудио-, видеосигналов для объективной оценки.

Дополнительные требования для систем, не обеспеченных такими каналами, оставлены для дальнейшего изучения.

2 Нормативные ссылки

В настоящем стандарте использованы нормативные ссылки на следующие стандарты. Для датированных ссылок применяют только указанное издание ссылочного стандарта, для недатированных — последнее издание ссылочного стандарта (включая все изменения к нему).

IEC 60268-4. Sound system equipment — Part 4: Microphones (Оборудование звуковых систем. Часть 4. Микрофоны)

IEC 60268-5. Sound system equipment — Part 5: Loudspeakers (Оборудование звуковых систем. Часть 5. Громкоговорители)

IEC 61146-1:1994, Video cameras (PAL/SECAM/NTSC) — Methods of measurement — Part 1: Nonbroadcast single-sensor cameras (Видеокамеры (PAL/SECAM/NTSC). Методы измерения. Часть 1. Камеры с одним преобразователем, не предназначенные для телевещания]

IEC 61146-2:1997, Video cameras (PAL/SECAM/NTSC) — Methods of measurement — Part 2: Two-and three-sensor professional cameras [Видеокамеры (PAL/SECAM/NTSC). Методы измерения. Часть 2. Профессиональные камеры с двумя и тремя преобразователями]

IEC 61966-2*1:1999 with Amendment 1 (2003), Multimedia systems and equipment — Colour measurement and management — Part 2-1: Colour management — Default RGB colour space — sRGB [Мультимедийные системы и оборудование. Измерение и управление цветом. Часть 2*1. Управление цветом. Цветовое пространство RGB. используемое по умолчанию — sRGB]

IEC 61966-3:2000. Multimedia systems and equipment — Colour measurement and management — Part 3: Equipment using cathode ray tubes (Мультимедийные системы и оборудование. Измерение и управление цветом. Часть 3. Оборудование, использующее электронно-лучевые трубки)

Издание официальное

IEC 61966-4:2000. Multimedia systems and equipment — Colour measurement and management — Part 4: Equipment using liquid crystal display panels (Мультимедийные системы и оборудование. Измерение и управление цветом. Часть 4. Оборудование, использующее жидкокристаллические дисплейные панели)

IEC 61966-5:20001. Multimedia systems and equipment — Colour measurement and management — Part 5: Equipment using plasma display panels (Мультимедийные системы и оборудование. Измерение и управление цветом. Часть 5. Оборудование, использующее плазменные дисплейные панели)

IEC 61966-9:2000”, Multimedia systems and equipment — Colour measurement and management — Part 9: Digital cameras (Мультимедийные системы и оборудование. Измерение и управление цветом. Часть 9. Цифровые камеры)

ITU-R BS.1387-1:2001. Method for objective measurements of perceived audio quality (Метод объективных измерений воспринимаемого качества аудиосигнала)

ITU-R ВТ.601-5:1995, Studio encoding parameters of digital television for standard 4:3 and wide-screen 16:9 aspect ratios (Параметры студийного кодирования цифрового телевидения для стандартного форматного соотношения 4:3 и широкоэкранного форматного соотношения 16:9)

ITU-T J.144:2001. Objective perceptual video quality measurement techniques for digital cable television in the presence of a full reference (Методы объективного измерения воспринимаемого качества видеосигнала для цифрового кабельного телевидения при наличии полного эталонного сигнала)

ITU-T Р.931:1998. Multimedia communications delay, synchronization and frame rate measurement (Задержка при передаче мультимедийных данных, синхронизация и измерение частоты кадров)

3 Термины и определения

В настоящем стандарте применены следующие термины с соответствующими определениями:

3.1 система аудио-, видеосвязи (audio-video communication system): Система, обрабатывающая аудио-, видео- и. возможно, другие потоки данных синхронизированным в рамках восприятия пользователей способом для передачи и/или обмена информацией, работающая, как предполагается, через локальную или глобальную цифровую сеть.

3.2 DMOS (DMOS): Разность качества исходного и обработанного видеосигнала, оцениваемого на основании средних экспертных оценок (MOS). полученных в результате субъективной оценки испытаний. проведенных группой экспертов по качеству видеосигнала (VQEG).

3.3 PEAQ (PEAQ): Оценка восприятия качества аудиосигнала, определенная согласно ITU-R BS.1387-1.

3.4 PSNR (PSNR): Объективный параметр качества видеосигнала, определяемый отношением пикового сигнала к шуму, который вычисляют из сравнения исходных и обработанных видеокадров.

3.5 VQR (VOR): Объективная оценка качества видеосигнала, заниженная по сравнению с любым объективным параметром благодаря наличию оптимальной корреляции с DMOS.

4 Конфигурация для оценки качества

4.1 Входные и выходные каналы

Аудио- и видеосигнал в аудио-, видеопотоках должны быть зарегистрированы на соответствующих входном и выходном каналах системы аудио1, видеосвязи, как показано на рисунке 1.

идее»


Микрофон


Вход

7V

Водкмнвл

7V

Адооомл

ДввОДЙР

/\

/\

<„Л

Кодер

Пдмапав

Выход

Рисунок 1 — Модель систем аудио-, видеосвязи



фомвгаводипль


4.2 Точки входных и выходных оконечных устройств

Руководствуясь принципом сквозной оценки качества систем аудио-, видеосвязи, точки для получения необработанных данных должны быть в максимально возможной степени предельными оконечными точками. Методы измерения и характеристики оборудования, входящего в состав систем аудио-. видеосвязи, стандартизованы, например на входные преобразователи, такие как видеокамеры и микрофоны, распространяются МЭК 81146-1, МЭК61146-2. МЭК61966-9 и МЭК60268-4. а на выходные преобразователи, такие как дисплеи видеосигнала и громкоговорители. — МЭК 61966-3, МЭК 61966-4. МЭК 61966-5 и МЭК 60268-5. требования которых могут быть не применимы для сквозной оценки качества систем аудио-, видеосвязи.

Структурная схема оценки качества при двухстороннем и полном эталонных сигналах приведена на рисунке 2.


1 — исходный эталонный аудио- или видеосигнал:

2 — предварительная подготовка аудио- или видеосигнала:

- уменьшение динамическою частотною диапазона аудиосигнала.

- уменьшение размера кадра и частоты кадров видеосигнала для получения пригодности к оценке качества систем аудио-. видеосвязи, при необходимости.

3 — кодирование с помощью кодера сетевой потоковой передачи с заданной скоростью передачи данных для согласования пропускной способности сквозною сетевою соединений.

4 — декодирование с помощью декодера и визуализация полученных данных для получения слышимых и видимых данных:

5 — сбор данных и расчет оценки качества для предоставления информации, установленной настоящим стандартом

Рисунок 2 — Структурная схема оценки качества

5 Качество видеосигнала

5.1 Введение

В настоящем стандарте для сквозной объективной оценки качества видеосигнала рассмотрены два аспекта:

• статические характеристики, такие как воспроизведение тона и воспроизведение цвета, описан* ныв в 5.2 и 5.3:

* динамические характеристики, основанные на потоковой передаче видеокадров в сети, описан* ные в 5.4.5.5 и 5.6.

В качестве исходного эталонного видеосигнала, указанного на рисунке 2 (позиция 1). рекомендуется использовать набор наиболее распространенных исходных видеосигналов, например испытательные последовательности канадского научного центра (CRC). Для фактического кодирования потокового видеосигнала в сеть с ограниченной полосой пропускания исходный эталонный сигнал должен быть уменьшен по размеру кадра и скорости передачи, как указано на рисунке 2 (позиция 2). из-за высокой скорости передачи данных и большого размера кадра, при необходимости.

Доступные в настоящее время эталонные видеопоследовательности для динамических характеристик приведены е таблице А.1. Все источники эталонных видеосигналов, указанные в таблице А.1. которые были использованы группой экспертов по качеству видеосигнала (VQEG) для проведения субъективных испытаний качества видеосигнала в целях получения разности средних экспертных оценок (DMOS). а также для объективной оценки качества видеосигнала (VRG) согласно ITU-R 10-11Q/56-E1, были использованы в настоящем стандарте с разрешения владельца — канадского научного центра (CRC).

Формат каждого из исходных эталонных видеосигналов состоит из 10 кадров (для ракорда) + видеокадры за 8 с ♦ 10 кадров (для трейлера). Существует два видеоформата 525/60 Гц и 625/50 Гц. однако в настоящем стандарте для оценки качества используют только формат 525/60 Гц, приведенный в таблице А.1.

Каждая строка находится в пиксельном мультиплексированном 4:2:2 компонентном видеоформате в последовательности Cb Y Сг Y... и так далее, закодированной в соответствии с ITU-R ВТ.601-5. где 720 байт/строка для Y. 360 байт/строка для СЬ. а Сг — 360 байт/строка для Сг. Строки соединены последовательно в кадры, а кадры соединены последовательно в форме последовательности файлов.

Формат содержит 720 пикселей (1440 байт) на горизонтальную строку и имеет 486 активных строк на кадр. Размеры кадров составляют 1440*486 = 699840 байт/строка. а размеры последовательности — размер файла из 240 кадров за 8 с * 20 кадров. Таким образом, размер файла составляет 699840 байт/кадр * 260 кадров - 181958 400 байт. 30 кадров/с дает скорость передачи данных 699840 байт/кадр * 30 кадров/с * 8 бит = 167961600 бит/с. Поскольку эта скорость передачи данных слишком высокая для обработки обычными персональными компьютерами и потоковой передачи в сети Интернет, исходные испытательные последовательности были уменьшены по размеру кадра до 320*240 пикселей и по формату — до 24-бит/пиксель цветового пространства RGB (вместо цветового пространства YCC) для соответствия типовому видеоформату (AVI) с учетом требований IEC 61966-2-1.

Примечание 1 — Оценка ошибок, проводимая поликсельно. требует уверенного использования крате высокой степени нормализации. Для нормализации требуется как пространственное, так и временное выравнивание. а также поправки на усиление и смещение. С этой целью следует обратиться к разделу А2 ITU-R 6Q/39-E.

Примечание 2 — Поскольку значения объективных показателей качества в значительной степени зависят от контента видеосигнала, следует в максимально возможной степени использовать различные наиболее распространенные источники видеосигналов.

Примечание 3 — Показатели качества видеосигнала, полученные путем объективной оценки, проведенной согласно разделу 5. должны быть преобразованы в VQR посредством оптимальной корреляции с DMOS. рассматриваемой в ITU-R WP 60.

5.2 Сквозное воспроизведение тонов

5.2.1 Параметры, подлежащие оценке

Оценивают сквозную нелинейность в отношении воспроизведения тонов.

5.2.2 Метод оценки

В качестве исходного эталонного сигнала для позиции 1 рисунка 2 должно быть использовано изображение шкалы серых тонов, установленное МЭК 61146-1. как показано на рисунке 3. Статическое ахроматическое изображение должно быть подготовлено (позиция 2 на рисунке 2) и повторно закодировано как потоковый видеосигнал, переданный в сеть.

Рисунок 3 — Изображение шкалы серых тонов, установленное МЭК 61146-1

Полученный потоковый видеосигнал должен быть декодирован и воспроизведен устройством просмотра входящих потоковых видеосигналов. Подлежащие отображению данные изображения должны быть зарегистрированы выходным оконечным устройством.

Данные принятого изображения следует сравнивать по показателям трехкомпонентных данных: R (красный). G (зеленый) и В (синий), усредненных в каждой из соответствующих областей.

5.2.3 Представление результата оценки

Результаты оценки, включающие данные воспроизведения изображения по сравнению с входными данными изображения, должны быть представлены в виде таблицы и графика, как показано в таблице 1 и на рисунке 4. соответственно, вместе с оцениваемой системой аудио-, видеосвязи и спецификацией точки входа-выхода.

Таблица 1 — Пример воспроизведения тонов

Измерение

Спецификация

входной сигнал

Выходной сигнал

R.%

G. *

в.%

R

G

В

R

6

в

0

2.0

2.0

2.0

44

43

44

34

39

28

1

4.5

4.5

4,5

63

63

62

55

60

53

2

6.1

8,1

8.1

82

81

82

73

78

69

3

13.0

13.0

13.0

102

102

101

93

98

87

4

19.8

19.8

19.8

123

122

123

115

120

110

5

27.9

27.9

27.9

144

144

144

136

140

128

6

37,8

37.8

37.8

165

164

165

158

163

152

7

48.6

48.6

48.6

184

184

186

174

180

171

8

63.0

63.0

63.0

207

206

208

198

203

195

9

77.3

77.3

77.3

226

227

228

216

219

213

10

89.9

89.9

89.9

243

243

235

217

218

211

Рисунок 4 — Пример графика воспроизведения тонов

5.3 Сквозное воспроизведение цвета

5.3.1 Параметр, подлежащий оценке

Оценивают сквозные сдвиги цвета в цветовом пространстве CIELAB для статического цветного изображения.

5.3.2 Метод оценки

В качестве исходного эталонного сигнала для позиции 1 рисунка 2 должно быть использовано изображение шкалы воспроизведения цвета, установленное МЭК 61146-1. как показано на рисунке 5. Статическое цветное изображение должно быть подготовлено (позиция 2 на рисунке 2) и повторно закодировано как потоковый видеосигнал, переданный в сеть.

Рисунок 5 — Изображение шкалы воспроизведения цвета по МЭК 61146-1

Полученный потоковый видеосигнал должен быть декодирован и воспроизведен устройством просмотра потоковых видеосигналов. Подлежащие отображению данные цветного изображения должны быть зарегистрированы на выходном оконечном устройстве.

Данные принятого изображения должны быть получены в формате трехкомпонентных данных: R (красный). G (зеленый) и В (синий), усредненных по каждой из соответствующих областей, б

5.3.3 Представление результата оценки

Результаты оценки, включающие входные и выходные цвета е формате данных R. G и В. должны быть рассмотрены как цвета в цветовом пространстве sRGB. определенном в МЭК 61966-2-1. Они должны быть преобразованы в CIE 1976 L'a’b* однородное цветовое пространство. Цветовые разности между эталонными и полученными данными должны быть рассчитаны и представлены, как по

казано в таблице 2.

Таблица 2 — Пример воспроизведения цвета

Измерение

Спецификация

входной сигнал |&-6кт»ый>3)

Выходной сигнал (&-£итный*Э)

Цветовая

разность.

R. К

6. %

в. %

R

G

В

R

G

В

0

87.053

80.546

87.216

222

205

222

221

211

215

3.5

1

48.904

24.181

23.419

184

134

132

186

135

129

1.4

2

37.405

27,352

12.466

163

141

99

164

144

91

4.2

3

25.874

32.782

5.646

138

154

69

139

156

66

2.0

4

12.176

34.717

19.279

98

158

121

96

158

123

0.9

5

15,414

34.081

41.443

109

156

171

109

158

166

22

6

17.982

29.222

61.449

117

146

204

119

145

196

1.9

7

36.893

24.007

52.231

164

130

190

163

137

187

3.9

8

51.332

22.896

45.507

188

130

178

187

132

162

5.3

9

43.311

3.062

4.885

174

52

65

172

56

54

8.1

10

83.988

56.759

4.964

236

197

65

219

201

62

4.7

11

2.426

25.943

13.965

47

138

104

45

140

105

1.2

12

3.259

7.178

18.424

54

77

118

50

77

113

2.7

13

82.033

49.052

37.190

233

184

163

219

186

157

3.7

14

10.356

12.908

4.612

91

101

63

89

100

53

52

Средняя цветовая разность составляет: - 3.396.

5.4 Сквозные цветовые разности

5.4.1 Параметр, подлежащий оценке

Оценивают среднее значение цветовых разностей в психофизически однородном цветовом пространстве. определенном в МЭС 15.2. между эталонным видеокадром и соответствующим ухудшенным видеокадром.

5.4.2 Метод оценки

8 качестве исходного эталонного сигнала для позиции 1 рисунка 2 используют эталонные видеосигналы из таблицы А.1. Видеосигнал должен быть подготовлен путем уменьшения размера кадра видеосигнала в несжатом формате AVI (позиция 2 на рисунке 2). В этой точке необходимо встроить номера кадров, чтобы их можно было использовать для идентификации принятых кадров, соответствующих переданным кадрам.

Закодированные и переданные потоковые видеосигналы должны непрерывно регистрироваться. Вычисления должны быть проведены попиксельно.

Среднюю цветовую разность ДЕа6к в психофизически однородном цветовом пространстве между эталонными и ухудшенными кадрами к рассчитывают по формуле

_. 4 U, N;

^,‘■7 Z • СО

Л т-М,п-Н,

1

где К ■ 7-п-г — триплеты в цветовом пространстве CIELAB. соответствующие каж-

2 -M1+1)(W2 -W,+1)

дому пикселю эталонного видеокадра А;

Д£а6 +(ad, “ ао.) + fa, — Цветовая разность CIELAB между пикселями.

Триплеты в цветовом пространстве CIELAB должны быть исключены из значений пикселей Я би в эталонных и ухудшенных видеокадров по умолчанию в цветовом пространстве RGB (sRGB), опреде-ленном МЭК 61966-2-1. Каждый пиксель располагается в строке т и столбце л видеокадра.

5.4.3 Представление результатов оценки

Результаты оценки представляют в виде графика зависимости цветовой разности между каждым из соответствующих кадров и номерами кадров, как показано на рисунке 6. вместе с идентификацией исходных эталонных видеосигналов. Также должны быть представлены условия измерения, такие как размер кадра в пикселях, частота кадров, скорость потока передачи данных.


b) Пример для SRC14_REF_525


с) Пример для SRC15_REF_525


е) Пример для SRC17_REF_525


d) Пример для SRC16_REF_525

Цветовая рвтпость



Этапотьй искщним закодированный/ поташный еидеооинал

°0 90 100 190 200 290

Кадры

О Пример для SRC18_REF_525

Рисунок 6 — Цветовые разности между эталонными и потоковыми видеокадрами при 250 кбит/с и 30 кадр/с. лист 1

Цветовая радость

20

• Т Т 1 "1 I ■

Этэлоюгый исходный закодированный/ потоковый видеосигнал

20

Эталонный немодный закодироюнгый/ потоковый видеосигнал

15

я

15

10

10

5

Л

S

л

’о

50 100 150 200

250

кадры

и0

50 100 150

200

250

кадры

i) Пример для SRC21_REF_525

j) Пример для SRC22_REF.

_525

Цветовая разность



Условия оценки:

• размер видеокадра — 320 х 240 пикселей:

• частота кадров — 30 кадр/с:

• потоковая скорость передачи данных — 250 кбит/с;

• пропускная способность сети — более 250 кбит/с:

• воспроизведение — плейер Microsoft Media Player ® версия 7.1

Рисунок 6. лист 2

Для заключительной оценки полученные данные должны быть усреднены по кадрам с помощью формулы (2), чтобы обеспечить единичный параметр для объективной оценки, являющийся общим средним значением цветовой разности, которое должно быть представлено, как показано в таблице 3.


21+1)


£ •

к-К,

(2)


Таблица 3 — Общие средние значения цветовых разностей

Идентификация исходного эталонного видеосигнала

Общее среднее значение цветовой разности

SRC13 REF 525

9.6

SRC14 REF 525

8.4

SRC15_REF_525

14.9

SRC16 REF 525

8.3

Окончание таблицы 3

Идентификация исходного эталонного видеосигнала

Общее среднее значение цветовой разности

SRC17 REF 525

16.8

SRC18_REF_525

8.2

SRC19 REF 525

8.2

SRC20_REF_525

9.2

SRC21 REF 525

5.4

SRC22 REF 525

13.2

5.5 Сквозное отношение максимального сигнала к шуму (PSNR)

5.5.1 Параметр, подлежащий оценке

Оценивают отношение мощности максимального сигнала к мощности шума. PSNR. в трехмерной системе координат.

5.5.2 Метод оценки

В качестве исходного эталонного сигнала для позиции 1 рисунка 2 используют эталонные видеосигналы из таблицы А.1. Видеосигнал должен быть подготовлен путем уменьшения размера кадра видеосигнала в несжатом формате AVI (позиция 2 на рисунке 2). При необходимости в этой точке встраивают номера кадров, чтобы их можно было использовать для идентификации принятых кадров, соответствующих переданным кадрам.

Закодированные и переданные потоковые видеосигналы должны приниматься непрерывно. Вычисления должны быть проведены лопиксельно.

Следует использовать отношение максимального сигнала к шуму (PSNR) между полным эталонным изображением и воспроизведенным изображением, рекомендованное в ITU-T J.144. PSNR рассчитывают по формуле

Cxi

(3)


ImseJ-

« А *Г, Wj.

raeMSE = — £ £ £ (d(p.m,n)-o(p,m,n)) .

_1_.

ГДв “ (P2 - P, + 1)(M2 - M, 11)(W2 - W, +1)’

d (p. m.n)no (p. m, n) — представляют, соответственно, ухудшенные и исходные пиксельные векторы в кадре р. строке т и столбце п:

Smax — максимально возможное значение пиксельных векторов.

В случае цветных изображений каждый элемент изображения обычно состоит из трехмерных зна

чений: красного (R). зеленого (G) и синего (В). Таким образом, для определения среднеквадратичных ошибок применяют формулу

(4)

где Smex{RGB) в 3 • 22(W _1) для значений при JV-бмтном кодировании.

Для оценки PSNR в более однородном цветовом пространстве CIE 1976 LAB рекомендуют при

менять формулу

1 р> Ч { .2

£ I 4£„) . (5)

р-Р./п-М.л-Ж'

ГДв SmaxlLabt^eb. = ^(Ciax ) + (Этак ) + (^тах ) , факТИЧбСКОб Значение КОТОРОГО ЗЭВИСИТ ОТ ЦВвТОВОЙ гаммы исходного цветового пространства RGB.

Рекомендуется по умолчанию использовать цветовое пространство RGB. определенное МЭК 61966-2-1. в котором Smax(Lab, =148.254.

Примечание — Следует отметить, что члены суммирования в формуле {5} являются квадратом цветовых разностей в психофизически однородном цветовом пространстве, описанных в 5.4.

Дополнительно для сравнения рассчитывают сигнал яркости У и два цветоразностных сигнала С6 и Си обозначенных как У, по формуле

MSEy

ги


(6)


В системе цветового пространства YCbCr. определенного в МЭК 61966-2-1 Sn,ax{Ycc) = 1.01659.

5.5.3 Представление результатов оценки

PSNR в трехмерных пространствах Lab. Yw и RGB вместе с PSNR е одномерных пространствах L* и У должны быть представлены в протоколе, как показано на рисунке 7.

Также должны быть представлены условия измерения, такие как размер кадра в пикселях, частота кадров, скорость потока передачи данных в битах.

Примечание — В приложении А для информации приведено программное обеспечение для оценки различных параметров качества в отношении известного гипотетического ухудшения, используемого группой экспертов по качеству видеосигнала (GQEG). с точки зрения трехмерных и одномерных PSNR вместе со средней цветовой разностью, разработанное университетом Мибв в сотрудничестве с компанией Mitsubishi Electric Corp.


Рисунок 7 — Примеры оценки PSNR. лист 1








Рисунок 7. лист 2


PSNR дБ

30

SRC21_REF_525

25

20

15

50 100 150 200 250

Кадры


PSNR дБ 35


30-


29


20ь


SRC22_REF_525


яте——,—*


15 •


-г—


i) SRC21_REF_525


50 100 150

j) SRC22_REF_525


-V


200 250

кадры


Условия оценки:

• размер видеокадра — 320 х 240 пикселей:

• частота кадров — 30 кадр/с:

• скорость потока передачи данных — 250 кбит/с;

• пропускная способность сети — более 250 кбит/с:

• воспроизведение — плейер Microsoft Media Player ® версия 7.1

Рисунок 7. лист 3

Для заключительной оценки PSNR должны быть усреднены по кадрам с помощью формулы (7). чтобы обеспечить общие параметры для объективной оценки. Результаты расчета должны быть пред* ставлены в виде таблицы 4.

PSNR ‘ IK к t PSNR«■ (7)

2 -л, +1)й.к

Таблица 4 — Общие PSNR, усредненные по кадрам

Идентификация эталонного

сигнала

PSNR в CIELAB

PSNReYCC

PSNR в RGB

PSNR в L‘

PSNR в Y

SRC13_REF_525

20.9

24.4

24.4

23,3

26.1

SRC14 REF 525

22.3

29.9

30.0

24.4

30.9

SRC15 REF 525

17.7

21.5

21.5

21,9

23.5

SRC16_REF_525

22.1

27.0

27.2

23.7

28.2

SRC17 REF 525

16.9

23.7

23.7

19,6

25.1

SRC18_REF_525

22.5

28.3

28.3

25,2

30.2

SRC19 REF 525

22.3

27.0

27.0

24.4

28,4

SRC20 REF 525

20.7

23.2

23.0

21.3

23.6

SRC21_REF_525

24.4

29.8

29.7

24.9

30.3

SRC22 REF 525

18.8

23.6

23.5

21.5

24.9

5.8 Сквозная объективная оценка качества видеосигнала

5.6.1 Параметр, подлежащий оценке

Оценивают субъективную разность средних экспертных оценок (DMOS) качества видеосигнала с использованием модели, имитирующей характеристики зрения и восприятия человеком цифровых видеосигналов.

5.6.2 Метод оценки

В результате первого этапа испытаний и изучения VQEG в соответствии с ITU-R10-11Q/56-E предложенных десяти моделей оценки (фактически девять из десяти представленных моделей были признаны эффективными) приняты следующие модели для оценки качества видеосигнала:

a) оценка изображения на основе сегментации, обеспечивающая прогнозирование качества по набору заранее заданных сцен:

b) оценка зрительного различения, имитирующая реакции пространственно-временных зрительных механизмов человека.

c) оценка имитации характеристик зрения человека с использованием пространственно-временных трехмерных фильтров;

d) оценка среднеквадратической ошибки (MSE). взвешенной с помощью зрительных фильтров человека, таких как фильтры на основе пикселей, блоков и последовательностей:

e) оценка параметра искажения восприятия, основанного на пространственно-временной модели зрительной системы человека;

f) оценка, включающая оценку модели восприятия и выделителя признаков, специально настроенного на определенные типы искажений;

д) оценка качества цифрового видеосигнала, включающая множественные аспекты зрительной чувствительности человека при обработке простых изображений.

h) оценка субъективного измерения восприятия видеосигнала с использованием подхода к измерению качества видеосигнала, такого же. как для измерения качества восприятия речи;

i) оценка с использованием характеристик ограниченной полосы пропускания, выделенных из пространственно-временных областей и линейной комбинации параметров для оценки субъективных показателей качества.

Эффективность оценки всех моделей была проверена с точки зрения возможности выделения признаков по сравнению с традиционным методом отношения максимального сигнала к шуму.

VQEG в настоящее время проводит испытания новой предложенной модели для оценки (метода оценки) на основе полного эталонного телевидения. Возможный на практике метод оценки на основе полного эталонного телевидения находится на рассмотрении.

Примечание — Республикой Корея был представлен «новый метод», включающий в себя пространственно-временное вэйелет-преобраэоаание, как описано в ITU-R 6Q/42-E. В настоящем стандарте этот метод был рассмотрен в области цветового пространства sRGB. как показано в приложении В.

5.6.3 Представление результатов оценки

Результаты оценки качества видеосигнала должны быть представлены в виде оценки разности средних экспертных оценок вместе с используемой оцениваемой моделью и условиями.

Примечание — Пример представления результатов оценки находится на рассмотрении.

6 Качество аудиосигнала

6.1 Воспринимаемое качество аудиосигнала по отношению к полным эталонным сигналам

6.1.1 Параметр, подлежащий оценке

Оценивают значения объективной разницы качества (ODG). измеренные методом РЕАО (оценка восприятия качества аудиосигнала), рекомендованным ITU-R BS.1387-1.

6.1.2 Обоснование

Воспринимаемое качество аудиосигнала (PEAQ) является одним из ключевых факторов при разработке цифровых систем аудио-, видеосвязи. Официально принятые испытания на прослушивание всегда были важным методом оценки качества аудиосигнала. Однако субъективные оценки качества являются трудоемкими и дорогостоящими. В связи с этим возникла необходимость разработки объективного метода измерения при проведении оценки качества аудиосигнала. Традиционные объективные методы измерений, такие как отношение сигнала к шуму (SNR) или общее гармоническое искажение (THD). в действительности никогда не показывали достоверного воспринимаемого качества аудиосигнала. Проблемы возникают, когда эти методы применяют по отношению к современным кодекам, которые являются нелинейными и неустановившимися. МСЭ-Р (сектор радиосвязи Международного союза электросвязи) рекомендовал объективный метод измерения для оценки воспринимаемого качества аудиосигнала испытуемого оборудования, например, кодека с низкой скоростью передачи данных, известный как PEAQ (оценка восприятия качества аудиосигнала). Этот метод установлен в ITU-R 8S.1387-1 и кратко описан в приложении В.

Выходная переменная объективного метода измерений PEAQ является показателем объективной разницы качества (ODG) и показателем искажения (DI). OOG соответствует показателю субъективной разницы качества (SDG) в субъективной области. Точность оценки ODG ограничена одним десятичным знаком. Однако следует соблюдать осторожность и. в целом, не ожидать, что разница между любой парой ODG в одну десятую показателя будет являться значительной. DI имеет то же значение, что и ODG. Однако 01 и ODG можно сравнивать только количественно, ко не качественно. Как правило. ODG следует использовать в качестве показателя качества для значений ODG. приблизительно более минус 3.6. ODG очень хорошо коррелируется с субъективной оценкой в этом диапазоне. Если значение ODG составляет менее минус 3.6, следует использовать 01. Таким образом, должны быть измерены обе выходные переменные 00G и 01.

6.1.3 Метод оценки и алгоритм PEAQ

Базовая модель метода объективного измерения PEAQ показана на рисунке 8. Базовая модель состоит из двух входов, один из которых предназначен для (необработанного) эталонного аудиосигна-ла. соответствующего позиции 2 рисунка 2. а другой — для испытуемого аудиосигнала. Испытуемый аудиосигнал может быть, например, выходным сигналом цифровых систем аудио-, видеосвязи, соответствующим выходу позиции 4 рисунка 2, на который подается эталонный сигнал.

Настоящий метод измерения применим к большинству типов оборудования для обработки цифровых и аналоговых аудиосигналов. В настоящем стандарте рассматривают применение метода только по отношению к цифровым каналам аудиосвязи. Блок «испытуемое устройство» соответствует позициям 2 и 3 рисунка 2.

Рисунок 8 — Базовая модель проведения объективных измерений

Алгоритм проведения оценки методом PEAQ приведен на рисунке 9. Метод PEAQ основан на общепринятых психоакустичесхих принципах. В целом он сравнивает сигнал, который был некоторым образом обработан, с соответствующим синхронизированным во времени эталонным сигналом. На первом этапе обработки сигнала используется периферийное устройство, моделирующее ухо. известное как «модель восприятия», или «модель уха». Одновременные блоки данных эталонного и обработанного сигнала преобразуются в выходные сигналы моделей уха. На следующем этапе модели алгоритма определяют присутствие слышимого искажения в испытуемом сигнале путем сравнения выходных сигналов моделей уха. Информация, полученная посредством этих процессов, дает несколько значений, так называемых MOV (выходных переменных метода измерений), и может использоваться для детального анализа сигнала.

Конечной целью является управление показателем качества, состоящего из одного числа, указывающего на слышимость искажений, присутствующих в испытуемом сигнале. В целях сохранения этого параметра требуется некоторая дальнейшая обработка MOV, имитирующая когнитивную часть слуховой системы человека. Поэтому алгоритм PEAQ включает искусственную нейронную сеть.

Существуют две версии PEAQ: «базовая» версия, отличающаяся низким уровнем сложности, и «расширенная» версия, обеспечивающая большую точность за счет более высокой сложности. Структура обеих версий очень похожа и точно соответствует модели PEAQ, показанной на рисунке 9. Основное различие между базовой и расширенной версиями заключается в соответствующих моделях уха и наборе используемых MOV. В приложении С приводится дополнительная информация о PEAQ. которая помогает понять результаты измерений.

Рекомендуется использовать доступные эталонные сигналы из ITU в виде WAV-файлов (в формате Microsoft RIFF) на CD-ROM-диске. Все эталонные сигналы были отобраны на частоте 48 кГц для 16-битного РСМ. Эталонные и испытуемые сигналы, предоставленные ITU. уже согласованы друг с другом по времени и уровню, поэтому дополнительного усиления или задержки не требуют.

Алгоритм измерения должен быть откорректирован на уровень прослушивания 92 дБ SPL.

Рисунок 9 — Представление модели PEAQ

6.1.4 Представление результатов оценки

Результаты измерения РЕАО должны быть приведены е виде таблицы параметров указанных эталонного и испытуемого сигналов11, а также полученных значений DI и ODG.

Таблица 5 относится к базовой версии, а таблица 6 содержит значения для расширенной версии.

Та блица 5 — Параметры испытуемого сигнала и полученные значения DI и ODG для базовой версии

Параметр

DI

ODG

Acodsna.wav

1.304

-0.676

Bcodtri.wav

1.949

-0.304

Ccodsax.wav

0.048

-1.829

Ocodryc.wav

1.648

-0.458

Ecodsmg.wav

1.731

-0.412

Fcodsb1.wav

0.677

-1.195

Fcodtr1.wav

1.419

-0.598

Fcodtr2.wav

-0.045

-1.927

fcodtr3.wav

-0.715

-2.601

gcodcla.wav

1.781

-0.386

hcodryc.wav

2.291

-0.166

Hcodstr.wav

2.403

-0.128

icodsna.wav

-3.029

-3.786

kcodsme.wav

3.093

0.038

lcodhrp.wav

1.041

-0.876

lcodpip.wav

1.973

-0.293

moodda.wav

-0.436

-2.331

ncodsfe.wav

3.135

0.045

scoddv.wav

1.689

-0.435

Наименования соответствующих параметров эталонных сигналов получаются путем замены подстроки «cod» в наименованиях параметров испытуемых сигналов на «ref», например наименованием параметра эталон* ного сигнала для «bcodtri.wav» является «breftn.wav».

Таблица б — Параметры испытуемого сигнала и полученные значения 01 и ООО для расширенной версии

Параметр

01

ООО

Acodsna.wav

1.632

-0.467

Bcodtn.wav

2.000

-0.281

Ccodeax.wav

0.567

-1,300

Dcodryc.wav

1.725

-0.415

Ecodsmg.wav

1.594

-0.489

Fcodsb1.wav

1,039

-0.877

Fcodtrl .wav

1,555

-0.512

Fcodtr2.wav

0.162

-1,711

Fcodtr3.wav

-0,783

-2.662

Goodda.wav

1.457

-0.573

Hcodryc.wav

2,410

-0.126

Hcodstr.wav

2.232

-0.187

lcodsna.wav

-2.510

-3,664

Kcodsme.wav

2.765

-0.029

Lcodhrp.wav

1.538

-0.523

Lcodpip.wav

2.149

-0.219

Mcodcla.wav

0.430

-1.435

Ncodsfe.wav

3.163

0,050

Scoddv.wav

1.972

-0.293

6.2 Частота дискретизации и разрешение квантования

6.2.1 Параметр, подлежащий оценке

Оценивают частоту дискретизации и пропускную способность эталонного и обработанного аудио* сигнала.

6.2.2 Метод оценки

Частота дискретизации зависит от полосы пропускания аудиосигналов. Для высококачественных аудиосигналов используется частота дискретизации 48 кГц. Должны быть выбраны значения частоты дискретизации и ширины полосы эталонного и обработанного аудиосигналов.

Разрешение квантования относится к динамическому диапазону аудиосигналов или шума кванто* вания. Для высококачественных аудиосигналов используют линейный (или равномерный) метод кван* тования. имеющий 16-битное разрешение квантования. Значение разрешения и метод квантования должны быть идентифицированы.

6.2.3 Представление результатов оценки

Должны быть зарегистрированы выбранные и идентифицированные значения.

6.3 Задержка

6.3.1 Параметр, подлежащий оценке

Оценивают время задержки аудиосигналов от аудиовходов до кодера и их принятия, измеренное в секундах.

6.3.2 Метод оценки

Импульсные аудиосигналы должны быть использованы в качестве входных для позиции 2 рисунка 2. Время обработки сигнала между входом позиции 3 и выходом позиции 4 рисунка 2 должно быть измерено в секундах.

Примечание — Большинство систем аудиосвязи посредством цифровых сетей включает в себя схему буферизации. Следовательно, время буферизации также учитывают при измерении.

6.3.3 Представление результата оценки

Регистрируют измеренное время задержки в секундах.

7 Качество видео- и аудиосигналов в целом

7.1 Синхронизация аудио- и видеосигнала (синхронизация изображения и речевых сигналов)

7.1.1 Параметр, подлежащий оценке

Оценивают временную синхронизацию между аудио- и видеоканалами.

7.1.2 Метод оценки

Полноценные мультимедийные системы в отличие от простого набора несвязанных медиаканалов способны поддерживать временную синхронизацию между различными каналами. Следовательно, включение измерения качества временнбй синхронизации в показатели оценки качества систем аудио-, видеосвязи имеет чрезвычайно большое значение.

Алгоритм измерения временнбй синхронизации между медиаканалами приведен в Рекомендации ITU-T Р.931. Он основан на исходном условии, что медиасигкал визуального канала может быть зарегистрирован на таких интерфейсах, как выход камеры и вход дисплея для видеоканала, и выход микрофона и вход громкоговорителя — для аудиоканала. Это исходное условие приведено на рисунке 1.

Медиасигналы, зарегистрированные такими интерфейсами, оцифровывают, при необходимости разбивают на кадры фиксированного размера и дают временные метки. Для получения дополнительной информации об этой процедуре см. Рекомендацию ITU-T Р.931.

Оцифрованным кадрам аудио- и видеомедиапотоков присваивают порядковые номера следующим образом:

- А(гл) и V(n) — входные аудио- и видеокадры, соответственно (гл) и (л) — порядковые номера для каждого потока. Предполагается, что они связаны между собой и соответствуют одному и тому же событию;

- А'{р) и V'(q) — выходные аудио- и видеокадры соответственно;

- и ^а(п) “ временные метки для А(т) и А(п) соответственно. Временные метки для других кадров определяют аналогичным образом.

Для каждого входного кадра необходимо найти соответствующий выходной кадр, а не использовать все входные кадры, какописано в ITU-T Р.931. Поскольку данные медиапотока изменяются, искажаются. пропускаются и переформируются, процесс согласования не является простым. Для видеокадров используют метод, применяющий параметры PSNR. рассмотренные в разделе 5. Для аудиокадров используют двухэтапный процесс, применяющий аудиоогибающие для этапа грубого согласования и спектральные плотности мощности — для этапа точного согласования. Дополнительная информация приведена в ITU-T Р.931.

При таком рассмотрении предполагается, что между А(т) и А'(р). А'(д) и V'(n) и V’(q) установлены соотношения согласования. При этом предположении временнбй перекос между аудио- и видеокадрами рассчитывают по следующей формуле.

Sa (p.q) = Q'M(p.q} - QAV(m.n). (8)

где 0AV(m.n) - TA(m) - Tv(n) и O;v(p,q)» T^p) - Tj(q).

Примечание 1 — Для получения достоверного и значимого результата оценки важно выбрать подходящие входные аудиосигналы. Если видеосигнал содержит статические или близкие к статическим сцены, процесс согласования входных и выходных кадров будет затруднен или даже невозможен. Анапоги'ыую осторожность следует соблюдать и при оценке аудиоканала.

Примечание 2 — Современные схемы сжатия видеосигнала дают колебания времени сжатия, передачи (при использовании кодирования с переменной скоростью передачи данных) и распаковки в зависимости от свойств входных сигналов. Следовательно, для оценки следует использовать подходящие входные сигналы, пригодные для предполагаемого применения.

Примечание 3 — Для систем с низкой частотой видеокадров иногда предпочтигвгънее иметь больший временной перекос между видео- и аудиопотоками, поскольку время задержки видеосигнала изменяется, в то время как аудиоданные обычно передаются изохронно.

Выбор стандартных входных аудио- и видеопотоков, пригодных для общего использования, оставлен для дальнейшего изучения.

7.1.3 Представление результатов оценки

Протокол измерений должен быть представлен в таком виде, чтобы любое различие между отдельными измерениями было четко проиллюстрировано. Также может быть представлена типичная сводная статистика (например, минимальное, максимальное, среднее и стандартное отклонение).

7.2 Масштабируемость

7.2.1 Параметр, подлежащий оценке

Оценивают автономную функцию динамической настройки частоты кадров в зависимости от доступной полосы пропускания между передатчиком и приемником.

7.2.2 Метод оценки

Метод измерения масштабируемости находится на рассмотрении.

7.2.3 Представление результатов оценки

Находится на рассмотрении.

7.3 Общее качество испытуемых сигналов

7.3.1 Параметр, подлежащий оценке

Оценивают коэффициент общего качества, являющийся характеристикой взаимодействия аудио-и видеосигнала.

7.3.2 Метод оценки

Общее качество систем аудио-, видеосвязи OOAV рассчитывают по формуле

OOAV «= aQy + ЬОЛ + cQv&a . (9)

где О, — объективный показатель качества, оцененный в разделе 5:

Од — объективный показатель качества, оцененный в разделе 6:

OV&A — объективный показатель качества, оцененный в настоящем разделе.

в, b и с — коэффициенты взвешивания, зависящие от фактических применений системы аудио-.

видеосвязи.

7.3.3 Представление результатов оценки

Должен быть представлен общий коэффициент качества с достаточной информацией об оцениваемой системе аудио-, видеосвязи.

Приложение А (справочное)

PSNR, определенные в трехмерных пространствах, применяемые к гипотетическому ухудшению испытуемых сигналов по отношению к исходным эталонным видеосигналам

А.1 Введение

Настоящее приложение предназначено для демонстрации определений PSNR е трехмерном векторном пространстве для каждого пикселя, входящего в состав кадров видеосигналов. Определение PSNR в цветовом пространстве CIELAB приведено в уравнении (5). PSNR в пространстве sYCC — в уравнении (в), a PSNR в пространстве sRGB — в уравнении (4). Средняя цветовая разность, определенная е уравнении (1), также включена в это приложение для сравнения совместно с одномерными PSNR в пространствах С и Y.

Значения объективных показателей качества легко сравниваются с другими возможными показателями качества. которые могут быть применены в будущем, и результатами субъективной оценки качества видеосигнала.

А.2 Испытуемые сигналы и гипотетическое ухудшение

В настоящем приложении приведены 16 известных различных гипотетических ухудшений по сравнению с цифровыми видеофайлами, подготовленными в формате, установленном ITU-R ВТ.601-5. и используемыми при проведении оценки группой экспертов по качеству видеосигнала (VQEG). Исходные эталонные видеосигналы имеют обозначения от SRC13_REF_525.yuv до SRC22_REF_525.yuv. как показано в таблице А1. Они используются

с разрешения VOEG.

Программное обеспечение для различных объективных показателей качества видеосигналов было разработано в университете Миба. Япония, в сотрудничестве с компанией Mitsubishi Electric Corp. Значения были получены для кадра уменьшенного размера 320 х 240 пикселей на кадр, более чем для 260 кадров. В уравнении (4) применяют следующие значения показателей: Р1 = 1. Р2 = 260, М1 = 1. М2 = 240 и W1 = 1. N2 - 320. Результаты расчета приведены в таблицах А2 —А6.

Таблица А.1— Исходные эталонные видеосигналы, доступные для объективной оценки качества

Обозначение

Наименование

Содержание

SRC13 REF 525

Balloon-pops

Пленка, насыщенный цвет, движение

SRC14 REF 525

New York 2

Маскирующий эффект, движение

SRC15 REF 525

Mobile & Calendar

Цвет, движение

SRC16 REF 525

Betes pas betes

Цвет, синтезируемый, движение, вырезка сцен

SRC17 REF 525

Le point

Цвет, прозрачность, движение во всех направлениях

SRC18 REF 525

Autumn leaves

Цвет, пейзаж, масштабирование, движение падающей воды

SRC19 REF 525

Football

Цвет, движение

SRC20 REF 525

Sailboat

Близхое к статическому изображение

SRC21 REF 525

Susie

Цвет кожи

SRC22 REF 525

Tempete

Цвет, движение

Таблица А.2 — PSNR в различных цветовых пространствах и цветовая разность для видеосигналов SRC13 и SRC14

Обозначение

Lab

sYCC

sRGB

L*

У

дЕ

Обозначение

Lab

sYCC

sRGB

L‘

Y

дЕ

hrc1/src13

20.5

23.2

23.6

26.3

26.3

8.3

hrc6/src13

22,2

22.6

22.1

25.9

24.9

6.2

hrc2/src13

23.6

23.5

23.2

25.9

25.0

5.4

hre7/src13

22.2

21.1

20.7

23.0

22.1

5.9

hrc3/src13

22T

22.7

22.3

25,6

24.6

5.8

hrc8/sro13

21.9

22.3

21.9

25.3

24.5

6.7

hre4/src13

21.4

22.1

21.7

25.6

24.7

7,4

hrc9/src13

21.6

20.6

20.3

22.8

21.8

6.9

hrc5/src13

20.4

19.3

19,0

21.2

20.3

8.0

hrc10/src13

22.1

20.9

20.6

23.0

22.0

6.3

Окончание таблицы А.2

Обозначение

Lab

sYCC

sRGB

L‘

Y

ЛЕ

Обозначение

Lab

sYCC

sRGB

L*

Y

ЛЕ

hrc11/src13

2lS

22.8

22.5

24.5

25.3

6.9

hrc6/src14

24.5

23.6

23.8

25.3

24.1

5.0

hre12/src13

22.4

23.6

23.3

24.8

26.0

5.9

hrc7/src14

24.5

21.5

21.7

22.5

21.4

4.1

hre13/src13

21.3

20.7

20.6

23.4

22.2

6.8

hrc8/src14

24.3

23,5

23.7

24.9

24.0

5.3

hrc14/src13

21.2

20.3

20.0

22.7

21.6

7.9

hrc9/src14

24.3

21.4

21.7

22.4

21.4

4.5

hrc15/src13

Zi

22.1

21.7

25.3

24.4

7.6

Hrc10/src14

24.3

21.4

21.6

22,5

21.4

4.4

hrc16/8fc13

22.1

22.8

22.3

25.8

25.2

7.0

Hrc11/src14

25.5

26.0

26.1

24.6

26.3

4.1

hrc1/src14

22.4

25.8

25.9

26.6

28,1

7.5

Hrc12/src14

26.0

26.2

26.4

24.8

26.4

3.7

hrc2fcrc14

25.7

24.3

24.5

25.4

24.3

4.9

Hrc13/src14

21.5

20.8

21.7

23.2

21.7

5.4

hrc3/src14

243

23.8

24.0

25.1

24.1

4.7

Hrc14/src14

23.9

21.3

21.6

22.4

21.3

5.3

hrc4/src14

24.0

23.9

24.0

25.4

24.3

5.5

Hrc15/src14

25.8

25,8

26.0

27.2

26.3

5.6

hrc5/src14

22.5

19.7

20.0

20.7

19.6

5.9

Hrc16/src14

26.0

26.0

262

27.4

26.5

5.3

Примечание 1 — Видеосигналы hrc16/src14 и т. д. соответствуют гипотетически ухудшенному видеосигналу (hrc16) по сравнению с исходным эталонным видеосигналом (src14) соответственно.

Примечание 2 — Все видеосигналы представлены в размере 320»240 пикселей с 24-битной глубиной цвета.

Таблица А.З — PSNR в различных цветовых пространствах и цветовая разность для видеосигналов SRC15 и SRC16

Обозначение

Lab

sYCC

sRGB

L*

Y

ЛЕ

Обозначение

Lab

sYCC

sRGB

L'

Y

ДЕ

hrc1/src15

11.8

13.6

13.1

20.7

19.5

24.8

hrc1/src16

20.3

21.6

21.8

23.8

25.7

9.5

hrc2/src15

18.5

18.4

24.2

23.1

10,8

hrc2/src16

27.1

28.1

28.0

31.1

32.0

4.4

hrc3/src15

16.7

16.5

23.1

21.7

13,2

hrc3Zsrc16

292

29.0

28.9

31.0

31.9

2.4

hrc4/src15

‘ЯЕ1

15.0

14.5

23.0

212

18,7

hrc4/src16

22.9

23.7

23.6

28.3

28.3

6.0

hrc5/src15

15.4

152

19.8

18.9

15.9

hrc5/src16

21.7

22.0

21.9

24.8

25.5

6.0

hrc6fcrcl5

15.4

15.0

23.0

21.3

17,3

hrc6/src16

23.5

24.2

24.0

28.7

28.7

5.1

hrc7/src15

17.0

16.9

21.1

20.3

12.1

hrc7/src16

22.8

22.9

22.8

25.7

26.4

4.4

hrc8/src15

15.3

15.0

22.6

20.9

17.6

hrc8/src16

23,4

24.2

24.0

28.4

28.5

5.2

hrc9Zsrc15

16.6

16.5

20,7

19.7

13.1

hrc9/src16

22.8

22.7

22,7

25.5

26.1

4.6

hre10/sre15

17.3

172

22.1

21.0

11.9

hrc1Q/src16

24.9

25.8

25.4

28.9

30.3

3.8

hrc11/src15

17.2

17.0

22,9

22.0

12,8

hrc11/src16

25.4

27.5

27.3

27.8

31.6

3.8

hrc12/src15

17.5

17.3

23.3

22.7

12.0

hrc12/src16

25.7

27,9

27.6

28.0

322

3.5

hro13/src15

16.2

16.1

21.5

19.7

14.6

hrc13/src16

23.3

23.5

23.6

29.1

29.5

4.3

hre14/src15

16.1

16.0

20.6

192

14.3

hrc14/src16

22.9

22.6

22.6

25.2

25.4

5.2

hrc15/src15

-ТЯ

16.1

16.0

21.1

19.3

15.4

hrc15/src16

23.7

23.3

23.5

26,0

26.2

5.8

hrc16/src15

16.3

162

21,6

19.9

14.9

hrc16/src16

23Д

23.5

23.7

26.2

26.5

5.6

Примечание 1 — Видеосигналы hrc16/src16 и т. д. соответствуют гипотетически ухудшенному видеосигналу (hrc16) по сравнению с исходным эталонным видеосигналом (вгс1б) соответственно.

Примечание 2 — Все видеосигналы представлены в размере 320»240 пикселей с 24-битной глубиной цвета.

Таблица А.4 — PSNR в различтх цветовых пространствах и цветовая разность для видеосигналов SRC17 и SRC18

Обозначение

Lab

sYCC

sRGB

С

Y

д£

Обозначение

Lab

sYCC

sRGB

L*

Y

ДЕ

hrc1/src17

ЕбЯ

| 19.2

192

20.6

23.3

16.7

hrct/src18

18,3

21.0

20.7

23,2

25.6

10,2

hrc2/src17

20.2

23,2

23.6

26.6

26.9

92

hrc2/src18

228

24.8

24.5

28.0

28.7

6.0

hrc3/src17

202

23,2

23.3

262

27.1

В.З

hrc3/src18

22^

24.2

23.8

27.7

28.0

6.5

hrc4/src17

21.2

21.6

252

25.0

11.1

hrc4/src18

18.1

20.4

19.7

26.6

26.9

9.9

hrc5/src17

20.1

20.5

22.7

23.0

11.8

hrc5/src18

ТёЯ

20.1

20.0

21.7

22.6

9.0

hrc6/src17

^8?

20.8

21.1

24.9

24.7

10.0

hrc6/src18

19.3

21.6

21.0

27.2

27.4

8.4

hrc7/src17

21.8

22.1

24.5

24.9

8.6

hrc7/src18

202

21.5

21.5

22.8

23.7

12

hrc8/src17

18.1

20.5

20.8

24.3

24.2

10.9

hrc8/src18

^9J

21.7

21.2

26.8

27.2

8.4

hrc9/src17

ёаД

20.6

20.9

23.4

23,7

10.3

hrc9/src18

20Л

21.5

21.6

22.8

23.6

7.4

hrc10/src17

19.7

21,9

222

24.8

25,2

8.9

hrc10/src18

23.0

22.8

25.3

26.0

6.5

hrc11/sre17

ТёТ

20.4

20.7

23.2

23,9

10.8

hrc11/src18

21.5

24.4

24,0

26,7

29.8

6.4

hrc12/src17

23

21.4

21.8

24.1

25.1

9.3

hrcl2/src18

24.5

24,1

26,7

30.1

6.1

hrc13/src17

16.9

18.6

19.0

22.0

22.0

132

hrc13/src18

24.0

23.6

27.7

27.9

6.9

hrc14/src17

20.3

20.6

23.4

23.4

11.6

hrc14/src18

2t3

22.8

22.6

25,2

25.7

7.2

hrc15/src17

^7?

20.0

20.4

23.0

23.0

13.4

hrc15/src18

2t6

23,7

23.3

29.0

28.5

7.8

hrc16/src17

^82

20.7

212

23,8

24.0

12.5

hrc16/src18

21J

23,9

23.4

29.4

29.2

7.4

Примечание 1 — Видеосигналы hrc16/src!8 и г. д. соответствуют гипотетически ухудшенному видеосигналу (hrc16) по сравнению с исходным эталонным видеосигналом (srcl6) соответственно.

Примечание 2 — Все видеосигналы представлены в размере 320*240 пикселей с 24-бигной глубиной.

Таблица А.5 — PSNR в различиях цветовых пространствах и цветовая разность для видеосигналов SRC19h SRC2O

Обозначение

Lab

sYCC

sRGB

L*

Y

дЕ

Обознеченне

Lab

sYCC

sRGB

L*

Y

ДЁ

hrc1/src19

23

22.6

22.6

23,2

25.6

7.8

hrc1/src20

15.8

17.4

17.2

20.1

20.2

12.7

hrc2/src19

23.6

25.1

24.9

27.9

28.6

4.8

hrc2/src20

20.6

20.8

20.7

23,7

22.1

6.9

hrc3Zsrc19

23.1

24.6

24.4

27.7

28.0

5.8

hrc3/src20

18.7

19.3

19.3

22.6

21.3

8.2

hrc4/src19

20.3

22,5

22.1

26.6

27.1

6.9

hrc4/src20

18.7

19.2

19.0

22.6

21.0

8.8

hrc5Zsrc19

19.8

20.8

20.7

22.5

23.3

7.4

hrc5/src20

18.7

16.2

16.0

18.5

16.6

8.3

hrc6/src19

20j

22.7

22.3

27.0

27,2

6.6

hrc6/src20

18Я|

19.4

19.2

23.1

21.4

8.1

hrc7/src19

21.0

21.7

21.7

22.8

23,5

5.9

hrc7/src20

19.4

17.5

17,3

19.6

18.1

12

hrc8/src19

20.7

22.6

22.3

26.6

26.9

6.8

hrc8/src20

18.6

19.2

19.0

22.8

21.2

8.4

hrc9/src19

21.2

23.1

22.7

27.2

27.2

8.2

hrc9/src20

20.0

20.3

20.1

23,5

22.0

6.4

hrc10/src19

20Д

21.3

21.1

24.4

24.7

7.8

Hrc10/src20

2O.3|

18.8

18.6

21.3

19.5

6.5

hrc11/sre19

21.4

23.6

23,3

25.6

27.7

6.3

Hrc11/src20

19jl

21.5

21.4

23.3

23.8

6.6

hrc12/src19

22.4

24.7

24.4

25.9

28.8

5,4

Hrc12/src20

21.9

21.7

23.4

24.1

6.2

hrc13/src19

20.8

21.8

21.7

24.2

24,3

6.9

Hrc13/src20

19.8

18.8

18.7

21.4

19.8

7.8

hrc14/src19

21.1

22.1

22.0

24.8

25.1

7.1

Hrc14/src20

19.6

18.4

18.2

21.1

19.3

7.6

hrc15/src19

23.3

24.6

24.4

28.8

28.5

5.9

Hrc15/src20

19.5

20.3

20.2

23,5

22.2

8.4

hrc16/src19

23.6

25.1

24.8

29.4

29.4

5.4

Hrc16/src20

19^

20.4

20.4

23.7

22.4

8.3

Примечание 1 — Видеосигналы Hrc16/src20 и т. д. соответствуют гипотетически ухудшенному видеосиг

Таблица А.6 — PSNR а различных цветовых пространствах и цветовая разность для видеосигналов SRC21 и SRC22

Обозначение

Lab

«YCC

sRGB

L*

Y

ДЕ

Обозначение

Lab

sYCC

sRGB

L*

Y

ДЕ

Hrc1/src21

23.1

25,3

25.8

22.8

25.8

5.9

hrc1/STC22

18.0

17.6

22,3

24,1

16.8

Hrc2ferc21

2эТ

29,1

29.2

28.5

29.6

3.2

hrc2/src22

18.9

21.7

21.0

26.3

26.5

9.3

Hrc3/src21

29.4

28.8

28.8

28.4

29.3

2.9

hrc3/src22

17.0

19.9

19.3

24.8

24.9

11.0

Hrc4/src21

28.4

27.7

27.9

27,3

28.2

3.5

hrc4/src22

17.4

20.1

19.4

25.4

25.6

11.2

Hrc5/src21

25.7

24,0

24.1

22.8

24.0

3.S

hrc5Zsrc22

17.4

18.9

18.0

21,5

21.9

11.2

Hrc6/src21

29.5

28.3

28.5

27.9

28.6

2.8

hrc6/src22

17,2

20.0

19,3

25.7

25.6

10.8

Hrc7/src21

26.0

24.4

24.5

23.1

24.4

3.0

hrc7/src22

«7

19.9

19.2

22.8

23.3

9.8

Hrc8/src21

29.1

28,1

28.3

27.5

28.4

3.0

hrc8/src22

17.2

19.9

19,2

25.1

25.2

11.1

Hrc9/src21

30.7

29.4

29.5

28.5

29.6

2.0

hrc9ferc22

17.9

20.5

19.8

25.4

25.5

9.7

hre10/src21

28.5

26.9

27.0

25.8

26.9

2.5

hrc10/src22

18.2

20.3

19,5

23.9

24.2

9,7

hre11/src21

28.8

30.6

30.7

26.7

31.0

2,4

hrc11/src22

18.0

20.8

20,3

24.4

25.6

10.0

hrc12/src21

28.9

30.8

30.9

26.7

31.2

2,2

hrc12/src22

18.3

21.3

20.7

24.9

26.5

9.3

hrc13/src21

27.4

25.8

25.9

25.0

25.9

3.2

hrc13/src22

wT

18.9

18.5

22.7

22.6

12.2

hrc14/src21

28.2

26.7

26.8

25.7

26.8

2.9

hrc14/src22

17.8

19.7

19.0

23.2

23.2

11.0

hro15/src21

30.5

30.4

30.5

30,3

31.1

3,2

hrc15/snc22

17.8

20.2

19.8

24.4

23.9

12.0

hre16/src21

30.6

30.5

30.6

30.4

31.2

3.2

hrc16/src22

18.1

20.6

20.3

25.4

25,1

11.3

Примечание 1 — Видеосигналы hrc16/src22 и т. д. соответствуют гипотетически ухудшенному видеосигналу (hrc16) по сравнению с исходным эталонным видеосигналом {src22) соответственно.

Примечание 2 — Все видеосигналы представлены в размере 320*240 пикселей с 24-битной глубиной.

налу (hrc16> по сравнению с исходным эталонным видеосигналом (src20) соответственно.

Примечание 2 — Вое видеосигналы представлены в размере 320*240 пикселей с 24-битной глубиной.


Приложение В (справочное)

Сквозная объективная оценка качества видеосигнала в пространственно-частотной области

В.1 Параметр, подлежащий оценке

Оценивают среднеквадрэтичвские ошибки между соответствующими блоками е вейвлет-првобразованной области, соответствующей эталонному и ухудшенному видеосигналам, приведенные в ITU-R 6Q/42-E. Предполагается трехуровневое вейвлет-преобразование, поэтому существует 10 блоков, как показано на рисунках В.1 и В.2.

1 2

5 8

3

4

6 7

9

10

Рисунок В.1 — Назначение номеров блоков Рисунок В.2 — Пример визуализированного вейвлет-разложения

В.2 Метод оценки

В качестве исходного эталонного сигнала для позиции 1 рисунка 2 используют эталонные видеосигналы, приведенные в таблице А. 1. Видеосигналы с уменьшенным размером кадра в несжатом формате AVI должны быть подготовлены для позиции 2 рисунка 2. В этой точке необходимо встроить номера кадров, чтобы их можно было использовать для идентификации принятых кадров, соответствующих переданным кадрам.

Закодированные и переданные потоковые видеосигналы должны непрерывно приниматься. Должно быть проведено лопиксельное вычисление.

Среднеквадратичные ошибки между каждым из соответствующих блоков р- 1... 10 в исходном и ухудшенном видеокадрах к должны быть получены следующим образом:

Обозначим коэффициенты в вейвлет-области для позиции (/. /) блока р эталонных красных, зеленых и синих пиксельных данных как Сд0 . С^^,, и соответственно и и СВввф — для позиции (/. J)

блока р ухудшенных красных, зеленых и синих пиксельных данных, соответственно.

Ухудшение в блоке р кадра к в вейвлет-области должно быть оценено как сумма квадратов ошибок, как приведено в формулах (В. 1) и (В.2).

dpk в + Д^бурк + )• (В.1)

i i

гав = cR — cR вijpf,

iCG#A = CG dgpk ~ CG ojpk <B'2>

ЛСвдаА = Свво.даЖ

В.З Представление результатов оценки

Должен быть построен график зависимости параметра суммы квадратов ошибок между блоками, соответствующими вейалет-лреобраэованным кадрам, от номеров кадров, как показано на рисунке В.З. совместно с идеи-

тификацией исходных эталонных видеосигналов. Также должны бьль представлены условия измерения, такие как размер кадра е пикселях, частота кадров, потоковая скорость передачи данных.

Квадрат ошибки аейвпет-коэффтмитоа


Квадрат ошибки вейвпет^оэффиииеитов


Квадрат ошибки мйвпемюэффициемтоа


Квадрат ошибки вейвпвт-коэффндиемтое


Квадрат ошибки иеиипот-моэффидивитов


Квадрат ошибки аейвлвт-коэффмииыгов


Рисунок В.З — Диаграммы разности коэффициентов вейвлет-лреобраювания между эталонным и потоковым видеокадрами при скорости 250 кбит/с и 30 кадр/с, лист 1

Ккцрат ошибш мйялет-коэффицивнгоа



Квадрат ошибки вейвлет •юэффкыемтоя

SRC20_REF_525

»

. . .....

1_а_1_1_L.

О 50 100 ISO 200 250

кадры


h) Пример для SRC2O_REF_525



Условия оценки:

• размер видеокадра: 320 пикселей х 240 пикселей:

• частота кадров: 30 кадр/с:

• потоковая скорость передачи данных: 250 кбиг/с;

• пропускная способность сети: более 250 кбиг/с;

• воспроизведение: плейер Microsoft Media Player® версия 7.1

Рисунок В.З. лист 2

Для получения результата оценки полученные квадраты ошибок также должны быть усреднены по кадрам согласно формуле (В.З). чтобы обеспечить общие параметры для объективной оценки, которые должны быть представлены. как показано в таблице В.1.

К,

i ^кр

(В.З)


В целях оценки рейтинга качества видеосигнала (VQR) в виде единого параметра для каждого из полученных видеосигналов взвешенная сумма параметров VQR. приведенная в таблице 5 и рассчитанная в соответствии с формулой (В.4). должна быть представлена в крайнем правом столбце таблицы В. 1.

»0 _

VQRsWq + ^wpCp. (В.4)

р-1

где w0 — смещение, a wp при р =1 ...10 — весовые коэффициенты для VQR, которые должны наилучшим образом коррелировать с DMOS для набора эталонных видеосигналов, ухаэаншх в ITU-R 10-110 и ITU-R WP 60 (см. ITU-R 10-11Q/54-E).

Таблица В.1 — Сводная табгмца разности коэффициентов вейвлет-коэффициентов

Исходный эталонный видеосигнал

с,

сг

с3

с5

с7

с8

с»

С,о

VQR

SRC13_REF_525

725

300

440

212

275

343

109

201

203

40

20.4

SRC14_REF_525

197

64

76

30

77

62

23

74

47

14

14.7

SRC15 REF 525

785

346

714

314

401

728

245

404

464

112

43.3

SRC16_REF_525

388

120

289

94

117

191

53

105

125

25

17,1

SRC17 REF 525

733

309

438

241

317

443

153

247

262

56

28J

SRC18 REF 525

165

67

140

61

77

134

49

78

95

23

18.7

SRC19_REF_525

441

150

266

113

152

217

74

128

140

30

19.9

SRC20 REF 525

212

101

273

136

165

500

168

237

510

116

35.1

SRC21_REF_525

187

42

136

35

49

56

20

48

45

10

14.3

SRC22 REF 525

483

147

472

150

191

522

139

207

342

68

29,7

Примечание — Значения VQR напрямую зависят от набора применяемых весовых коэффициентов. Пример в крайнем правом столбце условно основан на наборе весовых коэффициентов, подготовленном в университете Чиба в январе 2002 года.

Приложение С (справочное)

Описание метода объективного измерения PEAQ

С.1 Базовая структура алгоритма измерения PEAQ

Базовая структурная схема метода объективного измерения PEAQ приведена на рисунке С.1. Она состоит из двух входов, один из которых предназначен для (необработанного) эталонного сигнала, а другой — для испытуемого сигнала. Последний может быть, например, выходным сигналом кодека, на который подается эталонный сигнал.

Этот метод измерения применим к большинству типов оборудования для обработки аудиосигналов, как цифровых. так и аналоговых. Однахо ожидается, что многие приложения будут ориентированы на аудиокодеки.

Рисунок С.1 — Базовая структурная схема проведения объективных измерений

Высокоуровневое представление модели PEAQ показано на рисунке С.2. Метод PEAQ основан на общепринятых психоакустичесхих принципах. В целом он сравнивает сигнал, который был некоторым образом обработан, с соответствующим выровненным по времени эталонным сигналом. На первом этапе обработки сигнала моделируют периферийную акустическую модель («модель восприятия», или «модель уха»). Одновременные кадры эталонного и обработанного сигналов преобразуют в выходные сигналы акустических моделей. На следующем этапе алгоритма моделируют звуковое искажение, присутствующее в испытуемом сигнале, путем сравнения выходных сигналов акустических моделей. Информация, полученная посредством этих процессов, дает несколько значений, так называемых MOV (выходных переменных модели), и может использоваться для детального анализа сигнала.

Конечной целью является введение параметра качества, состоящего из одного числа, указывающего на слышимость искажений, присутствующих в испытуемом сигнале. Для сохранения этого параметра требуется некоторая дальнейшая обработка MOV. имитирующая когнитивную часть слуховой системы человека. Следовательно, алгоритм PEAQ использует искусственную нейронную сеть.

Существуют дев версии PEAQ: базовая версия, отличающаяся низким уровнем сложности, и расширенная версия, обеспечивающая большую точность за смет болев высокой сложности. Структура обеих версий очень похожа и точно соответствует модели PEAQ. показанной на рисунке С.2. Основное различие между базовой и расширенной версиями состоит в соответствующих моделях уха и набора, применяемых MOV. Базовая и расширенная версии описаны в разделах С.2 и С.З.

Рисунок С.2 — Представление модели PEAQ

С 2 Базовая версия

В базовой версии реализована акустическая модель на основе FFT. как показано на рисунке С.З. Большинство характерных признаков этой модели основано на фундаментальных психоакустичесхих

принципах. На рисунке С.З показано прохождение сигнала от входного сигнала до конечного расчета диаграммы возбуждения. Обработка начинается с преобразования входного сигнала в частотный домен (интервал).

Применяется 2048-точечное FFT с последующим масштабированием спектров в соответствии с уровнем прослушивания. значение которого должно быть введено пользователем в качестве параметра. Этот процесс дает частотное разрешение, составляющее приблизительно 23.4 Гц. и соответствующее временное разрешение 23.4 мс {при частоте дискретизации 48 кГц).

В конструктивном блоке эффекты акустической модели наружного и среднего уха моделируют путем взвешивания спектра с подходящими фильтрующими функциями. Затем спектры группируют в критические полосы, сохраняя разрешение 1/4 барка1* на полосу. Последующее добавление «внутреннего шума» предназначено для моделирования эффектов, таких как постоянная маскировка эвухов в нашей слуховой системе, вызываемых циркуляцией крови и другими физиологическими явлениями. За этим этапом следует вычисление маскирующих эффектов. Одновременную маскировку моделируют функцией распределения, зависимой от частоты и уровня. Временная маскировка моделируется лишь частично, поскольку временное разрешение представляет собой тот же диапазон, что и синхронизация любых фоновых маскирующих эффектов, которые в результате этого не могут быть смоделированы. Эксперименты показали, что обратная маскировка очень грубо моделируется побочными эффектами FFT.

Используя устройство выделения характерных признаков, из компенсации выходного сигнала акустической модели извлекают одиннадцать MOV. В таблице С. 1 приведены перечень этих MOV и их интерпретация. Дополнительная информация о MOV приведена в приложении ITU-R рекомендации BS 1387-1.

Рисунок С.З — Акустичесхая модель на основе FFT. базовая версия РЕАО

Таблица С.1 — Переменные выходные данные модели, базовая версия PEAQ

Переменные выходные денные модели {MOV)

Назначение

WinModDtfflg

Изменения в модуляции {связанные с резкостью)

AvgMod Drill g

AvgModOrff2B

RmsNoiseLoudg

Громкость искажения

BandwdthRefg

Линейные искажения (частотная характеристика и т. д.)

BandwdthTestg

RelDistFramesg

Частота слышимых искажений

Total NMRjj

Отношение шума к маске

MFPDb

Вероятность обнаружения

AOBb

EHSb

Гармоническая структура ошибки

1> Барк (z) — психофизическая единица высоты звука.

С.З Расширенная версия

В расширенной версии используют некоторые MOV. полученные путем реализации акустической модели базовой версии, однако в дополнение к этому она реализует вторую акустическую модель с улучшенным временным разрешением, как показано на рисунке С.4.

По сравнению с базовой версией эта модель выполняет частотно-временное преобразование с использованием набора фильтров, группируя сигнал в 40 полос слышимых частот с временным разрешением около 0.66 мс. Этот процесс позволяет с высокой степенью точности моделировать эффекты обратной маскировки. После расчета обратной и одновременной маскировки сигнал является субдисхретизированным {повторно отобранным) с коэффициентом 1:6 для повышения эффективности расчета. После добавления к субдискрвтизировакному сигналу внутреннего шума и конечного моделирования эффектов остаточной маскировхи выход этой модели становится повторно возбужденным.

По сравнению с базовой версией на основе FFT улучшается временное разрешение, что позволяет лучше моделировать временные эффекты за счет частотного разрешения и сложности вычислений.

Благодаря сочетанию параметров, полученных из обеих акустических моделей, количество MOV, используемых расширенной версией для получения окончательного параметра качества, может быть уменьшено до пяти. При этом немного улучшается точность алгоритма по сравнению с базовой версией. MOV. используемые расширенной версией, приведены в таблице С.2. Дополнительная информация о расширенной версии приведена в приложении к ITU-R BS.1387-1.

Рисунок С.4 — Акустическая модель на основе набора фильтров, расширенная версия РЕАО

Таблица С.2 — Переменные выходные данные модели, расширенная версия РЕАО

Выходные переменные данные модепи (MOV}

Назначение

RmsNoiseLoudAsymA

Громкость искажения

RmsModDtffA

Изменения е модуляции (связанные с резкостью)

AvgLinDistA

Линейные искажения (частотная характеристика и т. д.)

Segmental NMRq

Отношение шума к маске

EHSb

Гармоническая структура ошибки

С.4 Выходной параметр метода измерения PEAQ

Выходным параметром метода PEAQ является уровень объективной разности (ООО), соответствующий уровню субъективной разности (SDG) в субъективной области. Точность ООО ограничена одним десятичным знаком. Однако следует соблюдать предусмотрительность и е целом не ожидать, что разница между любой парой ООО а одну десятую значения уровня будет являться значительной. Это замечание справедливо и при рассмотрении результатов субъективного испытания на прослушивание. ООО также может принимать положительные значения.

Такие значения могут возникать, потому что PEAQ использует когнитивную модель для сопоставления MOV с результатами субъективного испытания на прослушивание. В случае субъективных испытаний на прослушивание SOG может принимать положительное значение в тех случаях, когда испытуемый неправильно установил эталонный и испытательный сигналы.

Показатель искажения (DI) имеет то же значение, что и OOG. Однако DI и OOG можно сравнивать только количественно. но не качественно. DI характеризуется меньшим насыщением, чем насыщение значения ODG. Кроме того, отличается диапазон значений. Как правило. ODG следует использовать в качестве показателя качества для значений ODG, превышающих приблизительно минус З.б. OOG очень хорошо коррелирует с субъективной оценкой в этом диапазоне. Если значение OOG составляет меньше минус З.б. следует использовать 01.

C.S Эффективность метода измерения PEAQ

Эффективность модели PEAQ может зависеть от значений целого ряда различных показателей. Корреляция между ODG и SOG является очевидным показателем оценки эффективности. Кроме того, для проверки эффективности были использованы два дополнительных показателя, учитывающие надежность среднего значения — оценка абсолютных ошибок (AES) и схема устойчивости сигнала.

Проведенные ITU-R контрольные испытания показали, что PEAQ с высокой точностью предсказывает воспринимаемое качество и превосходит ранее существующие методы измерений. Дополнительная информация приведена в приложении к ITU-R BS.1387-1 и (AES-PEAQJ4

11 т. Theide и др. «ОВКА — Стандарт МСЭ для объективного измерения воспринимаемого качества аудиосигнала». J. Audio Eng. Soc., том 48. с. 3—29 (январь/февраль 2000 г.}

Приложение ДА (справочное)

Сведения о соответствии ссылочных международных стандартов национальным стандартам

Таблица ДА.1

Обозначение ссылочною международного стандарта

Степень

соответствия

Обозначение и маиыеиоеэние соответствующего национального стандарта

IEC 60268-4

е

IEC 60268-5

е

IEC 61146-1:1994

е

IEC 61146-2:1997

е

1ЕС61966-2-1:1999

1ЕС 61966-3:2000

е

1ЕС61966-4:2000

е

IEC 61966-5:2000

е

IEC 61966-9:2000

е

ITU-R BS.1387-1:2001

1TU-R ВТ.601-5:1995

е

ГГи-Т J.144:2001

е

ГГи-Т Р.931:1998

е

* Соответствующий национальный стандарт отсутствует. До его принятия рекомендуется использовать перевод на руосхий язык данного международного стандарта. Официальный перевод данного международного стандарта находится в Федеральном информационном фонде стандартов.

Библиография

ITU-R 10-11Q/56-E:2001

ITU-R 6Q/39-E:2001

ITU-R 6Q/42-E:2001


ITU-T Р.930:1996

ITU-T 6.113:2001


ITU-T Р.862.2001


Canada (on behalf of the Entire VQEG body) — Draft Video Quality Experts Group's Results [Канада (от имени всех членов VQEG)— Предварительные результаты группы экспертов по качеству видеосигнала]

Liaison Rapporteur with U.S. Committee T1A1. Documentation of objective video quality metrics (Докладчик no связям с Комитетом США T1A1. Документация no объективным параметрам качества сигнала для видеоматериалов)

Republic of Korea — Proposed Preliminary Draft New Recommendation — A new method for objective measurement of video quality using wavelet transform (Республика Корея — Предлагаемый предварительный проект новой рекомендации. Новый метод объективного измерения качества видеосигнала с использованием вейвлет-преобразования)

Principles of a reference impairment system for video (Принципы системы ухудшения качества передачи эталонного видеосигнала)

Transmission impairments due to speech processing. Appendix I: Provisional planning values for the equipment impairment factor le and packet-loss robustness factor Bpl (Ухудшения качества передачи из-за обработки речи. Приложение I. Предварительные запланированные значения для коэффициента ухудшения качества оборудования le и коэффициента устойчивости к потере пакетов Bpl)

Objective quality measurement of telephone-band (300—3400 Hz) speech codecs (Объективное измерение качества речевых кодеков диапазона телефонной связи (300—3400 Гц)

Т. Theide ef.al. PEAQ — The ITU standard for Objective Measurement of Perceived Audio Quality. J. Audio Eng. Soc., vol.48. pp 3—29 (2000 JanJFeb.) (PEAQ — Стандарт МСЭ для объективного измеретя воспринимаемого качества аудиосигнала)

Measuring quality in videoconferencing systems. Part number PC316, Intel Corporation (November 1997) (Измерение качества в системах видеоконференцсвязи, каталожный номер РС316. Intel Corporation)

Criteria for product evaluation. NASA Desktop video expert center. National Aeronautics and Space Administration. Ames Research Center. Moffett Fteld. California (August 1997) (Критерии оценки продукта, экспертный центр по настольным видеосистемам NASA)

Quality aspects of computer-based video services. Norbert Gerfelder (Fraunhofer Institute for Computer Graphics. Darmstadt. Germany and Wolfgang Muller (Darmstadt Technical University). (Oct. 1995) (Качественные аспекты компьютерных видеоуслуг)

Comparative study on narrow-bandwidth presentation of streaming educational videos. H. ikeda. S. Dickerson. Y. Higaki. Journal of Faculty of Engineering. Chiba University. Voi. 49.No. 1. pp.19—26 (1997-9) (Сравнительное исследование узкополосного представления потоковых образовательных видеоматериалов)

УДК 621.377:006.354 ОКС 33.160.60 ОКПД2 26.30

Ключевые слова: аудиосигнал, видеосигнал, эталонный видеосигнал, модель, метод оценки, оценка качества, сквозное воспроизведение цвета, сквозное воспроизведение тона. РЕАО. DMOS. PSNR. VQR

БЗ 5—2018/47

Редактор Л.В. Коретникоеа Технический редактор В.Н. Прусакова Корректор П.С. Лысенко Компьютерная верстка Е.О. Асташина

Сдано е набор 18.10.2018. Подписана а печать 14.11.2018. Формат 80«84’/^. Гарнитура Ариал.

Усл. печ. л. 4,85. Уч.-иад. л.4.21.

Подготовлено па основе электронной аерсии. предоставленной разработчиком стандарта

\AV



1

Заменен на IEC 61966-5:2008. Однако для однозначного соблюдения требований настоящего стандарта, вьфажекного в датированной ссылке, рекомендуется использовать только указанное в этой ссылке издание.

Заменен на 1ЕС 61966-9:2003. Однако для однозначного соблюдения требований настоящего стандарта, въфажвтого в датированной ссылке, рекомендуется использовать только указанное в этой ссылке издание.