База ГОСТовallgosts.ru » 01. ОБЩИЕ ПОЛОЖЕНИЯ. ТЕРМИНОЛОГИЯ. СТАНДАРТИЗАЦИЯ. ДОКУМЕНТАЦИЯ » 01.020. Терминология (принципы и координация)

ГОСТ Р ИСО 30042-2016 Системы управления терминологией, базами знаний и контентом. Обмен терминологическими базами [TermBase eXchange (TBX)]

Обозначение: ГОСТ Р ИСО 30042-2016
Наименование: Системы управления терминологией, базами знаний и контентом. Обмен терминологическими базами [TermBase eXchange (TBX)]
Статус: Действует

Дата введения: 09/01/2017
Дата отмены: -
Заменен на: -
Код ОКС: 01.020, 35.240.60
Скачать PDF: ГОСТ Р ИСО 30042-2016 Системы управления терминологией, базами знаний и контентом. Обмен терминологическими базами [TermBase eXchange (TBX)].pdf
Скачать Word:ГОСТ Р ИСО 30042-2016 Системы управления терминологией, базами знаний и контентом. Обмен терминологическими базами [TermBase eXchange (TBX)].doc


Текст ГОСТ Р ИСО 30042-2016 Системы управления терминологией, базами знаний и контентом. Обмен терминологическими базами [TermBase eXchange (TBX)]



ФЕДЕРАЛЬНОЕ АГЕНТСТВО ПО ТЕХНИЧЕСКОМУ РЕГУЛИРОВАНИЮ И МЕТРОЛОГИИ

НАЦИОНАЛЬНЫЙ

СТАНДАРТ

РОССИЙСКОЙ

ФЕДЕРАЦИИ

ГОСТР ИСО 30042— 2016

СИСТЕМЫ УПРАВЛЕНИЯ ТЕРМИНОЛОГИЕЙ, БАЗАМИ ЗНАНИЙ И КОНТЕНТОМ

Обмен терминологическими базами [TermBase exchange (ТВХ)]

(ISO 30042:2008, IDT)

Издание официальное

Москва

Стамдэртинформ

2017

ГОСТ Р ИСО 30042—2016

Предисловие

1    ПОДГОТОВЛЕН Автономной некоммерческой организацией «Институт безопасности труда» (АНО «ИБТ») на основе собственного перевода на русский язык англоязычной версии международного стандарта, указанного в пункте 4

2    ВНЕСЕН Техническим комитетом по стандартизации ТК 55 «Терминология, элементы данных и документация в бизнес-процессах и электронной торговле»

3    УТВЕРЖДЕН И ВВЕДЕН В ДЕЙСТВИЕ Приказом Федерального агентства по техническому регулированию и метрологии от 30 ноября 2016 г. № 1906-ст

4    Настоящий стандарт идентичен международному стандарту ИСО 30042:2008 «Системы для управления терминологией, знаниями и содержанием. Обмен терминологическими базами [TermBase exchange (ТВХ)]» (ISO 30042:2008. «Systems to manage terminology, knowledge and content — TermBase exchange (TBX)», IDT}.

При применении настоящего стандарта рекомендуется использовать вместо ссылочных международных стандартов соответствующие им национальные стандарты Российской Федерации, сведения о которых приведены в дополнительном приложении ДА

5    ВВЕДЕН ВПЕРВЫЕ

Правила применения настоящего стандарта установлены в статье 26 Федерального закона от 29 июня 2015 г. N9 162-ФЗ «О стандартизации в Российской Федерации». Информация об изменениях к настоящему стандарту публикуепкя е ежегодном (по состоянию на 1 января текущего года) информационном указателе «Национальные стандарты», а официальный текст изменений и поправок— в ежемесячном информационном указателе «Национальные стандарты». В случав пересмотра (замены) или отмены настоящего стандарта соответствующее уведомление будет опубликовано в ежемесячном информационном указателе «Национальные стандарты». Соответствующая информация, уведомление и тексты размещаются также в информационной системе общего пользования — на официальном сайте Федерального агентства по техническому регулированию и метрологии в сети Интернет ()

© Стандартинформ, 2017

Настоящий стандарт не может быть полностью или частично воспроизведен, тиражирован и распространен в качестве официального издания без разрешения Федерального агентства по техническому регулированию и метрологии

II

ГОСТ Р ИСО 30042—2016

Содержание

1    Область применения..................................................................1

2    Нормативные ссылки.................................................................1

3    Термины и определения..............................................................1

4    Отношение к другим стандартам........................................................4

5    Применение ТВХ.....................................................................4

6    Основные принципы..................................................................4

6.1    Общая информация...............................................................4

6.2    Принципы, касающиеся группировки и представления категорий данных...................5

7    Требования для файлов Т8Х...........................................................5

7.1    Требования соблюдения...........................................................5

7.2    Примеры несоблюдения...........................................................6

7.3    Уровни внедрения.................................................................7

8    Модуль основной структуры............................................................7

8.1    Введение........................................................................7

8.2    Иерархия........................................................................8

8.3    Компоненты терминологического входа...............................................8

8.4    Элементы, которые могут появиться на многократных уровнях входа......................9

8.5    Элементы, которые встречаются только в уровне термина или ниже.......................9

8.6    Обработка текста................................................................10

8.7    Элементы метаданных............................................................12

8.8    Признаки.......................................................................13

8.9    Проблемы кодировки.............................................................14

8.10    Язык..........................................................................14

9    Ограничения категории данных по умолчанию............................................14

9.1    Введение.......................................................................14

9.2    Категории данных встроены в основную DTD структуры Т8Х............................15

9.3    Категории данных специализированные от категорий метаданных до файла XCS...........15

10    Примеры..........................................................................20

10.1    Пример типичного файла ТВХ.....................................................20

10.2    Примеры кодирования элементов ТВХ..............................................22

10.3    Примеры записей ТВХ...........................................................22

11    Ссылка на объекты.................................................................25

11.1    Общая информация о ссылке.....................................................25

11.2    Ссылка на файл, который включен в аппарат файла ТВХ..............................25

11.3    Ссылка на файл от аппарата......................................................26

11.4    Ссылка на файл непосредственно во входе.........................................26

11.5    Ссылка на внешний источник.....................................................26

11.6    Ссылка и документирование библиографического источника...........................27

11.7    Ссылка и документирование информации об ответственном человеке или организации.....28

11.8    Ссылка на внешнюю систему понятия, систему классификации или тезаурус..............29

11.9    Ссылка на вход ТВХ из корпуса....................................................29

12    Создание настроек ТВХ TMLs........................................................29

12.1 Общая информация о TMLs......................................................29

III

ГОСТ Р ИСО 30042—2016

12.2    Пример файла XCS для определенного пользователями ТВХ TML......................30

12.3    Создание пользовательских имен списка выбора дисплея.............................31

Приложение А (обязательное) DTD для основного модуля структуры..........................33

Приложение В (обязательное) DTD для ограничений категории данных (файл XCS)..............38

Приложение С (обязательное) Файл XCS по умолчанию.....................................40

Приложение D (обязательное) Описания основных элементов структуры и признаков

и категорий данных по умолчанию..........................................48

Приложение Е (обязательное) Описания элементов и признаков для файла XCS................89

Приложение F (справочное) Интегрированная схема и другие ресурсы ТВХ.....................74

Приложение G (справочное) ТВХ-основной................................................75

Приложение Н (справочное) Сумма изменений.............................................78

Приложение I (справочное) Индексы.....................................................80

Приложение ДА (справочное) Сведения о соответствии ссылочных международных стандартов

ссылочным национальным стандартам Российской Федерации.................84

Библиография........................................................................85

IV

ГОСТ Р ИСО 30042—2016

Введение

Настоящий стандарт определяет основанную на XML структуру представления структурированных терминологических данных, называемых обменом терминологическими базами [TermBase (ТВХ)]. В пределах этой структуры может быть определено множество терминологических языков разметки (TMLs). TML. определенный ТВХ. может облегчить обмен терминологическими данными между пользователями, переводчиками и писателями, использующими инструменты распознавания текста и компьютерного перевода, а также программное обеспечение для авторинга. TML может быть ориентирован как на пользователя, так и на машины — ориентирование на терминологические данные. Таким образом, это может позволить использовать поток терминологической информации всюду по информационному производственному циклу, как внутри организации, так и с внешними поставщиками услуг.

Целевая аудитория этого документа состоит из двух групп: 1) программисты и аналитики, которые хотят развить приложения и которые обрабатывают ТВХ-лослушные файлы с данными: 2) терминологи и другие языковые специалисты, которые хотят проанализировать терминологический сбор данных для представления в ТВХ или понять файл ТВХ.

Эта версия ТВХ представляет собой обновление версии, которая была издана Ассоциацией локализации отраслевых стандартов [Localization Industry Standards Association (LISA)] в 2002 г. Среди других улучшений текущая версия обеспечивает ссылку на интегрированную схему, которая включает модуль основной структуры и ограничения категории данных в объединенных декларациях, используя языки Relax NG и Schematron. Данная версия обеспечивает также ссылку на ТВХ. совместимый с TML. под названием ТвХ-Basic.

Пользователям настоящего стандарта необходимо сначала изучить его содержание (разделы 1—12). Предложенное использование приложений А—I описано ниже.

1)    Модуль основной структуры ТВХ

Все TMLs в рамках структуры ТВХ имеют одинаковую основную структуру. Модуль основной структуры описан в разделе 8. ОТО для модуля основной структуры описаны в приложении А. Элементы. признаки и типы данных описаны в приложении D и перечислены в алфавитном порядке в приложении I.

2)    Модуль XCS

TMLs могут отличаться относительно того, какие категории данных разрешены и на каких уровнях терминологического входа эти категории данных могут произойти. Эти ограничения на основную структуру, которые определяют особый TML, формально представлены в файле XCS. DTD для модуля XCS описана в приложении В. Элементы и признаки описаны в приложении Е и перечислены в алфавитном порядке в приложении I.

3)    Принимаемый по умолчанию XCS ТВХ

ТВХ. принимаемый по умолчанию TML. ограничен принимаемым по умолчанию файлом XCS. Принимаемый по умолчанию ТВХ XCS описан в разделе 9. Принимаемый по умолчанию XCS представлен в приложении С. Категории данных описаны в приложении О и перечислены в алфавитном порядке в приложении I.

4)    Проверка соблюдения случаев документа ТВХ

После ТВХ TML определена с помощью XCS. экземпляр ТВХ-документа может быть проверен на соответствие этому TML. Требования для соблюдения находятся в разделе 7. Можно использовать множество методов и схемы определения языков, чтобы проверить соответствие. В частности. Relax NG. упомянутый в приложении F. может использоваться, чтобы проверить, совместим ли случай документа ТВХ с ТВХ. принимаемым по умолчанию TML. В приложении F также указано, где пользователь ТВХ может найти дополнительные ресурсы для проверки соблюдения. Другой ТВХ TML. названный ТВХ-основным, упомянут в приложении G.

5)    Изменения, которые были внесены в ТВХ. начиная с его представления ISO в феврале 2007 г. приведены в приложении Н.

Резюме приложений:

А. ОТО для модуля основной структуры

V

ГОСТ Р ИСО 30042—2016

В: DTO для модуля XCS

С: XCS по умолчанию, который определяет ТВХ по умолчанию TML D: Описания основных элементов структуры и ее признаков Е: Описания элементов XCS и ее признаков F: Relax NG и другие ресурсы для соблюдения соответствия G: Ссылка на TBX-Basic Н: Резюме изменений ТВХ

I: Индексы (алфавитные списки элементов и категорий данных)

VI

ГОСТ Р ИСО 30042—2016

НАЦИОНАЛЬНЫЙ СТАНДАРТ РОССИЙСКОЙ ФЕДЕРАЦИИ

СИСТЕМЫ УПРАВЛЕНИЯ ТЕРМИНОЛОГИЕЙ.

ВАЗАМИ ЗНАНИЙ И КОНТЕНТОМ

Обмен терминологическими базами [Term8ase exchange (ТВХ)]

Systems to manage terminology, knowledge and content. TermBase exchange (TBX)

Дата введения — 2017—09—01

1    Область применения

Настоящий стандарт определяет структуру ТВХ. разработанную для поддержки различных типов обработки терминологических данных, включая анализ, описательное представление, распространение и обмен в различных информационных средах. Основная цель ТВХ —• обмен терминологическими данными. Области применения по назначению включают перевод и создание.

ТВХ является модульный системой поддержки переменных типов терминологических данных или категорий данных, которые включены в различные терминологические базы данных (терминологические базы). ТВХ включает в себя два XML-модуля: основная структура и форма для идентификации ряда категорий данных и их ограничений. Термин в ТВХ относится к структуре, состоящей из этих двух взаимодействующих модулей.

ТВХ позволяет максимизировать совместимость фактических терминологических данных, а также обеспечить набор категорий данных, которые используются в терминологических базах данных. Подмножества или суперкаборы категорий данных по умолчанию могут использоваться в пределах структуры ТВХ. чтобы поддержать определенные пользовательские требования.

2    Нормативные ссылки

В настоящем стандарте использованы нормативные ссылки на следующие международные стандарты. Для датированных ссылок применяют только указанные издания. Для недатированных ссылок применяют самые последние издания (включая любые изменения и поправки).

ISO 8601:2004. Data elements and interchange formats — Information interchange — Representation of dates and times (Элементы данных и форматы для обмена информацией. Обмен информацией. Представление дат и времени)

IS012620. Language resource management —• Morpho-syntactic annotation framework (MAF) (Терминология, другие языковые ресурсы и ресурсы содержания. Спецификация категорий данных и ведение реестра категорий данных для языковых ресурсов)

3    Термины и определения

В настоящем стандарте применены следующие термины с соответствующими определениями:

3.1 анализ (analysis): Идентификация элементов и структура терминологического сбора данных.

Издание официальное

1

ГОСТ Р ИСО 30042—2016

3.2    затемнение (blindness): Собственность формата данных, указывающего на степень, до ко* торой данные достаточно определены, что делает ненужным для импортера устанавливать контакт с создателем данных для того, чтобы интерпретировать их.

Примечание — Термин «затемнение» возникает е технической фразе «передача без подтверждения приема», которая относится к передаче данных, где нет необходимости «видеть», кто отправитель данных, чтобы интерпретировать его. В терминологии понятие затемнения часто используется е контексте слепого обмена (3.3).

3.3    слепой обмен (blind interchange): Способность получить файл терминологии и объединить его в целевую систему, такую как машинный инструмент перевода (Computer-Assisted Translation (CAT)], не имея необходимости связываться с создателем файла, чтобы понять его содержание.

Примечание — Обмен, который является совершенно слепым, не требует никакой связи между отправителем и управляющим дан ими. Из-за различий между терминологическими сборами данных и форматами поеьяиения совершенно слепой обмен редок. Как правило, некоторые данные в сборе данных слепые (может быть обмен без потери и без связи между сторонами), а некоторые данные требуют связи между сторонами, чтобы быть обмененными.

3.4    дополнительная информация: Cl (complementary information): Информация, дополнительная к изложенной в терминологических записях и разделенная через терминологический сбор данных.

(ИСО 16642:2003]

Примечание — В случае документа ТВХ дополнительная информация содержится е аппарате.

3.5    модуль основной структуры (core-structure module): Спецификация XML элементов и признаков. которые разрешены в файле ТВХ.

Примечание — Модуль основной структуры определен в DTD. которая используется в тандеме с файлом XCS. который применяет дополнительные ограничения категории данных. Это может также использоваться, чтобы произвести интегрированную схему, такую как «понижение схемы» NG (ИСО 19757-2]. которая определяет и модуль основной структуры, и ограничения категории данных в одном файле. См. также ограничение категории данных (3.7).

3.6    категория данных (data-category): Результат спецификации данного поля данных.

(ИСО 1087-2:2000]

Пример — /часть речи/, /грамматическое чист/.

Примечание 1 — Набор по умолчанию категорий данных для ТВХ был прежде всего отобран из ИСО 12620:1999.

Примечание 2 — В бегущем тексте названия категории данных установлены от использования передовых разрезов и курсива. В случае документа ТВХ случай верблюда (например. <termNote type="partOfSpeech*>noun</ termNote>) должен использоваться вместо того, чтобы использовать белое пространство между словами.

3.7    ограничение категории данных (data-category constraint): Спецификация ценности признака, содержания элемента одного или более структурных уровней, который ограничивает применение категории метаданных (3.16).

Примечание — Ограничения категории данных определены в файле XCS и используются в тандеме с ОТО. который определяет модуль основной структуры. Они могут также быть включены в интегрированную схему, такую как «понижение схемы» NG. которая включает и модуль основной структуры, и ограничения категории данных в один файл. См. также модуль основной структуры (3.5).

3.8    файл данных (data file): Последовательность байтов, которая или сохранена на диске в традиционной файловой системе, или передана как лоток данных по сети.

3.9    расширяемая ограничительная спецификация XCS (extensible Constraint Specification): Файл XML. который определяет категории данных и их ограничения для определенного ТВХ TML (3.21).

3.10    расширение (extension): Все количество объектов, которым соответствует понятие.

(ИСО 1087-1:2000]

3.11    глобальная информация. Gl (global information): Техническая информация и административная информация, относящаяся ко всему сбору данных.

(ИСО 16642:2003]

Примечание — В случае документа ТВХ глобальная информация содержится во вступительной части.

3.12    усилие (intension): Набор особенностей, который составляет понятие.

(ИСО 1087-1:2000]

2

ГОСТ Р ИСО 30042—2016

3.13    обмен (interchange): Операционные данные об экспорте вовлечения от одного терминологического сбора данных и импортирования его в другой терминологический сбор данных.

3.14    аннотация (lemma): Лексическая единица, выбранная согласно лексикографическим соглашениям представлять различные формы флективной парадигмы.

(ИСО 1951:2007)

3.15    лемматизировать (lemmatize): Преобразовать флективную форму слова к его аннотации (3.13).

3.16    преобразование без потерь (lossless roundtrip): Серия процедур манипулирования данными. посредством чего данные произведены от базы данных в формат обмена и затем повторно импортированы в ту же самую базу данных без потери информации.

3.17    категория метаданных (meta data-category): Группировка подобных категорий данных вместе.

Примечание — Категория метаданных эквивалентна напечатанному элементу по ИСО 16642. Категория метаданных иллюстрируется примерами е терминологическую категорию данных через ценность ее признака типа.

Пример — В признаке <descrip type="definition~> категория метаданных descrip и терминологическая категория данных /definition/.

3.18    регистр метаданных (metadata registry): Информационная система для регистрации метаданных.

Примечание — Связанный информационный запас или база данных.

3.19    язык объекта (object language): Язык, описываемый в <tangSet>.

Пример — В элементе <langSet xml:lang-'fr-FR'> язык объекта французский.

Примечание — См. также рабочий язык (3.28).

3.20    структурный уровень (structural level): Уровень метамодели, к которой могут быть приложены информационные единицы.

(ИСО 16642:2003)

3.21    TML (ТВХ): TML (3.27). который придерживается ТВХ (3.26).

Примечание — Лица, осуществляющие внедрение ТВХ TML. могут использовать или не использовать файл XCS (вместе с DTD. представляющей основную структуру) в целях проверки. Некоторые могут использовать интегрированную схему вместо этого.

3.22    ТВХ по умолчанию TML (ТВХ-default TML): ТВХ (3.26) и его выбор ло умолчанию категорий данных (3.6) и их ограничения в XCS (3.9) файл.

3.23    случай документа ТВХ (ТВХ document instance): Файл, содержащий терминологические записи в Т8Х TML (3.21) формате.

3.24    терминологическая база данных (terminological database): База данных, включающая информацию о специальных языковых понятиях и условиях, определяемых, чтобы представлять эти понятия наряду со связанной концептуальной и административной информацией.

3.25    компонент термина (term component): Одно из слов, включающих термин мультислова или компонент, таких как морфема, термина изолированного слова.

3.26    обмен базами данных ТВХ (TermBase exchange): Структура, состоящая из основной структуры и формализма (расширяемая ограничительная спецификация (3.9)]. для идентификации ряда категорий данных (3.6) и их ограничения, выраженные в XML.

3.27    терминологический язык разметки: TML (terminological markup language): Заявление XML на описание терминологического сбора данных, соответствующего ограничениям, выражено в ИС016642 (Терминологическая структура повышения).

Примечание 1—Адаптированное из ИСО 16642:2003.

Примечание 2 — ТВХ XCS включает TML под названием ТВХ TML (3.22). TBX-Basic является также TML.

3.26 рабочий язык (working language): язык, по умолчанию использующийся в терминологических записях.

Примечание — См. также язык объекта (3.19).

3

ГОСТ Р ИСО 30042—2016

4    Отношение к другим стандартам

Основы для ТВХ были установлены следующими тремя международными стандартами:

-    ИСО 16642:2003 (TMF) определяет структурную метамодель для ТВХ и другого TML:

•    ИСО 12620 обеспечивает инвентарь категорий данных для терминологических данных:

•    ИСО 12200:1999 (MARTIF) обеспечивает основу для основной структуры ТВХ и XML. стилей его элементов и признаков.

Особый TML требует выбора стиля XML и выбора категорий данных. Большинство категорий данных из ТВХ-неплатежа TML были выбраны из ИСО 12620:1999. и стиль XML ТВХ был принят от ИСО 12200. Таким образом. ТВХ основывается на стандартах ИСО 16642. ИСО 12620 и ИСО 12200.

5    Применение ТВХ

ТВХ разработан, чтобы облегчить следующие случаи использования:

Поддержка обмена:

•    поток терминологических данных между технологиями и системами;

-    интеграция терминологических данных из многократных источников:

-    преобразование данных, требуемое изменением в заявлениях или технологиях. Распространение, включая:

-    сверку многократных терминологических баз данных через единственный пользовательский интерфейс и через общий промежуточный формат на партии или динамическом основании.

•    общий промежуточный формат на партии или динамическом основании;

•    размещение данных на интернет-сайте для загрузки заинтересованными сторонами;

•    создание записей, которые требуют общедоступной обработки путем обратной связи;

-    предоставление доступа к терминологии в электронном виде через веб-сервис.

Анализ и представление, включая:

-    сравнение содержания различных терминологических баз данных;

-    анализ возможных потерь данных при их преобразовании из одной терминологической базы в другую;

-    проектирование новой терминологической базы данных с минимальными потерями данных во время преобразования.

6 Основные принципы

6.1 Общая информация

Структура ТВХ основана на предположении, что в связи с разнообразием терминологических сборов данных и сценариев использования никакой терминологический язык повышения не удовлетворил бы все пользовательские требования.

Чтобы максимизировать совместимость, рекомендуется, чтобы лица, осуществляющие внедрение ТВХ. придерживались стандартов ISO. управляющих принципами и методологиями управления терминологией и содержанием и качеством терминологических ресурсов, таких как указанные в разделе 2 и библиографии. Рекомендуется выбирать и использовать для терминологических баз данных категории, которые определены в настоящем стандарте. Расширения вне тех категорий данных и ограничения должны быть взяты от ИСО 12620. если это возможно. Основные принципы терминологических данных, такие как степень детализации данных, данные elementarily, воспроизводимость данных и автономия термина, описаны в других стандартах ISO ТС 37.

Информация, представленная в случае документа ТВХ. должна быть ориентирована на понятие. Условия в единственном входе, как предполагается, синонимичны, если не указано иное.

ТВХ позволяет представлять различные виды информации об отдельных условиях, которые отличают их от других условий в одном понятии. Это встречается в ситуациях, когда термин на одном языке может быть таким же термином на другом языке, а обратное невозможно из-за частичной эквивалентности. Следует отметить, что один термин может быть почти идентичным понятию в отдельных связанных записях. ТВХ может отразить оба подхода.

4

ГОСТ Р ИСО 30042—2016

6.2 Принципы, касающиеся группировки и представления категорий данных

В ТВХ существуют четыре общих типа категорий данных. Понимание, что эти общие типы означают и как они представлены, облегчит понимание остальной части настоящего стандарта.

Примечание — В этой спецификации названия атрибута определены е знаке (@) в приложении D и выделены курсивом.

категория данных модуля основной структуры

Категория данных модуля основной структуры — любая категория данных, которая определена в OTD модуля основной структуры. Например. <date>. <tenri> и <descrip>.

категория метаданных

Категория метаданных — категория данных модуля основной структуры, которая берет признак типа, такой как <descrio>. <admin> и <termNote>. Это — общая категория данных, которая используется для группировки целей и отражения метамодели в стандарте ИСО 16642. Каждое значение атрибута типа отражено примерами категории метаданных в определенную терминологическую категорию данных. которая определена согласно ИСО 12620. Значения атрибута типа определены в файле XCS. Например, признак <descrip type="definrtion'> включает категорию метаданных <descrio>. отраженную примерами в терминологическую категорию данных, которую называют /definition/согласно ИСО 12620.

категория данных, осуществленная как использование признака

Использование категории данных признака является терминологической категорией данных, которая определена согласно ИСО 12620, такой как /definition/, и которая определена как ценность признака имени в файле XCS. В случае документа ТВХ эти категории данных появляются как ценность признака типа на элементе категории метаданных. Ценность этих категорий данных — содержание их соответствующего элемента. Например, /definition/ категория данных, представленная через признак «descrip type=Hdefmition*>, берет свободный текст в качестве своего содержания, и /gender/ категория данных, представленная в признаке <termNote type="grammaticalGender“>. берет одно значение рода из разворачивающегося списка значений.

категория данных, осуществленная как содержание элемента

Категория данных, осуществленная как содержание элемента, является простой категорией данных, т. е. одной ценностью закрытого набора ценностей (разворачивающийся список). Эти терминологические категории данных также зарегистрированы согласно ISO 12620. Они перечислены в файле XCS как допустимое содержание категории метаданных, имеющей значение атрибута определенного типа. Например, категория метаданных <termNote>. у которой есть значение атрибута типа 'termType', может содержать ограниченный набор ценностей, который включает сокращение, акроним и т. д. В интегрированной схеме RNG. которая упомянута в приложении F. содержание элемента ограничено к разворачивающемуся списку через вложенные правила Schematron (для ссылки на Schematron см. библиографию).

Использование категорий метаданных в структуре ТВХ облегчает модульность. Основная структура (которая остается постоянной) является одним модулем и особым файлом XCS (который выражает ограничения на основную структуру). Комбинация этих двух модулей определяет особый TML. Этот подход определяет TMF (ИСО 16642) как модуль основной структуры, соответствующий абстрактной модели данных TMF. Это показывает взаимосвязь двух TML в пределах структуры ТВХ (основная структура) и их отличие (выраженное как различия между их файлами XCS). Этот модульный подход совместим с общепринятыми принципами модульности в программировании, позволяя программисту/ аналитику изучить основную структуру и структуру XCS отдельно, без изучения сложных схем.

7 Требования для файлов ТВХ

7.1 Требования соблюдения

TML. чтобы быть совместимым с ТВХ. должен соответствовать следующим критериям:

1.    TML должен определить случаи документа XML. которые действительны согласно модулю основной структуры ТВХ. Модуль основной структуры описан в 8 модуле основной структуры и определен формально Т8Х DTD (приложение А).

2.    TML должен содержать свои категории данных и их ограничения в файле XCS (приложение В) для ограничений категории данных в файле XCS. TML. содержащий категорию данных, указанную е XCS. должен использовать эту категорию данных согласно своему описанию, приведенному в приложении С.

5

ГОСТ Р ИСО 30042—2016

3. TML может включать меньше или больше категорий данных, чем указанные в XCS (приложение С), и все еще быть совместим с ТВХ при условии, что те категории данных выражены в файле XCS. Если TML будет включать категории данных, которые не находятся в XCS. то дополнительные категории данных должны быть описаны в заголовке файла XCS.

Примечание — Несколько общих ограничений, таких как формат даты, формально не определены в DTD или в XCS. но описаны в соответствующих частях настоящего стандарта, таких как приложение D. Эти ограничения должны также применяться для соблюдения ТВХ.

Расширение для случая документа ТВХ — .tbx, расширение случая документа XCS — .xcs.

Хотя случай документа XCS должен существовать, чтобы формально определить ТВХ TML. он не должен использоваться для проверки соблюдения условий. Инструменты проверки XML общего назначения не признают ограничения в файле XCS. если эти ограничения не были включены в интегрированную схему, такую как упомянутая в приложении F.

Проверка соблюдения ТВХ — нейтральный язык определения схемы. В настоящем стандарте описаны три типа проверки соблюдения:

DTD и XCS

DTD. представляющая основную структуру ТВХ. приведена в приложении А. Файл XCS. представляющий по умолчанию набор категорий данных и их ограничений, приведен в приложении С. С ОТО и файлом XCS случай документа ТВХ может быть подтвержден при помощи контролера соблюдения, который специально предназначен для файлов ТВХ.

Понижение NG

Понижение файла схемы NG. представляющего основную структуру и набор категорий данных и их ограничений, упомянуто е приложении F. Этот файл включает Schematron для некоторых ограничений категории данных. При помощи этого файла можно утвердить случай документа ТВХ для соответствия ТВХ TML при помощи любого контрольного устройства XML. которое поддерживается NG и Schematron. Соответствующим программным обеспечением поддреживается интегрированная схема NG. которая могла быть произведена для другого ТВХ TML. основанного на его XCS.

Другие методы

Проверка соблюдения ТВХ также возможна с использованием других методов, которые включают информацию от модуля основной структуры и ограничений категории данных. Дополнительные методы могут быть зарегистрированы в сети LISA.

7.2 Примеры несоблюдения

Соблюдение ТВХ включает следующие аспекты:

1.    правильность XML;

2.    правильность относительно модуля основной структуры:

3.    приверженность ограничениям категории данных в файле XCS.

Следующий пример неправильно построен, так как у первого <descrip> элемента есть ошибка правописания в конечном тэге и <term> у элемента нет заключительного признака.

<term>kitten <descrip type-'deftnition^Small feline</deescrip>

Следующий пример правильно построен, но недействительна основная структура, так как модуль основной структуры ТВХ не позволяет <descrip> признаку следовать <tig>.

ClangSet xml: lang^fr-ca”»

<tig><term>zone de soufflage</term>

</tig>

<descrip type-'*definition">Area where snow is thrown by a snowplow.</descrip> </langSet>

Следующий пример действителен согласно ОТО основной структуры ТВХ. но не придерживается XCS. так как нет никакой категории данных ТВХ. названной «conflagration» в файле XCS.

<term>kitten</terro> <descrip type-'conflagration’>Small £eline</descrip>

6

ГОСТ Р ИСО 30042—2016

7.3 Уровни внедрения

Существуют три уровня внедрения ТВХ для данного приложения относительно особой терминологической базы данных.

Уровень 1

Приложение должно экспортировать и импортировать файлы ТВХ. которые правильно построены и которые придерживаются по крайней мере одного файла XCS. а приложение должно обнаружить, когда случаи документа не будут правильно построены, либо недействительна основная структура, либо отсутствует соответствие XCS. Уровень 1 поддерживает обмен между системами, которые используют тот же самый XCS.

Уровень 2

Приложение должно достигнуть уровня внедрения и импортировать каждую категорию данных, которая находится в XCS. Уровень 2 поддерживает импорт файлов ТВХ из любого внешнего источника, а экспорт может быть ограничен категориями данных, которые придерживаются файла XCS.

Уровень 3

Приложение, достигшее уровня 2 и имеющее возможность проверки XCS. который поддерживает перенос данных без потерь от терминологической базы данных в применении к ТВХ TML и обратно. Таким образом, как только информация в терминологической базе данных была экспортирована в Т8Х. терминологическая база данных может быть форматирована и впоследствии повторно загружена информацией из файла ТВХ.

8 Модуль основной структуры

8.1 введение

Эта секция описывает модуль основной структуры для ТВХ. Элементы модуля основной структуры приведены в приложении А и описаны в приложении О. Для быстрого доступа ко всем этим элементам необходимо обратиться к индексу (приложение I).

Существует обмен информацией между элементами высокого уровня модуля основной структуры и метамодели TMF (ИСО 16642), показанной на рисунке 1. Терминологический сбор данных (ТОС) соответствует случаю документа ТВХ.

TMF мвтаыод&гш»

Рисунок 1 — Структура высокого уровня метамодели TMF (ИСО 16642)

7

ГОСТ Р ИСО 30042—2016

8.2 Иерархия

Элемент XML высшего уровня в случае документа ТВХ — <martcf> элемент, который состоит из <martifHeadef> элемента и <text> элемент (см. рисунок 2. структуру MARTIF). Эти названия элемента взяты из ИСО 12200 и имеют корни в тексте.

<text> элемент на рисунке 2 состоит из терминологических записей, которые приложены в пределах одного <body> элемента, и дополнительной информации (метаобразцовый класс объекта). В ТВХ дополнительная информация содержится в <back> элементе.

<martifHeader> элемент соответствует глобальной информации в метамодели TMF и состоит из описания целого терминологического сбора данных (е <fileDesc> элементе), информации о применимом файле XCS (в <enoodingDesc> элементе) и истории пересмотров (в <revisk>nDesc> элементе). Информация о кодировке символов должна быть включена в заголовок, когда признаком кодирования декларации XML в случае документа ТВХ не будет Unicode.

Рисунок 2 — Структура MARTIF

8.3 Компоненты терминологического входа

Каждый терминологический вход понятия в <body> элемент называют <termEntry>. он следует за структурой метамодели TMF.

Группа auxlnfo на рисунке 3 соответствует информации, которая может быть связана с любым из трех уровней: первый уровень (<termEntry>. т. е. уровень понятия), языковой уровень (<langSet>) и уровень термина (<ntig> или его упрощенная версия <tig>). <temnNote> и <termNoteGrp> элементы могут появиться в уровне термина и ниже. <termCompList> элемент соответствует классу объекта секции компонента термина метамодели TMF.

Иерархический вход (termEntry) указан в рисунке 3.

8

Рисунок 3 — Уровни терминологического входа

ГОСТ Р ИСО 30042—2016

8.4    Элементы, которые могут появиться на многократных уровнях входа

Следующие элементы (представленные как группа auxtnfo на рисунке 3. уровнях терминологического входа) могут появиться на любом из трех уровней входа.

<descrlp>

Предоставляет описательную информацию о рассматриваемом узле. Тип описательной информации обозначен ценностью признака /пипа. Это может быть ограничено определенными уровнями входа в зависимости от ценности признака типа, как обозначено в файле XCS. Если дополнительная информация (административная) должна быть связана с описанием, то она может быть вложена в элемент <descrioGrp>.

<descripGrp>

Содержит один <descrip> элемент, сопровождаемый нулем или больше <descripNote>. <admin>. <adminGro>. <transacGro>. <note>. <ref> и <xref> элементы.

<admin>

Содержит информацию административного характера для рассматриваемого узла, такого как источник информации, проект или клиент. Тип административной информации обозначен ценностью признака типа. Если дополнительная информация (примечание или ссылка) должна быть предоставлена, то она может быть вложена в элемент <adminGro>.

<adminGrp>

Содержит один <admin> элемент, сопровождаемый нулем или больше <adminNote>. <note>. <ref> и <xref> элементы.

<adminNote>

Содержит некоторую административную информацию, такую как источник примечания или другого текста.

<transacGrp>

Содержит один <transac> элемент, сопровождаемый нулем или больше <transacNote>. <date>. <note>. <ref> и <xref> элементы. Содержит такую информацию, как дата заполнения, оператор. Дата определена <date> элементом, а имя человека или организации определено <transacNote> элементом.

Примечание — Любая дата во входе ТВХ должна появиться в пределах <transacGrp> элемента.

<note>

Содержит любой вид.

<ref>

Перекрестная ссылка, которая указывает на другой элемент в пределах <martjf> элемента.

<xref>

Перекрестная ссылка, которая указывает на внешний объект (URL или другой веб-адрес).

8.5    Элементы, которые встречаются только в уровне термина или ниже

Уровень термина в иерархии входа упомянут как ntig и tig на рисунке 3. Самый верхний элемент в уровне термина может быть или <ntiq>. или его более простой вариант <tig>.

Следующие элементы могут произойти в уровне термина.

<«а>

Предоставляет всю информацию о термине. Содержит один <term> элемент, сопровождаемый нулем или большим количеством <temnNote> элементов, сопровождаемых любым из элементов, описанных в п. 8.4.

<ntiq>

Предоставляет всю информацию о термине. Содержит более глубокую структуру, чем более простой вариант <tjg>. Содержит один <termGro> элемент, сопровождаемый любым из элементов, описанных в п. 8.4. Этот элемент должен быть выбран вместо <tig>. если необходимо зарегистрировать компоненты термина в рамках того же самого входа.

<termGrp>

Содержитодин <term> элемент, сопровождаемый произвольно, или <teimNote>. или <termNoteGrp> элемент, и ноль или больше <termComoList> элементов.

<termNoteGrp>

Содержитодин <termNote> элемент и ноль или больше <admin>. <adminGrp>,<transacGrp>.<note>. <ref> и <xref> элементы.

9

ГОСТ Р ИСО 30042—2016

<termNote>

Обеспечивает различные типы информации о термине в зависимости от ценности типа. Может содержать информацию, такую как род или часть речи, ссылки на другие связанные условия, адми* нистративную информацию, такиую как источник термина или е каких областях он используется и т. д. Следующие элементы могут появиться на уровне компонента термина.

<termCompGrp>

Содержит один <termComp> элемент, сопровождаемый произвольно, или <termNote>. или <termNoteGro> элемент, и ноль или больше <admln>. <adminGro> <transacGrp>. <note>. <ref> и <xref> элементы, которые относятся к термину.

<termCompList>

Показывает внутренний состав термина и состоит из любого из элементов, описанных в п. 8.4, со* провождаемого одним или несколькими <termComp> или <termComoGrp> элементами.

<termComp>

Содержит компонент термина, такого как одно из слов, из которых термин составлен. Может со* держаться в <termComoGrp> или <termCompList>.

8.6 Обработка текста

8.6.1    Типы текста

В ТВХ существуют пять различных случаев, когда элемент может содержать текст. noteText

текст примечания

noteText — предприятие, определенное в основной DTO. Элементы, которые определены с этим предприятием, могут взять текст в качестве своего содержания, и сам текст может содержать некоторые предопределенные элементы. noteText используется текстовыми элементами, которые могут потребовать повышения значения <descrip type="definition*> или <termNote type=’usageNote">. basicText основной текст

basicText — также предприятие, определенное в основной DTD. Элементы, которые определены с этим предприятием, могут взять текст в качестве своего содержания, плюс один или более <Ь[> элементов, чтобы представлять более ограниченные действующие стили повышения, чем разрешенный. noteText. basicText используется <term> и подобными термину элементами, такими как <termNote type=’shortFormFor">. plaintext обычный текст

plain Text обращается к тексту без любого действующего повышения. Это соответствует понижению определения NG <mg:text/> и определению DTO PCDATA. Элементы, которые используют этот тип данных. можно считать символом, таким как <descrip type=’subjectFie4d"> и <admin type="productSubset’>. text as markup текст как повышение

Некоторые элементы, такие как <bot>. содержат текст, который фактически представляет повышение от другой системы, такой как система Translation Memory, которая должна быть сохранена в ТВХ. Эти элементы описаны в п. 8.6.2. picklist

разворачивающийся список

Некоторые элементы вносятся путем предопределенного набора элементов из разворачивающегося списка. Например, элемент «termNote type=’grammaticalGender"> может только содержать одну из последовательностей обычного текста согласно XCS. Элементы из списка определены в файле XCS. Тип данных, поддержанный каждой категорией данных ТВХ. определен в разделе 9.

8.6.2    Действующие элементы повышения

ТВХ содержит пять элементов повышения в пределах категорий данных, имеющих тип данных noteText. как определено в п. 9.2. Эти элементы используются, чтобы определить язык или функцию текстовых последовательностей или позволить случаям документа ТВХ содержать различные виды другого повышения (такие как HTML или относящееся к обработке текстов повышение), который должен быть сохранен, но не должен быть обязательно обработан во время управления терминологией. Данные элементы описаны ниже.

10

ГОСТ Р ИСО 30042—2016

<forelqn>

Иностранный — <foreiqn> элемент используется, чтобы отметить сегмент текста на иностранном языке. Дополнительный признак хтМапд может использоваться, чтобы определить язык текста, содержавшегося в данном элементе.

<Ы>

Основной момент — <hi> элемент разграничивает часть текста. Может использоваться для различных задач обработки, например, чтобы отметить математическое выражение или вызванный термин в определении или другом текстовом поле. <Ы> элемент также допустим в пределах <term> элемента. чтобы отметить части условий. Например, есть условия, у которых есть характер в приписке, или суперподпиннике. или компоненте в пределах термина, который выделен курсивом или требует другого форматирования.

Начните соединенный признак — <ьм> элемент используется, чтобы разграничить первую из соединенной последовательности родных кодексов (например. HTML <strong> признак). Каждый <bpt> будет иметь соответствующий <eot> элемент после него в пределах того же самого исходного элемента.

<ept>

Закончите соединенный признак — <ept> элемент используется, чтобы разграничить вторую из соединенной последовательности родных кодексов (например. HTML </strong> признак). Каждый <eot> буду иметь соответствующий <bot> элемент перед ним в пределах того же самого исходного элемента.

<ph>

Заполнитель — <ph>. элемент используется, чтобы разграничить последовательность родных автономных кодексов в сегменте, который не соединен с другим элементом (например, XHTML <br/> код). Он не должен использоваться для замены кодов, которые находятся в логических парах.

У любого вложенного повышения должны быть любые знаки признака начала («<») или амперсанды (&). преобразованные в их соответствующие предприятия. &К; и &атр: это преобразование позволяет повышению быть сохраненным и обработанным во время показа или импорта, не усложняя основную структуру ТВХ. при необходимости включать XHTML DTD в основную структуру. Любой вид основанного на тексте повышения, включая RTF, может быть заключен в капсулу в этих признаках и позже восстановлен без потери информации.

/ (внутреннее соответствие) признак используется, чтобы соединить <bpt> элементы с их соответствующими <ept> элементами. Этот механизм предоставляет ТВХ поддержку, позволяя повысить возможно накладывающиеся диапазоны кодов HTML:

This is <i>some <b>sampLe HTML</i> markup </b> with improper nesting.

Вышеупомянутое повышение было бы представлено следующим образом, используя <ept> и <bot>:

This is <bpt i-"l">&lt;iX/bpt>some <bpt i*,,2,,>4lt;bX/bpt>sample HTML<ept

i-"l">4lt;/ ix/ept> markup <ept i-'*2">4lt,,/b></ept> with improper nesting.

Значения i будут уникальны в пределах исходного элемента <bot> или <eot> элемент.

8.6.3    Признак xmhlang

У каждого элемента, содержащею свободный текст, должен быть язык текста явного или унаследованною признака xmlJang. В ТВХ признак xmiilang не относится ни к каким признакам или их значениям.

8.6.4    Кодирование

В ТВХ весь текст должен быть в Unicode (ISO/IEC 10646). Есть три допустимых encodings Unicode: UTF-в. UTF-16 и семибитный ASCII со знаками не ASCII, представленными как ссылки характера ссылок на их кодовую точку Unicode. Ссылки характера ссылок должны быть представлены, как это определено в стандарте XML.

8.6.5    Математические выражения в ТВХ

Время от времени необходимо представлять математические выражения в случаях документа ТВХ. включая в рамках условий и определений. Для математических выражений, которые требуют форматирования. кроме того доступного в простом текстовом формате, когда требуется проверка DTD ТВХ и файла XCS, <h[> может использоваться как элемент со значением атрибута типа 'математика'. Поскольку механизм DTD не оказывает поддержку для пространства имен XML механизм, содержание

11

ГОСТ Р ИСО 30042—2016

этого элемента должно состоять из LaTeX — данные о формате (который не использует маркировку XML-стиля). Следующие примеры показывают, как LaTeX математические выражения могут быть включены в случай документа ТВХ (для получения дополнительной информации о LaTeX математическом форматировании следут проконсультироваться с группой пользователей ТеХ в ). Следует отметить, что любые случаи < или & в LaTeX последовательностях должны быть заменены соответствующими предприятиями &lt; и &атр;.

Математический пример #1:

<descrip type-"definition">

результат определен выражением <hi cype«*'math,*> |С| • \sqrt(С1 л(2) + С,,л(2)} - \sigma_(2) / \epsilon_{2} </hi>

</descrip>

Графический эквивалент содержания <hi> элемента в этом примере является следующим:

|с| = Vc'2 + С"2 ш02и3.

Математический пример #2:

<descrip type-”definition”»

отношение фактических к критическому демпфированию, где критическое демпфирование состоит в том, которое требуется для пограничного условия между колебательным и неколеОателькым поведением. Демпфирование порции является функцией логарифмического декремента L: Это безразмерное уравнение: <hi type*»"fnath”> \ mu « \frac(A/2\piИ\sqrt(1+<a/2\pi>л2)\ - \sin \arctan (А/2\рi)

</hi> Для маленьких ценностей <hi type»-',inath,,>A/\mu - A/2\pi</hi>

</descrip>

Два случая of <hi> могут быть графически представлены следующим образом:

А/2я    ^ .л,п ,

д а    a sin arctan(A / 2л-)

$ + {ai2xf и

А/даА/2л.

При желании MathML namespace может использоваться вместо LaTeX повышения. Однако если использовать основную OTD структуры для проверки, то некоторая предварительная обработка будет требоваться, а именно комментарии или удаление элементов пространства имен MathML. Проверка MathML невозможна с основной DTD. Обработка не требуется при схеме, которая поддерживает пространство имен XML.

8.7 Элементы метаданных

Элемент метаданных — элемент, у которого могут быть многократные различные модели содержания. один для каждой различной ценности его признака типа. Сохраняя название элемента постоянным. далее определяя элемент на уровне признака, элемент метаданных служит цели группировать категории данных, у которых есть общие признаки. Например. «3escrio> элемент, содержащий различные описания, и <terrnNote> элемент, содержащий различную информацию об условиях. Ограничения содержания элементов метаданных определены XCS или в интегрированной схеме, такой как в Приложении F. Комбинация названия элемента и ценность его признака типа соответствуют категории данных, как определено в ИСО 12620. Например, элемент <descrip type="definition’> соответствует /definition/ категории данных от ИСО 12620.

Элементы метаданных в ТВХ:

-    <termNote>

-    <termComoList>

• <admin>

12

ГОСТ Р ИСО 30042—2016

•    <adminNoto>

•    <transac>

•    <transacNote>

•    <descrio>

•    <descripNote>

•    <ref>

•    <xref>

•    <refObiectList>

Существует два случая, где категория данных не определена ценностью признака типа на элементе метаданных, который это логически описывает. Первый случай включает элементы данных о списке. т. е. <termCompList> и <refObjectUst>. Эти два элемента данных берут признак типа, но значение этого признака типа фактически относится к компонентам списка, а не к самому списку. Например, для <termCompList> допустимые признаки типа включают 'hyphenation', морфологический элемент' и т. д. Эти особенности логически относятся к термину в списке, а не к самому списку. Это пример принципа наследования, где последующие элементы наследуют признаки типа исходных элементов.

Второй случай включает элементы данных группы, такие как <transacGro> и <descripGrp>. Ни одному из этих элементов не разрешено иметь признак типа. Вместо этого тип группы обозначен в содержании ее основного последующего элемента. См. пример transacGrp в 10.3.4. Это показывает, что тип сделки, которая <transacGrp» описывает, обозначен как содержание последующего элемента <transac>. Это — пример принципа обратного наследования.

В отличие от других элементов метаданных, элементы <adminNote> и <transao иллюстрируются примерами как один data category, потому что у них есть только одна допустимая ценность их признака типа. т. е. <adminNote> берет только признак типа 'sourceType'. и <transac> берет только признак типа transactionType'. Однако их все еще считают элементами метаданных, потому что в целях расширяемости новые значения атрибута типа могли быть определены группой пользователей в таможенном файле XCS.

8.8 Признаки

Главными признаками, используемыми в ТВХ, являются xmlilang (язык), id (чтобы определить элемент уникально в рамках документа XML) и цель (чтобы указать на другой элемент или внешний объект). Ценность признака xmlilang наследуется вниз через подразумеваемую древовидную структуру документа XML. если это не отвергнуто другим признаком xmlilang. <martif> элемент требуется, чтобы иметь признак xmlilang. Язык, определенный в <martif> элементе, становится рабочим языком всего файла ТВХ. Каждый <langSet> элемент должен также определить язык, который относится к языковой секции, при этом становится языком объекта и рабочим языком языковой секции. Таким образом, содержание <descrip тип="определение"> элемент в первом уровне, как предполагается, находится на рабочем языке файла ТВХ, если иначе не определено, и примечание в языковой секции, как предполагается. находится на том же самом языке как языковая секция, если иное не определено явным признаком xmlilang. Допустимые значения признака xmlilang в ТВХ найдены в IETF RFC 4646 или его преемнике, как определено в IETF ВСР 47.

Id и целевые признаки взаимосвязаны и указывают на однозначность между элементами в том же самом файле ТВХ. Например, один вход!

<terznEntry id-^eid-database-5574">

...< вход для "охотничья собака")

</termEntry>

мог быть указан другим входом.

<terznEntry>

<descrip    type-"superordinateConceptGeneric"    target-"eid-database-

5574">охоткичья собака

</descrip>

... (вход для "ретривера" [тип охотничьей собаки]}

</termEntry>

13

ГОСТ Р ИСО 30042—2016

Содержание «охотничья собака» во втором входе дано для примера. Это обеспечивает видимую этикетку для связи с целевым входом.

Целевой признак указывает на внешний объект.

8.9    Проблемы кодировки

Множество мнемонических предприятий приведено в ИСО 12200. но ТВХ имеет более строгие требования. Могут быть использованы ссылки характера и мнемонические предприятия, встроенные в XML. Это должно уменьшить бремя на установленном порядке импорта, который не может содержать все мнемонические предприятия характера, которые могли бы использоваться. Файлы с данными ТВХ должны быть в одном из трех encodings Unicode: a) UTF-16. b) UTF-8 или с) чистый 7-битный ASCII (ISO/ IEC 646). в котором знаки не-ASCII закодированы как восемь знаков ASCII, использующих ссылку характера XML (таких как &#1103;). а также пять знаков, предопределяющих предприятия XML. кавычка, амперсанд, апостроф, знаки «меньше» и «больше».

Такие ссылки характера автоматически преобразованы в удобочитаемые знаки, в том случае когда файл с данными XML. содержащий их. показан в различных типах программного обеспечения, которое может отображать файлы XML. Этот третий тип кодирования можно формально считать UTF-6. хотя он и не использует метод UTF-8 кодирования знаков, кодовая точка которых выше 127.

8.10    Язык

<martif> и <langset> элементы —единственные элементы, для которых признак xmklang обязателен.

На <martif> элементе этот признак указывает на рабочий язык случая документа ТВХ. Это относится ко всем элементам в случае документа ТВХ (если не исключено другим признаком xmlilang. таким как <langset> элемент).

На <iangset> элементе этот признак указывает и на рабочий язык, и на язык объекта соответствующей языковой секции. Если не исключено другим признаком xmUlang на последующем элементе, содержание всех элементов в языковой секции, как предполагается, находится на языке, определенном xmUang признаком <langset> элемента. Это не относится к содержанию элементов, которые являются элементами разворачивающегося списка, как определено в файле XCS. Чтобы изменить язык элемента в языковой секции, кроме важности xmhlang признака <langset> элемента необходимо использовать признак xml:lang на этом элементе.

9 Ограничения категории данных по умолчанию

9.1 Введение

Эта секция описывает категории данных ТВХ и их ограничения. Эти категории данных и ограничения формально описаны в приложении D. Случай документа ТВХ может быть утвержден против категорий данных по умолчанию и ограничен при помощи файла XCS. который приведен в приложении С.

XCS по умолчанию не единственный XCS. который может использоваться для ТВХ-управняемых терминологических баз данных. Особью группы пользователей могут определить свой собственный файл XCS.

Рекомендации для кодирования категорий данных как элементы XML даны в л. 10.2.

Категории данных в следующих таблицах организованы в группах, которые отражают общее содержание или цель. Каждая категория данных, кроме категорий исходных данных, встроенных в основную ОТО в первой секции ниже, связана с метамоделью. будучи классифицированной или как административная. или как описательная. Описательные категории данных описывают или понятие, или термин. За немногим исключением категории данных, которые используют элемент <descno>. описывают понятие, а категории данных, которые используют элемент <termNote>. описывают термин. Все категории данных, которые используют элемент <admin> — административные. Категория данных, которой указывают целевой признак (как обозначено в XCS). указывает на отношение к другой информации. такой как другой термин, или понятие, или библиографическая ссылка.

Категории данных в п. 9.2 осуществлены непосредственно как элементы ТВХ или признаки в OTD основной структуры. Остальные таблицы содержат категории данных, которые являются специализациями (через ценности признака типа) категорий метаданных, которые определены в OTD основной структуры. Первая колонка — уникальное имя категории данных (по ИСО 12620). Вторая колонка (тип данных) указывает, какой текст позволен в элементе. Третья колонка указывает, может ли этот элемент взять целевой признак, когда это указывает, какой элемент может быть предназначен. Четвертая колонка

14

ГОСТ Р ИСО 30042—2016

указывает, какая категория метаданных используется для этой категории данных. Пятая колонка указы* вает на уровни в метамодели, в которой может появиться особая категория данных.

Если типом данных является разворачивающийся список, то содержание элемента ограничено предопределенным набором ценностей, иногда называемых областью стоимости. Элементы разворачивающегося списка определены в соответствующей метакатегории данных колонке, где они перечислены как допустимые признаки содержания элемента. Ценности разворачивающегося списка также определены в XCS. Группы пользователей могут выбрать свои собственные признаки показа для этих разворачивающихся списков, как описано в п. 12.3.

Примечание — Значения самих элементов разворачивающегося списка в настоящем стандарте не определены. Чтобы получить информацию о значении ценностей разворачивающегося списка, обратитесь к ИСО 12620.

По умолчанию <admm> элементы могут появиться на любом уровне, a <<3escrip> элементы могут появиться при входе, языке или названном уровне, если это не ограничено определенным уровнем в XCS. В файле XCS уровни выражены с помощью <leveis> элемента с дополнительнными элементами termEntry (первый уровень термина), tang Set (языковой уровень секции) или термин (уровень термина). Четвертый возможный уровень для отдельных компонентов термина выражен <fortermcompgrp> элементом. Элемент <termNote> может появиться только на уровне термина, если не разрешено (<fortermcompgrp> элементом) появление на уровне компонента термина.

Категории данных, которые не ограничены разворачивающимся списком в ТВХ XCS. могут быть ограничены разворачивающимся списком в подмножестве группы пользователей XCS (см. л. 12.1). Одним из очевидных вариантов на группу пользователей разворачивающегося списка является partOfSpeecn.

9.2 Категории данных встроены в основную DTD структуры ТВХ

9.2.1 Элементы

Наименование

Тип данных

Цель

Элемент

Начните соединенный признак

Простой текст

Нет

<Ьр1>

Дата

Дата (ISO-формат)

Нет

<date>

Закончите соединенный признак

Простой текст

Нет

<epl>

Внешний

Текст примечания

Нет

<foreion>

Основной момент

Простой текст

Элемент

<h[>

Примечание

Текст примечания

Нет

<note>

Заполнитель

Простой текст

Нет

<ph>

Термин

Основной текст

Нет

<term>

9.2.2 Признаки

Наименование

Тип данных

Признак

ElementtdenlfBer

CDATA

id

Lang

Языковые коды

xml:tang

Link

CDATA, IDREF

Цель

9.3 Категории данных, специализированные от категорий метаданных до файла XCS

9.3.1 Свойства и описания понятий

Эти категории данных описывают свойства понятий. Некоторым разрешают в термине уровень.

Наименование

Тип данных

Цель

Категория

метаданных

Уровень

Аудио

Обычный текст

binaryData

<descrie>

langSet, termEntry. term

15

ГОСТ Р ИСО 30042—2016

Окончание таблицы

Наименование

Тип данных

Цепь

Категория

метаданных

Уровень

Особенность

Обычный текст

Нет

<descrio>

term

ConceplOrtgin

Обычный текст

Нет

<admin>

langset. term Entry, term

Контекст

Текст примечания

Нет

<descrio>

term

ContextType

Разворачивающийся

список

Нет

<descrioNote>

langset. termEntry. term

Определение

Текст примечания

Нет

<йвксгю>

langSet. termEntry, term

DefinitionType

Разворачивающийся

список

Элемент

<descrioNote>

langset. termEntry. term

Пример

Текст примечания

Нет

<descriD>

langSet, termEntry, term

Объяснение

Текст примечания

Нет

<descrio>

langSet. termEntry, term

Число

Обычный текст

binaryData

<descriD>

langSet. termEntry, term

OtherBinaryOata

Обычный текст

binaryData

<descnD>

langSet, termEntry, term

Количество

Обычный текст

Нет

<descrio>

term

Диапазон

Обычный текст

Нет

<descnD>

term

Sample Sentence

Текст примечания

Нет

<dascrio>

term

Стол

Обычный текст

binaryData

<descriD>

langSet, termEntry, term

Единица

Обычный текст

Нет

<descrio>

term

Видео

Обычный текст

binaryData

<descnD>

langSet, termEntry, term

9.3.2 Отношения понятия
Эти категории данных указывают на отношения между понятиями.

Наименование

Тип данных

Цель

Категория

метаданных

Уровень

AntonymConcept

Основной текст

entry

<descrio>

termEntry

AssociatedConcept

Основной текст

entry

<descrio>

tangSet. termEntry

BroaderConceptGenenc

Основной текст

entry

<descrio>

tangSet. termEntry

BroaderConceptPartitive

Основной текст

entry

<descrio>

tangSet, termEntry

ConceptPosibon

Основной текст

concept

SysDescrip

<descrio>

tangSet. termEntry

CoordinateConceptGeneric

Основной текст

entry

<descrio>

tangSet. termEntry

Coord inateConceptPartitive

Основной текст

entry

<descrio>

tangSet. termEntry

Related Concept

Основной текст

entry

<descriD>

tangSet. termEntry

Related ConceptBroader

Основной текст

entry

<descriD>

tangSet. termEntry

Related ConceplNarrower

Основной текст

entry

<descriD>

tangSet. termEntry

SequenballyRelatedConcept

Основной текст

entry

<descriD>

tangSet. termEntry

SpatialtyRetatedConcept

Основной текст

entry

<descriD>

tangSet. termEntry

SobordinateConceptGeneric

Основной текст

entry

<descriD>

tangSet. termEntry

16

ГОСТ Р ИСО 30042—2016

Окончание таблицы

Наименование

Тил данных

Цепь

Категория

метаданных

Уровень

SubordinBteConceptPartrtive

Основной текст

entry

<descrio>

langSet. termEntry

SuperordinateConceptGeneric

Основной текст

entry

<descrio>

langSet. termEntry

SuperordinateConceptPartitive

Основной текст

entry

<descriD>

langSet. termEntry

TemporallyRelatedConcept

Основной текст

entry

<descrio>

langSet. termEntry

9.3.3 Свойства и описания условий
Эта группа категорий данных включает использование и административные свойства условий.

Наименование

Тил данных

Цепь

Категория

метаданных

Уровень

Одушевленность

Разворачивающийся

список

Нет

<lermNote>

term, termComponent

Этимология

Текст примечания

Нет

<lermNote>

term. termComponent

Частота

Разворачивающийся

СПИСОК

Нет

<termNote>

term

GeographtcalUsage

Простой текст

Нет

<termNote>

term

Grammabca (Gender

Разворачивающийся

список

Нет

<termNote>

term. termComponent

Grammabca (Number

Разворачивающийся

СПИСОК

Нет

<termNote>

term. termComponent

Grammabca (Valency

Простой текст

Нет

<termNote>

term

Language-ptanningQualifier

Разворачивающийся

СЛИСОК

Нет

<lermNote>

term

NormativeAulhorizabon

Разворачивающийся

список

Нет

<lermNote>

term

PartOfSpeech

Простой текст

Нет

<termNote>

term. termComponent

PropnetaryReslrictkxi

Разворачивающийся

список

Нет

<termNote>

term

Register

Разворачивающийся

список

Нет

<termNote>

term

ReliabilityCode

Разворачивающийся

список

Нет

<descrip>

langSet. termEntry. term

TemporalQualifier

Разворачивающийся

список

Нет

<termNote>

term

TermLocabon

Простой текст

Нет

<termNote>

term

TermProvenance

Разворачивающийся

список

Нет

<termNote>

term

TimeRestriction

Простой текст

Нет

<termNote>

term

TransferComment

Текст примечания

Нет

<termNote>

term

UsageNote

Текст примечания

Нет

<termNote>

term

17

ГОСТ Р ИСО 30042—2016

9.3.4 Типы условий, отношений к условиям
Эта группа включает категории данных, которые описывают различные типы условий или указывают на отношения к другим условиям.

Наименование

Тип данных

Цель

Категория

метаданных

Уровень

AbbreviatedFormFor

Основной текст

term

<termNole>

term

Antonym Term

Основной текст

term

dermNote»

term

Directionality

Разворачивающийся

список

term

dermNole»

term

False Friend

Основной текст

term

dermNote»

term

Homograph

Основной текст

term

<termNote>

term

ShortFormFor

Основной текст

term

dermNote»

term

TermType

Разворачивающийся

список

Нет

dermNote>

term

9.3.5 Компоненты условий

Наименование

Тип данных

Цепь

Категория мета*

ДАННЫХ

Уровень

Hyphenation

Простой текст

Нет

<termComoList>

termComponent

Аннотация

Простой текст

Нет

dermComoList»

termComponent

bonHotkey

Простой текст

Нет

dermNote>

term

MorphologtcalElement

Простой текст

Нет

dermComoList»

termComponent

Произношение

Основной текст

Нет

dermNote»

term. termComponent

Syllabification

Простой текст

Нет

dermComoList»

termComponent

TermElement

Простой текст

Нет

dermComoList»

termComponent

TermStructure

Простой текст

Нет

dermNote»

term, termComponent

9.3.6 Подурегулирование
Эта таблица включает категории данных, которые используются, чтобы разделить базу данных на логические подмножества, такие как предметная область, и различные административные подмножества.

Наименование

Тип данных

Цель

Каюгория негаданны к

Уровень

ApplicabonSubset

Простой текст

Нет

<admin»

langseL termEntry. term

BusinessUnitSubset

Простой текст

Нет

<admin>

langseL termEntry. term

CustomerSubset

Простой текст

Нет

<admin>

langset. termEntry. term

EnvironmentSubset

Простой текст

Нет

<admin»

langseL termEntry. term

ProductSubset

Простой текст

Нет

<admin»

langset. termEntry. term

ProjectSubset

Простой текст

Нет

<admin»

langseL termEntry. term

SecuritySubset

Разворачивающийся

СПИСОК

Нет

<admin»

langset. termEntry. term

SobjectFiekJ

Простой текст

Нет

<descrio»

termEntry

SubsetOwner

Простой текст

Нет

<admin»

langseL termEntry. term

16

ГОСТ Р ИСО 30042—2016

9.3.7 Поиск, индексация, другие использования условий

Наименование

Тип данных

Цель

Категория

негаданных

Уровень

ClassificationCode

Простой текст

Ш

<descrio>

langSeL termEntry. term

indexHeadmg

Простой текст

Нет

<admin>

langset. termEntry. term

Ключевое слоев

Простой текст

Нет

<admin>

langseL termEntry. term

SearchTerm

Простой текст

Нет

<admin>

langset. termEntry. term

SortKey

Простой текст

Нет

<admin>

langset, termEntry. term

ThesaurusOescriptor

Простой текст

Thesaurus

Descrip

<descrio>

termEntry

9.3.8 Административная информация

Наименование

Тип данных

Цель

Категория

метаданных

Уровень

AdministrativeStatus

Разворачивающийся

СПИСОК

Нет

<termNote>

term

AnnotatedNote

Текст

примечания

Нет

<admin>

langset. termEntry. term

DatabaseType

Простой текст

Нет

<admin>

langset, termEntry. term

Oomain Expert

Простой текст

В>Ы

<admin>

langset, termEntry. term

ElementWorkingStatus

Разворачивающийся

список

Нет

<admin>

langset. termEntry. term

EntrySource

Простой текст

Нет

<admin>

langset, termEntry. term

NoteSource

Простой тексг

Нет

<adminNote>

langset. termEntry. term

OriginatingDatabase

Простой тексг

Нет

<admin>

langset, termEntry. term

Originatinglnstitution

Простой тексг

Нет

<admin>

langset. termEntry. term

OriginatingPefson

Простой тексг

Нет

<admin>

langset, termEntry. term

ProcessStatus

Разворачивающийся

СПИСОК

Нет

<termNote>

term

Ответственность

Простой тексг

respPerson

<transac№>te>

langseL termEntry, term

Источник

Текст

примечания

Нет

<adrran>

langset. termEntry. term

Sourceldentifier

Простой тексг

ЫЫ

<admin>

langseL termEntry. term

SourceType

Разворачивающийся

СПИСОК

Нет

<adminNote>

langseL termEntry. term

TransacbonType

Разворачивающийся

список

Нет

<transac>

langseL termEntry. term

UsageCount

Простой тексг

Нет

<transacNota>

langseL termEntry. term

9.3.9 Ссылки и перекрестные ссылки

Наименование

Тип данных

Цель

Категория

метаданных

Уровень

CorpusTrace

Простой текст

Нет

<xret>

langseL termEntry. term

19

ГОСТ Р ИСО 30042—2016

Окончание таблицы

Наименование

Тил ванных

Цель

Категория

метаданных

Уровень

Перекрестная ссылка

Простой текст

Нет

<теО

langset termEntry. term

ExtemalCrossReference

Простой текст

Нет

<xret>

langset. termEntry. term

See

Простой текст

Нет

<ref>

langset termEntry. term. termComponent

XAudio

Простой текст

Нет

<xref>

langset, termEntry. term

XGraphk;

Простой текст

Нет

<xref>

langset. termEntry. term

XMathML

Простой текст

Нет

<xref>

langset, termEntry. term

XSource

Простой текст

Нет

<xref>

langset. termEntry. term

XVideo

Простой текст

Нет

<xref>

langset termEntry, term

9.3.10 Действующее повышение
Эта группа категорий данных обеспечивает средства повысить части текста в текстовых полях, таких как определение.

Наименование

Тип ванных

Цель

Категория

метаданных

Уровень

Смелый

Простой текст

Нет

<hi>

langset. termEntry. term

EntailedTerm

Простой текст

Нет

<hi>

langset termEntry. term

Hotkey

Простой текст

Нет

<hi>

langset termEntry. term

Курсив

Простой текст

Нет

<hi>

langset termEntry. term

Математика

Простой текст

Нет

<hi>

langset. termEntry. term

Приписка

Простой текст

Нет

<hi>

langset. termEntry. term

Суперподлинних

Простой текст

Нет

<hi>

langset. termEntry. term

10 Примеры
10.1 Пример типичного файла ТВХ
Ниже приведен пример простого, но полного файла ТВХ. Компоненты описаны после примера.

<->xml version-*1.0'?> <!DOCTYPE martif SYSTEM "TBXcoreStructV02.dtd"> cmartif type-"TBX" xml!lang-"en">

<martifHeader>

<fileDesc>

<sourceDesc>

<p>From an Oracle corporation termbase</p>

</sourceDesc>

</fileDesc>

<encodingDesc>

<p type-”XCSURI">> </encodingDesc>

</martifHeader>

<text>

<body>

<termEntry id-neid-Oracle-67">

20

ГОСТ Р ИСО 30042—2016

<descrip type“"subjectField">manufасturing</descгip>

<descrip type*-"defmition">A value between 0 and 1 used in ..,</descrip> clangSet xml гlang-"en">

<tig>

<term id*"tid-Oracle-67-enl">alpha smoothing factor</term>

<termNote type*-" par tOf Speech ">noun</termNote>

</tig>

</langSet>

<langSet xmlilang»"hu">

<tig>

<term id“,,tid-Oracle-67-hulH>Alfa siroitAsi t6nyezd</term>

<termNote type*"partOfSpeech">noun</termNote>

</tig>

</langSet>

</termEntry>

</body>

</text>

</martif>

xml декларация заявляет, что следующие линии составляют документ XML. который соответствует версии 1.0 определения XML консорциумом Всемирной паутины (W3C). DOCTYPE martif ..^декларация заявляет, что этот особый документ XML может быть утвержден против спецификации основной структуры ТВХ. которая для этого документа является DTD XML под названием TBXcoreStructV02.dtd (альтернативно структура документа может быть утверждена против версии схемы описания основной структуры, как в приложении F).

<martif> элемент указывает с его признаком типа, что это — документ ТВХ. Признак xmUang указывает. что язык по умолчанию для текста в этом документе английский {кодекс ISO 639 'еп'). Признак хтМапд может взять кодекс ISO 639 в качестве своей стоимости, но может также взять стоимость с двумя частями, такую как fr~CA для канадского и французского языка, со вторым компонентом, взятым от ISO 3166 (коды страны). Дальнейшие увеличения могут включать кодексы подлинника от ISO 15924. диалектов и других характерных особенностей, введенных в IETF RFC 4646 или его преемнике, как определено в IETF ВСР 47.

<marttfHeader> содержит другие элементы, которые предоставляют глобальную информацию о коллекции: описание файла, указывающее, что пример был получен из входа в терминологической базе данных, используемой в корпорации Oracle, и что Т8Х XCS (TBXXCSV02. XCS) содержит дополнительные ограничения категории данных.

<text> элемент окружает <bodv> элемент. Цель <text> элемента состоит в том. чтобы поддержать совместимость с текстом, кодирующим начальные рекомендации. <bodv> элемент содержит коллекцию ориентированного на понятие терминологического exoda (<termEntry>) элемента и произвольно <back> элемент.

Каждый <temnEntrv> элемент — один случай терминологического класса объекта входа по ИСО 16642. У id признака есть стоимость, которая уникальна по всему документу, позволяющему другим элементам указать однозначно на этот элемент. Id eid-OracJe-67 состоит из информации: eid [идентификатор входа) * название базы данных [Oracle] ♦ регистрационный номер входа (67).

<descrip type='subjectField'> элемент определяет предметную область для входа. Область предмета /subject field/категории данных разрешена файлом XCS. Она состоит из элемента категории метаданных (<descri&>) с определенной категорией данных, обозначенной в ценности признака типа. <descrip type-definition'» элемент содержит определение понятия.

<lanoSet> элемент соответствует языковому классу объекта секции, согласно которому терминологический вход состоит из связанной информации и языковых секций.

Метамодель в ISO 16642 декларирует, что языковая секция состоит из случаев класса объекта секции термина, который в ТВХ соответствует <tjfl> (или <ntio>1 элементу. Случай секции термина состоит из термина и связанной информации, которая в этом случае является типом термина, выраженного как termType. Имя tig обозначает группу информации о термине. Id tid Oracle 67 еп1 состоит из информации: tid [называют идентификатор) ♦ название базы данных [Oracle) ♦ регистрационный номер входа [67] + языковой кодекс [еп] + регистрационный номер <t|fl> в пределах той языковой группы (1).

21

ГОСТ Р ИСО 30042—2016

<temnNote> элемент с признаком termType соответствует категории данных. <terroNote> признак используется, так как информация связана с термином, а не с понятием.

Второй <lanoSet> элемент, имея языковое значение атрибута 'hu‘. начинает венгерскую языковую секцию. Вторая <tig> группа элемента состоит из секции термина с венгерским термином, но никаким определением и никаким явным типом термина.

У этого типового входа ТВХ есть несколько свойств:

•    соответствует непосредственно кота модели в ИСО 16642;

•    правильно построенная и основная действительная структура:

•    придерживается ТВХ (XCS).

10.2 Примеры кодирования элементов ТВХ

10.2.1    Элемент с одним признаком

Многие из элементов ТВХ требуют только одного признака, такого как признак типа. Они появились бы следующим образом.

<descrip type-,,definition,,x/descrip>

10.2.2    Элементы с двумя или больше признаками

Некоторые элементы ТВХ включают два признака, такие как все те элементы, которые позволяют целевой признак. Следующее повышение могло бы использоваться во входе о термине ACL.

<termNote type-"abbreviatedFormFor" target*"IBM-05529,’>cm4COK контроля до-CTyna</tern»Note>

У элементов иногда есть три и более признаков, например, определить язык и идентификатор элемента, как в следующем примере, который мог бы произойти, если XML используется на языках кроме английского, требуя следующего повышения в неанглийской языковой секции, и есть потребность указать на язык содержания элемента:

ctermNote type-^abbreviatedForm" target“*'x-5966" xml: lang»"en-US,,>XML</ termNote>

10.3 Примеры записей ТВХ

10.3.1 Компоненты термина

Следующий пример демонстрирует описание компонентов термина. Кроме того, это также показывает возможность использования <tig> вместо <ntig> в простых случаях:

•    fr: table des transitions d'6tats;

•    en: таблица изменения состояния.

Следующий <lanoSet> элемент содержит <ntk>>. сопровождаемый <Uq>:

<langSet xml:lang*"fr">

<ntig>

<termGrp>

<term>table des transitions d'6tats</terin>

CtermCompList type*"termElement">

< te rmC ompGrp>

<termComp>table</termComp>

<termNote type-"grammaticalGender">ferainine</termNote>

</termCompGrp>

<termCompGrp>

<termComp>des</termComp>

ctermNote type-"partOfSpeech">other</termNote>

</termCompGrp>

<termCompGrp>

<termComp>transitions</tetmComp>

CtermNote type~ngraRunaticalNumbern>pluralC/termNote>

22

ГОСТ Р ИСО 30042—2016

<termNote type*>,'grammaticalGendern>feminine</termNote>

</се rmCompGrp>

<cermCompGrp>

< t е rraComp > de < /1 e rmComp>

<termNote type«npartOfSpeech">preposicion</termNote>

</te rmCompGrp>

<terfnComp>4taes</termComp>

</termCompLis t>

</termGrp>

</ntig>

</langSet>

clangSet xml гlang~"en">

<cig>

<term>stace transition table</term>

</tig>

</langSec>

Следующий ntig эквивалентен английскому tig. данному выше:

ClangSet xml:lang»"en">

<ntig>

<termGrp>

<term>state cransicion cable</term>

</termGrp>

</ntig>

</langSec>

10.3.2 Синонимы
Следующий пример показывает, как синонимы могут быть представлены в ТВХ. Следующий при* мер данных указывает, что существует синоним для немецкою термина «Abtastglied»:
•    fr: 6chantillonneur;
•    еп: выборка элемента:
•    de: Abtastgiied; Abtaster.
Эти условия представлены следующим образом:

<termEntry>

<langSet xml2lar.g“"en">

<tig>

<term>sampling element</term>

</tig>

</langSec>

<langSet xml :lang*»"fr">

<tig>

<term>echantillonneur</term>

</tig>

</langSec>

<langSet xml:lang«"de">

<tig>

<term>Abcascglied</term>

</tig>

<tig>

<term>Abtascer</term>

</tig>

</langSec>

</cermEntry>

23

ГОСТ Р ИСО 30042—2016

Примечание — Использование категории данных типа термина /term type/ с ценностью 'синонима' не требуется, чтобы указывать на синонимы, так как два условия в том же самом языковом наборе, как предполагается. являются синонимами, если не указано иное.

10.3.3    Сокращения

Следующие примеры показывают, как сокращения могут быть представлены в ТВХ е двух различных методах. В следующих терминологических данных используют немецкий термин, имеющий сокращение:

•    fг: 6l6ment£ action proportionneMe et par integration:

•    en: пропорциональный плюс составной элемент:

•    de: Proportionalgfied plus Integrierglied: Pl-Glied.

Немецкий tang Set может быть представлен в ТВХ как:

<langSet xml:lang-"de”>

<tig>

<term>Pсорогtionalglied plus Integrierglied</term>

</tig>

<tig>

<term>PI-Glied</term>

CtermNote type“,,termType”>abbreviation</termNote>

</tig>

</langSet>

Немецкий langSet может быть представлен с использованием 'abbreviatedFormOF следующим образом. когда желательно показать отношения между сокращенной и полной формами:

<langSet xml:lang»"de">

ClangSet xmlilang-^de”»

<tig>

<term ID-"n337,*>Proportionalglied plus lntegrierglied</term>

</tig>

<tig>

<term>Pl-Glied</term>

<termNote type»"abbreviatedPormFor" target*"n337”>Proportionalglied plus Integrierglied</termNote>

</tig>

</langSet>

10.3.4    Сделки

Ниже приведен пример того, как терминологическая сделка технологического процесса базы данных может быть зарегистрирована в ТВХ. Следующий тип конструкции может произойти на любом из трех уровней терминологического входа, чтобы указать на информацию о технологическом процессе для всего понятия, языковой секции или секции термина.

<transacGrp>

<с г ansae type**” transact ionType''>modification</transac>

<note>marketing department requested change from gizmo to thing-o</note> <date>1999-ll-12</date>

<transacNote type~"responsibility">John Harris</transacNote> </transacGrp>

10.3.5    Примечания

Ниже приведен пример того, как сделать запись примечания, а также источника примечания. Следующий тип конструкции может произойти на любом из трех уровней терминологического входа, чтобы обеспечить примечание о понятии, языковой секции или секции термина.

24

ГОСТ Р ИСО 30042—2016

<adminGrp>

<admin type“"annotatedNote'*></admin>

OdminNoce type“"noteSource">Wikipedia</adminNote>

</admin<3rp>

Если никакая информация источника для примечания не запрошена, то используют простой <note> элемент.

11 Ссылка на объекты

11.1    Общая информация о ссылке

В ТВХ есть деа метода ссылки на объекты. Если объект будет внутренним к случаю документа ТВХ, то он должен быть включен в структуру файла ТВХ. Если объект будет внешним к случаю доку* мента ТВХ. то он должен быть связан с <xref> элементом. На практике большинство ссылок внешние.

Большинство терминологических баз данных содержат записи, которые должны ссылаться на объекты, которые являются внешними к самому входу, такими как графический файл, аудиофайл или веб-сайт. Эти объекты могут быть доступными в окружении (таком как компьютерная файловая система) или во внешнем источнике, таком как веб-сайт в Интернете. ТВХ обеспечивает различные способы представлять ссылки на объекты, которые показаны в следующих примерах.

Относясь к местным файлам, которые являются внешними к случаю документа ТВХ. используя целевой признак на <xref> элементе, необходимо определить местоположение файлов с путем, который является справочным и содержит случай документа ТВХ, вместо того чтобы использовать абсолютный путь на определенной машине. 8 целях обмена также необходимо упаковать папку, на которую ссылаются, и ее содержание со случаем документа ТВХ. Используя этот метод, рекомендуется включать объекты, на которые ссылаются, такие как графические файлы и аудиофайлы в определяемом справочнике.

Ссылаясь на ресурс, который находится в Интернете, рекомендуется использовать постоянный идентификатор и избегать деффектых связей, когда сетевой адрес для веб-сайта изменяется. Постоянные идентификаторы описаны в системе, приведенной на сайте .

Двоичные данные, включенные в аппарат случая документа ТВХ. должны быть закодированы в Base 64.

Единственный тип объекта, на который ссылаются, определенного в ТВХ файла XCS. является двойным типом объекта. Однако другие типы объектов могут быть определены так. как показано в л. 11.6 и п. 11.7. Дополнительные типы могут быть определены в установленном для пользователя ТВХ TMLs. Элементы XML, выбранные, чтобы представлять объекты, должны быть основаны на существующих стандартах, если это возможно.

Примечание — Эти примеры сосредотачиваются на графических файлах. <xref> элемент поддерживает другие значения атрибута типа, такие как 'xAudio* для аудиофайлов.

11.2    Ссылка на файл, который включен в аппарат файла ТВХ

Ссылка на файл, который включен в аппарат файла ТВХ. требует использования <descrip> элемента. В этом примере терминологический вход содержит указатель на графический файл, который включен в аппарат в форме двоичных данных.

<body>

<termEntry>

<descrip type-^figure" target»"fid-cricketbat">cricket bat</descrip> </termEntry>

</body>

<back>

<refObjectList eype-,,binaryData,*>

<refObject id-^fid-cricketbat'^

25

ГОСТ Р ИСО 30042—2016

<icem type-*'*codePage,*>base64</item>

<item type-"forraat">jpg</itein>

<icem type-"data">

/9j/4AAQSk2JRgABAQ£AYABgAAD/2w8DAAgGBgcGBQgHBwcJCQgKDBQNDAsLDBkSEv8UHRofHh0a... </item>

</refObject>

</refObjectList>

</back>

11.3 Ссылка на файл от аппарата
Этот пример показывает, как сделать запись местоположения диаграммы в аппарате, вместо того чтобы включить файл в аппарат.

<body>

<termEntry>

<descrip type*"figure" target*»"fid-cricketbat">cricket bat</descrip>

</termEntry>

</body>

<back>

CrefObjectList type»"binaryData'*>

<refObject id-"fid-cricketbat">

<itemSet>

<itemGrp>

< i cem>b a c.j pg</i tem>

<xref target*"sports/cricket/bat.jpg"/>

</itemGrp>

</itemSec>

</refObject>

</re£ObjectList>

</back>

11.4 Ссылка на файл непосредственно во входе
Этот пример демонстрирует, как использовать <xref> элемент, чтобы определить местоположение файла в файловой системе непосредственно во входе, избавляя от необходимости включать информацию в аппарат.

<termEntry>

<xref type**"xGraphic" target**"sports/cricket/bat. jpg">cricket bat</xref> </termEntry>

11.5 Ссылка на внешний источник
Следующий пример добавляет ссылку на веб-сайт, где диаграмма была первоначально получена.

<termEntry>

<xre£ type~"xGraphic" target-"sports/cricket/bat.jpg">cricket bat</xref> <xref type■*"xSource,, target«n .bestsportsgraphics.com1'> 8est Sports Graphics</xref>

</termEntry>

26

ГОСТ Р ИСО 30042—2016

Этот тип ссылки может также использоваться для определений, предложений контекста, примечаний и т. д, как демонстрирует следующий пример. Этот пример показывает использование <descrioGro> элемента, чтобы группировать определение и его внешний источник.

<termEntry>

<langSet xmltid-"en-US">

<tig>

<term>over</terra>

<descripGrp>

<descrip type-"deiinition">Six balls bowled in sequence by the same bowler.</descrip>

<xref type-"xSource" target-""> All About Cricket</xref>

</descripGrp>

</tig>

</langSet>

</termEntry>

11.6 Ссылка и документирование библиографического источника

Следующий пример показывает, как сослаться в терминологическом входе на библиографический источник, который зарегистрирован в аппарат случая документа ТВХ. Категории данных для библиографических ссылок (иенности признака типа на <item> элементы) приняты от дублинского набора элемента метаданных ядра. Пример, данный ниже только, включает подмножество доступных категорий данных в демонстрационных целях. Структура XML для библиографических ссылок указана в файле XCS для binaryOata.

<body>

<termEntry>

<langSet xml:lang-"en-US">

<tig>

<term>over</term>

<descripGrp>

<descrip type-"definition">Six balls bowled in sequence by the same bowler.</descrip>

<admin type-"sourceIdentifier" target-"bid-cricket">The Complete Guide to Cricketf p. 17</admin>

</descripGrp>

</tig>

</langSet>

</termEntry>

</body>

<back>

<re£ObjectList type**"bibl,l>

<refObject id-"bid-cricket">

<item type-"creator">Farrel, Bart</item>

<item type«"title">The Complete Guide to Cricket</item>

<item type-"type">book</item>

<item type-"identifier">978-3-16-148410-0</item>

<item type-"publisher">Sports Publishers Inc.</item>

<item type-"date">2000</item>

</refObject>

</refObjectList>

</back>

27

ГОСТ Р ИСО 30042—2016

11.7 Ссылка и документирование информации об ответственном человеке или организации

Следующий пример показывает, как сослаться на информацию о человеке и организации, которые ответственны за часть терминологического входа, который зарегистрирован в аппарат случая документа ТВХ. Данные — категории для личных или организационных справок (ценности признака типа на <item> элементы) приняты стандартом vCard. Пример, приведенный ниже, включает подмножество доступных категорий данных в демонстрационных целях. Структура XML для этих справок в аппарате уже принята файлом XCS для 'binaryOata'.

<body>

<termEntry>

clangSet xml:lang-"en-US">

<tig>

<term>rabbit</term>

<descripGrp>

<descrip type«”definition">In the game of cricket, a very poor batsman.

</descrip>

<transacGrp>

ctransac type-"transactionType”>importation</transac> ctransacNote type-”responsibility” target-”rpid-harris">John Karris</transacNote>

</transacGrp>

<transacGrp>

<transac type-”transactionType">origination</transac> ctransacNote type-"responsibility" target-”roid-CCA”>Canadian Cricket Association</transacNote>

</transacGrp>

</descripGrp>

</tig>

</langSet>

</termEntry>

</body>

<back>

<refObjectList type-"respPerson">

<refObject id-"rpid-harris">

<item type-"fn">John Harris</item>

<item type-"title”>Senior terminologist</item>

<item type*”role">Approver</item>

<item type-"email">jharris0myserver.com</item>

Citem type-"uid">xyzl23</item>

</refObject>

</ref Object Li so crefObjectList type-"respOrg">

<refObject id-"roid-CCA">

<item type-”org”>Canadian Cricket Association</item>

<item type-”tel”>123-456-7899</item>

Citem type-"email">cca0anotherserver. com</item>

Citem type-"adr">75 1st Street, Ottawa, Ontario, Canada</item> </refObject>

</refObjectList>

</back>

28

ГОСТ Р ИСО 30042—2016

11.8    Ссылка на внешнюю систему понятия, систему классификации или тезаурус

Внешняя система понятия, система классификации или тезаурус могут быть источником информации о понятиях. 8 этом случае рекомендуется дать указание на внешний ресурс при помощи .<xref> элемента с уникальным адресом вместо занесения информации об этом источнике в аппарат случая документа ТВХ.

11.9    Ссылка на вход ТВХ из корпуса

Ассоциация локализации отраслевых стандартов издала TermLink. спецификацию для ссылки на терминологические записи баз данных, доступный на .

12 Создание настроек ТВХ TMLs

12.1 Общая информация о TMLs

Терминосистемы и заявления используют одинаковый набор категорий данных. ТВХ — гибкий формат, потому что он позволяет группам пользователей выбирать свои собственные категории данных. Делая так. они могут создать свой собственный TML. адаптированный к их требованиям. Категории данных и их ограничения представлены в файле XCS.

Если категории данных, отобранные группой пользователей, находятся в ТВХ XCS. то TML — строгое подмножество ТВХ TML. Если группа пользователей выбирает все категории данных, которые находятся в ТВХ XCS плюс дополнительные. TML — строгий супернабор ТВХ TML. Группа пользователей может также выбрать некоторые категории данных ТВХ TML плюс некоторые дополнительные, чтобы создать смешанный набор. Чтобы облегчить совместимость, используют любые категории данных. которые не являются частью ТВХ XCS. а файл должен быть описан в комментариях в заголовке определенного для пользователя файла XCS. Если какая-либо из дополнительных категорий данных уже недоступна в ИСО 12620. то в заголовке файла XCS должна стоять отметка, указывающая, как и когда они будут представлены в ИСО ТС 37.

Категории данных должны быть отобраны из ИСО 12620. ТВХ TMLs совместимые и взаимозаменяемые. являются ли они супернабором или подмножеством ТВХ TML с возможно определенным уровнем, позволяют предотвратить или минимизировать потерю данных. TMLs. которые являются подмножеством Т8Х TML. будут легче заменяться и потребуют меньшего количества переговоров, чем супернабор TMLs.

Гибкость ТВХ основана на классическом различии содержания формы. Каждая комбинация основной DTD-схемы определяет форму и особый файл XCS. который определяет содержание и приводит к настроенному варианту (TML) Т8Х. Каждый ТВХ TML выполняет TMF (ИСО 16642). так как у него схожая с ТВХ структура. Отличие от другого ТВХ TMLs относительно данных представляет собой категории и ограничения на эти категории данных.

Form    Content

согетадклвп*    хс$1    хс92

В дополнение к ТВХ TML один вариант ТВХ (TML) упомянут в приложении G.

Чтобы продемонстрировать, как создать определенный для пользователя ТВХ TML. эта секция опишет фиктивный ТВХ TML. В иллюстративных целях этот TML позволит с минимальной терминологической информацией, предоставленной в исходном тексте, быть переведенной в областях производства и финансов.

29

ГОСТ Р ИСО 30042—2016

Этот TML приводит только два типа условий, полных форм и сокращенных форм. Это достигнуто с помощью разворачивающегося списка допустимых ценностей (иногда называемый областью стой* мости) для категории данных (типа термина), который является экземпляром категории метаданных <termNote>. Следующая информация помещена в модуль XCS относительно типа термина:

•    категория метаданных: <termNote>:

•    категория данных: /term type/.

•    разворачивающийся список: fullForm. abbreviatedForm.

Данная спецификация — строгое подмножество спецификаций для term Туре в XCS. Единственная разница в том. что XCS позволяет задать больше вариантов в разворачивающемся списке. Любой документ, который соответствует этому TML. также соответствует ТВХ.

Данный TML позволит задать два типа описательной информации: предметная область и определение. Предметные области, разращенные в этом подмножестве, производственные и финансовые, а технические требования предметной области допустимы только в первом уровне:

•    категория метаданных: <descrio>:

•    категория данных: /subject fold/:

-    разворачивающийся список: производство, финансы:

•    уровни: termEntry.

Файл XCS по умолчанию допускает любую стоимость обычного текста для предметной области, следовательно, подмножество XCS может определить разворачивающийся список. Разворачивающийся список возможных определений не может быть реализован, а спецификация для определения содержит тот же тип текста, указанного в общих сведениях (noteText) на двух уровнях — входе и языке. Это сделано путем размещения следующей информации в подмножестве файла XCS:

•    категория метаданных: <descrio>:

-    категория данных, /definition/-.

•    содержание: noteText:

•    уровни: termEntry, langSet.

12.2 Пример файла XCS для определенного пользователями ТВХ TML

Файл XCS для TML. описанного в предыдущей секции, выглядит следующим образом:

<хш1 version»"l.О"?»

<!DOCTYPE TBXXCS SYSTEM "tbxxcsdtd.dtd">

CTBXXCS id»"XCS-supplier" version-"1.0" lang»"en">

<header>

<title>subset XCS file for suppliers</title>

</header>

<datCatSet>

KtermNoteSpec id-"termType" datcatId»"IS012620A-0201">

<contents datatype»"picklist">fullForm abbreviatedForm</contents> </termNoteSpec>

<descripSpec id»"subjectField" datcatId»"IS012620A-04">

<contents datatype»"picklist'^manufacturing finance</contents> <levels>termEntry</levels>

</descripSpec>

<descripSpec id-"definition" datcatld»"IS012620A-0501">

<contents/>

<levels>termEntry langSet</levels>

</descripSpec>

</datCatSet>

</TBXXCS>

Примечание — В целях упрощения элементы «languages» и <refobjectdefset> были опущены в вышеупомянутом образце.

Нужно отметить, что автоматически обрабатываемый модуль XCS соответствует информации, перечисленной для этих трех категорий данных, представленных в вышеупомянутых примерах. Идентификаторы категории данных (такие как IS012620A-02010) суммированы в XCS.

30

ГОСТ Р ИСО 30042—2016

Определение только трех категорий данных (тип термина, предметная область и определение) как случаи метаданных определяет очень ограниченное подмножество ТВХ; этот модуль категории ограниченных данных может быть логически объединен с модулем основной структуры ТВХ. чтобы позволить ТВХ-допустимыв случаи как в л. 10.1. Элементы, которые не являются категориями метаданных. т. е. основные категории данных ТВХ. такие как <temn> и <note>. не определены в модуле XCS. так как они — часть основной структуры.

12.3 Создание пользовательских имен списка выбора дисплея

Допустимые значения выбора списка для категорий данных определены в приложении С как содержащие соответствующий элемент категории данных, например, административный статус. Стиль представления этих символов разворачивающегося списка — cametease. такой как standardizedTerm. Конечный пользователь может зарегистрировать настроенные названия дисплея этих символов при помощи следующих элементов в заголовке XCS:

<datCatDoc>

Элемент корня секции в заголовке XCS. который содержит отображения стоимости разворачивающегося списка. Содержит ноль или больше <datCatMao> элементов.

<datCatMap>

Элемент, который прилагает одно отображение стоимости разворачивающегося списка. Содержит один <datCatToken>. один или несколько <datCatDisolav> и произвольно один или несколько <la noCode» и <datCatNote>.

<datCatToken>

Название разворачивающегося списка оценивает XCS как <contents» элемент.

<datCatDisolav>

Определенный для пользователя показ стоимости разворачивающегося списка.

<tanoCode>

(Дополнительный) язык, к которому применяется категория данных (может быть повторен, чтобы указать на множество языков).

<datCatNote>

(Дополнительный) Любое примечание о категории данных.

Эти элементы могут использоваться, чтобы создать отображение между определенными пользователями названиями дисплеев и названиями категории данных. Этот механизм полезен для заявлений. где категория данных должка быть представлена пользователю на любом языке, кроме английского.

Например, следующее повышение в заголовке XCS определяет альтернативные названия для разворачивающегося списка на французском языке для терминологической базы данных, у которой есть французский пользовательский интерфейс:

<header>

<title>XCS file for a French cermbase</title>

<datCatDoc>

<datCatMap>

<datCatToken>masculine</dacCatToken>

<datCatDisplay>masculin</datCatDisplay»

<langCode>fr-FR</langCode>

<langCode>fr-CA</langCode>

</datCatMap>

<datCatMap>

<datCatToken>feminine</datCatToken>

< da tCatDisplay»feminin</datCatDisplay>

<langCode>fr-FR</langCode>

<langCode>fr-CA</langCode>

</datCatMap>

<datCatMap>

<datCatToken>neuter</datCatToken>

31

ГОСТ Р ИСО 30042—2016

<datCatDisplay>neutre</datCatDisplay>

<langCode>fr-FR</langCode>

<langCode>fr-CA</langCode>

<datCatNote xmL:lang»"fr">Ne s'applique qu'aux langues солипе l'alle mand.</datCatNote>

</datCatMap>

<datCatMap>

<datCatToken>ochetGender</datCatToken>

<datCatDisplay>aucre genre</datCatDisplay>

<langCode>fr-FR</langCode>

<langCode>£r-CA</langCode>

</datCatMap>

</datCatOoc>

</header>

32

ГОСТ Р ИСО 30042—2016

Приложение А (обязательное)

ОТО для основного модуля структуры

Настоящее приложение содержит формальное представление основной структуры DTD. Отдельный файл имеет название TBXcoreStruclV02.dld.

Предприятия XML (такие как noteText). перечисленные в DTD. позволяют мнемоническим именам быть данными для текстовых строк, особенно для текста, который используется в нескольких местах. Элементы ТВХ разделены на три группы: а) элементы такого уровня и контекстные примеры: Ь) элементы, составляющие терминологический вход (<termentry>); с) элементы высокого уровня и другие элементы, не используемые в терминологическом входе, такие как элементы заголовка.

<!— TBXcoreStruetVQ2.dtd -->

<!— note: see XCS Cor values o£ type on «eta data-categories and Cor values of xml:lang —>

SOME USEFUL ENTITIES THAT ARE REFERENCED BELOW

<!ENTITY '* baslcTexl ' («PCDATA I hl)*'>

<!ENTITY % noteText '(«PCDATA I hi I Coreign I bpt I ept I phl*’>

<!ENTITY % auxInCo '(descrip I descripGrp I admin i admlnGrp i transacGrp | note I ref

I xreC)* * >

<JENTITY « noteLinklnCo '(admin I adminGrp | transacGrp ) note i reC I xreC)*' >

<!— Entitles that define common sets of attributes

<!ENTITY % impIDLang ’ id    ID «IMPLIED

xml:lang    CDATA    «IMPLIED

'>

<!ENTITY % impIDType ' id ID «IMPLIED type    CDATA «IMPLIED

'>

<!entity % impiDLangTypTgtotyp ' id    ID «IMPLIED

xml:lang    CDATA    «IMPLIED

type    CDATA «REQUIRED

target IDREF «IMPLIED datatype    CDATA    «IMPLIEO

'>

ELEMENTS USED FOR TEXT MARKUP

<!ELEMENT hi («PCDATA) >

< iATTLIST hi

type CDATA «IMPLIED target I0REF «IMPLIEO xml:lang COATA «IMPLIED

>

<!ELEMENT Coreign «noteText; > <!ATTLIST Coreign

id    ID «IMPLIED

xml:lang COATA «IMPLIEO

<!ELEMENT bpt («РСОАТА) >

<iATTLIST bpt

i    CDATA    «IMPLIED

type    CDATA    «IMPLIEO

>

33

ГОСТ Р ИСО 30042—2016

<!ELEMENT ept («РСОАТА) > <!ATTLIST ept

i    СОАТА    VIMPLIED

>

<!ELEMENT ph («РСОАТА) > CATTLIST ph

type    CDATA    «IMPLIED

>

ELEMENTS NEEDED ГОР. TERMINOLOGICAL ENTRIES (IN ALPHABETICAL ORDER)

<!ELEMENT admin ‘tnoteText; > CATTL1ST admin

«implDLangTypTgtDtyp;

>

<!ELEMENT adminGrp (admin, (adminNote|note|ref|xcef)*> > OATTLIST adminGrp

id    ID «IMPLIED

>

<!ELEMENT adminNote («PCDATA) > oattlist adminNote

«ImplDLangTypTgtDtyp;

>

<!ELEMENT date («PCDATA) > OATTLIST date

id ID «IMPLIED

>

<!ELEMENT desccip «noteText; > OATTLIST desccip

llmpIDLangTypTgtDtyp;

>

<JELEMENT descripGcp (desccip, (descripNote|admin|adminGrp|transacGrp|note|refIxceC)*) >

CATTLIST descripGrp

id    ID «IMPLIED

>

<!ELEMENT descripNote («PCDATA) > OATTLIST descripNote

«implDLangTypTgtDtyp;

>

<!ELEMENT langSet ((«auxlnfo;), (tig I ntig)+> > ■OATTLIST langSet

id    ID «IMPLIED

xmi:lang CDATA «REQUIRED

>

<!ELEMENT note %noteText; >

<!ATTLIST note «impIDLang;

>

<!ELEMENT ntig (termGrp, lauxlnfo;) >

OATTLIST ntig

34

ГОСТ Р ИСО 30042—2016

id ID «IMPLIED

>

<!ELEMENT ref («PCDATA* > <!ATTLIST ret

«iffipIDLangTypTgtDtyp;

>

<!ELEMENT term 4baalcText; > <!ATTLIST term

id    ID «IMPLIED

>

<!ELEMENT termCofflp («PCDATA* > <!ATTLIST termComp timplDLang;

>

<!ELEMENT termCompGrp (termComp, (termNoteltermNoteGrp**, ^noteLinklnfo;* >

<!ATTLIST termCompGrp

id    ID «IMPLIED

>

<!ELEMENT termCompLiat ((tauxlnfo;*, (termComp | termCompGrp*** >

<!ATTLIST termCompLiat id    ID «IMPLIED

type    CDATA «REQUIRED

>

<!ELEMENT termEntry ((tauxlnfo;*,(langSet*** > <!ATTLIST termEntry

id    ID «IMPLIED

>

<!ELEMENT tetmGrp (term, (termNoteltermNoteGrp)*, (termCompLiat)* ) > <!ATTLIST termGrp

id    10 «IMPLIED

>

<!ELEMENT termNote InoteText; > <!ATTLIST termNote

«implDLangTypTgtDtyp;

>

<!ELEMENT termNoteGrp    (termNote, tnoteLinklnfo;) >

<!ATTLIST termNoteGrp

id    ID «IMPLIED

>

<!ELEMENT tig (term, (termNote**, «auxlnfo;* > <!ATTLIST tig

id    ID «IMPLIED

>

<!ELEMENT tranaac («PCDATA* > <!ATTLIST tranaac

timplDLangTypTgtDtyp;

>

* * >

<!ELEMENT tranaacGrp (tranaac, (tranaacNoteI date|note|ref|xref* <!ATTLIST tranaacGrp

35

ГОСТ Р ИСО 30042—2016

id

10 «IMPLIED

«'ELEMENT transaeNote («PCDATA) > <!ATTL1ST transaeNote

«implDLangTypTgtOtyp;

>

<!ELEMENT xref («PCDATA) > <!ATTL1ST xref timpIDType;

target CDATA «REQUIRED

>

<!--

OTHER ELEMENTS (in hierarchical order)

—>

<!ELEMENT martif (martifHeader, text) > <!ATTLIST martif

type COATA «REQUIRED xml:lang COATA    VREQUIRED

>

<!-- starting element

<!ELEMENT martifHeader <!ATTL1ST martifHeader id    ID «IMPLIED

>

(fileDesc, encodingDesc?, revisionDesc?) >

<!ELEMENT p    tnoteText; >    <J— p is used in several header elements

<!ATTLIST p

id    10 «IMPLIED

type    (DCSNamelXCSURIIXCSContent)    «IMPLIED

xml:lang CDATA «IMPLIEO

>

<! ELEMENT (lleDesc <!ATTLIST fileDesc

id    IO «IMPLIED

>

(titleStmt?, publicationStmt?, sourceDesc*) >

<!ELEMENT titiestmt <!ATTLIST titleStmt timpIOLang;

>

(title, note*) >

<!ELEMENT title ■OATTLIST title timplDLang;

>

(«PCDATA) >

<!ELEMENT publicationStfflt <!ATTLIST publicationStmt Id    ID «IMPLIED

>

(p+) >

<!ELEMENT sourceDesc <!ATTL1ST sourceDesc timplDLang;

>

(p+) >

36

ГОСТ Р ИСО 30042—2016

<!ELEMENT encodingDeac (р4) > <!ATTLIST encodingDeac id    ID 4IMPLIED

>

<!ELEMENT revialonDeac (change4> > c'ATTLIST revialonDeac %implDLang;

>

<!ELEMENT change (p+) >

<!ATTL1ST change tlfflpIDLang; >

<!ELEMENT text (body, beck?) > <!ATTLIST text

id    ID 4IMPLIED

>

<!ELEMENT body    (termEntry*) >

<!ATTLIST body

id    ID 4IMPLIED

>

<!ELEMENT back ((refObjectLiat)*) > <!ATTLIST back

id    ID 4IMPLIED

>

<!ELEMENT refObjectLiat    <cefOb)ect+) >

<!ATTL1ST refObjectLiat id    ID 4IMPLIED

type    CDATA fREQUIRED

>

<!ELEMENT refObJeet    ((itemSet | itemGrp | Item)*-) >

<!ATTLIST refObjeet

id    ID 4IMPLIED

>

<!ELEMENT item tnoteText; >

<!ATTLIST item %lmpIDType;

>

<!ELEMENT itemGrp (item, tnoteLlnklnfo;)> <!ATTLIST itemGrp

id    ID 4IMPLIED

>

<!ELEMENT itemSet ((item | ItemGrp)4)> <!ATTL1ST itemSet timpIDType;

>

<!-- end

37

ГОСТ Р ИСО 30042—2016

Приложение В (обязательное)

DTD для ограничений категории данных (файл XCS)

ОТО. которая используется, чтобы утвердить файл XCS или любой определенный для пользователя файл XCS. представляющий подмножество файла XCS. Обычный текст типа данных используется в файле XCS. но не определен в следующей ОТО. Обычный текст стоимости относится к PCDATA,

<!— start classes -->

«'ENTITY % specAtt.attributes ’ datcatld COATA    *REQUIRED

name COATA «REQUIRE0'»

<!— stop classes —>

<!-- stact elements —>

<!ELEMENT TBXXCS ((header,languages,datCatSet),(refObJectDefSet?))»

«JATTLIST TBXXCS

lang COATA VREQUIRED name CDATA 4REQUIRED version COATA VREQUIRED >

<!ELEMENT adminNoteSpec (contents)»

<!ATTLIST adminNoteSpec tspecAtt.attributes; >

<!ELEMENT adminSpec (contents)»

<!ATTLIST adminSpec %specAtt.attributes; >

<!ELEMENT contents («PCDATA)»

<!ATTL1ST contents datatype COATA «IMPLIED CorTerfflComp COATA «IMPLIED targetType CDATA «IMPLIED »

<!ELEMENT datCatDiSplay («PCDATA)>

«JATTLIST datcatoisplay xml:lang CDATA «IMPLIED >

<!ELEMENT datCatDoc (datCatMap)♦»

<!ELEMENT datCatMap (datCatToken,(datCatDisplay)*,(langCode)*,(datCatNote)?)»

<!ELEMENT datCatNote («PCDATA)»

«JATTLIST datCatNote xml:lang COATA «1MPL1E0 »

<!ELEMENT datCatSet (adminNoteSpec I adminSpec I descxipNoteSpec I descripSpec l hiSpec l refSpec i

termCompLlstSpec | termNoteSpec l transacNoteSpec | transacSpec i xreCSpec)*»

<!ELEMENT datCatToken («PCDATA)>

<!ELEMENT descripNoteSpec (contents)»

«JATTLIST descripNoteSpec

38

ГОСТ Р ИСО 30042—2016

tspecAtt.attributes; ?

<lELEMENT descripSpec (contents,levels!?

<!ATTLIST descripSpec tspecAtt.attributes; >

<!ELEMENT header (title,(datCatDoc!?!?

<!ELEMENT hiSpec (contents!?

<!ATTL1ST hiSpec tspecAtt.attributes; ?

<!ELEMENT itemSpec    (ЦPCDATA)>

<!ATTL1ST ItemSpec type CDATA tREQUIRED ?

<!ELEMENT ItemSpecSet (itemSpec!*?

<!ATTL1ST ItemSpecSet type COATA ¥REQUIRED ?

<!ELEMENT langCode    (IPCDATA)?

<!ELEMENT langlnfо (langCode,langName!>

<!ELEMENT langName    (PPCDATA)?

«'ELEMENT languages    (langlnCo!*?

<!ELEMENT levels (*PCOATA>>

<!ELEMENT reCObJectDeC (reCObjectType,ItemSpecSet!>

<!ELEMENT reCObJeetDefSet (reCObjectDef!*?

<!ELEMENT reCObjeetType    (♦PCDATA)>

<!ELEMENT refSpec (contents!?

«iattlist retspec tspecAtt.attributes; '?

<!ELEMENT termCompListSpee (contents!?

<!ATTL1ST termCompListSpee tspecAtt.attributes; >

<!ELEMENT termNoteSpec (contents!?

<!ATTLIST termNoteSpec tspecAtt.attributes; ?

<!ELEMENT title (PPCDATA)?

<!ELEMENT transacNoteSpec (contents!?

<!ATTLIST transacNoteSpec tspecAtt.attributes; ?

<!ELEMENT transacSpec (contents!?

<!ATTL1ST transacSpec tspecAtt.attributes; ?

<!ELEMENT xreCSpec (contents!? cattlist xrecspec tspecAtt.attributes; >

<!-- end elements —>

39

ГОСТ Р ИСО 30042—2016

Приложение С (обязательное)

Файл XCS по умолчанию

С.1 Введение

Это приложение содержит автоматически обрабатываемое определение выбора по умолчанию категорий данных для ТВХ и ограничений на эти категории данных в форме файла XCS. Файл XCS применяет ограничения категории данных к основной структуре. Определенные группы пользователей ТВХ могут использовать различные файлы XCS. Описание компонентов файла XCS приведено в приложении Е. DTD. которая может использоваться, чтобы утвердить любой файл XCS для ТВХ TMLs. приведена е приложении В.

Условия, при которых это приложение нормативно, приведены в п. 7.1.

Пример документа ТВХ XCS доступен на сайте Ассоциации локализации отраслевых стандартов. Для получения дополнительной информации см. приложение I.2.

С.2 XCS файл для категорий данных по умолчанию и ограничений

Примечание — Обычный текст типа данных, используемый в XCS. перенаправляет к PCDATA.

<?xml version-"!.0" encoding-"UTF-8"?? «'ООСТУРЕ TBXXCS SXSTEM "tbxxcsdtd.dtd"?

«TBXXCS name-"master" veraion-"0.4" lang-"en">

«header?

<citLe>T6X default XCS {extensible constraint specification) file Version 02. (Filename: TBXXCSV02.XCS ) </1 i 11 e?

<! — location where, if the default XCS lile is modified to include additional data- categories, those additions are also listed and described here for convenience purposes—? </header>

<languages>

«langlnfo?

<langCode>en</langCode>

<langKame?English</langttaine?

«/langlnfo?

«langlnfo?

<langCode?de«/langCode?

<langName?German«/langName?

</lang!nfo>

</languages?

«datCatSet?

<!—data-category constraint specifications are arranged in alphabetiai order by the value of the name attribute—>

«termNoteSpec name-"abbrevlatedFormFor" datcatld-"ISOl2620A-02013002"?

<contents datatype-"basicText" targetType-"teimV>

«/termNoteSpec?

«termNoteSpec name-"adfflinistrativeStetuan datcatTd-"IS012620A-020903"?

«contents datatype-"picklist"?    standardizedTerm-admn-sts preferred-

Term-admn-sts admittedTerm-admn-sts    deprecacedTera-admn-sts superseded-

Term-admn-sts legalTerm- admn-sts    regulatedTezm-admn-sts «/contents?

«/termNoteSpec?

«termNoteSpec name-"animacy" datcatId-HISO1262OA-O202O4"?

«contents datatype-"picklist" CorTermComp-"yes"?animate inanimate otherAnimacy«/con-tents?

«/termNoteSpec?

«adminSpec name-"annotatedNote" datcatld-""?

«contents/?

«/adminSpec?

«descrlpSpec name-"antonymConcept" datcatId»"IS0l2620A-10180602"?

40

ГОСТ Р ИСО 30042—2016

«contents datatype-"baslcText" targetType-"entcy"/>

<levels»term&ntry</levels»

«/descripSpec»

«termMoteSpec name-"antonymTerm" datcatld-" IS012620A-10180601 ">

«contents datatype-"basicText" targetType-"term"/>

«/termNoteSpec»

«adfflinSsec name-"applicationSubset" dateat Id-"IS012620A-100306"»

«contents datatype-"plainText"/>

«/adminSpec»

«descripSpec nam*-"associatedConeept" datcatld-"IS012620A-070210"»

«contents datatype-"basicText" tatgetType-"entEy"/»

<levels»langSet termEntry«/levels»

«/descr ipSpeo

«descripSpec name-"audio" datcatld-"IS012620A-050502">

«contents datatype-"plainText" tatgetType»"binatyOata"/>

<levels»langSet termEntry terra«/levels>

«/descripSpec»

«hiSpec name-"bold" datcatId-"">

«contents/»

«/hiSpeo

«descripSpec name-"bcoaderConceptGeneric" datcatld-"IS012620A-070201"»

«contents datatype~"basicText" targetType-"entry"/»

«levels»iangSet termEntry«/levels»

«/descr IpSpeo

«descripSpec name-"broaderConceptPactitlve" datcatld-"IS012620A-070202"»

«contents datatype-"basicText" targetType-"entry"/>

<levels»langSet termEntry</levels»

«/descr IpSpeo

«adminSpec name-"busineasUnitSubset" datcatld-"IS012620A-100308"»

«contents datatype-"plainText"/>

«/adminSpec»

«descripSpec name-"characteriatic" dateatld-"rS0l2620A-0b08">

«contents datatype-"plainText"/>

<levels>term</levels»

«/descripSpec»

«descripSpec name-"classirjeatlonCode" datcatld-"IS012620A-0402"»

«contents datatype-"plainText" targetType-"bibl"/»

<levels»langSet termEntry term«/levels»

«/descripSpec»

«adminSpec name-"conceptOrigin" datcatId-"IS012620A-OS09">

«contents datatype-"plainText"/»

«/adminSpec»

«descripSpec name-"conceptPosition" dateatId-"ISO12 620A-0702"»

«contents datatype-"plainText" targetType-"conceptSysOescrip"/»

<levels»langSet termEntry«/levels»

«/descripSpec»

«descripSpec name-"context" datcatld-"IS012620A-0503"»

«contents/»

<levels>term</levels»

«/descripSpec»

«descripNoteSpec name-"contextType" datcatId»"IS012620A-0803">

«contents datatype-”picklist”»deftningContext explanatoryContext associativeContext llngalsticContext metalinguistieContext translatedContext    «/contents»

«/descr ipMoteSpec»

«descripSpec пате-''coordinateConceptGenecic" datcatld-"IS012620A-07020<101H> «contents datatype-"basicText" targetType-"entry"/»

<levels»iangSet termEntry«/levels»

«/descripSpec»

«descripSpec name-"coocdinateConceptPartitive” datcatld-"IS012620A-07020402"> «contents datatype-"basicText" targetType-"entry"/»

«levels»langSet termEntry«/levels»

41

ГОСТ Р ИСО 30042—2016

«/descripspec»

«xrefSpec name-"corpuaTrace" dateatId-"ISOl262OA-l0l808"»

«contents targetType-"external"/>

«/xrefSpec»

<ref5pec name-"cro3SReference" datcatId-"IS012620A-1018"»

«contents targetType-"element"/»

«/refSpeo

«adminSpec name-"customecSubset" datcatId-"ISO12620A-100301"»

«contents datatype-"plainText"/>

«/adminSpeo

«adminSpec name-HdatabaseType" dateatId-"IS012620A-10220301">

«contents datatype-"plainText"/»

«/adminSpeo

«descrlpSpec name-"deIinitlon" datcatId-"IS012620A-0b01">

<contents/>

<levels»iangSet termEntry teim«/levels»

«/descripspec»

«descripNoteSpeo name-"definitionTypeH da teatId-"ISOI2 620A-0802">

«contents datatype-"picklist">intensionalDennition extensionalDeflnition partitiveDef-inition translatedDefLnition«/contents»

«/descripNoteSpeo

«descripNoteSpeo name-"descciptionType" dateatId-"IS012620A-0801">

«contents datatype-"plcklist" targetType-"element"/>

«/descripNoteSpeo

«termNoteSpec name-"directionality" datcatId-”">

«contents datatype-"picklist" targetType-"teem,’>monodirectional bidirectional incoecaensurate undetermined«/contents»

</termNoteSpec>

«adminSpec name-"donainExpert" datcatId-nIS0l2620A-102&">

«contents datatype-"plainText" targetType-"bibl"/>

«/adminSpeo

«adminSpec name-"elementHorkingStatua" datcatId~"IS0l2620A-1011"»

«contents datatype-"picklistn>stacterElement worklngElement consolidatedElement ar-chiveElement importedElement exportedElement«/contents>

«/adminSpeo

«hiSpec nam*-"entailedTerm" datcatId-"ISOl2820A-l00601">

«contents/»

«/hiSpeo

«adminSpec name-"er>trySource" datcatId»"IS012620A-1013">

«contents datatype-^plainText"/»

«/adminSpeo

«adminSpec name-"environmentSubset" da t ca 11d-"ISO12 620A-100307">

«contents datatype-"plainText"/>

«/adminSpeo

«termNoteSpec name-"etymology" da teatId-"ISO12 620A-020402">

«contents CorTermComp-"yes"/>

« / te r mNo teSpeo

«descrlpSpec name-"example" datcatId-"IS0l2620A-0S0«J"»

«contents/»

<levels»langSet tesmEntry term</levels»

«/descripSpeo

«descripspec name-"explanation" datcatId-"IS012620A-0502">

«contents/»

<levels»langSet termEntcy term</levels»

«/descripspec»

«xrefSpec name-"externalCrossReferenee" datcatId-"IS012620A-101807"»

«contents targetType-"external"/>

«/xrefSpec»

«termNoteSpec name-"falseFriendn datcatld-"IS012620A-0302"»

«contents datatype-"basicText" targetType-"term"/>

«/teroNoteSpec»

42

ГОСТ Р ИСО 30042—2016

«descripSpec name-"figure" datcatId-"IS012620A-0505Ql"»

«contents datatype-"plainText" targetType-"binaryData"/»

<levels»langSet termEntry term«/levels»

«/descripSpec»

«termNoteSpeo name-"frequency" dateatId-"IS012620A-020304">

«contents datatype-"picklist"»commonlyUsed infrequentlyUsed xarelyUsed«/contents» «/termNoteSpeo

«termNoteSpeo name-"geographicalUsage" datcatId»"IS012620A-020302">

«contents datatype-"plainText”/»

«/termNoteSpeo

«termNoteSpeo name-"grammaticalGender" dateatId-"IS012620A-020202"»

«contents datatype-"pickllst" forTeEmComp-"yes">mascullne feminine neuter otherGender«/contents»

«/termNoteSpeo

«termHoteSpee name-"grammaticaiNumber" dateatId-"IS012620A-020203"»

«contents datatype-*pleklist" forTermComp-"yes">singular plural dual mass otherNumbex«/contents»

</termNo teSpec >

«termNoteSpeo name-"grammatlcalValency" datcatId-"IS012620A-020207">

«contents datatype-"plainText"/>

«/termNoteSpeo

«termNoteSpeo name-"homograph" dateatId-"IS012620A-101805"»

«contents datatype-"basicText" targetType-"term"/>

«/termNoteSpeo

«hiSpec name-"hotkey" datcatId-"IS012620A-100604">

<contents/>

«/hiSpeo

«termCompListSpec name-"hyphenation” datcatId-"IS012620A-0207">

«contents forTermComp-"yes"/>

«/termCompListSpeo

«adminSpec name-"indexHeading" dateatId-"IS012620A-0905">

«contents datatype-"plainText"/>

«/adminSpeo

«hiSpec name-"ltalics" datcatld-""»

«contents/»

«/hiSpeo

«adminSpec name-"keyword" datcatrd-"IS012620A-0904">

«contents datatype-"plainText"/>

«/adminSpeo

«termNoteSpeo name-"language-planningQuallIier" datestId-"IS012620A-020902"»

«contents datatype-"picklist">recommendedTerm nonstandardizedTerm proposedTerm new-Term«/contents>

«/termNoteSpeo

«termCompListSpec name-"lemma" datcatId-"IS012620A-020S03">

«contents forTermComp-"yes"/>

«/termCompListSpeo

«termNoteSpeo name-"lionHotkey" datcatld-""»

«contents datatype-"plainText"/>

«/termNoteSpeo

«hiSpec name-"math" datcatld-""»

«contents/»

«/hiSpec»

«termCompListSpec name-"morphologicalElement" datcatld-"IS012620A-020801"»

«contents £orTermComp-"yes"/»

«/termCompListSpec»

«termNoteSpeo name-”normativeAuthorization" datcatld-"IS012620А-020901"»

«contents datatype-"picklist"»standardizedTerm preferredTerm admrttedTerm deprecat-edTerm supersededTerm legslTerm regulatedTerm«/contents»

«/termNoteSpeo

«adminNoteSpec name-"noteSource" datcatld-""»

«contents/»

43

ГОСТ Р ИСО 30042—2016

« /adm i nNo t е Speo

«admlnSpec name-"ociginatingDatabase" datcatld-"IS012£20A-102203">

«contents datatype-"plainText"/>

«/adminSpeo

«adminSpec name-"originatingInstitution" daccatId-"ISO12620A-102202">

«contents datatype«"plainText"/>

«/adminSpeo

«admlnSpec name-"originatingPeraon" datcatId-"IS012620A-l02201">

«contents datatype-"plainText"/>

«/adminSpeo

«descripSpec name-"other8inacyData" dateatId-"IS012&20A-050505H>

«contents datatype-"plainText" targetType-"binaryData"/>

<levels>langSet termEntry term</levels>

«/descripSpeo

«termHoteSpec name-"patLOfSpeech" datcatId-"ISOl2620A-020201">

«contents datatype-"plainText" £orTermComp-"yes"/>

</termNoteSpeo

<termNoteSpeo name-"processStatus" dateatId-"IS012620A-020904">

«contents datatype-"piekllst">unproce3sed ptovisionallyPtocessed nnalized«/contents> «/termNoteSpeo

«adminSpec name-"productSubset" datcatrd-"ISOl2620A-l0030S">

«contents datatype-"plainText"/>

«/adminSpeo

«admlnSpec name-"projectSubset" datcatld-"IS012620A-100303">

«contents datatype-"plainText"/>

«/adminSpeo

«termNoteSpeo name~"pconunciation" datcatld-"IS012620A-0205">

«contents datatype-"basicText" fotTetmComp-"yes"/>

«/termNoteSpeo

«termNoteSpeo name-"proprietacyRestrictionH datcatld-"IS012620A-020307">

«contents datatype-"pickll3t*,>traden)ack serviceMark tiadeName«/contents> «/termNoteSpeo

«descripSpec name-"quantity" datcatId-"IS012620A-05070l">

«contents datatype-"plainText"/>

<levels>tetm«/levels>

«/desctipspeo

«descripSpec name-"cange" da teat Id-"ISO12 620A-0507">

«contents datatype-^plainText"/»

<levels>ieim</levels>

«/desctipspeo

«termNoteSpec name-"eegister" datcatId-"IS012620A-020303">

«contents datatype-*,picklist">colloquialRegister neutralRegister technicalReglster in-houseReglster bench-levelRegister slangRegister vulgatRegistet«/contents> «/termNoteSpeo

«descripSpec name-"ceiatedConceptH datcatId-"ISOl2620A-070205">

«contents datatype-"basicText" targetType-"entry"/>

<levels>langSet termEntry«/levels>

«/desctipspeo

«descripSpec name-"relatedConcept8roaderH datcatld-"IS012620A-07020501">

«contents datatype-"basicText" taigetType-^entry"/?

«levels>langSet termEntry«/levels>

«/descripSpeo

«descripSpec name-"relatedConceptNarcower" datcatld-"IS012620A-07020502">

«contents datatype-"basicText" taigetType-"entry"/>

<leveis>langSet termEntry«/levels>

«/descripSpeo

«descripSpec name-"celiabiiityCode" da tea tId-"ISOI2 620A-0304">

«contents datatype-"picklisL">l 23456794 10</contents>

<levels>langSet termEntry term«/levels>

«/descripSpeo

«transacNoteSpec name-"responsibility" datcatld-"IS012620A-100202">

44

ГОСТ Р ИСО 30042—2016

«contents targetType-"respPecson"/?

«/transacNoteSpec?

«descripSpec name-"sampleSentence" datcatId-"IS012620A-050302"?

«contents/?

<levels?term</levels?

«/descripSpec?

«adminSpec name-"searchTerm" datcatId-"IS012620A-100603"?

«contents datatype-"plainText"/?

«/adminSpec?

«adminSpec name-"securitySubset" datcatId-"IS012620A-100309"?

«contents datatype-"picklist"?public conddentiaK/contents?

«/adminSpec?

«refSpee name-"see" datcatId-"IS0l2620A-101801"?

«contents targetType-"element" f о г Те rmComp-" у ea " / ?

«/refSpee?

«descripSpec name-"sequentiallyRelatedConcept" datcatld-"IS012620A-070206"? «contents datatype-"basicText" targetType-"entry"/?

<levels?langSet termEntry</levels?

«/descripSpec?

«termNoteSpec na me-"aho r t Fo rmFo r" datcatld-"IS012620A-02013004"?

«contents datatype-"basicText" targetType-’,term"/?

«/termNoteSpec?

«adminSpec name-HsortKey" datcatId-"IS012620A-100602"?

«contents datatype-"plainText"/?

«/adminSpec?

«adminSpec name~"source" datcatld-"IS012620A-1019"?

«contents/?

«/adminSpec?

«adminSpec name-"sourceIdentirier" datcatld-"IS012620A-1020"?

«contents datatype-"plainText" targetType-"bibl"/?

«/adminSpec?

«adminNoteSpec name-"sourceType" datcatId-"IS012620A-102001">

«contents datatype-"plcklist"?parallelText backgroundText«/contents? «/adminNoteSpec?

«descripSpec name-"spatiallyRelatedConcept" datcatId-"IS012620A-070208"? «contents datatype-"basicText" targetType-"entry"/?

<levels?langSet termEntry«/levels?

«/descripSpec?

«descripSpec name-"subjectField" datcatld-"IS012620A-00"?

«contents datatype-^plainText"/?

<levels?termEntry</levels?

«/descripSpec?

«descripSpec name-"subordinateConceptGeneric" datcatld-"1S012620A-07020301"? «contents datatype-"basicText" targetType-"entry"/?

<levels?langSet termEntryc/levels?

«/descripSpec?

«descripSpec name-"subordinateConceptPartitive" datcatld-"IS012620A-07020302"? «contents datatype-"basicText" targetType-"entry"/?

<levels?langSet termEntry</levels?

«/descripSpec?

«hiSpec name~"subseript" datcatld-""?

«contents/?

«/hiSpec?

«adminSpec name-"subsetOwner" datcatld-"IS012620A-10020210"?

«contents datatype-"plainText"/?

«/adminSpec?

«descripSpec name-"superordinateConceptGeneric" datcatld-"IS012620A-07020202"? «contents datatype-"basicText" targetType-"entry"/?

<levels?langSet termEntry</levels?

«/descripSpec?

«descripSpec name-"euperordinateConceptPartitive" datcatId-"IS012620A-07020203"?

45

ГОСТ Р ИСО 30042—2016

«contents datatype-"basicText" targetType-"entry"/»

<levels»langSet termEntry«/levels»

</descr i pspec»

«hiSpec name-"supe race ipt" datcatId-"">

«contents/»

«/hiSpec»

«tecmCompListSpec name-"syllabification" datcatld-"IS012620A-6206"»

«contents torTermComp-"yes"/>

«/tecmCompListSpec»

«descripSpec name-"table" datcatId-"IS012620A-050504"»

«contents datatype-"plainText" targetType-"binaryData"/»

<levels»langSet termEntty tecm</levels»

«/descripSpec»

«termMoteSpec name-"temporalOualifier" dateat Id-"IS012620A-020305"»

«contents datatype-"plcklist"»archaicTerm outdatedTerm obsoleteTermx/contents» «/termMoteSpec»

«descripSpec name-"temporallyRelatedConcept" dateat Id-"IS012620A-070207"»

«contents datatype-"basicText" targetType~"entry"/>

<levels»langSet termEntry</levels»

«/descripSpec»

«termCompListSpec name-"tetmElement" datcatld-"IS012620A-020802"»

«contents £ or Те r mComp-" у es " / »

«/termCompListSpec»

«termMoteSpec name-"termLocation" datcatld-"n/a"»

«contents datatype-"plainText"/>

</termMoteSpec»

«termMoteSpec name-"termPcovenance" datcatId-"IS012620A-020401H>

«contents datatype-"picklist"»transdisciplinaryBorrowing translingualBorrowing loan-Ttanslation neologism«/contents»

«/tezmMoteSpec»

«termMoteSpec name-"termStructure" datcatld-"IS012620A-020804">

«contents datatype-"plainText" forTermComp-"yes*'/»

«/termMoteSpec»

«termMoteSpec name-"termType" datcatId-"ISOl2620A-0201"»

«contents datatype-"picklist"»abbreviation acronym clippedTerm commonName encryTerm equation formula CullPorm initlalism internationalSclentilicTerm internationalism logic-alExpression phraseologlcalUnit partKumber shortForm shortcut sku symbol synonym synon-ymousPhrase standardText string transliteratedForm transcribedForm variant «/contents»

</te rmMoteSpec >

«descripSpec name-"thesaurusDescriptor” datcatId-“IS012620A-0902">

«contents datatype-"plainText" targetType-"thesaurusOescrip"/>

<levels»termEntry</levels»

«/descripSpec»

«termMoteSpec name-"timeRestrietion" datcatld-"IS012620A-020306"»

«contents datatype-"plainText"/»

«/tezmMoteSpec»

«transacSpec name-"transactlonType" datcatId-"ISO12S2QA-1001"»

«contents datatype-"picklist"»origination input modirlcation check approval withdrawal standardization exportation importation proposal userAccess</contents» «/transacSpec»

«termMoteSpec name-"transferComment" datcatld-"IS012620A-0305"»

«contents targetType-"term"/»

«/termMoteSpec»

«descripSpec name-"unit" datcatId-"IS012620A-0506"»

«contents datatype-"plainText"/>

<levels»term</levels»

«/descripSpec»

«transacMoteSpec name-"usageCount" dateatId-"IS012620A-100203">

«contents/»

«/transacMoteSpec»

46

«termNoteSpec name-"usageNote" datcatId-"IS0l2620A-020301" <contents/>

«/termNoteSpeo

«descrlpSpec name-»"video" datcatId-"IS01262OA-0b0S03"> «contents datatype-"plainText" targetType-"binaryData"/> <levels>langSet termEntry term</levels>

«/descripspeo

«xrefSpec name»"xAudio" datcatId-"ISO12620A-0b0502"> «contents targetType-"external"/>

«/xrefSpeo

«xrefSpec name-"xGraphic" datcatId-"IS012620A-0b0b01"> «contents targetType~"extemal"/>

«/xrefSpeo

«xrefSpec name-"xMathML" datcatld-"">

«contents taEgetType-"external,V>

</xiefSpec>

«xrefSpec name»"xSoucce" datcatId-"IS012620A-1019"> «contents targetType-"external"/>

«/xrefSpeo

«xrefSpec name-"xVideo" dateatId~"IS012620A-Ob0503"> «contents targetType-"external"/>

«/xrefSpeo

</detCatSet>

<zefOb]ectDefSet>

<refObjectDef>

<refObjectType>binaryOata«/refObjectType>

«itemSpecSet type-"validltemTypes">

«itemSpec type»"validItemType">foi»at«/itemSpeo «itemSpec type-"validitera?ype“>IileName</itemSpec> «itemSpec type-"validItemType">ilieDateTime</itemSpec> «itemSpec type«”valid!temTypeB>fileAttrlbutes</itemSpeo «itemSpec type«"validIteaTypea>IileOSKame«/ieemSpeo «itemSpec type«avalldXtemType">lileOSMumber</itemSpeo «itemSpec type-"validItemType*>eodePage</itemSpeo «ItemSpec type*"validZtemType''>ftleSi2e</itemSpeo «itemSpec type-"validIce«Type">data</itemSpeo «itemSpec type»*'veiid:tem?ype">description</itemSpeo </itemspecSet>

</refObjectcef>

</refObjectbefSet>

</TBXXCS>

ГОСТ Р ИСО 30042—2016

Приложение D (обязательное)

Описания основных элементов структуры и признаков и категорий данных по умолчанию

D.1 Общая информация приложения об описаниях

Это приложение содержит описание основной структуры ТВХ, которая определена в приложении А. и метаданных по умотанию — категории, которые определены 8 приложении С. Описаны три типа конструкций XML: macros макрос

Описывает типы данных и группы элементов, которые испотъзуются в многократных декларациях элемента. Эта секция также соответствует некоторым предприятиям в основной ОТО. attribute classes классы признака

Описывает отдельные признаки и группы признаков, которые используются в многократных декларациях элемента. Если признак используется одним элементом, то указывается его местоположение. Эта секция также соответствует некоторым предприятиям в основной ОТО. elements элементы

Описывает элементы ТВХ и их признаки.

Примечание — Длительность type признака типа, которая используется в ТВХ TML описана в приложении С.

Следующая таблица дает характеристики части описаний и способы их прочтения.

Участники

Элементы, использование классов признака, признак, описанный класс

Признаки

Признаки и классы признака, которые допустимы для элемента, или описанный класс, который в настоящее время определяется. По ссылке с декларацией класса признака идут названия признаков в данном классе (обозначенный после символ, который является понижением представления NG). Если признак уникален для элемента или класса признака, который в настоящее время определяется, его декларация предоставлена непосредственно. Признак может быть дополнительным либо необходимым.

Примечание — содержание элемента может быть ограничено к разворачивающемуся списку, когда у элемента есть определенные ценности его признака типа. Значения ценностей разворачивающегося списка не определены в настоящем стандарте. Чтобы получить информацию о значении ценностей разворачивающегося списка, обратитесь к ISO 12620.

Используемый

Элементы или группы элементов, которые могут содержать описанный элемент.

Мажет содержать

Элементы или типы данных, которые могут произойти в описанном элементе. Этот род указывает на модель содержания по умолчанию категории метаданных. Например, в случае <descrip> этот род указывает, что можно использовать элементы <tii>. <bpt>, <epl> и т. д. Однако модеть содержания по умолчанию может быть далее ограничена ценностью признака типа элемента. Если у <descrip> элемента есть значение атрибута типа 'диапазон', ни один из вышеупомянутых элементов не разрешен. Любые такие дополнительные ограничения обозначены в описании категории данных.

Примечание — Эта секция не указывает, какие элементы обязательны, а какие являются дополнительными. Для этой информации необходимо воспользоваться ОТО (приложение А) или интегрированной схемой RelaxNG (приложение F).

48

ГОСТ Р ИСО 30042—2016

D.2 Макрос entity.auxfnfo

auxlnfo предприятие соответствует информации, которая может быть связана с любым из трех уровней: терминологический первый уровень (<termentry>) (т. в. уровень понятия), языковой уровень (<langset>) и уровень термина {<ntig> иш его упрошенная версия <tig>).

entity.basicText

Основной текст используется для условий и подобных термину элементе», а также нескольких других элементов. Включает обычный текст плюс <М> для некоторого ограничения действующего повышения.

entity.noteText

Определяет текст, который используется в определениях, контекстных примерах и подобных элементах, позволяет больше действующего повышения, чем basicText.

entity.noteLinklnfo

Эго предприятие элементов групп для административной информации, примечаний и связей. Используется следующими элементами группировки: <termcompgrp>. <termnotegrp> и <itemgrp>.

D.3 Классы признака id

Идентификационный класс признака соответствует /etementldentifier/ в ИСО 12620:1999. Он указывает на уникальный идентификатор элемента. Идентификаторы элемента могут включать идентификаторы входа <etd-...). идентификаторы понятия (cid-...). идентификаторы термина <tid-...). Этот признак является дополнительным.

Участники IDLangTgtOtyp [ admin adminNote descrip descripNote ref termNote Iransac transacNote] idlang [ change note revisionDesc sourceOesc termComp title titieStmt] idtype [ item rtemSet] adminGrp back body date descripGrp enoodingDesc ffleDesc foreign itemGrp martifHeader ntig p publicationstmt refObject refObyectList term termCompGrp termCompList termEntry termGrp termNoteGrp text tig transacGrp xref Признаки @td

Статус Дополнительный Тип данных xsd:ID

idlang

Класс признаха idlang объединяет идентификационный признак и признак xmhlang. Оба дополнительные для элементов, которые используют этот класс признака.

Участники change note revisionDesc sourceDesc termComo title titleStml Признаки id (fi?id) tana <@xml:lanol

IDLangTgtOtyp

Класс IDLangTgtOtyp признака группируется id признаков, xmklang, цель и тип данных.

Участники admin adminNote descrip descripNote ref termNote transac transacNole Признаки lanq f@xml:lanq) jd_(@*d) tarqet-tDREF (@taroet)

©datatype

Тип данных обычного текста или PC.

Статус Дополнительный Тип данных Текст

idtype

Класс признака idtype объединяет идентификационный признак и признак типа. Оба дополнительные для элементов, которые используют этот класс признака.

Участники item rtemSet Признаки id (@id)

©type

Указывает на тип категории метаданных.

Статус Дополнительный Тип данных Текст

lang

Класс признака lang соответствует признаку xmhlang.

Участиики IDLangTgtOtyp ( admin adminNote descrip descripNote ref termNote transac transacNote] idlang [ change note revisionDesc sourceOesc termComp title titteStmt] foreign hi p

49

ГОСТ Р ИСО 30042—2016

Признаки @xm1:tang

Указывает на язык содержания элемента. Позволенные ценности указаны a IETF RFC 4646. Этот признак дополнительный для элементов, которые используют этот класс признака.

Статус Дополнительный Тип данных Текст

target-IDREF

Класс признака Цвлевой-IDREF соответствует целевому признаку, который является указателем на другой элемент. Связь установлена, когда ценность целевого признака исходного элемента совпадает с ценностью xmt:id признака целевого элемента. Когда этот признак используется с <termnote>. то целью является другой термин, поскольку в признаке <termnote =’abbreviatedFormFor* цель="П(М234“>. Содержанием элементов. которые берут этот признак, является ценность показа целевого элемента, такого как целевой термин. Элементы, которые берут этот признак, не могут быть пустыми, содержание показа обязательно. В отношении принципа автономии термина, который содержится в этом элементе, должен быть свой собственный вход в сборе данных.

Участники IDLangTgtDtyp [ admin adminNote descrip descripNote ref termNote transac transacNote] hi Признаки @target

Статус Дополнительный Тил данных xsd:IDREF

D.4 Элементы <admin>

Содержит информацию административного характера для узла рассматриваемый {исходный элемент), такой как источник информации, или проект, или клиент, для которого это применяется. Тип административной информации обозначен ценностью признака типа.

Признаки IDLangTgtDtyp [(©datatype) tang (@xml;lang) id (@id) target-IDREF (©target)!

@type

Указывает на тип категории данных <admin> элемента, такого xatforiginatingDatabase/nnH/entrySource/. Статус Необходимый

Используемый adminGrp descnpGro entftv.aoxlnfo entitv.noteUnklnfo Может содержать bpt eot foreion hi oh

<adminGrp>

Элемент, который содержит группу элементов с административной информацией.

Признаки id (®id)

Используемый desaioGrp entitv.auxlnfo enbtv.noteUnktnfo Может содержать admin adminNote note ref xref

<adminNote>

Административное примечание о некоторых данных. Этот элемент используется для определения типа исходного текста, в котором был найден термин. Дополнительные значения атрибута типа могут быть определены в дополнительных целях в определенном для пользователя файле XCS.

Признаки IDLanoTotDtyp K@datatvoe) tang_(@xml:lang) id f@idl taroet-IDREF (@taraetil ©type

Статус Необходимый Используемый adminGrp Может содержать Данные о характере

<back>

Элемент корня аппарата случая документа ТВХ.

Признаки id (@id)

Используемый text Может содержать refObjectLisl

<body>

Элемент, который содержит терминологические записи {<termen1ry>).

Признаки id (@id)

Используемый text Может содержать termEntrv

50

ГОСТ Р ИСО 30042—2016

<bpt>

<bpl> признак прилагает начинающийся признак пары.

Признаки @i'

Статус Дополнительный Тип данных Текст

©type

Статус Дополнительный Тип данных Текст Используемый entitv.noteText Может содержать Данные о характере

<change>

Информация об одном особом событии изменения в истории пересмотра случая документа ТВХ.

Признаки itflang lid (@idi lano (@xml:lang }|

Используемый revistonDesc Может содержать £

<date>

Дата 8 формате ISO. Допустимые ценности даты по ISO 8601 с использованием формат yyyy-mm-dd. Элемент даты используется с управленческими категориями данных терминологии в <transacGrp> элементе. Признаки id «Sid)

Используемый transacGrp

Может содержать Данные о характере

<descrip>

Элемент, который содержит описательную информацию о понятии или отношения к другим понятиям. Тип информации, которую содержит элемент о любых ограничениях на допустимые ценности элемента, определен ценностью признака типа.

Признаки IDLanoTotOtyp K@datatvpe) lang_(@xml;lang) id (@id> laroet-IDREF (@taraetll ©type

Указывает на тип категории данных <descrip> элемента, такого как определение или связанное понятие.

Статус Необходимый Используемый descrioGrp entitv.auxlnfo Может содержать bot eot foreign hi oh

<descripGrp>

Содержит один <descrip> элемент, а также дополнительные элементы для административной информации. Признаки id (@id)

Используемый entitv.auxlnfo

Может содержать admin adminGro descno descrioNote note ref IransacGro xref <descripNote>

Элемент указывает на тип определения или контекста.

Признаки IDLanoTotOtyp N@datatvpe> tang_(@xml:lang) id f@idl taraet-IDREF f@taraehl ©type

Указывает тип данных категории элемента <descnpNote>. такие как ’contextType'.

Статус Необходимый Используемый descrioGrp Может содержать Данные о характере

<encodingDesc>

Содержит <р> элемент, который сам включает указатель на файл XCS или вложенный файл XCS. если файл ТВХ не находится в Unicode.

Признаки id (@id)

Используемый mertHHeader Может содержать £

<ept>

<ept> признак прилагает начинающийся признак пары признака.

51

ГОСТ Р ИСО 30042—2016

Признаки @/

Статус Дополнительный Тип данных Текст Используемый entitv.noteText Может содержать Данные о характере

<fileDesc>

Элемент, содержащий элементы, которые описывают случай документа ТВХ.

Признаки id_(@id)

Используемый marMHeader

Может содержать pubiicaUonStmt sourceOesc titteStmt <foreign>

Используется, чтобы отметить сегменты текста на разных языках.

Признаки itflano lid (@id) lano (@xmi:lano1l Используемый entrtv.noteText Может содержать but eot (oreion hi oh

<hi>

Выдвигает на первый план сегмент текста и произвольно указывает на другой элемент.

Признаки taroet-IDREF ft@taroeO lano f@xml:lanol1 ©type

Используемый entitv.basicText entitv.noteText Может содержать Данные о характере

<item>

Описатель объекта в аппарате случая документа ТВХ.

Признаки idtvpe K<S)lvoe> jd_(@»d)]

Используемый itemGrp itemSet refObiect Может содержать bpt eot foreion hi oh

<itemGrp>

Содержит один <item> элемент, а также дополнительные элементы для связанной административной информации.

Признаки id (@id)

Используемый itemSet refObiect

Может содержать admin adminGrp item note ref transacGrp xref <itemSet>

Список <item> или <itemGrp>.

Признаки idtvpe ff@tvpel jd_(@*d)]

Используемый refObiect Может содержать item itemGrp

<langSet>

Элеменг. который содержит информацию в терминологическом входе, имеющем отношение к одному языку, включая <tig> или <ntig> элементы (условия и связанная информация).

Признаки @xml:iang

Указывает на язьк языковой секции. Этот признак требуется для <langset> элемента. См. также описание на <таг1И> элементе.

Статус Необходимый Тип данных Текст Используемый termEntrv

Может содержать admin adminGrp descno descnoGrp note ntio ref tio transacGrp xref <martif>

Элемент корня случая документа ТВХ.

Признаки @xml:lang

Указывает на язык <martif> элемента. Позволенные ценности признака xmlrlang приведены в IETF RFC 4646. о чем указано в IETF ВСР 47. Этот признак требуется для <martif> элемента.

Статус Необходимый

52

ГОСТ Р ИСО 30042—2016

Тип данных Текст ©type

Указывает на тип martif документа. Если будет использоваться значение атрибута типа ТВХ\ то случай документа ТВХ должен придерживаться XCS. Если случай документа ТВХ придерживается другого файла XCS. то значение атрибута типа может состоять из ТВХ-1 плюс другое слово, связанное с файлом XCS. например, 'TBX-Basic'. Статус Необходимый Тип данных Текст Используемый nfa Может содержать martifHeadef text

<martifHeader>

Группирующийся элемент, содержащий базовые элементы, которые описывают случай документа ТВХ. Признаки id <@id)

Используемый martf

Может содержать encodinoDesc fitePesc revisionPesc

<note>

Любой вид.

Признаки kgano fid (@idi lano (@xml:lano)l

Используемый adminGrp descripGrp trtteStmt transacGrp entity.auxlnfo entrty.ootebnkinfo Может содержать bot eol torsion hi oh

<ntig>

Группа информации о термине. Группирующийся элемент, который содержит элементы, описывающие термин. Эквивалентен <tig>, за исключением описания компонентов термина.

Признаки id (@id)

Используемый tengSet

Может содержать admin adminGrp descrio descrioGro note ret temiGro transacGrp xref

<p>

Текст параграфа, который содержит <mar1ifheader>. При помощи признака типа может также содержать информацию о содержании или местоположении файла XCS.

Признаки itflana {id (@id> lano (@xml:lanol1 ©type

encodingDesc:

•    XCSURI — URI файла XCS. который ограничивает содержание случая документа ТВХ.

•    DCSName — Название файла XCS. который ограничивает содержание случая документа ТВХ.

- XCSContenl — Содержание файла XCS. включенного непосредственно в случай документа ТВХ. Используемый change encodinoDesc oublicabonStml sourceOesc Может содержать bpt eot torsion hi oh

<ph>

Заполнитель. используемый для капсулирования кодексов повышения, которые не проходят в логических парах с другими кодексами. Примеры включают XHTML <br/> и <hr/> признаки. Этот элемент не должен капсули-ровагь кодексы, которые проходят 8 ларах {таких как XHTML <em> и </em> признаки) и должен быть сформирован с <bpt> и <epl>.

Признаки ©type

Статус Дополнительный Тип данных Текст Используемый entitv.noteText Может содержать Данные о характере

<publicationStmt>

Любая информация, имеющая отношение к пубткации случая документа ТВХ.

Признаки id (@id)

Используемый fitePesc Может содержать £

<ref>

Перекрестная ссылка, которая указывает на другой элемент в пределах <martif> элемента случая документа ТВХ. Содержание элемента — текст показа целевого элемента (т. е. термин).

53

ГОСТ Р ИСО 30042—2016

Признаки IDLanoTolPtyp K@datalvpei lang_(@xml:lang) id (@idi tarael-IDREF 1@1агоеП1 ©type

Статус Необходимый

Используемый adminGrp descripGro transacGro entitv.auxlnfo entitv.notaLjnklnfo Может содержать Данные о характере

«refObject>

Элемент а аппарате случая документа ТВХ. который содержат серию пунктов со ссылкой на объект. Признаки id (@id)

Используемый refObiectList Может содержать item itemGro itemSet

«refObjectList>

Список объектов, на которые ссылаются а аппарате случая документа ТВХ.

Признаки id (@id)

©type

Статус Необходимый Тип данных Текст Используемый back Может содержать refObject

«revision Desc>

Информация о любых пересмотрах, которые были выполнены на содержании случая документа ТВХ или на исходной базе данных.

Признаки itftana lid (@idi lano (@хт!:1апоЯ Используемый martifHeader Может содержать change

«source Desc>

Информация об источнике случая документа ТВХ.

Признаки itflano lid (@idi lano (@xml:lano)l Используемый fileDesc Может содержать £

<term>

Термин, который описывается в <Ug> или <ntig>. Этот элемент, а также другие подобные термину элементы. такие как упомянутые в таблице типы условий и отношений к условиям в разделе 9. может содержать «Ы> элемент, чтобы позволить ограниченную сумму действующего повышения. Это дает возможность обращаться с требованиями повышения в особых случаях и условиях, например, в случае научных понятий. Рекомендуется использовать действующее повышение только при необходимости, чтобы представлять термин в его основной форме. Не допускается использовать <hi> элемент для представляемых стилей, выбранных в эстетических целях.

Признаки id (@id)

Используемый termGro bo Может содержать Ы

«termComp>

Компонент термина. Включает текст части слова (такого как морфема или слог) или одно из слое, составляющих термин. Тип компонента термина будет зависеть от ценности признака типа <termComplist> элемент. Признаки idtong fid (®idl lano (@xml :lar>g)]

Используемый termComoGro termComoList Может содержать Данные о характере

«termCompGrp>

Группирующийся элемент, который включает один <termComp> плюс дополнительные элементы, описывающие компоненты термина, такие как примечания, административная информация и перекрестные ссылки. Признаки id <@id)

Используемый termComoList

Может содержать admin admmGro note ref termComo termNole termNoieGrp transacGro xref

54

ГОСТ Р ИСО 30042—2016

<termCompList>

Группирующийся элемент-, который содержит по крайней мере один <termcomp> элемент {обычно больше) или по крайней мере один <termcompgrp> элемент плюс произвольно дополнительную информацию о компонентах термина. Этот элемент разработан, чтобы содержать компоненты термина.

Признаки id (@id)

©type

Указывает на тип <termComplist> как на автоперенос. Стоимость указывает, на каком основании компоненты термина были определены, как авгопервнос частями или слогами.

Статус Необходимый Используемый termGro

Может содержать admin adnvnGro descno descnoGro note ref termComo lermComoGro transacGrp xref <termEntry>

Элемент корня терминологического входа. Должен содержать по крайней мере одну языковую секцию. Признаки id (@id)

Используемый body

Может содержать admin admmGro descno descnoGro tanaSet note ref transacGrp xref <termGrp>

Элемент используется в <ntig>. который содержит один <term> и дополнигвгъную информацию о термине. Этот элемент прежде всего используется вместе с <ntig>. когда термин разделен на компоненты.

Признаки id (@id)

Используемый ntio

Может содержать term termComoList lermNole termNoteGro <tennNote>

Категория метаданных используется для описания условий. Признак тлила определяет, какая информация включена в особый случай этого элемента.

Признаки IDLanoTolDlvo K@datatvoel tano <fi?xml:lanol id (@idl taroet-IDREF {@taroehl ©type

Указывает на тип категории данных <termNote>. такой как partOfSpeech или termType.

Статус Необходимый

Используемый termComoGrp termGro termNoteGrp tki Может содержать bot eot foreion hi oh

<termNoteGrp>

Группирующийся элемент, который содержит один <termNote> элемент и вспомогательную информацию, такую как административная информация, информация о сделке, примечания и перекрестные ссыгки.

Признаки jd.(@id)

Используемый termComoGrp termGro

Может содержать admin admmGro note ref termNote transacGrp xref <text>

Элемент случая документа TBX, который происходит после martif элемента. Этот элемент обеспечивает поддержку совместимости с TEI.

Признаки id (@id)

Используемый martrf Может содержать back body

<tig>

Группа информации о термине. Группирующийся элемент, который содержит элементы, описывающие термин. Часто упоминается как термин секция, если секция включает информацию о компонентах термина (таких как морфология) или отдельные слова термина.

Признаки id (@id)

Используемый lanaSel

Может содержать admin admmGro descno descnoGro note ref term lermNote transacGrp xref <title>

Название случая документа TBX Признаки itflana fid (@idi lano (@xmt:lar>g)|

Используемый header titleStml Может содержать Данные о характере

55

ГОСТ Р ИСО 30042—2016

<trtieStmt>

Элемент, содержащий название и любые примечания о случае документа ТВХ.

Признаки itflano lid (@id> lano (@xml:lano>l Используемый fileDesc Может содержать note title

<transac>

Отчет, который указывает на стадию входа в рамках полного процесса создания, одобрения и использования входа терминологии. В настоящее время этот элемент только используется, чтобы определить тип сделки, и поэтому только одна стоимость в настоящее время определяется для признака типа. Однако дополнительные значения атрибута типа могут быть определены в дополнительных цепях в определенном для пользователя файле XCS.

Признаки IDLanoTotDtvo lf@datatvpel tang_(@xml;lang) id f@idl taraet-IDREF (@taraehl ©type

Значение атрибута transacbonType гарантирует, что содержание <transac> элемента будет операционным типом.

Статус Необходимый Используемый transacGrp Может содержать Данные о характере

<transacGrp>

Элемент, который включает элементы, содержащие информацию о сделке.

Признаки id (@id)

Используемый descrioGro entitv.aoxlnfo entitv.noteLinktnfo Может содержать date note ref transac IransacNote xraf

<transacNote>

Информация о сделке, такая как имя человека, который выполнил сделку. Содержание этого элемента должно быть обычным текстом.

Признаки IDLanoTotOtvo K@datatvoel tang_(@xml:lang) id (@id) taraet-IDREF (@taroeDl ©type

Статус Необходимый Используемый transacGrp Может содержать Денные о характере

<xref>

Связывающийся элемент, который указывает на внешний объект, используя UR! (URL или другой веб-адрес). Целевой признак требуется. Содержание элемента — текст показа, представляющий целевой объект, такой как название, имя файла или краткое описание.

Признаки jd.(@id)

@ target

URi внешнего объекта.

Статус Необходимый Тип данных Текст

Примечание — В отличие от целевых признаков на большинстве элементов ТВХ. которые указывают на другие элементы в ТВХ XML случай документа (следовательно, у них есть тип данных iDREF}, целевой признак <xref> элемента указывает вне документа ТВХ, по-видимому к объектам, определенным URts. Тип данных целевого признака для <xref> элемента определен как CDATA.

©type

Статус Дополнительный

Используемый adminGrp descripGm transacGrp entity auxtnfo entity noteLinktnfo Может содержать Данные о характере

D.5 Категории данных по умолчанию

Определения категории данных в этой секции получены из ISO 12620. Они сгруппированы согласно категории метаданных, с которой они иллюстрируются примерами через ценность типа категории метаданных. Например, для признака <descrip ne4aTators"definition">. категория данных /definition/ описана в descrip секции.

56

ГОСТ Р ИСО 30042—2016

admin

annotatedNote

Примечание, которое может быть вместе с <adminnote> элементом, чтобы указать на источник примечания или другой административной информации о примечании. Если никакой источник или дополнительная информация о примечании не требуются, используйте <note> элемент.

applicationSubset

Идентификатор, который указывает, что исходный элемент, к которому он применяется, связан с определенным применением. Содержание должно быть в обычном тексте.

businessUnitSubset

Идентификатор, который указывает, что исходный элемент, к которому он применяется, связан с определенным отделом, подразделением или друтим отделением предприятия. Содержание должно быть е обычном тексте.

conceptOrigin

Учреждение, область, сообщество, культура, страна или другое место проведения, из которого происходит понятие, покрытое терминологическим входом. Поскольку эта категория данных предоставляет информацию о происхождении понятия, это должно произойти на <termentry> уровне. Содержание должно быть 8 обычном тексте.

customerSubset

Идентификатор, который указывает, что исходный элемент, к которому он применяется, связан с определенным клиентом. Содержание должно быть в обычном тексте.

databaseType

Идентификатор, который указывает на тип базы данных, из которой произошел исходный элемент. Этот элемент должен обычно происходить на <termentry> уровне, все записи происходят или импортированы из другой базы данных. Содержание должно быть в обычном тексте.

domainExpert

Специалист по предметной области, который предоставляет информацию для терминологического входа, такого как определение или эквивалентный выходной язык. У <admin> элемента, у которого есть значение атрибута типа 'йотаюЕхрег?. может также быть целевой признак, указывающий на идентификатор справочного входа в аппарате случая документа ТВХ. который предоставляет информацию об эксперте по области. Содержание должно быть в обычном тексте.

elamentWorkingStatus

Стоимость, указывающая на уровень полноты и точность элемента (область, отчет, вход) в пределах терминологической коллекции. Элемент <admm>. когда у его признака типа будет стоимость ’eiementWorfungStatus'. должен содержать одну из следующих ценностей:

-    starterElement

•    workingElement

•    consoiidatedElement

-    archiveElement

•    importedEiement

•    exportedElement

entrySource

База данных или файл, из которого был импортирован вход. Содержание должно быть в обычном тексте.

environmentSubset

Идентификатор, который указывает на определенную компьютерную окружающую среду, с которой связан исходный элемент. Содержание должно быть а обычном тексте.

indexHeading

Термин, выбранный, чтобы использоваться а индексе, чтобы представлять пункт или понятие в документе. Содержание должно быть а обычном тексте.

keyword

Слово или группа слое, возможно 8 лексикографически стандартизированной (temmatized) форме, вынутые из текста документа, который характеризует текст и позволяет его поиск. Например, категория данных условий

57

ГОСТ Р ИСО 30042—2016

и терминологический вход — ключевые слова для этого международного стандарта. В терминологической базе данных, которая содержит терминологию ISO 30042. они мог гы быть идентифицированы как ключевые слова при помощи этого элемента. Содержание должно быть в обычном тексте.

originating Database

База данных, из которой произошел исходный элемент. Содержание должно быть в обычном тексте.

originatinglnstitution

Учреждение (т. е. компания, правительственное учреждение и т. д.), которое предоставило информацию 8 исходном элементе. Содержание должно быть в обычном тексте.

originatingPerson

Человек, который предоставил информацию в исходном элементе. Содержание должно быть в обычном тексте.

productSubset

Идентификатор поручил на термин, отчет или вход указывать, что эго связывается с или используется в продукте. Содержание должно быть в обычном тексте и предпочтительно в одном из предопределенного набора ценностей разворачивающегося списка.

projectSubset

Идентификатор поручил на термин, отчет или вход указывать, что эго связывается с или используется в проекте. Содержание должно быть в обычном тексте и предпочтительно в одном из предопределенного набора ценностей разворачивающегося списка.

searchTerm

Термин вошел во вход термина в целях поиска. Содержание должно быть в обычном тексте.

securitySubset

Классификация термина, отчета или входа, указывающего, что его распределение ограничено из соображений безопасности. Иногда условия не опубликованы пока материал, который использует термин (продукт, обслуживание и т. д.) выпущен для общественности. До того времени этот элемент служит, чтобы защитить данные от распределения. Элемент <admin>, когда у его признака типа будет стоимость 'securitySubset1. должен содержать одну из следующих цетостей:

-    общественность;

• конфиденциальный.

sortKey

Строка символов используется для сортировки и слияния операций. Ключ вида может позволить алфавитный или систематический доступ. Содержание должно быть в обычном тексте.

source

Полная цитата источника информации в исходном элементе.

sourceldentifier

Указатель на библиографический вход, который содержит информацию об источнике исходного элемента. У <admin> элемента, у которого есть значение атрибута типа 'sourcetdentilier', также есть целевой признак, содержащий идентификатор библиографического входа. Содержание элемента — стоимость показа для источника.

subsefOwner

Владелец подмножества терминологических записей, которым принадлежит этот вход. Содержание должно быть в обычном тексте.

adminNote

sourceType

Собственность, описывающая исходный текст, т. е. является ли это фактическим параллельным текстом (текст, который эквивалентен тексту на другом языке) или справочный материал. Содержание <adminNote> элемента. когда он имеет значение атрибута типа 'sourceType*. должно быть одним из следующих:

-    parailelText

-    backgroundText

58

ГОСТ Р ИСО 30042—2016

noteSource

Источник примечания, которое выражено в <admin> элементе, имеющем значение атрибута типа 'annotatedNote'.

descrip

antonymConcept

Понятие, которое противоположно в значении понятию, представленному входом, содержащим <descrip> элемент. А у элемента <descnp>. у которого есть значение атрибута типа 'antonymConcept*. мажет быть целевой признак, указывающий на Ю входа <termentry>. который содержит понятие антонима. Срок показа в содержании элемента должен быть выражен в basicText.

associatedConcept

Понятие, которое показывает отношение к подчиненному понятию, которое может быть установлено на основе неиерархических тематических связей. У <descrip> элемента, у которого есть значение атрибута типа 'associatedConcept'. может также быть целевой признак, указывающий на ID входа <termentry>, который содержит связанное понятие. Например, учитель и школа представляют связанные понятия.

audio

Имя или другой идентификатор аудиофайла: звук, произносимые слова, музыка или другие слышимые представления раньше иллюстрировали или объясняли условия или понятия. У <descrip> элемента, у которого есть значение атрибута типа 'аудио*, может также быть целевой признак, указывающий на ID <refobject> в аппарате случая документа ТВХ. который описывает и указывает на аудиофайл. Содержание элемента должно быть в обычном тексте.

broaderConceptGeneric

Понятие двух или более уровней абстракции выше, чем подчиненное понятие в универсальной иерархической системе понятия. А у элемента <descrip>. у которого есть значение атрибута типа 'broaderConceptGeoeric*. может также быть целевой признак, указывающий на ID входа <termentry>. который содержит более широкое понятие. Универсальные отношения между понятиями. «-» отношения. Это означает, что более узкое понятие «является» случаем своего более широкого универсального понятия.

broaderConceptPartitive

Понятие уровня абстракции выше, чем подчиненное понятие в частично целой или meronyrnc иерархической системе понятия. У <descrip> элемента, у которого есть значение атрибута типа *broaderConceptPartitive*. может также быть целевой признак, указывающий на 1D входа <termentry>. который содержит более широкое понятие. Например, половица — часть дома (более широкое разделительное понятие), но это может быть более узко определено как являющийся честью пола (суперордината разделительное понятие).

characteristic

Абстракция собственности объекта или ряда объектов. Например, воспламеняемость — особенность топлива. Существенные особенности могут использоваться, чтобы определить понятия. Содержание элемента должно быть в обычном тексте.

classificationCode

Ряд символов с правилами для их применения, используемого, чтобы представлять классы и их взаимосвязи. <descrip> у элемента, у которого есть значение атрибута типа 'classificalonCode'. мажет также быть целевой признак, указывающий на ID библиографического <refobject> в аппарате, описывающем гриф секретности. Содержание элемента должно быть в обычном тексте.

conceptPosition

Положение понятия е системе понятия. У <descrip> элемента, у которого есть значение атрибута типа ‘conoeptPosibon'. может также быть целевой признак, указывающий на ID положения в системе понятия. Содержание элемента должно быть в обычном тексте.

context

Текст, который иллюстрирует понятие или термин, содержа само обозначение понятия. Контексты должны быть подлинными, т. е. они должны быть получены из существующего источника и не созданы терминологом. Контексты документируются очень часто в коллекциях терминологии. Контексты могут предоставить информацию для определения использования термина и словосочетаний. В ТВХ контекст как связанная с термином категория данных. Контекст может быть далее категоризирован согласно типу контекста.

59

ГОСТ Р ИСО 30042—2016

coordinateConceptGerwric

Понятие, имеющее то же самое самое близкое понятие суперордкнагы. как понятие, описываемое этим <descrip> элементом в универсальной системе понятия. У <descrip> элемента, у которого есть значение атрибута типа 'coordinateConceptGeneric'. может также быть целевой признак, указывающий на IO координационного понятия.

coordinateConceptPaiiitive

Понятие, имеющее то же самое самое близкое понятие супврординэты как понятие, описываемое этим <descrip> элементом 8 разделительной системе понятия. У <descrip> элемента, у которого есть значение атрибута типа 'ooocdinateConceptPartibve'. может также быть целевой признак, указывающий на ID координационного понятия.

definition

Представление понятия описательным заявлением, которое служит, чтобы дифференцировать то понятие от связанных понятий.

example

Текст, который иллюстрирует понятие или термин, обеспечивая пример объекта, определяемого понятием или термином, и не обязательно содержащий само обозначение понятия. Некоторые базы данных используют пример е качестве этикетки для контекстных справок. Содержание категорий данных должно быть преобразовано в контекст категории данных в целях обмена.

explanation

Заявление, которое описывает и разъясняет понятие и делает его понятным, но не обязательно дифференцирует его от других понятий.

figure

Имя или другое описание диаграммы, картины или другого графического материала раньше иллюстрировали понятие или труппу понятий. У <descrip> элемента, у которого есть значение атрибута типа 'числа*, также может быть целевой признак, указывающий на ID <refobject> в аппарате случая документа ТВХ. который описывает и указывает на файл, который содержит число. Содержание элемента должно быть е обычном тексте.

otherBinaryData

Любые двоичные датые. не покрытые числом категорий, аудио, видео. У <descrip> элемента, у которого есть значение атрибута типа 'olherSinaryOata'. может также быть целевой признак, указывающий на ID <refobjecl> в аппарате случая документа ТВХ. который указывает на бинаршй файл. Содержание элемента должно быть е обычном тексте.

quantity

Измеримое количество, связаное с понятием. Содержание элемента должно быть е обычном тексте.

range

Пара пределов, которые измерены количественно. Содержание элемента должно быть е обычном тексте.

relatedConcept

Понятие, у которого есть ассоциативное отношение к другому понятию, такому как 'учитель' и 'школа*. У <descrip> элемента, у которого есть значение атрибута типа 'relatedConcept'. может также быть целевой признак, указывающий на идентификатор входа связанного понятия.

relatedConceptBroader

Понятие, которое более широко относительно связанного понятия, но не включает ссылки на универсальную или разделительную систему. У <descrip> элемента, у которого есть значение атрибута типа 'relatedConceptBroader'. может также быть целевой признак, указывающий на идентификатор входа связанного понятия.

relatedConceptNarrower

Понятие, которое является более узким на некотором уровне относительно связанного понятия, но не включая осыпки на универсальную или разделительную систему. У <descrip> элемента, у которого есть значение атрибута типа ‘relatedConceptNarrower’. может также быть целевой признак, указывающий на идентификатор входа связанного понятия.

reliabilityCode

Кодекс, назначенный на категорию данных или рекордную точность указания и/или полноту. Содержание <descrip> элемента, имеющего значение атрибута типа 'reliabilityCode'. должно быть стоимостью от 1 (наименее надежный) к 10 (самый надежный).

60

ГОСТ Р ИСО 30042—2016

sampieSentertce

Предложение, иллюстрирующее использование термина в случаях, где подлинный контекст недоступен. Хотя контекстная информация должна быть взята из фактических текстов, написанных на рассматриваемом языке. такие контекстные ссылки могут не существовать для недавно введенных или предложенных терминов.

sequentialtyRelatedConcept

Понятие, у которого есть отношение к подчиненному понятию, основанному на пространственной или временной близости. Временные отношения и пространственные отношения могут быть последовательными. У <descrip> элемента, у которого есть значение атрибута типа 'sequentiallyRetatedConcept'. может также быть целевой признак, указывающий на идентификатор входа связанного понятия.

spatiallyRelatedConcept

Понятие, у которого есть отношение зависимости с подчиненным понятием. У <descrip> элемента, у которого есть значение атрибута типа 'spatiallyRelatedConcept'. может также быть целевой признак, указывающий на идентификатор входа связанного понятия.

subjectField

Область специальных знаний. Предметные области могут быть выражены на многократных уровнях, например: предметная область (уровень 1): болезнь: предметная область (уровень 2): рак: предметная область (уровень 3): неходжкинская лимфома. Предметные области должны быть выражены в обычном тексте и предпочтигегьно выбраны из определенного набора ценностей разворачивающегося списка. Предметные области должны быть определены в понятии (termEntry).

suborxiinateConceptGeneric

Понятие, у которого есть универсальное отношение с подчиненным понятием и более широкое усилие. У <descrip> элемента, у которого есть значение атрибута типа ‘subordinateConceptGeneric’. может также быть целевой признак, указывающий на идентификатор входа зависимого понятия.

subordinateConceptPartitive

Понятие, хоторое имеет разделительное отношение с подчиненным понятием и представляет одну из частей подчиненного понятия. У <descrip> элемента, у которого есть значение атрибута типа 'subordinateConceptParlitive'. может также быть целевой признак, указывающий на идентификатор входа зависимого понятия.

superordinataConceptGeneric

Понятие, у которого есть универсальное отношение с подчиненным понятием и более узкое усигые. У <descrip> элемента, у которого есть значение атрибута типа 'superordinateConceptGenenc'. может также быть целевой признак, указывающий на идентификатор входа понятия сулероодинаты.

superordinatBConceptPartitiv*

Понятие, которое имеет разделительное отношение с подчиненным понятием и представляет сумму частей: всестороннее понятие. У <descrip> элемента, у которого есть значение атрибута типа 'superordinaleConceptPartiti ve'. может также быть целевой признак, указывающий на идентификатор входа понятия сулероодинаты.

table

Название таблицы, которая используется, чтобы описать понятие в <refobject> в аппарате случая документа ТВХ. Целевой признак указывает на <refobject> идентификатор. Содержание элемента должно быть в обычном тексте.

Примечание — Необходимо использовать <хге(>.

temporatlyRetatodConcept

Понятие, имеющее отношение к подчиненному понятию через последовательное отношение, включающее время события. У <descrip> элемента, у которого есть значение атрибута типа 'temporailyRelatedConcept'. может также быть целевой признак, указывающий на идентификатор входа связанного понятия.

thesaurusDascriptw

Термин в тезаурусе, который может использоваться, чтобы представлять понятие в терминологическом входе. У <descrip> элемента, у которого есть значение атрибута типа IhesaurusOescriptor’. может также быть целевой признак, указывающий на ID <refobject> в аппарате случая документа ТВХ. который описывает тезаурус. Содержание элемента должно быть в обычном тексте.

Примечание — Необходимо использовать <xref>.

61

ГОСТ Р ИСО 30042—2016

unit

Точно определенное количество. Содержание элемента должно быть в обычном тексте, video

Имя или другое описание зарегистрированных визуальных изображений раньше представляли или иллюстрировали терминологическую информацию. У <descrip> элемента, у которого есть значение атрибута типа Video', может также быть целевой признак, указывающий на ID <refobject> в аппарате случая документа ТВХ. который описывает и указывает на видеофайл. Содержание элемента должно быть в обычном тексте.

Примечание — Необходимо использовать <xref>.

descripNote

contextType

Характеристика контекста согласно ряду теоретических или прагматических типов. Содержание <descripNote> элемента, имеющего значение атрибута типа 'contextType'. должно быть одним из следующих:

•    definingContext

-    explanatoryContext

•    associativeContext

•    linguisticContext

•    metalkigucsticContext

•    translatedContext

definition Type

Характеристика определения согласно ряду теоретических или прагматических типов. Содержание <descripnote> элемента при значении атрибута типа 'definibonType'. должно быть одним из следующих:

-    intens»onaiDefini!ion

•    extensionalDefinition

-    partitiveDefimtion

•    translatedDefinition

hi

entailedTerm

Термин, найденный в содержании текстового элемента {такой как <descrip. печатавт=’определение">). который определен в другом терминологическом входе в той же самой терминологической коллекции.

hotkey

Ключ или комбинация ключей на компьютерной клавиатуре как альтернатива использованию мыши или другого устройства ввода. Hotkeys поддержаны многими операционными системами (hotkey обозначен амперсандам в термине и подчеркиванием в визуальном показе). Этот тип <hi> элемента позволяет hotkey быть определенным 8 текстовом попе, гаком как контекст предложения. Чтобы определить hotkey для главного входа используется lionHotkey ценность признака типа <termr»ote>.

italics

Указывает, что содержание, приведенное в <hi> элементе, предоставлено курсивом. bold

Указывает, что содержание, приведенное в <Ы> элементе, предоставлено в полужирном шрифте. superscript

Указывает, что содержание, приведенное в <hi> элементе, предоставлено в суперподлиннике. subscript

Указывает, что содержание, приведенное е <№> элементе, предоставлено в приписке. math

Указывает, что содержание, прнведеююе е <hi> элементе, математическое а природе, ref

crvssReference

Указатель на другое связанное местоположение, такое как другой вход или другой термин. <ref> элемент со значением атрибута типа ‘перекрестной ссылки' будет иметь целевой признак, чтобы указать на идентификатор входа или термина.

62

ГОСТ Р ИСО 30042—2016

see

Элемент, который указывает на местоположение, где дополнительная информация может быть найдена. <ref> элемент с типом значение атрибута ‘see1, будет иметь целевой признак, чтобы указать на местоположение информации.

termCompList

hyphenation

<tenrtComp> элементы содержат части термина, написанного через дефис. lemma

<termComp> элементы содержат основную форму термина или отдельных слов. Основная форма слова или термина, иногда называемого аннотацией, является формой, которая используется в качестве формальной словарной статьи для термина. Для существительных основная форма часто номинативная исключительная форма (на языках, которые показывают изменение случаем). Для прилагательных это положительная форма прилагательного. в противоположность сравнительному, и на некоторых языках это грамматически неизменяемо, тогда как в других — мужское исключительное. Для глаголов — инфинитив.

morphoiogicalEJement

<termcomp> элементы содержат отдельные морфемы, которые включают термин. syllabification

<termcomp> элементы содержат отдельные слоги, которые включают термин. termEtement

<termcomp> элементы содержат любую другую логически значительную часть термина. termNote

abbreviatedFormFor

Связь раньше определяла отношение между термином, который является сокращенной формой и ее полной или расширенной формой. Это может быть вместе с целевым признаком, чтобы указать на вход полной или расширенной формы. Например, у термина WWW мог быть следующий признак, чтобы указать на его полную форму: <termnote ne4araioT=-abbreviatedFormFor'' target=’bd-vvor1dwidev/eb"> World W*de Web </termnote>. Фактическим содержанием элемента была бы текстовая World Wide Web. которая позволяет пользователю видеть, какой термин — полная форма текущего срока, не имея необходимость идти в местоположение полной формы в файле (местоположение обычно было бы где-нибудь в рамках текущего входа, так как сокращенная форма и полная форма представляют то же самое понятие). Содержание элемента должно быть выражено в basicText. Идентификация отношения между сокращенным термином и его полной формой указывает, какой термин в терминологическом входе — полная форма сокращенного термина. На многих языках обычно используются английские сокращения, но английской полной формы можно избежать в пользу эквивалентной полной формы на рассматриваемом языке, в этом случае анггмйское сокращение и полная форма появятся в разделе выходного языка входа.

administrativeStatus

Статус термина в пределах определенных производственных условий. Категория данных administrativeStatus должна быть связана, через целевой признак, к <refobject> в аппарате, который определяет административную организацию, которая определила статус. Элемент <termnote>. когда у его признака типа будет стоимость ’administrativeStatus'. должен содержать одну из следующих ценностей:

-    admittedTerm-admn-sts

-    deprecatedTerm-admn-sts

-    legalTerm-admn-sts

•    preferredTerm-admn-sts

-    regulatedTerm-admn-sts

-    standardizedTerm-admn-sts

•    supersededTerm-admn-sts

animacy

Особенность слова, указывающего, что в данном сообществе беседы его референт обладает качеством воли или сознания. Ценность <termnote> элемента заключается в значение атрибута типа одушевленности: живой, неодушевленный, otherAnimacy.

63

ГОСТ Р ИСО 30042—2016

antonymTerm

Термин, который определяет понятие, которое противоположно в значении к понятию, представленному входом. содержащим <termnote печатают=“ап1опутТегпГ> элемент. У <termnote> элемента, у которого есть значение атрибута типа 'antonymTerm'. может также быть целевой признак, указывающий на термин ID термина, который представляет понятие антонима. Срок показа в содержании этого элемента должен быть выражен в basicText.

directionality

Категория данных, которая через ценность ее целевого признака указывает на предпочтительный перевод термина е <term> элемент <bg> из числа доступных переводов во входе. Целевой признак должен указать на идентификатор <tig> как соответствие целевому термину. В случае ценностей, мононалраелвнных и двунаправленных, целевой термин — предпочтительный термин. Содержание <termnote> элемента, когда у него есть значение атрибута типа 'directionality', указывает на объем dtrecttonakly и должно быть следующим:

•    мононалравленный: перевод предпочтен с исходного языка (<tig> на выходной язык (цепь <tig>):

-    двунаправленный: перевод предпочтен в обоих направлениях, т. е. термин в цели <tig> является предпочтительным переводом термина в <Ьд> и наоборот;

-    несоизмеримый: отношение между термином в токе <tig> и термином в цели <tig> как переводы несовершенны и должны использоваться с осторожностью. В этом случав понятия не равны. <termnote THn=*lransferCommenr> должен использоваться для предоставления информации о различии между понятиями:

•    неопределенный: объем directionality не был определен.

etymology

Информация о происхождении слова и развитии его значения. Содержание элемента должно быть выражено в noteTexl.

falseFriend

Термин на другом языке, который семантически или морфологически подобен подчиненному термину во входе. ноне представляет то же самое понятие. У <termnote> элемента со значением атрибута типа falseFriend* может также быть целевой признак, стоимость которого — указатель на термин в другом входе. Содержание элемента должно быть выражено в basicText

frequency

Содержание <termnote> элемента, у которого будет значение атрибута типа 'частоты*, должно быть одним из: commontyUsed, mfrequentlyUsed. raretyUsed. Оценка частоты термина может быть основана на субъективных критериях.

geographicalUsage

Кодекс, определяющий любой определенный географический район, где термин использован, например, чтобы дифференцироваться между британским английским и американским английским языками. Предпочтительные ценности — языковые кодексы, объединенные с географическими кодексами по IETF RFC 4646. о чем указано в IETF ВСР 47. Например. еп-США для американского варианта английского языка. Содержание элемента должно быть выражено в обычном тексте.

grammaticalGender

Род. Ценность <termnote> элемента, когда у того возникает значение атрибута типа 'grammaticalGender’ (мужской, жвнсхий. средний).

grammaticalNumber

Собственность термина, который указывает на число объектов, упомянутых термином. Содержание <termnote> элемента, имеющего значение атрибута типа 'grammaticalNumber'. должно быть одним из: исключительный. множественный, двойной, масса или otherNumber.

grammaticalValency

Диапазон синтаксических элементов, требуемых или разрешенных лексической единицей. Содержание элемента должно быть выражено в обычном тексте.

homograph

Слово по буквам, которое произнесено как подчиненный термин во входе, но у него есть различное значение и происхождение. Омографы — условия, которые имеют ту же самую письменную форму, но получены из разлитого этимологического происхождения, например, порты для лодок и порты для компьютерной периферии. У <termnote> элемента, имеющего значение атрибута типа 'омографа*, мажет также быть целевой признак, чтобы указать на <t*g> входа, который описывает омограф. Содержание элемента должно быть выражено в basicText.

64

ГОСТ Р ИСО 30042—2016

language-pianningQualiner

Определитель, назначенный на временный термин в рамках языкового планирования или описательной окружающей среды терминологии. Содержание <termnote> элемента, имеющего значение атрибута типа 'яэыкэ-planningQualifier’, должно быть одним из: recommendedTerm. nonstandardizedTerm. proposedTerm или newTerm.

ItonHotkey

Hotkey — ключ или комбинация ключей на компьютерной клавиатуре, которая выполняет задачу как альтернатива использованию мыши или другого устройства ввода. Hotkeys поддержаны многими операционными системами, hotkey обозначен амперсандом в термине в файлах интерфейса программного обеспечения и подчеркиванием в фактическом визуальном показе. Содержание элемента должно быть выражено в обычном тексте.

normativeAuthorization

Определитель статуса термина, назначенный авторитетным органом, таким как Комитет по стандартизации или правительственное учреждение с регулирующей функцией. Содержание <termnote> элемента, имеющего значение атрибута типа 'normativeAuthonzation'. должно быть одним из:

•    standardizedTerm

•    preferredTerm

•    admittedTerm

•    deprecatedTerm

-    superseded Term

-    legalTerm

-    regulatedTerm

Название авторитетного органа должно быть зарегистрировано в хранилище терминологии и ссылаться в случае документа ТВХ при помощи <refobject>.

partOfSpeech

Категория, назначенная на слово, основанное на его грамматических и семантических свойствах. Например, существительное, глагол игы прилагательное. Содержание элемента должно быть выражено в обычном тексте и ограничено рядом ценности разворачивающегося списка. Должна быть разрешена только одна стоимость для каждого <term> в данном входе. Например, следующие ценности разрешены в ТВХ-осноеном TML:

•    поил

-    verb

•    adjective

-    adverb

-    properNoun

-    other

processStatus

Статус термина относительно wo продвижения в рамках управленческого процесса терминологии. Содержание <termnote> элемента, имеющего значение атрибута типа 'processStatus'. должно быть одним из: необработанный. provisionailyProcessed или завершенный.

pronunciation

В ТВХ произношение должно быть представлено в международном фонетическом алфавите. У данного термина мажет быть более одного произношения в зависимости от географического района, в котором использован термин. В этом случае используют отдельно <tig> или <nbg> элемент для каждого произношения и указывают на географический район для каждого при помощи <termnote> элемента со значением атрибута типа 'geographicalllsage'. Содержание элемента должно быть выражено в basicText.

proprietaryRestriction

Ограничение на термине в цепях защиты права организации на исключительное использование термина. Содержание <termnote> элемента, имеющего значение атрибута типа proprietaryResthcbon'. должно быть одним из: торговая марка. semceMark или товарный знак.

Примечание — авторское право относится к большим текстовым единицам, таким как книги.

register

Классификация, указывающая на уровень языка, назначенного на термин. Содержание <termnote> элемента. имеющего значение атрибута типа 'регистра', должно быть одним из:

-    cotloquialRegister

-    neutraiRegister

65

ГОСТ Р ИСО 30042—2016

-    technicalRegister

•    in-houseRegister

-    bench-tevelRegister

•    slangRegister

-    vulgarRegrster

shortFormFor

Связывающийся элемент, определяющий отношение между подчиненным термином, когда это краткая форма и ее полная или расширенная форма. Может быть вместе с целевым признаком, чтобы указать на полную или расширенную форму. Обычно краткая и полная формы будут содержаться в том же самом входе, но каждый в собственном <tig>, так как представляют одно понятие. Например, у термина Соединенные Штаты может быть повышение. чтобы указать на полный термин формы Соединенные Штаты Америки.

temporalQualrffer

Собственность термина относительно его использования в течение долгого времени. Содержание <termnote> элемента, имеющего значение атрибута ‘temporalQualifier’. должно быть одним из: archatcTerm. outdatedTerm. obsoleteTerm.

termLocation

Местоположение в документе, компьютерном файле или другой информационной среде, такие как объект пользовательского интерфейса {в программном обеспечении), упаковочный элемент, компонент в производственном процессе и т. д. Содержание элемента должно быть выражено в обычном тексте и предпочтительно ограничено рядом ценностей разворачивающегося списка. Следующие ценности разворачивающегося списка рекомендуются для местоположений пользовательского интерфейса программного обеспечения в окружающей среде Windows:

•    checkBox

-    с от bo Box

•    comboBoxElement

•    dialogBox

-    groupBox

-    informativeMessage

•    interactiveMessage

-    menultem

•    progressBar

-    pushButton

•    radioButton

•    slider

•    spinBox

-    tab

•    tableText

-    textBox

•    toolTip

•    user-definedTу pe

termProvenance

Классификация термина согласно методологии, используемой в создании термина. Содержание <termnote> элемента, имеющего значение атрибута типа 'termProvenance'. должно быть одним из: Iransdtsd pUnary Вот rowing, translingualBorrowing, loan Translation или неологизм.

termStrvcture

Структура компонентов термина, обозначается квадратными скобками. Например, [баланс банка) [общее количество] против [банке] [общее количество заявления]. Содержание элемента должно быть выражено в о&ьгчном тексте.

termType

Классификация термина относительно формальных представлений условий, где они используются как акронимы. Содержание <termnote> элемента, имеющего значение атрибута типа 'termТуре', должно быть одним из следующих:

•    abbreviation

-    acronym

•    clippedTerm

66

ГОСТ Р ИСО 30042—2016

-    commonName

•    entry Тест

-    equation

-    formula

-    fuItForm

-    irvtiaksm

•    internationalism

-    intemationalScientificTerm

•    logicalExpression

•    parlNumber

•    phraseologicalUnit

•    transcribedForm

-    transliteratedForm

-    shorlForm

•    shortcut

•    sku

•    standardText -string

-    symbol

-    synonym

•    synonymousPhrase

-    variant

Следует обратиться к ИСО 12620 для определений вышеупомянутых типов термина. Короткий путь стоимости относится к последовательности, которая действует как клавиша быстрого вызова на компьютерах, например. Ctrl * V является термином, которьм представляет клавишу быстрого вызова для понятия.

timeRestriction

Признак промежутка времени, начиная с которого термин подвергся использованию. Например, несколько европейских стран пересмотрели требования для определенных университетских дипломов в последние годы. Если бы. например, требования для степени бакалавра изменились с трех до четырех лет в 1993 году, то любой вход терминологии, определяющий термин, использованный, чтобы определять эту степень, должен будет определить ограничение времени, затрагивающее определение, которое отличалось бы до 1993 и после 1993 года. Содержание элемента должно быть выражено в обычном тексте.

transferComment

Примечание, включенное в информацию о степени эквивалентности, directionality или других особенностях, затрагивающих эквивалентность между термином на одном языке и термином на другом языке. Этот элемент может использоваться вместе с «termnote THn="directionatrty"> элемент, чтобы указать на предпочтительный перевод рассматриваемого термина. У <termnote> элемента оо значением атрибута типа 'transferComment' может также быть целевой признак, чтобы ухазать на термин, который является объектом комментария передачи.

usageNote

Примечание, содержащее информацию об использовании герьына. transac

transactionType

Отчет, который указывает на стадию входа в рамках полного процесса создания, одобрения и использования входа терминологии.

transacNote usageCount Количество входов.

responsibility

Имя человека или предприятия, связанное с управлением терминологией. У <transacnote> элемента со значением атрибута типа ‘ответственности’ может также быть целевой признак, чтобы указать на идентификатор библиографического входа в <refobject>, который содержит информацию о человеке или предприятии.

xref

corpusTrace

Примечание, указывающее на местоположение внешнего контекстного ресурса.

67

ГОСТ Р ИСО 30042—2016

extemalCrossReference

Термин или другой терминологический ресурс, который является внешним к терминологической базе данных или случаю документа ТВХ.

хAudio

Внешний аудиофайл. xGraphic

Внешний графический файл. xVid&o

Внешний видеофайл. xSource

Внешний источник информации, такой как источник определения или предложения контекста. xMathML

Математическое понятие выражено в MathML.

68

ГОСТ Р ИСО 30042—2016

Приложение Е

(обязательное)

Описания элементов и признаков для файла XCS

Е.1 Введение

Настоящее приложение предоставляет описания компонентов файла XCS. DTD. которая мажет использоваться. чтобы утвердить файлы XCS. обеспечена в приложении В. XCS. из которого могут быть получены определенные для пользователя файлы XCS, обеспечен в приложении С. Информация о том. как прочитать части этого приложения, предоставлена в приложении 0.1.

Примечание — Эта секция не указывает, какие элементы обязательны, а какие являются дополнительными. Для этой информации обратитесь к ОТО (приложение В).

Е.2 Классы признака specAtt

Группируются признаки datcatld и имя. которые используются для технических требований категории данных в файле XCS.

Участники admmNoleSoec adminSoec descripNoteSoec descrioSpec hiSoec refSoec termComoListSpec termNoteSoec IfansacNoleSrec transacSpec xrefSpec Признаки @datcatid

Указывает номер категории данных, которые определяются в файле XCS. указанных в ISO 12620.

Примечание — Если категория данных не определяется в соответствии с (SO 12620, то этот атрибут будет иметь пустое значение.

Статус Обязательный

@пате

Указывает название категории данных, которые определяется в файле XCS. Если категория данных определяется в соответствии с ISO 12620, его имя должно быть взято из этого стандарта, когда это возможно.

Статус Обязательный

Е.З Элементы <adminNoteSpec>

Спецификация категории данных, которая назначена на <adminnote> элемент метаданных.

Признаки specAtt (@datcatld. @name)

Используемый datCatSet Может содержать contents

<adminSpec>

Спецификация категории данных, которая назначена на <admin> элемент метаданных.

Признаки soecAtt f@datcalld. @name)

Используемый datCatSet Может содержать contents

<contents>

Содержит любые допустимые ценности для категории данных, определенной ее исходным элементом. Признаки предоставляют информацию о допустимом типе данных, применяется ли категория данных к компонентам термина если категория берет целевой признак, тип содержания, которое будет ожидаться для цели.

Признаки

@datatype

Тип данных, которые допустимы для категории данных.

Статус Дополнительный Тип данных Текст

69

ГОСТ Р ИСО 30042—2016

@forTermComp

Указывает, может ли категория данных быть зарегистрирована для компонентов термина а дополнение к условиям.

Статус Дополнительный

Ценности

-да:

-    нет.

@targetType

Этот признак только относится к категориям метаданных, которые берут целевой признак в основной DTD. Предоставляет информацию о типе содержания, которое должно ожидаться для цепи этих данных — категория. Рекомендуемые ценности для этого признака упомянуты ниже:

-    ЫЫ — Цель — библиографическая осылка:

•    binaryOata — Цель — случай двоичных данных, таких как диаграмма:

•    conceptSysDescrip — Цель — системный описатель понятия;

•    element — Цель — другой элемент 8 файле ТВХ (кроме <term> элемент игы <teimentry>. элемент):

-    entry — Цель — другой вход (<termentry>), как правило указывающий на идентификатор входа;

-    external — Цель — внешний ресурс:

•    respPerson — Цель — справочный вход (такой как в <refobject>) о человеке, ответственном за элемент:

-    term — Цель — термин (<term>);

•    thesaurusDescrip — Цель — описатель тезауруса.

Статус Дополнительный Тип данных Текст

Используемый adminNoteSoec adminSoec descrioNoteSoec descnoSoec hiSpec refSoec termCompListSpec lermNoteSpec transacNoteSpec transacSpec xrefSpec Может содержать Данные о характере

<datCatDoc>

Элемент корня для категории данных наносит на карту в заголовке XCS.

Признаки Отсутствуют Используемый header Может содержать datCatMap

<datCatDisp!ay>

Альтернативное имя для категории данных.

Признаки @xmt:tang

Статус Дополнительный Тип данных Текст Используемый datCatMap Может содержать Данные о характере

<datCatMap>

Отображение между названием категории данных по умолчанию и одним или более альтернативными названиями категории данных для одной определенной категории данных.

Признаки Отсутствуют Используемый datCatDoc

Может содержать datCatDisotav datCatNote datCatToken lanoCode <datCatNote>

Любое примечание об альтернативном названии категории данных.

Признаки @xm1:)ar>g

Статус Необязательный Тип данных Текст Используемый datCatMap Может содержать Данные о характере

<datCatSet>

Элемент корня технических требований категории данных.

Признаки Отсутствуют Используемый TBXXCS

70

ГОСТ Р ИСО 30042—2016

Может содержать adminNoteSoec admmSoec descripNoteSoec descrioSoec hiSoec rctSoec lermComoListSoec lermNoteSoec transacNoleSoec IransacSoec xrefSoec <datCatToken>

Название no умолчанию категории данных.

Признаки Отсутствуют

Используемый datCatMag

Может содержать Данные о характере

<descripNoteSpec>

Спецификация категории данных, которая назначена на <descripnote> элемент метаданных.

Признаки soecAtt f@datcatld. @name)

Используемый datCatSet Может содержать contents

<descripSpec>

Спецификация категории данных, которая назначена на <descrip> элемент метаданных.

Признаки soecAtt f@datcalld. @name)

Используемый datCatSet Может содержать contents levels

<header>

Элемент, содержащий название файла XCS и любую дополнительную информацию о категориях данных, кроме их формальных технических требований.

Признаки Отсутствуют Используемый TBXXCS Может содержать datCatDoc title

<hiSpec>

Спецификация категории данных, которая назначена на <hi> элемент метаданных.

Признаки soecAtt (@datcalld. @name)

Используемый datCatSet Может содержать contents

<itemSpec>

Спецификация <Hem> элемент является особенностью, которая может использоваться, чтобы описать refObject в аппарате случая документа ТВХ. Ценности содержания определены в ТВХ файла XCS. чтобы описать двойные объекты в случае документа ТВХ. Другие ценности могут быть в определенном для пользователя XCS. чтобы описать другие типы ссылок.

•    format

•    fileName

•    fileDateTime

•    fileAttnbutes - fileOSName

•    HleOSNumber -codePage

•    fileSize

•    data

•    description Признаки @type

Статус Необходимый Ценности vaiidltemType Используемый itemSoecSet Может содержать Данные о характере

<itemSpecSet>

Ряд технических требований к издегыю.

Признаки @type

Статус Необходимый Ценности vaiidltemType

71

ГОСТ Р ИСО 30042—2016

Используемый refObjectDef Может содержать itemSoec <langCode>

Кодекс ISO для языка по IETF RFC 4646. о чем указано в IETF ВСР 47.

Признаки Отсутствуют Используемый datCatMap lanolnfo Может содержать Данные о характере

<langlnfo>

Элемент, содержащий имя и кодекс одного из язьжов, которые появляются в случае документа ТВХ. который проверен против файла XCS. Каждый язык, который появляется в случае документа ТВХ. должен быть обозначен в разделе файла XCS.

Признаки Отсутствуют

Используемый languages

Может содержать lanaCode lanoNanre

<langName>

Название языка.

Признаки Отсутствуют

Используемый lanolnfo

Может содержать Данные о характере

<languages>

Набор языков, которые поддержаны случаем документа ТВХ. которым управляет файл XCS.

Признаки Отсутствуют Используемый TBXXCS Может содержать lanolnfo

<levels>

Уровень{ни) в терминологическом входе, при котором может произойти указанный элемент. Поддержанные иенности: termEntry. langSet термин.

Признаки Отсутствуют Используемый descripSpec Может содержать Данные о характере

<refObjectDef>

Определение типа refObject. который может быть зарегистрирован е аппарат случая документа ТВХ. В ТВХ файла XCS только один тип refObject определен (btnaryData). Другие типы могут быть 8 определенном пользователями файле XCS.

Признаки Отсутствуют

Используемый refObiectOefSel

Может содержать itemSpecSet refQbtedType

<refObjectDefSet>

Ряд refObject определения.

Признаки Отсутствуют Используемый TBXXCS Может содержать refObjectDef

<refObjectType>

Спецификация типа refObject. который может быть зарегистрирован в аппарат случая документа ТВХ. В ТВХ файла XCS только один тип refObject определен (btnaryOata). Другие типы могут быть в определенном пользователями файле XCS.

Признаки Отсутствуют Используемый refObjectDef Может содержать Данные о характере

<refSpec>

Спецификация категории данных, которая назначена на <ref> элемента метаданных.

Признаки specAtt «gjdatcatld. @name)

72

ГОСТ Р ИСО 30042—2016

Используемый datCatSet Может содержать contents <TBXXCS>

Элемент корня ТВХ XCS файл.

Признаки

©lang

Язык по умолчанию файла XCS.

Статус Необходимый Тип данных Текст ©пате

Имя. которым упомянут файл XCS.

Статус Необходимый Тип данных Текст ©version

Версия файла XCS.

Статус Необходимый Тип данных Текст Используемый п/а

Может содержать datCatSet header languages refObjectDetSet <termCompListSpec>

Спецификация категории данных, которая назначена на <termCompUst> элемент метаданных. Признаки soocAtt (@datcalld. ©name)

Используемый datCatSet Может содержать contents

<termNoteSpec>

Спецификация категории данных, которая назначена на <termnote> элемент метаданных. Признаки specAt< f@datcatld. ©name)

Используемый datCatSet Может содержать contents

<titte>

Название файла XCS.

Признаки Отсутствуют Используемый header titleSlml Может содержать Данные о характере

<transacNoteSpec>

Спецификация категории данных, которая назначена на <transacNote> элемент метаданных. Признаки soecAtt (@datcatld. ©name)

Используемый datCatSet Может содержать contents

<transacSpec>

Спецификация категории данных, которая назначена на <transac> элемент метаданных. Признаки soecAtt f@datcalld. ©name)

Используемый datCatSet Может содержать contents

<xrefSpec>

Спецификация категории данных, которая назначена на <xref> элемент метаданных. Признаки soecAlt (@datcatld. ©name)

Используемый datCatSet Может содержать contents

73

ГОСТ Р ИСО 30042—2016

Приложение F

(справочное)

Интегрированная схема и другие ресурсы ТВХ

Понижение схемы NG. которая объединяет основную структуру и ограничения категории данных в одном файле, доступно для скачивания на сайте Ассоциации локализации отраслевых стандартов (wwav.lisa.org/TBX-Resources.650.Cl.html). Данные ограничения категории выражены во вложенных правилах Schematron. Этот файл позволяет утверждать случаи документа ТВХ. использующие всего одну схему.

Также доступны некоторые типовые файлы ТВХ и некоторые инструменты проверки.

74

ГОСТ Р ИСО 30042—2016

Приложение G

(справочное)

ТВХ-основной

Вариант ТВХ лор названием ТВХ-основной доступен на сайте Ассоциации локализации отраслевых стандартов. ТВХ-основной более легкая версия ТВХ. предназначенного для малых языковых отраслей промышленности. Несмотря на то что основная аудитория — поставщики услуг локализации, формат также подходит для любого языкового применения, которое требует легкого подхода к управлению терминологией, такому как некоторые заявления на создание, которым управляют, и управление контент mi. Многие терминологические системы содержат малый набор категорий данных. Категории данных в ТВХ-основном — самые популярные, испогъзуемые е промышленности локализации, как определено исследованиями, проводимыми LISA.

Цель ТВХ-осноеных состоит в том. чтобы формализовать перевод и потребности промышленной локализации в повышении терминологии в стандарте XML. чтобы улучшить обмен терминологическими ресурсами между пользователями и использовать эти ресурсы в различных информационных средах.

ТВХ-основной также включает некоторые рекомендации для использования категорий данных и некоторых общих методов наиболее успешной практики для руководящей терминологии.

Для получения дополнительной информации использовать: http^/www .lisa.0rg/Term-Base-eXchan9e.32.O.html.

75

ГОСТ Р ИСО 30042—2016

Приложение Н

(справочное)

Сумма изменений

Эго приложение суммирует изменения, которые были внесены в документ спецификации ТВХ в течение периода создания документа между февралем 2007 года и до его заключительной ратификации как Международный стандарт ISO. Здесь зарегистрированы только значимые или технические изменения.

1.    'sourceLanguage' и largetLanguage' ценности признака типа <admin> элемента были удалены. Эти признаки были, вероятно, первоначально предназначены, чтобы определить язык оригинала текстового элемента, такой как <descrip тип=“определение*>. который был переведен. <note> элемент может использоваться с этой целью примечание, что признак xmhlang может использоваться на всех элементах ТВХ. чтобы определить язык содержания элемента.

2.    Ценность признака типа <transac> элемента была изменена от 'terrranologyManagementTransactions' до TransactionType'. чтобы исправить ошибку в оригинальной спецификации.

3.    'descripbonType* ценность признака типа <descripnote> элемента была удалена. Данная категория отсутствует в ISO 12620:1999. Используйте <descrip тип="объяснение"> элемент для объяснений понятий. Нет никакой потребности дифференцироваться между различными типами объяснений или огысаний.

4.    Действующее повышение было упрощено, с исключением <Н> {изолированный признак) и <ut>: (несоединенный признак) элементов. Эти элементы были избыточны с <ph> элементом, который должен использоваться вместо них. Кроме того, использование остающихся действующих признаков повышения. <Ьр<>. <ept> и <ph>. было разъяснено, и их описание больше не делает ссылки на стандарт ТМХ.

5.    В XCS признак forTermComp был удален из <adminspec> элемента, у которого есть стоимость 'elementWorkingStatus'. Это должно позволить категории данных использоваться на <termentry> уровне.

6.    Стоимость'coHoquiatRegister* теперь поддержана как содержание элемента <termnote>. когда у последнего есгь значение атрибута типа ‘регистр*.

7.    У <хге(> элемента есть пять новых допустимых ценностей его признака типа: 'xAudio*. '«Graphic*. 'xMathML*. 'xSource* и *xVkJeo*. Эти ценности указывают на различные внешние ресурсы. Как со всеми <xref> элементам, у этих случаев <xref> есть тип данных PCDATA, как определено в основной DTD.

8.    Следующие изменения были внесены в <Ы> элемент:

-    допустимые ценности признака типа были перемещены от основной DTD к файлу XCS;

-    есть пять новых допустимых ценностей признака типа: 'курсив', ’метаданные*, 'математика', 'суперподлин-ник* и ‘приписка*. Они были добавлены, чтобы поддержать действующее повышение для категорий данных, таких как термин или определение;

•    <hi> элемент со значением атрибута типа 'математики' берет текстовое содержание. Для случаев документа ТВХ. которые не требуют проводки против DTD и в котором использование стандартов XML желательно, математические выражения могут быть вкгаочены. используя MathML через XML namespace механизм:

•    значение атрибута типа ‘xlink’ было удалено из основной DTD. поскольку это значение атрибута не использовалось. Если лицо, осуществляющее внедрение, требует использования элементов or xlink стандарта, версия схемы XML основной DTD может использоваться и xlink повышение поддерживается через namespace декларацию:

•    признаки href были удалено из основной DTD.

9.    Категория данных 'термин антонима' была изменена от случая элемента <descrip> к случаю элемента <termnote>. Это должно позволить все другие типы отношений термина, которые являются всеми случаями <termnote>.

10.    Ценность признака типа данных для следующих категорий данных была изменена в XCS от ‘noteText' до 'обычного текста':

-    applicationSubset

•    audio

-    businesslInitSubsel

-    characteristic

•    classificabonCode

•    conceptOrigin

-    conceptPosition

-    customerSubset

-    domainExpert

•    entry Sou re©

-    environmentSubset

•    figure

76

ГОСТ Р ИСО 30042—2016

-    geographicalUsage

•    grammaticalValency

-    indexHeading

•    keyword

-    originatingDalabase

•    originatinglnstitution

•    otherBinaryData

•    productSubset

•    projectSubset

•    quantity

•    range

•    responsibly

-    searchTerm

•    sortKey

•    sourceldentifier

-    table

•    termLocation

-    termStructure

•    thesaurusDescriptor

-    timeRestriction

•    unit

-    usageCount

•    video

11.    Ценность признака типа данных для следующих категорий данных была изменена 8 XCS от 'noteText'до 'basicText:

•    abtxeviatedFormFor

•    antonymConcept

-    antonymTerm

. associatedConcept

-    broaderConceptGeneric

•    broaderConceptPartitive

-    coordinateConceptGeneric

•    coordinateConceptPartitive

•    fatseFriend

-    homograph

•    pronunciation

-    related Concept

•    related ConceptBroader

•    related ConceptNarrower

•    sequentialtyRelatedConcept

-    shortFormFor

•    spatiallyRelatedConcept

•    subordinateConceptGeneric

•    subordinateConceptPartitive

•    superordinateConceptGeneric

•    superordmateConceptPartibve

•    temporatlyRelatedConcept

12.    Тип данных <term> элемент был изменен в основной ОТО от noteText до basicText.

13.    Признак типа данных для следующих категорий данных был удален из XCS, потому что тип данных {обычный текст или PCDATA) для этих категорий данных уже определен в основной ОТО. Это было сделано, чтобы удалить избыточность в файле XCS.

•    corpusTrace

•    crossReference

-    entaitadTerm

•    extemalCrossReference

•    shortcut

•    see

14.    Признак типа данных для следующих категорий данных был удален из XCS, потому что тип данных (noteText) для этих категорий уже определен в основной ОТО. Это было сделано, чтобы убрать избыточность данных в файле XCS.

•    Context

77

ГОСТ Р ИСО 30042—2016

•    Definition

•    Example

-    Explanation

•    sample Sentence

-    source

•    superscript

•    subscript

•    transferComment

•    usageNote

15.    Тип данных следующих элементов был изменен в основной DTD от 'noteText' до 'PCDATA1:

-    <lermComp>

-    <transacNote>

-    <admrnNole> — Эта категория метаданных е настоящее время используется для определения типа исходного текста, а модель содержания — разворачивающегося списка, как определено в файле XCS.

-    <transac>

16.    Чтобы удалить избыточность, признак типа данных для всех случаев <termcomp(istspec> в файле XCS был удален. Этот признак типа данных, у которого первоначально была стоимость 'noteText*. был предназначен, чтобы ограничить элемент <termcomp>. Однако содержание <termcomp> было и вое еще ограничено в основной DTD. Обратите внимание на то. что тип данных — теперь 'PCDATA*, как упомянуто выше.

17.    Звездочка была удалена из деклараций PCDATA элементов <bpt>. <ept>. и <ph> 8 основной DTD. Это присутствовало по ошибке.

18.    Декларация <transac> элемента была изменена в основной DTD. чтобы удалить спецификацию ценности признака типа. Эта информация была добавлена к файлу XCS. Кроме того, он имеет теперь стандартный допустимый идентификационный признак. Его тип данных был также изменен от 'noteText* до ‘PCDATA*.

19.    Чтобы удалить избыточность, признак forTermComp был удален для всех технических требований <transao и <transacnote> в файле XCS. потому что ограничение уровня уже выражено в основной DTD.

20.    Признак lang был удален из <tangset> элемента в основной DTD. Признак Sang был первоначально включен. чтобы отличить рабочий язык (xml:lang) от языка объекта (tang) для языковой секции (<langset>). Признак xmlrlang может использоваться на любом элементе, чтобы определить язык содержания того элемента, таким образом отдавая lang избыточный.

21.    В 8.7 элементах метаданных, в списке категорий метаданных, элементы <termcomp> и <refobject> были заменены <termcomptist> и <refobyectlist>. и некоторое объяснение было обеспечено об уникальном характере этих двух категорий данных относительно их технических требований типа.

22.    Признак targetclass был удален из файла XCS и из ТВХ. Эго не служило никакой цели.

23.    В DTD для файла XCS. targetType и признаков типа данных для <oontents> элемент были изменены от необходимого до подразумеваемого.

24.    Новое значение атрибута типа, названное '(firecbonalit/. было добавлено к <termnote>. Этот элемент используется. чтобы указать от одного термина до предпочтительного перевода в рамках того же самого входа.

25.    Следующие элементы были добавлены к DTD XCS. Эти новые элементы позволяют пользователям определять свои собственные имена для ценностей разворачивающегося списка.

-    <datCatDoc>

•    <datCalMao>

-    <datCatToken>

•    <dalCatPrsolav>

-    <note>

26.    У элемента <termnote тип=‘,1егтпТуре"> есть новая допустимая ценность: короткий путь.

27.    Новая ценность типа annotatedNote была добавлена к <admin> элементу в файле XCS. Это должно позволить примечание, которое может взять саму административную информацию, такую как информация об источнике примечания. Чтобы поддержать и дополнить новую annotatedNote ценность <admin> элемента, у <adminnote> элемента есть noteSource как новая ценность его признака типа. Эти две комбинации элемента^признака разработаны. чтобы использоваться вместе, чтобы позволить примечания с информацией об источнике.

28.    У <termnote> элемента есть новая стоимость для ее признака типа: lionHotkey. В процессах локализации программного обеспечения для условий, указанных в пунктах меню, это используется, чтобы указать на характер термина, который может быть использован для короткого пути меню.

29.    Способ, которым кодируются определенные справочные объекты в аппарате случая ТВХ. больше не определяется ТВХ для объектов, которые уже являются предметом других стандартов. Следовательно, в файле XCS все случаи <refobjecttype> были удалены, за исключением 'binaryData'. Ссылки на использование внешних стандартов были предоставлены для обработки трех удаленных случаев: 'bibT. 'respPerson* и YespOrg*. Остальные удаленные случаи ('dassSystemDescrip*. 'conceptSysDescrip* и IhesaurusDescnp*) могут быть обработаны при помощи <xref>, который указывает на URI для целевого ресурса.

78

ГОСТ Р ИСО 30042—2016

30.    Элементы «ode» и <тар> были удалены. Они не требуются, поскольку ТВХ предписывает использование Unicode.

31.    Признак targetType был удален из «contents» элемента данных категории файла XCS.

32.    Элемент <item> был изменен на <itemspec> в OTD XCS и файле XCS. Это было сделано, чтобы сделать его уникальным по сравнению с <item> в основной ОТО.

33.    Тип данных для <descripnote> был изменен в основной ОТО от 'noteTexf до ’PCDATA'. Этот элемент используется. чтобы указать на тип контекста или определения, отобранных из предопределенного разворачивающегося списка.

34.    abbreviatedFormOfTerm был удален как ценность «termnote тип=ЧегтТуре“> признак в файле XCS. Эта категория данных ISO 12620, которая фактически относится к группе типов сокращения, была включена по ошибке. Вместо этого все действительные типы сокращенных форм включены:

• Abbreviation

-    shortForm {renamed from shortFormOrTerm)

-    inrtialism

-    acronym

-    clippedTerm

35.    massNoun стоимости разворачивающегося списка был изменен на массу, чтобы сохранять стиль других ценностей разворачивающегося списка категории данных (грамматическое число).

36.    «front» элемент был удален из основной ОТО. Этот элемент не использовался, и любая информация о вступительной части может быть включена в «martif» элемент.

37.    Элемент «itemset» был изменен в файле XCS и ОТО XCS к «itemspecset». Также элемент «rebobjectset» был изменен в файле XCS и ОТО XCS к «refobjectdefset». Это было сделано, чтобы поддержать суровость в названиях элемента согласно их цели.

38.    subjectFiefd категория данных теперь разрешена только в понятии (termEntry) уровень. Ранее эго было разрешено во всех первых уровнях по ошибке.

39.    Следующие ценности были добавлены к признаку типа <р> элемента, который используется в «encodingdesc» элемент «martifheader». чтобы предоставить информацию о файле XCS:

-    XCSURI — URL файла XCS;

-    XCSContent — содержание файла XCS. включенного в случай ТВХ.

Значения атрибута типа 'перекрестная ссылка', 'понятие антонима' и ‘термин антонима' были изменены на 'перекрестную ссылку*, 'antonymCoocept' и 'antonymTerm', чтобы уважать стиль случая верблюда ТВХ.

40.    В ОТО XCS элемент «refobjectdefset» был изменен от необходимого до дополнительного, чтобы допускать TMLs, у которых нет «refobject» элементов в аппарате, и нет необходимости ограничивать их в ОТО.

41.    Новая категория данных была добавлена (местоположение термина) (termLocabon).

79

ГОСТ Р ИСО 30042—2016

Приложение I

(справочное)

Индексы

1.1 ОТО основного модуля

auxlnfo................................................................„......................................................................................................

basicText .....................................................................................................................................................................

noteText......................................„.............................................................................................................................

noteLinfclnfo.................................................................................................................................................................

icflang...........................................................................................................................................................................

IDLangTgtDtyp ...........................................................................................................................................................

idlype..........................................................................................................................................................................

lang..............................................................................................................................................................................

target-IDREF...............................................................................................................................................................

admin...........................................................................................................................................................................

adminGrp.....................................................................................................................................................................

adminNote..................................................................................................................................................................

beck.............................................................................................................................................................................

body...........................................................................................................................................................................

change .........................................................................................................................................................................

date ............................................................................................................................................................................

descrip........................................................................................................................................................................

descripGrp..................................................................................................................................................................

descnpNote................................................................................................................................................................

encodirtgOesc............................................................................................................................................................

epl...............................................................................................................................................................................

fileDesc.......................................................................................................................................................................

foreign .........................................................................................................................................................................

hi.................................................................................................................................................................................

item............................................................................................................................................................................

itemGrp........................................................................................................................................................................

itemSel........................................................................................................................................................................

langSet........................................................................................................................................................................

msrtif...............................„..........................................................................................................................................

martifHeader................................................................................................................................................................

note .............................................................................................................................................................................

ntig...............................................................................................................................................................................

P ..................................................................................................................................................................................

Pb ................................................................................................................................................................................

poWicatjonStmt...........................................................................................................................................................

refObject.....................................................................................................................................................................

refObjectList..........................................................................................................................................................

revisionDesc..............................................................................................................................................................

sourceDesc................................................................................................................................................................

term............................................................................................................................................................................

termComp...................................................................................................................................................................

termCompGrp..............................................................................................................................................................

termCompList.............................................................................................................................................................

termEntry.....................................................................................................................................................................

termGrp.......................................................................................................................................................................

termNote......................................................................................................................................................................

termNoteGrp................................................................................................................................................................

text...............................................................................................................................................................................

80

ГОСТ Р ИСО 30042—2016

Ьд......................................................................

title....................................................................

tiBeStmt ...........................................................

Iransac..............................................................

IransacGrp........................................................

transacNote......................................................

xret...................................................................

1.2    XCS ОТО

specAtt.............................................................

admmNoteSpec................................................

adminSpec.......................................................

contents...........................................................

datCatOoc........................................................

datCatOisptay...................................................

datCatMap.......................................................

datCatNote.......................................................

datCatSet........................................................

datCatToken ..................................................

descripNoteSpec..............................................

descripSpec......................................................

header ..............................................................

hiSpec..............................................................

itemSpec..........................................................

itemSpecSet.....................................................

langCode..........................................................

langlnfo.............................................................

langName.........................................................

languages.........................................................

levels................................................................

refObjectDef.....................................................

refObjectOefSet..................................._..........

refObjedType..................................................

refSpec............................................................

TBXXCS..........................................................

termCompListSpec...........................................

termNoteSpec.................................................

tide ..................................................................

UansacNoteSpec............................................

transacSpec.....................................................

xrefSpec...........................................................

1.3    Терминологические категории данных

abbreviatedFormFor........................................

admrnistrativeStatus.........................................

animacy...........................................................

annotatedNote..................................................

antonymConcept.............................................

antonymTerm....................................................

applicationSubsel.............................................

associatedConcept...........................................

audio.................................................................

bold...................................................................

broaderConceptGenenc...................................

broaderConceptPartitive..................................

bosinessUnitSubset..........................................

characteristic...................................................

classificationCode ...........................................

conceptOrigin..................................................

conceptPosition...............................................

context..............................................................

81

ГОСТ Р ИСО 30042—2016

contextType.......................

coordinateConceptGeneric

coordinateConceptPartitive

corpusTrace ......................

crossReference.................

customerSubset ................

databaseType....................

definition............................

definrtionType....................

directionality......................

domainExpert....................

elementWorkingStatus......

entaitedTecm......................

entrySource.......................

environmentSubset...........

etymology..........................

example.............................

explanation........................

extemalCrossReference....

falseFriend.........................

figure.................................

frequency...........................

geographicalUsage...........

grammaticalGender...........

grammaticalNumber..........

grammaticalValency..........

homograph........................

hotkey................................

hyphenation.......................

indexHeading ....................

italics.................................

keyword.............................

language-planningQualifier

lemma................................

lionHotkey..........................

math..................................

morphologicalElement.......

normativeAuthorization......

noteSource........................

origmatingDatabase ..........

originatinglnstitutjon ..........

originabngPerson ..............

otherBinaryOata ................

partOfSpeech....................

processStatus....................

productSubset...................

projectSubset ....................

pronunciation.....................

proprietaryRestriction........

quantity..............................

range.................................

register..............................

relatedConcept..................

relatedConceptBroader.....

relatedConceptNarrower ...

reliabdityCode....................

responsibihty......................

sampteSentence................

searchTerm........................

securitySubset..................

see....................................

82

ГОСТ Р ИСО 30042—2016

sequentiallyRetatedConcept...

shortFormFor..........................

sortKey...................................

source.....................................

sourceldentifier.......................

sourceType.............................

spatiallyRelatedConcept.........

subjectFtetd............................

subordinateConceptGeneric... subordinateConceptPartitive ..

subscript.................................

subsetOwner..........................

superordinateConceptGeneric

superordinateConceptPartitive

superscript..............................

syllabification..........................

table........................................

temporallyRelatedConcept.....

lemporaKXialifier....................

termEtement...........................

lermLocation...........................

lermProvenance.....................

lermSIructure..........................

termType ................................

thesaurusDescriptor...............

timeRestriction........................

transacbonType......................

transferComment....................

unit..........................................

usageCount............................

usageNote..............................

video.......................................

хАиЛо ..................................

xGraphic.................................

xMathML................................

xSource..................................

xVideo ...................................

83

ГОСТ Р ИСО 30042—2016

Приложение ДА

(справочное)

Сведения о соответствии ссылочных международных стандартов национальным стандартам Российской Федерации

Таблица ДА.1

Обозначение ссылочного международного стандарта

Степень

соответствии

Обоаиачение и наименование соответствующего национального стандарта

ISO 8601

ют

ГОСТ ИСО 6601—2001 «Система стандартов по информации. библиотечному и издательскому делу. Представление дат и времени. Общие требования»

ISO 12620

ют

ГОСТ Р ИСО 12620—2012 «Терминология, другие языковые ресурсы и ресурсы содержания. Спецификация категорий данных для языковых ресурсов»

Примечание — В настоящей таблице использовано следующее условное обозначение степени соответствия стандартов:

- ЮТ — идентичные стандарты.

84

ГОСТ Р ИСО 30042—2016

Библиография

Этот раздел включает библиографию соответствующих публикаций и списка внешних ссылок на веб-сайты, которые обеспечивают инструменты, типовые файлы и т. д.

(1]    ISO 1087-1:2000 Терминологическая работа. Словарь. Часть 1. Теория и применение

(2]    ISO/1087-2:1999 Терминологическая работа. Словарь. Часть 2. Применение вычислительной техники

(3]    ISO 1951:2007 Представление и изложение словарных статей. Требования, рекомендации, информация

(4]    ISO/IEC 19757-2:2003 Информационные технологии. Язык определения схемы документа (DSDL). Часть 2. Валидация на основе регулярной грамматики. RELAX NG

(5]    ISO/IEC 19757-3:2006 Информационные технологии. Язык определения схемы документа (OSOL). Часть 3. Валидация на основе регулярной грамматики. Схвматрон

(6]    The Base16. Base32. and Base64 Data Encodings. July 2003. Available from

(7]    IETF BCP 47. IETF RFC 4646. Tags for Identifying Languages. September 2006. Available at tools.ietf.org/html/ rfc4646

(8]    Extensible Markup Language 1.0 (Fourth Edition). August 2006. W3C Recommendation 16. Available at  TR/REC-xmtf

(9]    The Text Encoding Initiative Guidelines (P5). 2007. Available from the TEI Consortium at  Р5/

(10]    Translation Memory exchange (TMX). 2007. Available from the Localization Industry Standards Association at www. Iisa.org/standards/tmx/

(11]    TBX Resources. Available from the Localization Industry Standards Association at Resourc-es.650.0.htmf

(12]    XML Localization Interchange Fde Format (XLIFF) 1.2,2008. Available from OASIS at http7/docs.oasis-open.org/xtrft/ xliff-core/xlif[-core.html

(13]    The Handto System. Available at 14.TeX Users' Group. Available at

(14]    TeX Users' Group. Available at

(15]    Representing vCard Objects in RDF/XML. Available at

(16]    Dublin Core Metadata Element Set. Available at dubtincore.org/documents/dces/#IS015836

85

ГОСТ Р ИСО 30042—2016

УДК 658:562.014:006.354    ОКС01.020
35.240.60
Ключевые слова: анализ, дополнительная информация CI, файл данных, расширение, глобальная информация GI. обмен, категория метаданных, терминологическая база данных. XML. ТВХ. TML

Редактор В.М. Пугачев Корректор Е.Р. Ароян Компьютерная верстка Ю.В. Поповой

Сдано в набор 12.12.20<в. Подписано в печать 27.01.2017. Формат 60 « в4*/д Гарнитура Ариел.

Уел. печ. п. 10.23

Подготовлено на основе электронной версии, предоставленной раэработчиком стандарта

Набрано а ИД «Юриспруденция», 115410, Москва, ул. Орджоникидзе. 11. www.ju>isizdaLnj    

Издано во ФГУП «СТАНДАРТИНФОРМ». 123905. Москва. Гранатный пор., 4. www.90stinlo.1u    Kilo@gostKiforu