ГОСТ 7.52-85
Группа Т62
ГОСУДАРСТВЕННЫЙ СТАНДАРТ СОЮЗА ССР
Система стандартов по информации, библиотечному
и издательскому делу
КОММУНИКАТИВНЫЙ ФОРМАТ ДЛЯ ОБМЕНА
БИБЛИОГРАФИЧЕСКИМИ ДАННЫМИ НА МАГНИТНОЙ ЛЕНТЕ
Поисковый образ документа
System of standards on information, librarianship and publishing.
Communication format for bibliographic data exchange on magnetic tape.
Search pattern of a document
ОКСТУ 0007
Дата введения 1986-07-01
РАЗРАБОТАН
Государственным комитетом СССР по науке и технике
Академией наук СССР
Государственным комитетом СССР по стандартам
Министерством электротехнической промышленности
Министерством авиационной промышленности
Государственным комитетом СССР по делам изобретений и открытий
ИСПОЛНИТЕЛИ
Г.Г.Белоногов, Н.Д.Кравченко, Н.П.Очнева, С.Я.Калачкина, В.И.Федосимов, В.Н.Белоозеров, О.А.Фуралев, Л.В.Шемберко, С.А.Горбань, Д.Г.Лахути, Н.В.Поцелуева, Е.Н.Казаков, А.Б.Антопольский, В.А.Киптенко, Т.В.Стрельцова, Н.И.Антонова, Ю.В.Сипапин, К.В.Благова
ВНЕСЕН Государственным комитетом СССР по науке и технике
Член Комитета Н.Б.Арутюнов
УТВЕРЖДЕН И ВВЕДЕН В ДЕЙСТВИЕ Постановлением Государственного комитета СССР по стандартам от 28 марта 1985 г., N 931
Настоящий стандарт устанавливает правила представления поисковых образов документов (ПОД) на магнитной ленте с записями в коммуникативном формате по ГОСТ 7.19-85.
Стандарт распространяется на ПОД, выраженные средствами информационно-поисковых языков (ИПЯ) с лексическими единицами на естественном языке (средствами вербальных ИПЯ). Правила построения ПОД на ИПЯ классификационного типа установлены в ГОСТ 7.19-85.
В настоящем стандарте используются термины по ГОСТ 7.14-84, ГОСТ 7.19-85, ГОСТ 7.25-80, ГОСТ 7.27-80 и ГОСТ 7.39-82, а также приведенные в справочном приложении.
1. ОБЩИЕ ПОЛОЖЕНИЯ
1.1. Каждая библиографическая запись в коммуникативном формате должна содержать ПОД, состоящий из лексических единиц одного из следующих типов: дескрипторы, ключевые слова, предметные рубрики. Допускается в пределах одной записи применять ПОД, включающие лексические единицы разных типов.
1.2. Лексические единицы (ЛЕ) в ПОД и их синтаксические конструкции снабжают специальными пометами, характеризующими их семантику и структуру.
1.3. Дескрипторы и предметные рубрики сопровождаются информацией о словаре, использованном при индексировании.
2. СТРУКТУРА ПОИСКОВОГО ОБРАЗА ДОКУМЕНТА
2.1. ПОД из ключевых слов или дескрипторов имеет структуру:
линейную (простой перечень ЛЕ с соблюдением или без соблюдения алфавитного порядка),
иерархическую (с синтаксическими конструкциями двух или более уровней иерархии).
В ПОД с иерархической структурой отдельные ЛЕ образуют исходный нижний уровень иерархии. Объединение ЛЕ (условно "предложение") образует второй уровень. Объединение предложений (условно "абзац") образует третий уровень. Количество уровней иерархии не ограничено.
Структурированный ПОД состоит из синтаксических конструкций (объединений ЛЕ) одного или разных уровней иерархии, а также наряду с синтаксическими конструкциями может включать отдельные ЛЕ.
Примеры:
1. ПОД состоит из простого перечня ЛЕ: А
2. ПОД состоит из предложений: (А
3. ПОД состоит из абзацев: ((А
4. ПОД состоит из предложения и отдельных ЛЕ: (А
5. ПОД состоит из абзаца и предложения: ((А
6. ПОД состоит из абзаца, предложения и отдельной ЛЕ: ((А
2.2. ПОД на языке предметных рубрик всегда имеет иерархическую структуру. Лексическими единицами ПОД на языке предметных рубрик являются предметные заголовки и уточняющие их предметные подзаголовки различного уровня иерархии. Форма их представления и взаимное подчинение заданы словарем (списком) предметных рубрик.
Пример: ПОД состоит из двух предметных рубрик (Р). Первая рубрика включает заголовок (З) и подзаголовок (ПЗ). Вторая рубрика включает заголовок, подзаголовок и подподзаголовок (ППЗ).
Р
Р
2.3. Данные, относящиеся к одному дескриптору, записывают в одном поле с меткой
2.4. Данные, относящиеся к одному ключевому слову, записывают в одном поле с меткой
2.5. Каждый предметный заголовок, подзаголовок или подподзаголовок предметной рубрики записывают в отдельном поле с меткой
2.6. Данные о связи ЛЕ, а также информационный вес синтаксических конструкций записывают в полях данных с меткой
2.7. В пределах ПОД рекомендуется при каждой ЛЕ приводить одинаковый набор подполей.
3. СПЕЦИФИКАЦИЯ ЭЛЕМЕНТОВ ДАННЫХ, ФОРМИРУЮЩИХ ПОД
3.1. Для идентификации элементов данных ПОД в соответствии с ГОСТ 7.19-85 используют метку, порядковый номер элемента данных в подзаписи (второй и третий символ части справочника, определяемой при применении), индикатор и идентификатор.
Индикатор для элементов данных ПОД принимает значение
В настоящем разделе элементы данных описываются в следующем порядке:
обозначение элемента данных: метка, индикатор и идентификатор (его второй символ),
наименование элемента данных,
признак обязательности (О - обязательный, Н - необязательный),
пояснение содержания,
способ записи,
пример записи.
Примеры записи даны в табличной форме, где указано содержание компонентов справочника (метка и порядковый номер поля данных) и полей данных (индикатор, идентификатор и содержание элемента данных).
3.2. Спецификация элементов данных поля с меткой
Перечень подполей с меткой
Таблица 1
|
|
C | Дескриптор тезауруса |
E | Код дескриптора |
N | Иерархический код дескриптора |
S | Дополнительная информация о дескрипторе |
A | Наименование тезауруса |
M | Регистрационный номер тезауруса в АСВИЯ |
Лексическая единица (дескриптор), взятая из тезауруса (дескрипторного словаря).
Способ записи. На естественном языке в соответствии со словарем-источником. Каждый дескриптор записывается в поле, включающем также элементы данных
Пример. ПОД состоит из дескрипторов, взятых из тезауруса с регистрационным номером
|
| ||
C | микро-ЭВМ | ||
|
| M | |
С | интерфейсы | ||
|
| М | |
С | стандарты | ||
|
| М | |
С | физика высоких энергий | ||
|
| М |
Код дескриптора в соответствии с используемым словарем ИПЯ. В коммуникативном формате может употребляться только с элементом данных
Способ записи. В виде, представленном в словаре. Подполе входит в состав поля, в котором записан дескриптор (элемент данных
Код, обозначающий место дескриптора в иерархии ПОД.
Способ записи. В подполе N поля
K - десятичная цифра, обозначающая число уровней иерархии в синтаксической конструкции,
i = 1,2,3…, K - номер уровня иерархии, начиная с верхнего.
N
Пример. Двухуровневый ПОД состоит из пяти дескрипторов, образующих два предложения:
первое предложение - программное обеспечение, компиляторы программ
второе предложение - грамматический разбор, К-грамматики, применение
|
| ||
C | программное обеспечение | ||
|
| N | 2 |
|
| M | |
С | компиляторы программ | ||
|
| N | 2 |
|
| М | |
С | граматический разбор | ||
|
| N | 2 |
|
| М | |
С | К-грамматики | ||
|
| N | 2 |
|
| М | |
С | применение | ||
|
| N | 2 |
|
| М |
Характеристики дескриптора, представленные в табл. 2.
Способ записи. В виде 6-символьного кода в соответствии с табл. 2 в поле соответствующего дескриптора. При отсутствии информации в позициях кода проставляется
Пример. Дескриптор "приусадебное хозяйство" является наименованием журнала и найден в тезаурусе при ручном индексировании данного журнала.
|
| ||
C | приусадебное хозяйство | ||
|
| S | IS |
|
| M | 53 |
Таблица 2
|
|
|
|
Семантическая | 1 | I | Имя собственное (идентификатор) |
характеристика |
| T | Термин |
|
| P | Наименование параметра |
|
| V | Значение параметра |
|
| M | Число |
|
| E | Единица величины |
Морфологическая | 2 | F | Фрагмент слова |
характеристика |
| A | Простое слово |
|
| C | Сложное слово |
|
| S | Словосочетание |
|
| B | Аббревиатура |
Роль в ПОД | 3 | Объект исследования, изобретения | |
|
| 1 | Характеристики, свойства, параметры объекта |
|
| 2 | Методы и средства исследования, технологическая оснастка |
|
| 3 | Составные части, узлы, детали объекта |
|
| 4 | Область применения объекта |
|
| 5 | Назначение объекта |
|
| 6 | Цель исследования, разработки |
|
| 7 | Результаты исследования, разработки |
Роль ЛЕ в конструкции | 4 | K | Опорная ЛЕ конструкции (используется как входное слово предметных указателей) |
|
| H | Второстепенная ЛЕ конструкции (определитель) |
|
| F | При данной ЛЕ имеется фактографическая информация |
Информационный вес ЛЕ в документе | 5 | 3 | Главный элемент (понятие, термин) |
|
| 2 | Определитель главного элемента |
|
| 1 | Второстепенный элемент |
|
| Отрицательный вес (в документе отсутствуют соответствующие данные) | |
Способ получения | 6 | 1 | ЛЕ назначена индексатором |
ЛЕ |
| 2 | ЛЕ получена при автоматическом индексировании |
|
| 3 | ЛЕ приписана при избыточном индексировании |
Наименование словаря-источника на естественном языке.
Способ записи. В соответствии с титульным листом словаря.
Регистрационный номер словаря-источника, присвоенный Центральной службой АСВИЯ.
Способ записи. Элемент данных записывается в структуре ННН.ГГ
(ННН - порядковый номер регистрации, ГГ - две последних цифры года регистрации).
Пример. Индексирование проводилось по тезаурусу, который имеет регистрационный номер 534.82
|
|
М 534.82 |
3.3. Спецификация элементов данных поля с меткой
Перечень подполей поля с меткой
Таблица 3
|
|
A | Ключевое слово (КС) |
N | Иерархический код КС |
S | Дополнительная информация о КС |
C | Язык КС |
Слово или словосочетание естественного языка, представляющее собой отдельную лексическую единицу ПОД.
Способ записи. На естественном языке в нормализованном виде по ГОСТ 7.25-80 в соответствии с индексируемым документом: в том же алфавите с сохранением пробелов, знаков препинания, цифр и специальных знаков. Примеры приведены в описании элемента данных
Код, обозначающий место ключевого слова в иерархии ПОД.
Способ записи и пример аналогичны приведенным в описании элемента данных
Характеристики ключевого слова, представленные в табл. 2.
Способ записи аналогичен приведенному в описании элемента данных
Пример. ПОД содержит одно предложение и два отдельных ключевых слова:
Примечание. ПОД представляется в виде однородных синтаксических конструкций (предложений). Первое предложение содержит два ключевых слова, второе и третье предложения содержат по одному ключевому слову.
|
| ||
A | конференции | ||
|
| N | 2 |
|
| S | |
A | Париж | ||
|
| N | 2 |
|
| S | |
A | обработка данных | ||
|
| N | 2 |
|
| S | |
A | программное обеспечение | ||
|
| N | 2 |
|
| S |
Язык, на котором записаны ключевые слова ПОД.
Способ записи и пример приведены в описании элемента данных 1
3.4. Спецификация элементов данных поля с меткой 67
Перечень подполей поля с меткой 67
Таблица 4
|
|
В | Предметная рубрика |
N | Иерархический код предметных рубрик |
С | Наименование словаря предметных рубрик |
М | Регистрационный номер словаря предметных рубрик |
67
Заголовок или подзаголовок предметной рубрики.
Примечание. Предметные рубрики могут состоять из заголовка и уточняющих его подзаголовков 1, 2, 3-го и более глубоких уровней иерархии. Каждый уровень иерархии предметной рубрики содержит не более одной ЛЕ. Формат не ограничивает глубину иерархии предметных рубрик.
Способ записи. В соответствии со словарем-источником. Каждая ЛЕ предметных рубрик записывается в отдельном поле.
Пример. ПОД включает одну простую предметную рубрику "Аккумуляторы", являющуюся заголовком и не имеющую подзаголовков:
|
| ||
B | Аккумуляторы |
67
Код, обозначающий место лексической единицы в иерархии предметной рубрики.
Способ записи. В виде трехсимвольного кода в подполе поля соответствующей ЛЕ в структуре РУУ
(Р - односимвольный порядковый номер рубрики в ПОД,
УУ - двухсимвольный номер уровня иерархии ЛЕ в предметной рубрике).
При этом нумерация уровней иерархии ведется от уровня заголовка предметной рубрики, которому присваивается номер
Пример. ПОД включает две предметные рубрики, имеющие подзаголовки:
Торф - Влажность - Измерение
Торф - Брикетирование
|
| ||
B | Торф | ||
|
| N | 1 |
B | Влажность | ||
|
| N | 1 |
B | Измерение | ||
|
| N | 1 |
B | Торф | ||
|
| N | 2 |
B | Брикетирование | ||
|
| N | 2 |
Описание аналогично элементу данных
Описание аналогично элементу данных
M.
3.5. Спецификация элементов данных поля с меткой 42
Перечень подполей поля с меткой, применяемых для представления ПОД, и порядок их следования в записи указаны в табл. 5.
Таблица 5
|
|
E | Характер отношения между элементами данных |
N | Характер отношения между ЛЕ в ПОД |
42
В соответствии с ГОСТ 7.19-85 содержит символ 4 для обозначения связи ЛЕ.
42
Дополнительная информация о характере отношения между ключевыми словами и/или дескрипторами ПОД, а также об информационном весе синтаксической конструкции.
Способ записи. В виде трехсимвольного кода, позиции которого заполняют по табл. 6, сопровождаемого адресами характеризуемых элементов данных, записываемыми вслед за трехсимвольным кодом и отделяемыми от него и друг от друга пробелом. Адресом ЛЕ является метка 63
Пример 1. Характеризуются отношения между третьим, четвертым и пятым ключевым словом ПОД. Отношение является связью компонентов в параметрической конструкции.
|
|
Пример 2. Вторая и третья ЛЕ дескрипторного ПОД являются синонимами.
|
|
Пример 3. Синтаксическая конструкция типа абзац образована первым и вторым предложением, а также включает пятый дескриптор. Конструкция характеризуется как главный элемент ПОД.
|
|
Таблица 6
Характер отношения между ЛЕ
|
|
|
|
Синтаксическая связь | 1 | С | Содержательная неинтерпретированная связь |
|
| D | Порядковая связь (указывать не обязательно) |
|
| F | Связь фрагментов лексической единицы |
|
| E | Связь компонентов параметрической конструкции |
|
| А | Связь типа "объект-характеристика" |
Парадигматические отношения | 2 | С | Синонимия |
|
| В | Связь опорной ЛЕ с вышестоящей по иерархии словаря индексирования |
|
| Н | Связь опорной ЛЕ с нижестоящей по иерархии словаря индексирования |
|
| А | Ассоциация |
Информационный | 3 | 3 | Главный элемент (ключевая |
2 | Определитель главного элемента | ||
1 | Второстепенный элемент (неключевая конструкция) | ||
Отрицательный вес |
4. ПРЕДСТАВЛЕНИЕ ДАННЫХ В ЗАПИСИ
4.1. При записи ПОД используют наборы символов и методы кодирования по ГОСТ 7.19-85. Не допускается заменять коды знаков одного алфавита кодами сходных по начертанию знаков другого алфавита.
4.2. В тех случаях, когда ПОД содержит дескрипторы или предметные рубрики, взятые из одного и того же словаря, либо ключевые слова, относящиеся к одному и тому же языку, достаточно указывать элементы данных
Пример. ПОД, приведенный в примере к описанию элемента данных
|
| ||
C | микро-ЭВМ | ||
|
| M | |
C | интерфейсы | ||
C | стандарты | ||
C | физика высоких энергий |
4.3. В качестве идентификаторов и кодов характеристики лексических единиц, установленных настоящим стандартом, применяют цифры и прописные буквы латинского алфавита.
ПРИЛОЖЕНИЕ
Справочное
ПОЯСНЕНИЯ К ТЕРМИНАМ, ПРИМЕНЯЕМЫМ В СТАНДАРТЕ
Вербальный ИПЯ - информационно-поисковый язык, для представления лексических единиц которого используются слова или выражения естественного языка.
Иерархический код - элемент данных, выраженный кодом, определяющим положение лексической единицы или синтаксической конструкции в иерархической структуре ПОД.
Структурированный ПОД - поисковый образ документа, записанный при помощи ИПЯ, использующего объединение лексических единиц в синтаксические конструкции.
Синтаксическая конструкция ПОД - объединение двух или более лексических единиц ПОД, которые при поиске информации должны рассматриваться совместно или в связи друг с другом. Синтаксические конструкции могут включать в себя синтаксические конструкции нижнего уровня и входить в конструкции верхнего уровня.
Отдельные ЛЕ также могут быть рассмотрены как вырожденные синтаксические конструкции.
АСНТИ - автоматизированная система научно-технической информации.
ГАСНТИ - Государственная автоматизированная система научно-технической информации.
АСВИЯ - Автоматизированная система ведения информационных языков.
Текст документа сверен по:
Госстандарт СССР -
М.: Издательство стандартов, 1985