allgosts.ru01. ОБЩИЕ ПОЛОЖЕНИЯ. ТЕРМИНОЛОГИЯ. СТАНДАРТИЗАЦИЯ. ДОКУМЕНТАЦИЯ01.140. Информатика. Издательское дело

ГОСТ Р 7.0.29-2010 Система стандартов по информации, библиотечному и издательскому делу. Электронные издания. Представление расширенного кириллического алфавита для обмена информацией

Обозначение:
ГОСТ Р 7.0.29-2010
Наименование:
Система стандартов по информации, библиотечному и издательскому делу. Электронные издания. Представление расширенного кириллического алфавита для обмена информацией
Статус:
Действует
Дата введения:
07/01/2011
Дата отмены:
-
Заменен на:
-
Код ОКС:
01.140.40

Текст ГОСТ Р 7.0.29-2010 Система стандартов по информации, библиотечному и издательскому делу. Электронные издания. Представление расширенного кириллического алфавита для обмена информацией



ФЕДЕРАЛЬНОЕ АГЕНТСТВО ПО ТЕХНИЧЕСКОМУ РЕГУЛИРОВАНИЮ И МЕТРОЛОГИИ

НАЦИОНАЛЬНЫЙ

СТАНДАРТ

РОССИЙСКОЙ

ФЕДЕРАЦИИ

ГОСТР

7.0.29-

2010

Система стандартов по информации, библиотечному и издательскому делу

ЭЛЕКТРОННЫЕ ИЗДАНИЯ

Представление расширенного кириллического алфавита для обмена информацией

ISO 5427:1984

Extension of the Cyrillic alphabet coded character set for bibliographic

information interchange (MOD)

ISO 10754:1996

Information and documentation — Extension of the Cyrillic alphabet coded character set for non-Slavic languages for bibliographic information interchange

(MOD)

Издание официальное

Москва

Стандартииформ

2011

ГОСТ Р 7.0.29—2010

Предисловие

Цели и принципы стандартизации а Российской Федерации установлены Федеральным законом от 27 декабря 2002 г. № 164-ФЗ «О техническом регулировании», а правила применения национальных стандартов Российской Федерации — ГОСТ Р 1.0—2004 «Стандартизация в Российской Федерации. Основные положения »

Сведения о стандарте

1    ПОДГОТОВЛЕН Учреждением Российской академии наук Всероссийским институтом научной и технической информации РАН (ВИНИТИ РАН)

2    ВНЕСЕН Техническим комитетом по стандартизации ТК191 «Научно-техническая информация, библиотечное и издательское дело»

3    УТВЕРЖДЕН И ВВЕДЕН В ДЕЙСТВИЕ Приказом Федерального агентства по техническому регулированию и метрологии от 9 ноября 2010 г. No 346-ст

4    Настоящий стандарт включает в себя идентичные основные нормативные положения следующих международных стандартов:

раздел 5 — ИСО 5427:1984 «Расширение набора кодированных знаков кириллицы для обмена библиографической информацией» (ISO 5427:1984 «Extension of the Cyrillic alphabet coded character set for bibliographic information interchange»);

раздел 8 — ИСО 10754:1996 «Расширение набора кодированных знаков кириллицы неславянских языков для обмена библиографической информацией» (ISO 10754:1996 «Information and documentation — Extension of the Cyrillic alphabet coded character set for non-Slavic languages for bibliographic information interchange»).

Сопоставление структуры и нумерации структурных элементов настоящего стандарта и основных нормативных положений указанных международных стандартов приведено во введении.

Применение указанных стандартов в настоящем стандарте обусловлено совпадением объекта стандартизации и принципов установления требований к нему

5    ВВЕДЕН ВПЕРВЫЕ

Информация об изменениях к настоящему стандарту публикуется в ежегодно издаваемом информационном указателе кНациональные стандарты», а текст изменений и поправок — е ежемесячно издаваемых информационных указателях «Национальные стандарты». В случае пересмотра (замены) или отмены настоящего стандарта соответствующее уведомление будет опубликовано в ежемесячно издаваемом информационном указателе «Национальные стандарты». Соответствующая информация, уведомление и тексты размещаются также е информационной системе общего пользования — на официальном сайте Федерального агентства по техническому регулированию и метрологии в сети Интернет

© Сгандартинформ. 2011

Настоящий стандарт не может быть полностью или частично воспроизведен, тиражирован и распространен в качестве официального издания без разрешения Федерального агентства по техническому регулированию и метрологии

ГОСТ Р 7.0.29—2010

Содержание

1    Область применения...................................................1

2    Нормативные ссылки..................................................1

3    Термины и определения................................................2

4    Общие положения....................................................2

5    Символы алфавитов славянских языков......................................2

в Символы алфавитов неславянских языков.....................................2

Приложение А (справочное) Использование символов расширенного набора в кириллических

алфавитах различных языков....................................8

in

ГОСТ Р 7.0.29—2010

Введение

Настоящий стандарт устанавливает расширение набора кодов для представления букв и других символов, используемых в алфавитах языков, продолжающих традициюславянской письменности, идущую отСвв. Кирилла и Мефодия в IX в. н. э. Вчислоэтих языков входит русский язык, другие восточнославянские и южнославянские языки, монгольский язык и множество языков народов бывшего Советского Союза. Эти алфавиты включают в себя основные буквы современного русского языка, коды которых установлены ГОСТ 27463—87. а также дополнительные символы, коды которых устанавливает настоящий стандарт в соответствии с требованиями двух международных стандартов. 8 разделе 5 настоящего стандарта установлена кодовая таблица для символов славянских языков (включая их старописьменные алфавиты), идентичная кодовой таблице ИСО 5427:1984. В разделе 6 настоящего стандарта установлена кодовая таблица для алфавитов неславянских языков, идентичная таблице 1 ИС0 10754:1996. 6 совокупности со стандартом ГОСТ27463—87 коды, установленные настоящим стандартом, достаточны для передачи текстовых данных на языках, указанных в приложении А. а также в других случаях, когда набор необходимых символов не выходит за пределы кодовых таблиц настоящего стандарта.

IV

ГОСТ Р 7.0.29—2010

НАЦИОНАЛЬНЫЙ СТАНДАРТ РОССИЙСКОЙ ФЕДЕРАЦИИ

Система стандартов по информации, библиотечному и издательскому делу

ЭЛЕКТРОННЫЕ ИЗДАНИЯ

Представление расширенного кириллического алфавита для обмена информацией

System of standards on information, librananshipand publishing. Electronic publishing. Representation of extended Cyrillic alphabet for information interchange

Дата введения — 2011—07—01

1    Область применения

1.1    Настоящий стандарт устанавливает набориэ135графичвскихсимволов, включая ихнаимено-вания, обозначения и7-битные коды, атакже указания об их использовании—для обмена информацией на машиночитаемых носителях и в информационных сетях. Данный набор символов используется совместно с набором КОИ-7 HI по ГОСТ 27463. При использовании 8-битного кода настоящий стандарт применяется совместно с ГОСТ 19768.

1.2    Эти символы вместе с основным набором кириллических символов, зарегистрированным под номером 37 в международном регистре ИСО. составляют набор символов для международного обмена информацией, включая библиографические данные, аннотации и полные тексты документов, электронные издания на языках, указанных в 1.3.

1.3    Набор символов предназначен для представления текстовых данныхи обмена ими наследую-щихяэыках славянской группы: русском, белорусском, украинском, болгарском, македонском, сербском, а также на других языках, которые используют алфавиты на русской графической основе (кириллические алфавиты) в пределах установленного здесь набора. Перечень соответствующих языков см. в приложении А.

1.4    Настоящий стандарт не включает в себя символы, использовавшиеся в алфавитах некоторых языков в XIX веке и ранее и к XX веку вышедшие из употребления.

1.5    Настоящий стандарт не устанавливает типы шрифтов графических символов и не регламентирует методы обнаружения и обработки ошибок кодового представления символов.

1.6    Настоящий стандарт предназначен дляорганов научно-технической информации, а также для других организаций и предприятий, осуществляющих научно-информационную деятельность.

2    Нормативные ссылки

8 настоящем стандарте использованы нормативные ссылки на следующие стандарты:

ГОСТ 19768—93 Информационная технология. Наборы 8-битных кодированных символов. Двоичный код обработки информации

ГОСТ 27463—87 Системы обработки информации. 7-битные кодированные наборы символов

ГОСТ 27466—87 Системы обработки информации. Наборы символов в 7-и 8-битных кодах. Методы расширения кодов.

Примечание — При пользовании настоящим стандартом целесообразно проверить действие ссылочных стандартов в информационной системе общего пользования — на официальном сайте Федерального агентства по техническому регулирование и метрологии в сети Интернет или по ежегодно издаваемому информационному указателе «Национальные стандарты», который опубликован по состояние на 1 января текущего года, и по соответствующим ежемесячно издаваемым информационным указателям, опубликованным в текущем году.

Издание официальное

1

ГОСТ Р 7.0.29—2010

Если ссылочный стандарт заменен (изменен), то при пользовании настоящим стандартом следует руководствоваться заменяющим (измененным) стандартом. Если ссылочный стандарт отменен без замены, то положение, в котором дана ссылка на него, применяется в части, не затрагивающей эту ссылку.

3    Термины и определения

В настоящем стандарте применены следующие термины с соответствующими определениями.

3.1    кириллический алфавит: Алфавит, основанный на использовании русских букв и некоторых дополнительных символов и восходящий к традиции письменности, установленной просветителями славянских народов Сев. Кириллом и Мефодием в IX в.

3.2    символ алфавита: Элемент письменности, представленный на машиночитаемом носителе 7-битным кодом и визуализируемый как изображение определенной буквы или другого орфографического знака.

4    Общие положения

4.1    Настоящий набор кодов применяется для записи текстовых данных на носителях информации и для передачи по линиям связи в соответствии с национальными и международными стандартами на обработку данных, которые, в частности, определяют меры обнаружения и исправления ошибок.

4.2    Применение настоящего стандарта осуществляется совместно с ГОСТ 27466. Кодирование символов алфавитов славянских языков определено в разделе 5. Кодирование символов алфавитов неславянских языков определено в разделе 6.

4.3    В кодовых таблицах 1 и 2 внутри жирной рамки указаны изображения символов алфавитов, а в боковике и головке таблиц — значения битое соответствующего кода b;beb5b4b3b2b,. где [Ьд — значения л-го бита (ноль или единица)лри счете, начинаяот младшего разряда]. Коды, соответствующие незаполненным клеткам таблицы, для представления алфавитных символов не используют. В пятой колонке боковика указаны 16-ричные значения первых четырех битов; в четвертой строчке — 6-ричные значения последних трех битов кода.

4.4    Идентификация настоящего набора графических символов в потоке данных осуществляется переключающими последовательностями согласно ГОСТ 27466.

5    Символы алфавитов славянских языков

5.1    Коды символов для расширенных алфавитов славянских языков (русского, белорусского, болгарского. македонского, сербского и украинского) устанавливает кодовая таблица 1.

5.2    Для идентификации настоящего набора символов в потоке данных установлены следующие переключающие последовательности:

АР2 2/8 3/2 — в качестве набора ГО;

АР2 2/9 3/2 — в качестве набора Г1.

5.3    ВтаблицеЗ указаны наименования символов иязыки, в алфавите которыхони употребляются.

6    Символы алфавитов неславянских языков

6.1    Коды символов для расширенных алфавитов неславянских языков (указанных в приложении А) устанавливает кодовая таблица 2.

6.2    В колонках 2 и 3 таблицы 2 (позиции 21—27 и 31—37) указаны диакритические знаки, которые используются в комбинации с одним из остальных символов в качестве надстрочного или подстрочного дополнения.

В алфавитах неславянских языков иногда не соблюдаются точное написание и различение подстрочных знаков «хвостик направо», «хвостик налево», «огонек», «левый огонек», а также надстрочных знаков «верхняя запятая», «апостроф», «слабое ударение», но они все приведены втаблицах2и4.стем чтобы обеспечить передачу орфографически правильного текста.

2

ГОСТ Р 7.0.29—2010

Таблица 1— Коды символов расширенного набора для алфавитов славянских языков

•>7

0

0

0

0

1

1

1

1

be

0

0

1

t

0

0

1

1

bs

0

1

0

t

0

1

0

1

b1

b?

0?

bl

0

1

2

3

4

б

6

7

0

0

0

0

0

r

b

r

ь

0

0

0

1

1

b

e

Ъ

0

0

0

1

0

2

г

V

f

V

0

0

1

1

3

ж

e

ж

0

1

0

0

4

ё

Ё

0

1

0

1

5

s

s

0

1

1

0

6

i

i

0

1

1

1

7

l

i

1

0

0

0

8

j

J

1

0

0

1

9

Jb

Jb

1

0

1

0

A

lb

H>

1

0

1

1

в

h

i

ъ

1

1

0

0

C

k

к

1

1

0

1

0

9

i

У

1

1

1

0

E

Ц

u

1

1

1

1

F

ъ

6.3 Переключающие последовательности для идентификации в потоке данных настоящего набора кодов установлены Международным регистром наборов символов11.

1} International Register of Cheractres Sest. Обратиться к нему можно через секретариат регистрационного агентства по адресу: ЕСМА. 114 Rue du Rone. CHOI294. Geneve. Suisse (Switzerland).

3

ГОСТ Р 7.0.29—2010

Таблица 2 — Коды символов расширенного набора для алфавитов неславянских языков

Ь7

0

0

0

0

1

1

1

1

Ьв

0

0

1

1

0

0

1

1

Ь*

0

1

0

1

0

1

0

1

Ь4

ЬЭ

Ь2

*>1

0

1

2

3

4

5

в

7

0

0

0

0

0

I

I

о

<&

0

0

0

1

1

t

fw

j

J

ое

0

0

1

0

2

О

к

К

П)

ft

0

0

1

1

3

9

9

ТС

ТС

Р=

К

0

1

0

0

4

Р

Р

k

к

с-

С-

0

1

0

1

S

б

б

к

к

X

X

0

1

1

0

б

9

б

q

Oi

Y

Y

0

1

1

1

7

о

6

i

L

Y

Y

1

0

0

0

в

ж

Ж

я

Л

W

W

1

0

0

1

9

F

Г

Л

Л>

д

и

1

0

1

0

А

н

Е

Ж

ч

Ч

1

0

1

1

В

d

d

fT

ьг

h

h

1

1

0

0

с

ct

d

Н»

ft

ч;

't

1

1

0

1

D

3

3

Н,

Н/

о

В

1

1

1

0

Е

-)

3

lh

ft

ж

Ж

1

1

1

1

F

3-

&

О

о

I

6.4 В таблице 4 приведены наименования или описания символов для расширенных алфавитов неславянских языков.

ГОСТ Р 7.0.29—2010

Таблица 3 — Наименования символов расширенного набора для алфавитов славянских языков

Кед в 16-значном представлении

Строимая

буква

Код а 16-зм*мом представлении

Заглавная

буква

Наименование

Язык

40

Г

60

Г

Взрывное Г

Украинский.

белорусский

41

Ь

61

Ъ

Мягкое Д

Сербский

42

г

62

Г

Мягкое Г

Македонский

43

е

63

Мягкое Е

Украинский

44

ё

64

Ё

Ё(йо)

Русский,

белорусский

4S

S

65

S

Зело

Македонский

46

i

66

I

И с точкой

Украинский.

белорусский.

русский

47

«•

1

67

I

И с двумя точками

Украинский

48

j

68

J

Йот

Сербский,

македонский

49

л>

69

л>

Мягкое Л

Сербский.

македонский

н>

Н>

Мягкое Н

Сербский.

македонский

48

h

ев

Ъ

Мятое Т

Сербский

к

вс

К

Мягкое К

Македонский

4D

У

60

У

Краткое У

Белорусский

U

ц

Звонкое Ч

Сербский

6F

ъ

Твердый знак

Русский.

болгарский

50

t

70

ъ

Ять

Русский,

болгарский

51

в

71

0

Фита

Русский,

болгарский

52

V

72

V

Ижица

Русский,

болгарский

53

ж

73

ж

Юс

Болгарский

58

[

Скобка

открывающая

Все

50

]

Скобка

закрывающая

Все

5F

Нижняя черта

Все

S

ГОСТ Р 7.0.29—2010

Таблица 4 — Символы расширенного набора для алфавитов неславянских языков

Код а 16-зн»*«>м представлении

Строчная

буква

Кода 16-значном представлвти

Заглавная

буква

Описание, уточняющее характер изображения

21

й

Ударение (акут)

22

• •

Диерез (трема, умляут). Две точки над буквой

23

ф

Огонек. Хвостик снизу буквы

24

О.

Хвостик справа от буквы

25

Кратка (бревис) Плавная дута над буквой

26

ф

Седиль

27

Слабое ударение (гравие)

28

зе

38

JE

Лигатура А и Е

29

F

39

Г

Перечеркнутая Г

К

ЗА

Е

Гс крюком

d

38

d

Совпадает с латинской строчной d

d

ЗС

d/

Латинская строчная d с хвостиком вверх

20

3

30

3

3 с плоской верхушкой

1

ЗЕ

3

3 С ХВОСТИКОМ ВНИЗ

2F

г

3F

3 с хвостиком вверх

31

а

Двойное ударение

32

П

Долгота (макрон). Прямая черта сверху буквы

33

ф

Левый огонек Хвостик налево под буквой

34

щ

Левый хвостик

35

W

Корона. Ломаная черта над буквой

36

й

Кружок над буквой

37

й

Запятая над буквой

40

t

50

X

I

Латинская ( с чертой и точкой сверху

41

i

41

j

Перечеркнутый йот

42

к

52

К

Перечеркнутая К

6

ГОСТ Р 7.0.29—2010

Окончание таблицы 4

Кол В 16-ЗНЗЧНОМ представлении

Строчная

буква

Коде 16-значном представлении

Заглавная

буква

Описание, уточняющее характер изображения

43

ТС

53

ТС

К с флажком слева

44

к

54

к

К с крестом

4S

к

55

К с кружком сверху

46

q

56

о!(Q)

Совпадает с латинской Q

47

I

57

L

Совпадает с латинской L

48

л

58

Л

Л с хвостиком вверх

49

Jb

59

Jh

Л с крюком

JV.

Ж

Лигатура Л и К

48

O'

58

ьг

Лигатура Н и Г

lb

Ну

Н с флажком справа

40

а

SD

Н/

Н с хвостиком вверх

Н»

Ну

Нс крюком

4F

&

5F

о

Перечеркнутая 0

60

а

70

Напоминает рукописную заглавную О

61

се

71

СЕ

Лигатура 0 и Е

62

п»

72

гъ

П с крюком

63

I*

73

к

Лигатура Р и К

64

с-

74

G

С с чертой, напоминает латинскую заглавную G

65

ъ

75

т

Т с хвостиком вверх

66

Y

76

Y

Прямая У. совпадает с латинской Y

67

Y

77

¥

Прямая У перечеркнутая

68

W

78

W

Совпадает с латинской w

69

и

79

ц

Ц с крышкой

ч

Ч

Перечеркнутая Ч

68

h

h

Совпадает с латинской строчной h

Напоминает рукописную Ч

60

Э

70

0

Шва

ж

Ж

Лоттура Я и Е

6F

I

Гуттуральный знак

7

ГОСТ Р 7.0.29—2010

Приложение А (справочное)

Использование символов расширенного набора в кириллических алфавитах

различных языков

Таблице А.1

Язык

Простые буквы и комбинации

с диакритическими знаками, используемые е данном языке

Абазинский

I

Абхазский

к, ц,£, Ъ з, к, <&, п, п?, т, *,и, % э

Аварский

I

Адыгейский

I

Азербайджанский

г, o,j, к, о, у, М

Айсорский

d, э, j, 1, q, s, h

Алтайский

j,w. 6, у

Башкирский

f, 3,tc, y,h, э

Белорусский

i, % e, r

Болгарский (до 1945 г.)

i, b, v, в, ж

Бурят схий

й, 0, у, Yt h

Даргинский

I

Дунганский

Y

Ингушский

I

Кабардинский

I

Казахский

Э, F, i, 1$, h,, 0, Yt ¥> h

Калмыцкий

а, 6,у,зц,ц,о, Y, h, э

Каракалпакский

э, г, К, Ц, 0, Yt Ут x

Кэрэчайский

У

Карельский

a, o,y

Киргизский

i\, e, y

Коми

i,o

Корякский

Курдский

г', э, э', k\ 6, n', p', t\ h, h\ ч\ q, w

Лакский

1

Лезгинский

I

Македонский

f, S,j, к

Мансийский

H, (Ю

Марийский (горный)

а, о, у, и-, ы

8

ГОСТ Р 7.0.29—2010

Окончание таблицы А.1

Язык

Простые буквы и комбинации

с диакритическими знаками, используемые в данном языке

Марийский (путовой)

а, о, у, н-

Молдавский

ж

Монгольский

в» Y

Мордовский (мокша)

ж, ё, jk, ir, б, р, й, э

Мовдовский (эрзя)

Ненецкий

н.

Осетинский

ж

Русский

ё

Русский (до 1918 г.)

ё, i, b, v, о

Саамский

Ц

Селькупский

а, се

Сербский

Ь, h, л», 1Ь. у, j

Табасаранский

I

Таджикский

г,к,х,,Ч*й,у

Татарский (казанский)

ж,, н* ©, у, К э

Татарский (кряшенский)

а, б, у, н-

Татский

I

Тувинский

Ц,0,У

Туркменский

ж,, ц, в, Y>э

Удмуртский

ж, 3, й, б, ч

Узбекский

Уйгурский

г, ж,, к, н,е,у,э, h

Украинский

г, i, i, е

Хакасский

г, U,h;, 6,y,v, h, (ц)

Хантыйский (вахский)

а, б,ё, е,э,э, у, к,, н>

Хантыйский (казымский)

а, ё, о, э, э, п\н,

Хаитыйсхий (сургутский)

а, ё, в, э, у, к,, н,

Хантыйский (шуруцкарский)

Ц

Цыганский

Чеченский

с, h, h, j, к,, k, н., д, q, ть х, ц, А, I

Чувашски*

а, ё, ё, л», нч д, if., с, т;, f, т>, у, у

Чукотский

к,,Д

Шорский

|.н\ б, у

Эвенкийский

д

Эвенский

Д, 0, 0

Эскимосский

г', к', л', н\ х\ у, (л,)

Якутский

а, 6, у, у, 0, R, H\h

9

ГОСТ Р 7.0.29—2010

УДК 025.43.026.036:006.354    ОКС01.140.40    Т62

Ключевые слова: набор кодированных символов, кириллический алфавит, расширенный набор символов, символы алфавитов, славянские языки, неславянские языки, обмен информацией, текстовые данные. лредставление данных

ю

Редактор Р.Г. Гоаврдовекая Технический редактор Н.С. Гришанова Корректор Ы.8. буйная Компьютерная верстка И.А Напейкиной

Сдано а набор 07.11.2011. Подписано а печать 14.11.2011.    Формат 60 к 84у£. Гарнитура Арнал.

Уел. печ. л. 1.86. Уч.-иэд л. 1.30. Тираж 111 эко. Зак. 1089

ФГУП «СТАНДАРТИНФОРМ». 123996 Москва. Гранатный пер.. *. www.90slinfo.1u    

Набрано во ФГУП «СТАНДАРТИНФОРМ» на ПЭВМ.

Отпечатано а филиале ФГУП «СТАНДАРТИНФОРМ» — тип. «Московский печатник». 105062 Москва. Лялин пер.. 6.