ФЕДЕРАЛЬНОЕ АГЕНТСТВО ПО ТЕХНИЧЕСКОМУ РЕГУЛИРОВАНИЮ И МЕТРОЛОГИИ

НАЦИОНАЛЬНЫЙ
СТАНДАРТ
РОССИЙСКОЙ
ФЕДЕРАЦИИ
ГОСТР
7.0.29-
2010
Система стандартов по информации, библиотечному и издательскому делу
ЭЛЕКТРОННЫЕ ИЗДАНИЯ
Представление расширенного кириллического алфавита для обмена информацией
ISO 5427:1984
Extension of the Cyrillic alphabet coded character set for bibliographic
information interchange (MOD)
ISO 10754:1996
Information and documentation — Extension of the Cyrillic alphabet coded character set for non-Slavic languages for bibliographic information interchange
(MOD)
Издание официальное

Москва
Стандартииформ
2011
ГОСТ Р 7.0.29—2010
Предисловие
Цели и принципы стандартизации а Российской Федерации установлены Федеральным законом от 27 декабря 2002 г. № 164-ФЗ «О техническом регулировании», а правила применения национальных стандартов Российской Федерации — ГОСТ Р 1.0—2004 «Стандартизация в Российской Федерации. Основные положения »
Сведения о стандарте
1 ПОДГОТОВЛЕН Учреждением Российской академии наук Всероссийским институтом научной и технической информации РАН (ВИНИТИ РАН)
2 ВНЕСЕН Техническим комитетом по стандартизации ТК191 «Научно-техническая информация, библиотечное и издательское дело»
3 УТВЕРЖДЕН И ВВЕДЕН В ДЕЙСТВИЕ Приказом Федерального агентства по техническому регулированию и метрологии от 9 ноября 2010 г. No 346-ст
4 Настоящий стандарт включает в себя идентичные основные нормативные положения следующих международных стандартов:
раздел 5 — ИСО 5427:1984 «Расширение набора кодированных знаков кириллицы для обмена библиографической информацией» (ISO 5427:1984 «Extension of the Cyrillic alphabet coded character set for bibliographic information interchange»);
раздел 8 — ИСО 10754:1996 «Расширение набора кодированных знаков кириллицы неславянских языков для обмена библиографической информацией» (ISO 10754:1996 «Information and documentation — Extension of the Cyrillic alphabet coded character set for non-Slavic languages for bibliographic information interchange»).
Сопоставление структуры и нумерации структурных элементов настоящего стандарта и основных нормативных положений указанных международных стандартов приведено во введении.
Применение указанных стандартов в настоящем стандарте обусловлено совпадением объекта стандартизации и принципов установления требований к нему
5 ВВЕДЕН ВПЕРВЫЕ
Информация об изменениях к настоящему стандарту публикуется в ежегодно издаваемом информационном указателе кНациональные стандарты», а текст изменений и поправок — е ежемесячно издаваемых информационных указателях «Национальные стандарты». В случае пересмотра (замены) или отмены настоящего стандарта соответствующее уведомление будет опубликовано в ежемесячно издаваемом информационном указателе «Национальные стандарты». Соответствующая информация, уведомление и тексты размещаются также е информационной системе общего пользования — на официальном сайте Федерального агентства по техническому регулированию и метрологии в сети Интернет
© Сгандартинформ. 2011
Настоящий стандарт не может быть полностью или частично воспроизведен, тиражирован и распространен в качестве официального издания без разрешения Федерального агентства по техническому регулированию и метрологии
ГОСТ Р 7.0.29—2010
Содержание
1 Область применения...................................................1
2 Нормативные ссылки..................................................1
3 Термины и определения................................................2
4 Общие положения....................................................2
5 Символы алфавитов славянских языков......................................2
в Символы алфавитов неславянских языков.....................................2
Приложение А (справочное) Использование символов расширенного набора в кириллических
алфавитах различных языков....................................8
in
ГОСТ Р 7.0.29—2010
Введение
Настоящий стандарт устанавливает расширение набора кодов для представления букв и других символов, используемых в алфавитах языков, продолжающих традициюславянской письменности, идущую отСвв. Кирилла и Мефодия в IX в. н. э. Вчислоэтих языков входит русский язык, другие восточнославянские и южнославянские языки, монгольский язык и множество языков народов бывшего Советского Союза. Эти алфавиты включают в себя основные буквы современного русского языка, коды которых установлены ГОСТ 27463—87. а также дополнительные символы, коды которых устанавливает настоящий стандарт в соответствии с требованиями двух международных стандартов. 8 разделе 5 настоящего стандарта установлена кодовая таблица для символов славянских языков (включая их старописьменные алфавиты), идентичная кодовой таблице ИСО 5427:1984. В разделе 6 настоящего стандарта установлена кодовая таблица для алфавитов неславянских языков, идентичная таблице 1 ИС0 10754:1996. 6 совокупности со стандартом ГОСТ27463—87 коды, установленные настоящим стандартом, достаточны для передачи текстовых данных на языках, указанных в приложении А. а также в других случаях, когда набор необходимых символов не выходит за пределы кодовых таблиц настоящего стандарта.
IV
ГОСТ Р 7.0.29—2010
НАЦИОНАЛЬНЫЙ СТАНДАРТ РОССИЙСКОЙ ФЕДЕРАЦИИ
Система стандартов по информации, библиотечному и издательскому делу
ЭЛЕКТРОННЫЕ ИЗДАНИЯ
Представление расширенного кириллического алфавита для обмена информацией
System of standards on information, librananshipand publishing. Electronic publishing. Representation of extended Cyrillic alphabet for information interchange
Дата введения — 2011—07—01
1 Область применения
1.1 Настоящий стандарт устанавливает набориэ135графичвскихсимволов, включая ихнаимено-вания, обозначения и7-битные коды, атакже указания об их использовании—для обмена информацией на машиночитаемых носителях и в информационных сетях. Данный набор символов используется совместно с набором КОИ-7 HI по ГОСТ 27463. При использовании 8-битного кода настоящий стандарт применяется совместно с ГОСТ 19768.
1.2 Эти символы вместе с основным набором кириллических символов, зарегистрированным под номером 37 в международном регистре ИСО. составляют набор символов для международного обмена информацией, включая библиографические данные, аннотации и полные тексты документов, электронные издания на языках, указанных в 1.3.
1.3 Набор символов предназначен для представления текстовых данныхи обмена ими наследую-щихяэыках славянской группы: русском, белорусском, украинском, болгарском, македонском, сербском, а также на других языках, которые используют алфавиты на русской графической основе (кириллические алфавиты) в пределах установленного здесь набора. Перечень соответствующих языков см. в приложении А.
1.4 Настоящий стандарт не включает в себя символы, использовавшиеся в алфавитах некоторых языков в XIX веке и ранее и к XX веку вышедшие из употребления.
1.5 Настоящий стандарт не устанавливает типы шрифтов графических символов и не регламентирует методы обнаружения и обработки ошибок кодового представления символов.
1.6 Настоящий стандарт предназначен дляорганов научно-технической информации, а также для других организаций и предприятий, осуществляющих научно-информационную деятельность.
2 Нормативные ссылки
8 настоящем стандарте использованы нормативные ссылки на следующие стандарты:
ГОСТ 19768—93 Информационная технология. Наборы 8-битных кодированных символов. Двоичный код обработки информации
ГОСТ 27463—87 Системы обработки информации. 7-битные кодированные наборы символов
ГОСТ 27466—87 Системы обработки информации. Наборы символов в 7-и 8-битных кодах. Методы расширения кодов.
Примечание — При пользовании настоящим стандартом целесообразно проверить действие ссылочных стандартов в информационной системе общего пользования — на официальном сайте Федерального агентства по техническому регулирование и метрологии в сети Интернет или по ежегодно издаваемому информационному указателе «Национальные стандарты», который опубликован по состояние на 1 января текущего года, и по соответствующим ежемесячно издаваемым информационным указателям, опубликованным в текущем году.
Издание официальное
1
ГОСТ Р 7.0.29—2010
Если ссылочный стандарт заменен (изменен), то при пользовании настоящим стандартом следует руководствоваться заменяющим (измененным) стандартом. Если ссылочный стандарт отменен без замены, то положение, в котором дана ссылка на него, применяется в части, не затрагивающей эту ссылку.
3 Термины и определения
В настоящем стандарте применены следующие термины с соответствующими определениями.
3.1 кириллический алфавит: Алфавит, основанный на использовании русских букв и некоторых дополнительных символов и восходящий к традиции письменности, установленной просветителями славянских народов Сев. Кириллом и Мефодием в IX в.
3.2 символ алфавита: Элемент письменности, представленный на машиночитаемом носителе 7-битным кодом и визуализируемый как изображение определенной буквы или другого орфографического знака.
4 Общие положения
4.1 Настоящий набор кодов применяется для записи текстовых данных на носителях информации и для передачи по линиям связи в соответствии с национальными и международными стандартами на обработку данных, которые, в частности, определяют меры обнаружения и исправления ошибок.
4.2 Применение настоящего стандарта осуществляется совместно с ГОСТ 27466. Кодирование символов алфавитов славянских языков определено в разделе 5. Кодирование символов алфавитов неславянских языков определено в разделе 6.
4.3 В кодовых таблицах 1 и 2 внутри жирной рамки указаны изображения символов алфавитов, а в боковике и головке таблиц — значения битое соответствующего кода b;beb5b4b3b2b,. где [Ьд — значения л-го бита (ноль или единица)лри счете, начинаяот младшего разряда]. Коды, соответствующие незаполненным клеткам таблицы, для представления алфавитных символов не используют. В пятой колонке боковика указаны 16-ричные значения первых четырех битов; в четвертой строчке — 6-ричные значения последних трех битов кода.
4.4 Идентификация настоящего набора графических символов в потоке данных осуществляется переключающими последовательностями согласно ГОСТ 27466.
5 Символы алфавитов славянских языков
5.1 Коды символов для расширенных алфавитов славянских языков (русского, белорусского, болгарского. македонского, сербского и украинского) устанавливает кодовая таблица 1.
5.2 Для идентификации настоящего набора символов в потоке данных установлены следующие переключающие последовательности:
АР2 2/8 3/2 — в качестве набора ГО;
АР2 2/9 3/2 — в качестве набора Г1.
5.3 ВтаблицеЗ указаны наименования символов иязыки, в алфавите которыхони употребляются.
6 Символы алфавитов неславянских языков
6.1 Коды символов для расширенных алфавитов неславянских языков (указанных в приложении А) устанавливает кодовая таблица 2.
6.2 В колонках 2 и 3 таблицы 2 (позиции 21—27 и 31—37) указаны диакритические знаки, которые используются в комбинации с одним из остальных символов в качестве надстрочного или подстрочного дополнения.
В алфавитах неславянских языков иногда не соблюдаются точное написание и различение подстрочных знаков «хвостик направо», «хвостик налево», «огонек», «левый огонек», а также надстрочных знаков «верхняя запятая», «апостроф», «слабое ударение», но они все приведены втаблицах2и4.стем чтобы обеспечить передачу орфографически правильного текста.
2
ГОСТ Р 7.0.29—2010
Таблица 1— Коды символов расширенного набора для алфавитов славянских языков
•>7 | 0 | 0 | 0 | 0 | 1 | 1 | 1 | 1 | ||||
be | 0 | 0 | 1 | t | 0 | 0 | 1 | 1 | ||||
bs | 0 | 1 | 0 | t | 0 | 1 | 0 | 1 | ||||
b1 | b? | 0? | bl | 0 | 1 | 2 | 3 | 4 | б | 6 | 7 | |
0 | 0 | 0 | 0 | 0 | r | b | r | ь | ||||
0 | 0 | 0 | 1 | 1 | b | e | Ъ | 0 | ||||
0 | 0 | 1 | 0 | 2 | г | V | f | V | ||||
0 | 0 | 1 | 1 | 3 | € | ж | e | ж | ||||
0 | 1 | 0 | 0 | 4 | ё | Ё | ||||||
0 | 1 | 0 | 1 | 5 | s | s | ||||||
0 | 1 | 1 | 0 | 6 | i | i | ||||||
0 | 1 | 1 | 1 | 7 | l | i | ||||||
1 | 0 | 0 | 0 | 8 | j | J | ||||||
1 | 0 | 0 | 1 | 9 | Jb | Jb | ||||||
1 | 0 | 1 | 0 | A | lb | H> | ||||||
1 | 0 | 1 | 1 | в | h | i | ъ | |||||
1 | 1 | 0 | 0 | C | k | к | ||||||
1 | 1 | 0 | 1 | 0 | 9 | i | У | |||||
1 | 1 | 1 | 0 | E | Ц | u | ||||||
1 | 1 | 1 | 1 | F | ъ |
6.3 Переключающие последовательности для идентификации в потоке данных настоящего набора кодов установлены Международным регистром наборов символов11.
1} International Register of Cheractres Sest. Обратиться к нему можно через секретариат регистрационного агентства по адресу: ЕСМА. 114 Rue du Rone. CHOI294. Geneve. Suisse (Switzerland).
3
ГОСТ Р 7.0.29—2010
Таблица 2 — Коды символов расширенного набора для алфавитов неславянских языков
Ь7 | 0 | 0 | 0 | 0 | 1 | 1 | 1 | 1 | ||||
Ьв | 0 | 0 | 1 | 1 | 0 | 0 | 1 | 1 | ||||
Ь* | 0 | 1 | 0 | 1 | 0 | 1 | 0 | 1 | ||||
Ь4 | ЬЭ | Ь2 | *>1 | 0 | 1 | 2 | 3 | 4 | 5 | в | 7 | |
0 | 0 | 0 | 0 | 0 | I | I | о | <& | ||||
0 | 0 | 0 | 1 | 1 | t □ | fw □ | j | J | ое | (Е | ||
0 | 0 | 1 | 0 | 2 | О | □ | к | К | П) | ft | ||
0 | 0 | 1 | 1 | 3 | 9 | 9 | ТС | ТС | Р= | К | ||
0 | 1 | 0 | 0 | 4 | Р | Р | k | к | с- | С- | ||
0 | 1 | 0 | 1 | S | б | б | к | к | X | X | ||
0 | 1 | 1 | 0 | б | 9 | б | q | Oi | Y | Y | ||
0 | 1 | 1 | 1 | 7 | о | 6 | i | L | Y | Y | ||
1 | 0 | 0 | 0 | в | ж | Ж | я | Л | W | W | ||
1 | 0 | 0 | 1 | 9 | F | Г | Л | Л> | д | и | ||
1 | 0 | 1 | 0 | А | н | Е | /к | Ж | ч | Ч | ||
1 | 0 | 1 | 1 | В | d | d | fT | ьг | h | h | ||
1 | 1 | 0 | 0 | с | ct | d | Н» | ft | ч; | 't | ||
1 | 1 | 0 | 1 | D | 3 | 3 | Н, | Н/ | о | В | ||
1 | 1 | 1 | 0 | Е | -) | 3 | lh | ft | ж | Ж | ||
1 | 1 | 1 | 1 | F | 3- | & | О | о | I |
6.4 В таблице 4 приведены наименования или описания символов для расширенных алфавитов неславянских языков.
ГОСТ Р 7.0.29—2010
Таблица 3 — Наименования символов расширенного набора для алфавитов славянских языков
Кед в 16-значном представлении | Строимая буква | Код а 16-зм*мом представлении | Заглавная буква | Наименование | Язык |
40 | Г | 60 | Г | Взрывное Г | Украинский. белорусский |
41 | Ь | 61 | Ъ | Мягкое Д | Сербский |
42 | г | 62 | Г | Мягкое Г | Македонский |
43 | е | 63 | € | Мягкое Е | Украинский |
44 | ё | 64 | Ё | Ё(йо) | Русский, белорусский |
4S | S | 65 | S | Зело | Македонский |
46 | i | 66 | I | И с точкой | Украинский. белорусский. русский |
47 | «• 1 | 67 | I | И с двумя точками | Украинский |
48 | j | 68 | J | Йот | Сербский, македонский |
49 | л> | 69 | л> | Мягкое Л | Сербский. македонский |
4А | н> | 6А | Н> | Мягкое Н | Сербский. македонский |
48 | h | ев | Ъ | Мятое Т | Сербский |
4С | к | вс | К | Мягкое К | Македонский |
4D | У | 60 | У | Краткое У | Белорусский |
4Е | U | 6Е | ц | Звонкое Ч | Сербский |
6F | ъ | Твердый знак | Русский. болгарский | ||
50 | t | 70 | ъ | Ять | Русский, болгарский |
51 | в | 71 | 0 | Фита | Русский, болгарский |
52 | V | 72 | V | Ижица | Русский, болгарский |
53 | ж | 73 | ж | Юс | Болгарский |
58 | [ | Скобка открывающая | Все | ||
50 | ] | Скобка закрывающая | Все | ||
5F | — | Нижняя черта | Все |
S
ГОСТ Р 7.0.29—2010
Таблица 4 — Символы расширенного набора для алфавитов неславянских языков
Код а 16-зн»*«>м представлении | Строчная буква | Кода 16-значном представлвти | Заглавная буква | Описание, уточняющее характер изображения |
21 | й | Ударение (акут) | ||
22 | • • □ | Диерез (трема, умляут). Две точки над буквой | ||
23 | ф | Огонек. Хвостик снизу буквы | ||
24 | О. | Хвостик справа от буквы | ||
25 | □ | Кратка (бревис) Плавная дута над буквой | ||
26 | ф | Седиль | ||
27 | □ | Слабое ударение (гравие) | ||
28 | зе | 38 | JE | Лигатура А и Е |
29 | F | 39 | Г | Перечеркнутая Г |
2А | К | ЗА | Е | Гс крюком |
2В | d | 38 | d | Совпадает с латинской строчной d |
2С | d | ЗС | d/ | Латинская строчная d с хвостиком вверх |
20 | 3 | 30 | 3 | 3 с плоской верхушкой |
2Е | 1 | ЗЕ | 3 | 3 С ХВОСТИКОМ ВНИЗ |
2F | г | 3F | 3 с хвостиком вверх | |
31 | а | Двойное ударение | ||
32 | П | Долгота (макрон). Прямая черта сверху буквы | ||
33 | ф | Левый огонек Хвостик налево под буквой | ||
34 | щ | Левый хвостик | ||
35 | W □ | Корона. Ломаная черта над буквой | ||
36 | й | Кружок над буквой | ||
37 | й | Запятая над буквой | ||
40 | t | 50 | X I | Латинская ( с чертой и точкой сверху |
41 | i | 41 | j | Перечеркнутый йот |
42 | к | 52 | К | Перечеркнутая К |
6
ГОСТ Р 7.0.29—2010
Окончание таблицы 4
Кол В 16-ЗНЗЧНОМ представлении | Строчная буква | Коде 16-значном представлении | Заглавная буква | Описание, уточняющее характер изображения |
43 | ТС | 53 | ТС | К с флажком слева |
44 | к | 54 | к | К с крестом |
4S | к | 55 | 1с | К с кружком сверху |
46 | q | 56 | о!(Q) | Совпадает с латинской Q |
47 | I | 57 | L | Совпадает с латинской L |
48 | л | 58 | Л | Л с хвостиком вверх |
49 | Jb | 59 | Jh | Л с крюком |
4А | JV. | 5А | Ж | Лигатура Л и К |
48 | O' | 58 | ьг | Лигатура Н и Г |
4С | lb | 5С | Ну | Н с флажком справа |
40 | а | SD | Н/ | Н с хвостиком вверх |
4Е | Н» | 5Е | Ну | Нс крюком |
4F | & | 5F | о | Перечеркнутая 0 |
60 | а | 70 | (й | Напоминает рукописную заглавную О |
61 | се | 71 | СЕ | Лигатура 0 и Е |
62 | п» | 72 | гъ | П с крюком |
63 | I* | 73 | к | Лигатура Р и К |
64 | с- | 74 | G | С с чертой, напоминает латинскую заглавную G |
65 | ъ | 75 | т | Т с хвостиком вверх |
66 | Y | 76 | Y | Прямая У. совпадает с латинской Y |
67 | Y | 77 | ¥ | Прямая У перечеркнутая |
68 | W | 78 | W | Совпадает с латинской w |
69 | и | 79 | ц | Ц с крышкой |
6А | ч | 7А | Ч | Перечеркнутая Ч |
68 | h | 7В | h | Совпадает с латинской строчной h |
6С | 'е | 7С | 'е | Напоминает рукописную Ч |
60 | Э | 70 | 0 | Шва |
6Е | ж | 7Е | Ж | Лоттура Я и Е |
6F | I | Гуттуральный знак |
7
ГОСТ Р 7.0.29—2010
Приложение А (справочное)
Использование символов расширенного набора в кириллических алфавитах
различных языков
Таблице А.1
Язык | Простые буквы и комбинации с диакритическими знаками, используемые е данном языке |
Абазинский | I |
Абхазский | к, ц,£, Ъ з, к, <&, п, п?, т, *,и, % э |
Аварский | I |
Адыгейский | I |
Азербайджанский | г, o,j, к, о, у, М |
Айсорский | d, э, j, 1, q, s, h |
Алтайский | j,w. 6, у |
Башкирский | f, 3,tc, y,h, э |
Белорусский | i, % e, r |
Болгарский (до 1945 г.) | i, b, v, в, ж |
Бурят схий | й, 0, у, Yt h |
Даргинский | I |
Дунганский | Y |
Ингушский | I |
Кабардинский | I |
Казахский | Э, F, i, 1$, h,, 0, Yt ¥> h |
Калмыцкий | а, 6,у,зц,ц,о, Y, h, э |
Каракалпакский | э, г, К, Ц, 0, Yt Ут x |
Кэрэчайский | У |
Карельский | a, o,y |
Киргизский | i\, e, y |
Коми | i,o |
Корякский | |
Курдский | г', э, э', k\ 6, n', p', t\ h, h\ ч\ q, w |
Лакский | 1 |
Лезгинский | I |
Македонский | f, S,j, к |
Мансийский | H, (Ю |
Марийский (горный) | а, о, у, и-, ы |
8
ГОСТ Р 7.0.29—2010
Окончание таблицы А.1
Язык | Простые буквы и комбинации с диакритическими знаками, используемые в данном языке |
Марийский (путовой) | а, о, у, н- |
Молдавский | ж |
Монгольский | в» Y |
Мордовский (мокша) | ж, ё, jk, ir, б, р, й, э |
Мовдовский (эрзя) | 1Г |
Ненецкий | н. |
Осетинский | ж |
Русский | ё |
Русский (до 1918 г.) | ё, i, b, v, о |
Саамский | Ц |
Селькупский | а, се |
Сербский | Ь, h, л», 1Ь. у, j |
Табасаранский | I |
Таджикский | г,к,х,,Ч*й,у |
Татарский (казанский) | ж,, н* ©, у, К э |
Татарский (кряшенский) | а, б, у, н- |
Татский | I |
Тувинский | Ц,0,У |
Туркменский | ж,, ц, в, Y>э |
Удмуртский | ж, 3, й, б, ч |
Узбекский | |
Уйгурский | г, ж,, к, н,е,у,э, h |
Украинский | г, i, i, е |
Хакасский | г, U,h;, 6,y,v, h, (ц) |
Хантыйский (вахский) | а, б,ё, е,э,э, у, к,, н> |
Хантыйский (казымский) | а, ё, о, э, э, п\н, |
Хаитыйсхий (сургутский) | а, ё, в, э, у, к,, н, |
Хантыйский (шуруцкарский) | Ц |
Цыганский | |
Чеченский | с, h, h, j, к,, k, н., д, q, ть х, ц, А, I |
Чувашски* | а, ё, ё, л», нч д, if., с, т;, f, т>, у, у |
Чукотский | к,,Д |
Шорский | |.н\ б, у |
Эвенкийский | д |
Эвенский | Д, 0, 0 |
Эскимосский | г', к', л', н\ х\ у, (л,) |
Якутский | а, 6, у, у, 0, R, H\h |
9
ГОСТ Р 7.0.29—2010
УДК 025.43.026.036:006.354 ОКС01.140.40 Т62
Ключевые слова: набор кодированных символов, кириллический алфавит, расширенный набор символов, символы алфавитов, славянские языки, неславянские языки, обмен информацией, текстовые данные. лредставление данных
ю
Редактор Р.Г. Гоаврдовекая Технический редактор Н.С. Гришанова Корректор Ы.8. буйная Компьютерная верстка И.А Напейкиной
Сдано а набор 07.11.2011. Подписано а печать 14.11.2011. Формат 60 к 84у£. Гарнитура Арнал.
Уел. печ. л. 1.86. Уч.-иэд л. 1.30. Тираж 111 эко. Зак. 1089
. 123996 Москва. Гранатный пер.. *. www.90slinfo.1u
Набрано во на ПЭВМ.
Отпечатано а филиале — тип. «Московский печатник». 105062 Москва. Лялин пер.. 6.
