allgosts.ru01.140 Информатика. Издательское дело01 ОБЩИЕ ПОЛОЖЕНИЯ. ТЕРМИНОЛОГИЯ. СТАНДАРТИЗАЦИЯ. ДОКУМЕНТАЦИЯ

ГОСТ 7.79-2000 Система стандартов по информации, библиотечному и издательскому делу. Правила транслитерации кирилловского письма латинским алфавитом

Обозначение:
ГОСТ 7.79-2000
Наименование:
Система стандартов по информации, библиотечному и издательскому делу. Правила транслитерации кирилловского письма латинским алфавитом
Статус:
Действует
Дата введения:
07.01.2002
Дата отмены:
-
Заменен на:
-
Код ОКС:
01.140.20

Текст ГОСТ 7.79-2000 Система стандартов по информации, библиотечному и издательскому делу. Правила транслитерации кирилловского письма латинским алфавитом


ГОСТ 7.79-2000
(ИСО 9-95)

Группа Т62

МЕЖГОСУДАРСТВЕННЫЙ СТАНДАРТ


Система стандартов по информации, библиотечному и издательскому делу

ПРАВИЛА ТРАНСЛИТЕРАЦИИ КИРИЛЛОВСКОГО ПИСЬМА ЛАТИНСКИМ АЛФАВИТОМ

System of standards on information, librarianship and publishing.
Rules of transliteration of Cyrillic script by Latin alphabet

МКС 01.140.20

ОКСТУ 0007

Дата введения 2002-07-01

Предисловие

1 РАЗРАБОТАН Всероссийским институтом научной и технической информации Российской Академии наук и Министерства науки и технологий Российской Федерации, Техническим комитетом по стандартизации ТК 191 "Научно-техническая информация, библиотечное и издательское дело"

ВНЕСЕН Госстандартом России

2 ПРИНЯТ Межгосударственным Советом по стандартизации, метрологии и сертификации (отчет Технического секретариата N 17 от 19-22 июня 2000 г.)

За принятие проголосовали:

Наименование государства

Наименование национального органа по стандартизации

Азербайджанская Республика

Азгосстандарт

Республика Армения

Армгосстандарт

Республика Беларусь

Госстандарт Республики Беларусь

Республика Казахстан

Госстандарт Республики Казахстан

Кыргызская Республика

Кыргызстандарт

Российская Федерация

Госстандарт России

Республика Таджикистан

Таджикстандарт

Туркменистан

Главгосслужба "Туркменстандартлары"

Республика Узбекистан

Узгосстандарт

3 Настоящий стандарт представляет собой аутентичный текст ИСО 9-95 "Информация и документация. Транслитерация кириллических букв латинскими. Славянские и неславянские языки"

4 Постановлением Государственного комитета Российской Федерации по стандартизации и метрологии от 4 сентября 2001 г. N 371-ст межгосударственный стандарт ГОСТ 7.79-2000 введен в действие непосредственно в качестве государственного стандарта Российской Федерации с 1 июля 2002 г.

5 ВЗАМЕН ГОСТ 16876-71

1 Область применения

Настоящий стандарт распространяется на правила транслитерации средствами латинского алфавита отдельных букв, слов, выражений, а также связанных текстов на языках, письменность которых базируется на кирилловском алфавите. Правила согласно настоящему стандарту применяют везде, где требуется обеспечить однозначное представление кирилловского текста латинскими буквами и возможность алгоритмического восстановления текста в исходной кирилловской записи, в частности при передаче документов по компьютерным сетям.

Настоящий стандарт не распространяется на правила передачи латинскими буквами звукового облика слов, записанных кириллицей.

Правила представления национальных географических наименований на картах определяются руководящими документами соответствующих картографических служб.

2 Нормативные ссылки

ГОСТ 7.28-80 Система стандартов по информации, библиотечному и издательскому делу. Представление расширенного латинского алфавита для обмена информацией на магнитных лентах

ГОСТ 7.29-80 Система стандартов по информации, библиотечному и издательскому делу. Представление расширенного кирилловского алфавита для обмена информацией на магнитных лентах

ГОСТ 27465-87 Системы обработки информации. Символы. Классификация, наименование и обозначение

3 Определения

В настоящем стандарте применяют следующие термины с соответствующими определениями:

3.1 система письма: Совокупность начертательных (графических) символов и приемов, принятая для фиксации на бумаге или другом материале текстов, высказываний, сообщений, составленных на некотором языке;

3.2 конверсия систем письма: Представление текстов, составленных на определенном языке, средствами системы письма, принятой для другого языка;

3.3 транслитерация: Конверсия систем письма, при которой каждый графический элемент (знак) одной системы письма представляется (заменяется) одним и тем же графическим элементом другой системы письма;

3.3.1 строгая транслитерация: Замена каждой буквы исходного текста только одной буквой другой письменности;

3.3.2 ослабленная транслитерация: Замена некоторых букв исходного текста сочетанием двух или более букв чужого алфавита;

3.3.3 расширенная транслитерация: Представление некоторых буквосочетаний исходного текста особым образом;

3.4 алфавит: Конечный набор графических символов (букв), используемый в определенной системе письма для передачи элементов звуковой речи;

3.5 буква: Графический символ, входящий в состав алфавита.

Примечание - Каждая система письма устанавливает пределы, в которых может варьировать начертание букв без изменения их алфавитного значения;

3.6 алфавитная система письма: Система письма, основанная на использовании алфавита;

3.7 латиница: Система письма, принятая в разных вариантах западно-европейскими и большим числом других языков мира и основанная на письменной традиции латинского языка;

3.8 латинский алфавит: Алфавит, используемый в том или ином варианте латиницы;

3.9 кириллица: Система письма, принятая в разных вариантах рядом славянских и других языков Европы и Азии и созданная на основе греческого уставного письма в традиции перевода Священного Писания на старославянский язык;

3.10 кирилловский алфавит: Алфавит, используемый в том или ином варианте кириллицы;

3.11 базовый (основной) алфавит: Алфавит, содержащий только те буквы, которые используются большинством систем письма, основанных на алфавите определенного типа.

Примечание - В настоящем стандарте в качестве базового латинского алфавита принят набор латинских букв, установленный ГОСТ 27465;

3.12 расширенный алфавит: Алфавит, включающий в себя буквы базового алфавита, а также буквы, употребляемые лишь некоторыми языками, письменность которых основана на алфавите определенного типа.

Примечание - В настоящем стандарте в качестве расширенного латинского алфавита принят набор символов, установленный ГОСТ 7.28, и в качестве расширенного кирилловского алфавита - набор букв - по ГОСТ 7.29;

3.13 диакритический знак: Графический символ, добавляемый к букве сверху или снизу или наносимый на изображение буквы для изменения ее начертания и функций в системе письма;

3.14 диакритика: Система диакритических знаков.

4 Общие положения

4.1 Настоящий стандарт является одним из серии международных и национальных стандартов, устанавливающих правила конверсии систем письма с целью обеспечения международного обращения письменных сообщений как в автоматизированных информационных и коммуникационных системах, так и при интеллектуальной обработке, требующей точного и однозначного представления текстовых данных, созданных на одном языке, средствами другого языка.

Такие правила должны обладать следующими необходимыми свойствами:

- однозначностью, обеспечивающей стабильность представления элементов исходной письменности (букв, слов, выражений) средствами другой (конвертирующей) письменности;

- обратимостью, обеспечивающей возможность однозначного точного восстановления текста на исходном языке;

- простотой, обеспечивающей автоматическое выполнение процедуры перехода от исходного текста к конвертированному и обратно на основе простых алгоритмов, преимущественно сводящихся к применению таблиц замены знаков одной системы письма знаками другой системы письма.

При применении правил конверсии могут не всегда соблюдаться требования звукового соответствия знаков конвертируемых систем письма, эстетические соображения и традиционные нормы, хотя в каждом отдельном случае желательна разработка таких правил, чтобы нарушение традиционных, фонетических и эстетических норм было минимальным. Однако каждый, кто знает исходный язык и правила конверсии, имеет возможность восстановить исходный текст и прочитать его по правилам исходного языка.

Для алфавитных систем письма способом, удовлетворяющим сформулированным выше требованиям, является транслитерация.

4.2 Устанавливают две системы транслитерации кирилловских алфавитов латинскими буквами:

А) с использованием диакритики - см. раздел 5,

Б) с использованием буквосочетаний - см. раздел 6.

Использование системы А или Б определяет орган, производящий транслитерацию, и это должно быть указано в сопроводительных материалах к документу. В составе одного документа следует использовать только одну систему, либо каждый раз вид транслитерации оговаривать особо и обозначать специальными указателями в тексте. Исключение из этого правила делается только для документов, в которых цитируются тексты, транслитерируемые в другом (цитируемом) документе, с указанием источника цитирования.

4.3 Транслитерированный текст на машиночитаемых носителях должен быть снабжен указателями, определяющими его границы, исходную письменность и способ транслитерации. Спецификация таких указателей должна быть задана стандартами на язык разметки структуры документов.

4.4 Небуквенные знаки письма (знаки препинания и др.), указанные в приложении Б, при транслитерации сохраняются, как правило, без изменения.

При отсутствии нужных символов в печатающем устройстве используют символы, предусмотренные ГОСТ 27465, при этом допускается:

- изменять вид кавычек (вместо открывающих строчных кавычек использовать подстрочные кавычки либо надстрочные кавычки, а вместо закрывающих строчных кавычек использовать надстрочные кавычки);

- заменять тире дефисом, окруженным с двух сторон пробелами;

- заменять многоточие тремя последовательными точками;

- заменять символ номера знаком # или сочетанием No.

Не допускается заменять верхние кавычки двумя апострофами или двумя ударениями, а нижние - двумя запятыми.

5 Система А - транслитерация с использованием диакритики

5.1 Транслитерация с использованием диакритики (система А) является строгой транслитерацией. Она задает единое для всех языков, указанных в приложении А, отображение расширенного кирилловского алфавита на расширенный латинский алфавит. Для славянских языков это отображение показано в таблице 1, для неславянских - в таблице 2.

5.2 Транслитерация дополнительных букв славянских языков, которые не вошли в таблицу 1, но употребляются в особых случаях, задается таблицей 2.

Таблица 1 - Транслитерация славянских алфавитов по системе А

Продолжение таблицы 1

Продолжение таблицы 1

Продолжение таблицы 1

Окончание таблицы 1

Таблица 2 - Транслитерация неславянских алфавитов по системе А

5.3 Заглавные (прописные) буквы кирилловских алфавитов транслитерируют соответствующими заглавными (прописными) буквами латинского алфавита, строчные буквы транслитерируют строчными. Не допускается заменять заглавные (прописные) буквы с диакритическими знаками буквами без диакритики.

5.4 Арабские цифры 0, 1, 2, 3, 4, 5, 6, 7, 8, 9 при транслитерации сохраняются без изменений.

Римские цифры I, V, X, С, М, L, D и их комбинации транслитерации не подлежат. Они должны быть выделены из транслитерируемого текста специальными указателями.

5.5 Таблица 3 определяет обратный переход от транслитерированного текста к исходному.

Таблица 3 - Ретранслитерация по системе А

6 Система Б - транслитерация с использованием буквосочетаний

6.1 Транслитерация с использованием буквосочетаний (система Б) является ослабленной транслитерацией. Она задает для каждой кирилловской буквы представление в виде одной буквы основного (ограниченного) латинского алфавита или в виде такого сочетания букв, которое не может встретиться в тексте иначе чем при представлении данной буквы.

В состав используемых для транслитерации букв входят:

а, b, с, d, e, f, , h, , j, k, l, m, n, o, p, q, r, s, t, u, v, w, x, y, z, (апостроф), `(слабое ударение), а также знаки препинания и специальные знаки, используемые распространенными массовыми печатающими устройствами.

6.2 Для каждого языка разрабатывается специальная таблица транслитерации, в максимальной степени учитывающая фонетические и графические особенности данного языка. Таблица 4 определяет переход от кирилловских букв к латинским для славянских языков: русского, белорусского, украинского, болгарского и македонского. Представление сербохорватского текста латинскими буквами осуществляется при помощи национальной латинской системы письма, используемой в этом языке наряду с кириллицей.

Системы транслитерации с использованием буквосочетаний для неславянских языков должны быть установлены отдельными (национальными) стандартами.

Таблица 4 - Транслитерация славянских алфавитов по системе Б

Кирилловская буква

Латинская транслитерация в языках

русском

белорусском

украинском

болгарском

македонском

А

а

a

a

a

a

Б

b

b

b

b

b

В

v

v

v

v

v

Г

-

-

-

-

Д

d

d

d

d

d

Е

е

e

e

e

e

уо

уо

-

-

-

Є

-

-

ye

-

-

Ж

zh

zh

zh

zh

zh

3

z

z

z

z

z

S

-

-

-

-

И

-

у`

Й

j

j

j

j

-

J

-

-

-

-

j

I

,

,

-

-

-

y

-

-

К

k

k

k

k

k

-

-

-

-

k`

Л

l

l

l

l

l

-

-

-

-

М

m

m

m

m

m

Н

n

n

n

n

n

-

-

-

-

О

o

o

o

o

o

П

p

p

p

p

p

Р

r

r

r

r

r

С

s

s

s

s

s

Т

t

t

t

t

t

У

u

u

u

u

u

-

u`

-

-

-

Ф

f

f

f

f

f

Х

x

x

x

x

x

Ц

cz, с

cz, с

cz, с

cz, с

cz, c

Ч

ch

ch

ch

ch

ch

-

~

-

-

dh

Ш

sh

sh

sh

sh

sh

Щ

shh

-

shh

sth

-

Ъ

``

-

-

a`

-

Ы

у`

у`

-

-

-

Ь

`

`

`

`

-

Э

е`

e`

-

-

-

Ю

yu

yu

yu

yu

-

Я

уа

уа

уа

уа

-

(апостроф)

(ять)

уе

-

-

ye

-

(фита)

fh

-

-

fh

-

(ижица)

yh

-

-

yh

-

(юс)

-

-

-

0'

-

6.3 При транслитерации заглавных (прописных) букв буквосочетанием в транслитерированном тексте заглавный (прописной) вариант выбирается только для первой буквы сочетания, если в данном слове имеются строчные. Если все буквы исходного слова заглавные (прописные), то в транслитерированном слове заглавными пишут все буквы сочетания.

6.4 В таблицу 4 включены также ныне не используемые буквы , , , , которые прежде широко употреблялись в славянских языках и могут потребоваться для передачи текстов, написанных по старой орфографии.

6.5 Однозначная обратимость таблицы 4 обеспечивается специфическим употреблением латинских букв h, у, с и символа `. Буквы h, у не означают сами по себе никаких кирилловских букв и употребляются только в буквосочетаниях.

6.6 Для кирилловских букв Ц и установлены два варианта транслитерации.

Ц передается либо латинской С, либо сочетанием CZ. Рекомендуется употреблять С перед буквами , Е, Y, J, а в остальных случаях - CZ.

Кирилловская в украинском и белорусском языках всегда передается через латинскую . Также она передается в русских и болгарских текстах, написанных по старой орфографии, где она, как правило, употребляется перед гласными буквами. В редких случаях употребления ее перед согласной (например, в слове "мiрь"), она передается сочетанием .

6.7 Таблица 5 определяет обратный переход от транслитерированного текста к исходному. Она предполагает замену на кирилловские буквы сначала трехсимвольных сочетаний, затем двухсимвольных и, наконец, одиночных букв. В таблицу 5 включены также некоторые написания, не предусмотренные таблицей 4, но реально встречающиеся на практике.

Таблица 5 - Ретранслитерация по системе Б

Очередность замены

Латиница

Кириллица

Язык

Трехбуквенные сочетания (преобразования I очереди)

shh

щ

бг, ру, ук

sth

щ

бг

Двухбуквенные сочетания (преобразования II очереди)

уа

я

бг, бе, ру, ук

ye

ук

ye

ст

уi

ук

уо

бе, ру

yu

ю

бг, бе, ру, ук

zh

ж

все

ch

ч

все

sh

ш

все

fh

ст

kh

х

все

dh

мк

мк

s

мк

ќ

мк

љ

мк

њ

мк

ъ

бг

э

ру, бе

ст

у

бе

ст

yh

v

ст

``

ъ

ру

cz

ц

все

Однобуквенные соответствия (преобразования III очереди)

a

а

все

b

б

все

с

ц

все

d

д

все

e

е

все

f

ф

все

г

все

h

х

бг, мк, ру

h

г

бе, ук

и

бг, мк, ру

бе, ук

ст (перед гласной)

j

й

бг, бе, ру, ук

j

j

мк

k

к

все

л

все

m

м

все

n

н

все

о

о

все

p

п

все

q

щ

бг, ру, ук

r

p

все

s

с

все

t

т

все

u

у

все

v

в

все

w

ы

ру

w

и

ук

x

х

все

у

ы

бе, ру

у

и

ук

z

з

все

ПРИЛОЖЕНИЕ А
(справочное)

Список языков с кирилловской письменностью, охваченных настоящим стандартом

Таблица А.1

Русское название

Английское название

Французское название

абазинский

Abaza

abaza

абхазский

Abkhaz

abkhaze

аварский

Awar

avar

адыгейский (черкесский)

Adyge (Circassian)

(сircassiеn)

азербайджанский

Azeri

azeri

алтайский

Altay

altaїen

балкарский

Balkar

balkar

башкирский

Bashkir

bachkir

белорусский

Byelorussian

bielorusse

болгарский

Bulgarian

boulgare

бурятский

Buryat

bouriate

гагаузский

Gagauzi

gagaouze

даргинский

Dargwa

dargwa

долганский

Dolgan

dolgane

дунганский

Dungan

doungane

ингушский

Ingush

ingouche

кабардинский (черкесский)

Kabardian (Circassian)

kabarde (circassien)

казахский

Kazakh

kazakh

калмыцкий

Kalmyk

kalmouk

караимский

Karaim

caraїte

каракалпакский

Karakalpak

karakalpak

карачаевский

Karachay

karachaї

карельский

Karelian

carelien

кетский

Ket

kete

коми-зырянский

Komi-Zyrian

komi-zyrene

коми-пермяцкий

Komi-Permian

komi-permien

корякский

Koryak

koriak

крымско-татарский

Crimean Tatar

tatar de Crimee

кумыкский

Kumyk

koumyk

курдский

Kurdish

kurde

кыргызский (киргизский)

Kirgiz

kirghize

лакский

Lak

lak

лезгинский

Lezgian

lezghien

македонский

Macedonian

macedonien

мансийский

Mansi

mansi

марийский (горный)

Mari (high)

mari (haut)

марийский (луговой)

Mari (low)

mari (bas)

молдавский (молдовский)

Moldavian

moldave

монгольский

Mongolian

mongol

мордовско-мокшанский

Mordvin-Moksha

mordve-mokcha

мордовско-эрзянский

Mordvin-Erza

mordve-erza

нанайский

Nanay

nanaї

нганасанский

Nganasan

nganassane

ненецкий

Nenets

nenetse

нивхский

Nivkh

nivkhe

ногайский

Noghay

nogaї

осетинский

Ossetic

ossete

русский

Russian

russe

саамский

Saam

same

селькупский

Selkup

selkoupe

сербохорватский

Serbo-Croatian

serbo-croatien

табасаранский

Tabasaran

tabassarane

таджикский

Tajik

ladjik

татарский

Tatar

tatar

татский

Tat

tate

тофаларский

Tofalar

tofalar

тувинский

Tuva

touva

туркменский

Turkmen

turkmene

удмуртский

Udmurt

oudmourte

удэ(ге)йский

Udegey

узбекский

Uzbek

оuzbek

уйгурский

Uyghur

ouїgour

украинский

Ukrainian

ukrainien

ульчский

Ulch

oultche

хакасский

Khakass

khakasse

хантыйский (ваховский)

Vakh Khanty

khanty de Vakh

хантыйский (казымский)

Kazym Khanty

khanty de Kazym

хантыйский (сургутский)

Surgut Khanty

khanty de Sourgout

хантыйский (шурыкшарский)

Shurykshar Khanty

khanty de Chourykchar

цыганский

Tsigane

tsigane

чеченский

Chechen

tchetchene

чувашский

Chuvash

tchouvache

чукотский

Chukcha

tchouktche

шорский

Shor

chor

шугнанский

Shugnan

chougnane

эвенкийский

Evenki

эвенский

Even

эскимосский

Eskimo

esquimau

юкагирский

Yukagir

ioukaguir

язгулямский

Yazgulam

iazgoulame

якутский (саха)

Yakut

iakoute

ПРИЛОЖЕНИЕ Б
(справочное)

Небуквенные знаки кириллицы

Таблица Б.1

Изображение знака

Наименование знака

.

точка

запятая

;

точка с запятой

:

двоеточие

многоточие

-

дефис

__

тире

?

вопросительный знак

!

восклицательный знак

надстрочные кавычки

подстрочные кавычки

строчные кавычки открывающие

строчные кавычки закрывающие

(

скобка открывающая

)

скобка закрывающая

§

параграф

номер

апостроф

Текст документа сверен по:

М.: ИПК Издательство стандартов, 2002

Превью ГОСТ 7.79-2000 Система стандартов по информации, библиотечному и издательскому делу. Правила транслитерации кирилловского письма латинским алфавитом