沃拉普克編碼

維基百科,自由的百科全書

沃拉普克編碼俄語: кодировка "волапюк", kodirovka "volapyuk")是一種用拉丁字母替代西里爾字母的網絡方言。與用諧音字替換的音譯不同,沃拉普克編碼用形近或音近的拉丁字母替換西里爾字母。

詞源

沃拉普克編碼這個名字來源於一種叫沃拉普克語人造語言,但與這個語言沒有直接聯繫。俄國人覺得沃拉普克語寫起來很有趣,而且認為「Волапюк」(沃拉普克語在俄語的寫法)用俄語讀起來很有趣,因此用這個語言為這種看起來同樣覺得有趣的轉寫方式命名。

歷史

沃拉普克編碼與音譯俄國剛剛連接到互聯網的時候都被使用。在早期互聯網上,收發電子郵件時受字體、輸入方式等限制,使用西里爾字母是相當困難的。一方面,如果輸入者沒有支持輸入西里爾字母的鍵盤輸入法,就無法用西里爾字母輸入;另一方面,無論是收件人還是發件人,如果不使用同一種西里爾字母的編碼(計算機剛引入俄羅斯時有很多種不太完善又互不相通的文字編碼),那麼收發雙方看見的內容往往是大相逕庭的。另外,當時使用的7比特儲存一個字符的編碼阻礙了西里爾字母的引入。因此當時很多電子郵件用戶往往使用各種方法來表達原本用西里爾字母書寫的俄語信息,沃拉普克編碼正是其中一種方案。

一些俄羅斯電郵服務供應商甚至提供選項讓用戶能把從俄羅斯發出國外的郵件自動轉換為沃拉普克編碼再發出。以下是一封經過轉換為沃拉普克編碼再發出的電子郵件的抬頭:

"MIME/BASE64, MIME/Quoted-Printable, volapuk, uuencode"[1]

到了20世紀90年代後期,隨着越來越多軟件廠家和互聯網服務供應商支持官方標準,因此包括沃拉普克編碼在內的西里爾字母羅馬化方案逐漸淡出人們的視野。[1]

轉換規則

沃拉普克編碼通常用拉丁字母取代看起來相同的印刷體或手寫體西里爾字母,也有用阿拉伯數字替代。這使得轉換後的文本看起來像黑客文

  1. 用看起來相同的字母替換:a, e, K, M, T, o, y。為了看起來更像,有時會用大寫字母:比如用大寫K會比小寫k更像西里爾字母к;大寫M替換м,而小寫m則用於替換手寫體的т;印刷體的т則用大寫的T取代。
  2. 用看起來相似的字母或字符組合替換:в - B,г - 2(與手寫體相似)或r,з - 3,л - J|或/\ (前者像印刷體,後者像手寫體),н - Н,п - n (與手寫體相似),р - p,с - c,х - x,ч - 4。實際應用上還有很多種替換方式。
  3. 用其他方式替換,比如:ж - *,я - 91,щ - LLI_,э - -),等等。這使得實際應用時的替換方式有很多種,比如щ可能有超過15種變化。用怎樣的字符替代一個字母取決於用戶的喜好。

轉換方式與語言有關,比如烏克蘭語用戶會由於烏克蘭語字母表與俄語字母表不同而有不同的轉換方式[2]

轉換對照表

  • АA
  • Б6b
  • ВB
  • ГFr
  • ДDg (手寫體)
  • ЕE
  • ЁEE"Ë (拉丁字母)
  • Ж*}I{
  • З3
  • ИNu (手寫體)
  • ЙN'Ñu'ú (後兩者都是手寫體)
  • КK
  • ЛJI/\
  • МM
  • НH
  • ОO
  • ПIIn
  • РP
  • СC
  • ТTm (手寫體)
  • Уy
  • ФØqp
  • ХX
  • ЦU,
  • Ч4
  • ШWLLI
  • ЩW, 或 "W_" 或 LLL
  • Ъb 或 'b
  • Ыbl
  • Ьb
  • Э~) (歐元符號)
  • ЮIOI-O
  • ЯR91

例子

「蘇聯」一詞:

  • СОВЕТСКИЙ СОЮЗ (西里爾字母)
  • COBETCKNN COIO3 (沃拉普克碼)
  • SOVETSKIY SOYUZ (音譯)

參考文獻

引用

書籍

  • Frolov, A.V. and Frolov, G.V. Electronic Mail. Your Internet Companion (А.В. Фролов, Г.В. Фролов, "Электронная почта. Ваш спутник в Интернете") Russkaya Redaktsiya Publishers (Русская Редакция) (2000) ISBN 5-7502-0156-2, Chapter 6 online頁面存檔備份,存於互聯網檔案館(俄文)

參見