國際語言環境指南

語言文字與字母的差異

本節說明語言之間重要的差異。

文字分割元

在英文中,文字通常使用空間字元來分隔。不過,在中文、日文,和泰文等語言中,兩個文字之間並沒有分隔。

排序順序

特定字元的排序順序在每個語言中各有不同。例如,在德文中,“ö” 字元是以一般的 “o” 排序, 但在瑞典則是分別排序,其中該字元為字母中的最後一個字。在某些語言中,字元有其重要性以決定字元序列的優先順序。例如,泰文字典中會根據不同的重要性來對字元的順序進行排序。

字元集

字元集在字母字元以及特殊字元的編號上會有所不同。當英文字母表只包含 26 個字元時,某些語言包含多出更多的字元。例如,日文,可能包含超過 20,000 個字元,而中文可能包含甚至更多的字元。

西歐字母表

大部分西方國家的字母和英語系國家所使用的標準 26 個字母相似,但通常會出現一些附加的基本字元、一些標記 (或重音) 字元,和一些連音符號。

日語文字

日語文字是由三種不同的字體混合在一起所組成。 包括源自中國的表意漢字,和兩種稱為平假名和片假平的表音字串 (或音節文字)。

雖然每個平假名中的字元都有一個對等的片假名字元,但平假名仍是最常見的字串,它是一種草寫字母而不是區塊狀的字母格式。漢字字元用來撰寫字根。片假名通常用來表示“外來”文字,也就是從日文以外的語言所“輸入” 的文字。

漢字擁有數萬個字元,但是經常使用的數目正逐年穩定的減少當中。雖然一般的日本人平均擁有 2000 個漢字的能力,但現在仍經常使用的漢字大約只剩 3500 個。不過,為了符合日本業界標準 (JIS),電腦系統必須支援超過 7000 個字。另外,還有大約 170 個平假名以及片假平字元。平均而言,55% 的日語文字為平假名,35% 是漢字以及 10% 為片假名。在日語文字中也會出現阿拉伯數字與羅馬字母。

雖然可以完全避免使用漢字,但大部分的日本人發現,若缺少了漢字文件將變的難以理解。

韓語文字

可以使用一種稱為 Hangul 的語音寫入系統來撰寫韓語文字。Hangul 擁有超過 11,000 個字元,其是由已知的 jamos 子音與母音所組成。全部的 Hangul 字彙中大約有 3000 字元為韓文電腦系統中所經常使用。韓國人也使用源自於中國文字的表意文字,稱為 hanja。韓語文字需要超過 6000 個 hanja 字元。當使用 Hangul 會造成語意不清時,大部份都是用 Hanja 來避免混淆。Hangul 字元是藉由合併子音與母音所形成。在將其合併之後,可以組成一個 Hangul 字元音節。Hangul 字元通常會呈現方塊狀,使其所佔的空間和 hanja 字元相同。在韓語文字中也會出現阿拉伯數字、羅馬字母以及特殊符號字元。

泰語文字

泰文字元是以四個顯示儲存格在顯示螢幕上定義為一個欄位位置 。每個欄位位置最多可以有三個字元。顯示儲存格的構成是以泰文字元分類為基礎。某些泰文字元可能是由另一個字元分類所組成。若是其可以組合在一起,則兩種字元位於相同的儲存格中。否則,其位於分隔的儲存格中。

中文字

中文幾乎全由稱為漢字的表意字串所組成。

如果字元並不是根字元,則它通常是由兩個或更多部分所組成,兩個為最常見。在兩部分的字元中,其中一個部分是用來表意,而另一個則用來表音。 偶爾兩部份同時用來表意。部首為最重要的元素,而字元通常也是以部首來編排,部首的數量約為數百個。單一音調可以藉由許多不同的字元來表示,這些字元在用法上無法互相交換。單一字元可以擁有不同的音調。

在指定的上下文中某些字元比其他字元較為合適—藉由使用音調以便在發音上區分該合適的字元。相比之下,日文與韓文口語中並沒有音調。

有幾個語音的系統代表中文。在中華人民共和國中最普遍的是拼音,其使用羅馬字元並廣泛的在西方針對地名使用,例如 Beijing。威妥系統是較古老的語音系統,從前使用在地名上,像是 Peking。在台灣注音(或ㄅㄆㄇㄈ)通常使用唯一字母類型的語音字母表來替代。

希伯來語文字

希伯來語文字 是用來撰寫希伯來語及猶太語言的字體,並在時間上早於英語數千年。希伯來文為雙向字串的一個範例,希伯來文的字母是以由右至左的方向讀寫,數字則是由左至右。任何內嵌於希伯來語文字中的英語文字也是從左向右閱讀。

希伯來文使用 27 字元的字母,並採用標準拉丁文 (或英文) 字母中的發音標記和數字。希伯來語文字也包括母音與發音符號。這些標記是以基本字元中的點 (Dagesh) 、字元下的母音標記,或字元左上角的重音來表顯示。這些符號一般只使用在禮拜儀式文字中,並在日常使用中很少見。希伯來文中也沒有大寫字母。

北印度語文字

北印度語文字 是以稱為 Devanagari 的字體所撰寫,其意思為 "上帝的寫作"。北印度文是語音語言,並且撰寫為一連串的音節。每一個音節是由三種類型的字母片斷(Devanagari 字元)所組成:子音字母、獨立的母音以及相依的母音符號。音節本身是由一個子音和母音核所組成,並附帶一個選擇性的前置子音。不像英文是從基準線開始,Devanagari 字元是從寫在字元最上方的水平線 (稱為前筆畫) 垂下。這些字元可根據上下文來結合或變更外形。如同希伯來文,北印度語文字在大寫或小寫字母之間沒有區別。