國際語言環境指南

語言文字與字母的差異

本節說明語言之間重要的差異。

文字分割元

以英文為例,文字通常是以空格字元來分隔的。不過,在中文、日文和泰文等語言中,文字之間通常沒有分隔。

排序

所有語言中的特殊字元排序是不相同的。例如,在德文中,“?” 字元是以一般的 “o” 排序,但在瑞典則是分別排序,其中該字元為字母中的最後一個字。在某些語言中,字元有其重要性以決定字元序列的優先順序。例如,泰文字典中會根據不同的重要性來對字元的順序進行排序。

字元集

字元集的字母字元數和特殊字元數可以是不同的。當英文字母表只包含 26 個字元時,某些語言包含多出更多的字元。以日文為例,可能包含超過 20,000 個字元,而中文甚至可能包含更多的字元。

西歐字母表

大部分西歐國家的字母類似於英語系國家所使用的標準 26 個字元字母。這些字母通常會包含某些額外基本字元、某些標記或重音字元以及連音字。

日文文字

日文文字是由三種不同的字體混合組成的:

雖然每個平假名中的字元都有一個對等的片假名字元,但平假名仍是最常見的字體,它是一種草寫字母而不是區塊狀的字母格式。漢字字元用來撰寫字根。片假名通常用來表示「外來」文字,也就是從日文以外的語言所引進的文字。

漢字擁有數萬個字元,但是經常使用的數目正逐年穩定的減少當中。雖然一般的日本人平均擁有 2000 個漢字的能力,但現在仍經常使用的漢字大約只剩 3500 個。不過,為了符合日本業界標準 (JIS) 的需求,電腦系統必須支援超過 7000 個字元。另外,還有大約 170 個平假名和片假名字元。平均而言,55% 的日文文字為平假名,35% 是漢字以及 10% 為片假名。在日語文字中也會出現阿拉伯數字與羅馬字母。

雖然可以完全避免使用漢字,但大部分的日本人發現,文件若缺少漢字將變得難以理解。

韓文文字

可以使用語音書寫系統來寫出的韓文文字稱為 Hangul。Hangul 擁有超過 11,000 個字元,其是由稱為 jamos 的子音與母音所組成。全部的 Hangul 字彙中大約有 3000 字元為韓文電腦系統中所經常使用。韓國人也使用源自於中國文字的表意文字,稱為 Hanja。韓語文字需要超過 6000 個 Hanja 字元。當使用 Hangul 會造成語意不清時,大部份都是用 Hanja 來避免混淆。Hangul 字元是藉由合併子音與母音所形成。當這些字元合併之後,它們可以組合成一個音節,然後成為 Hangul 字元。Hangul 字元通常會呈現方塊狀,使其所佔的空間和 Hanja 字元相同。在韓語文字中也會出現阿拉伯數字、羅馬字母以及特殊符號字元。

泰文文字

泰文字元是以四個顯示格在顯示螢幕上定義為一個欄位位置 。每個欄位位置最多可以有三個字元。顯示格的構成是以泰文字元分類為基礎。某些泰文字元可能是由另一個字元分類所組成。若是兩種字元可以組合在一起,則兩種字元會位於同一個顯示格中。否則,其位於分隔的顯示格中。

中文文字

中文幾乎全由稱為漢字的表意字體中的字元所組成。

如果字元並不是根字元,則它通常是由兩個或更多部分所組成,兩個為最常見。在兩部分的字元中,其中一個部分是用來表意,而另一個則用來表音。偶爾兩部份同時用來表意。部首為最重要的元素,而字元通常也是以部首來編排,部首的數量約為數百個。單一音調可以藉由許多不同的字元來表示,這些字元在用法上無法互相交換。單一字元可以擁有不同的音調。

部分字元比其他字元更相稱於給定的文意。此相稱字元使用音調來作語音上的區別。相比之下,日文與韓文口語中並沒有音調。

有數種語音系統可用來表示中文。在中華人民共和國最普遍的是拼音,其使用羅馬字元,並廣泛的在西方針對地名使用,例如 Beijing (北京)。威妥系統是較古老的語音系統,從前使用在地名上,像是 Peking。在台灣則是使用注音 (或 ㄅㄆㄇㄈ),這種具有獨特文字形式的語音字母來取代拼音。

希伯來文文字

希伯來文文字是用來書寫希伯來文與意第緒文語言的字體。希伯來文使用雙向字體。希伯來文字母是從右向左書寫和閱讀,而數字是從左向右閱讀的。任何內嵌於希伯來語文字中的英語文字也是從左向右閱讀。

希伯來文使用 27 字元的字母,並採用標準拉丁文 (或英文) 字母中的發音標記和數字。希伯來文文字也包括母音與發音符號。這些標記是以基本字元中的點 (dagesh)、字元下的母音標記或字元左上角的重音來表示。這些符號一般只使用在禮拜儀式文字中,在日常使用中很少見。希伯來文沒有大寫字母。

北印度文文字

北印度文文字是以梵文字母 (稱為 Devanagari) 書寫的,其意為「上帝的寫作」。北印度文是語音語言,並且撰寫為一連串的音節。每一個音節是由三種類型的字母片斷 (梵文字母字元) 所組成:子音字母、獨立的母音以及具依賴性的母音符號。音節本身是由一個子音和母音核所組成,並附帶一個選擇性的前置子音。不像英文是從基準線開始,Devanagari 字元是從寫在字元最上方的水平線 (稱為前筆畫) 垂下。這些字元可根據上下文來結合或變更外形。如同希伯來文,北印度文文字在大寫與小寫字母之間沒有區別。