國際語言環境指南

第 4 章 支援的亞洲語言環境

本章提供有關於日文、印度文和泰文的本土化資訊。本章的內容包括:

日文本土化

本節說明日文特定語言環境資訊。

日文語言環境

目前 Solaris 環境中有四種可支援不同字元編碼的日文語言環境。其中兩種是以日文 EUC 為基礎的 jaja_JP.eucJP 語言環境ja_JP.eucJP 語言環境符合「UI-OSF 日文環境執行協定 1.1 版」,ja 語言環境符合起始於較早 Solaris 發行版本的傳統規格。另外兩種是以 PC 漢字字碼 (稱為 Shift_JIS) 為基礎的 ja_JP.PCK 語言環境以及以 UTF-8 為基礎的 ja_JP.UTF-8 語言環境。

請參閱「eucJP(5) 線上說明手冊」,以取得日文 EUC 與字元集的對映資訊。請參閱「PCK(5) 線上說明手冊」,以取得 PC 漢字字碼與字元集的對映資訊。

日文字元集

支援的日文字元集包括:

JIS X 0212-1990 在 ja_JP.PCK 語言環境中不支援。JIS X 0213-2000 只能在 ja_JP.UTF-8 語言環境中獲得支援。並非所有在 JIS X 0213-2000 中定義的字元都可以使用。只可以使用 Unicode 4.0 字元集中定義的字元。

也支援供應商定義的字元 (VDC) 以及使用者定義的字元 (UDC)。VDC 佔用 JIS X 0208-1990 或 JIS X 0212-1990 中未使用 (保留的) 的字碼點。除了那些配置給 VDC 的字碼點之外,UDC 會佔用與 VDC 相同的字碼點。

日文字型

支援三種日文字型格式:點陣圖字型、TrueType 字型以及 Type1 字型。日文 Type1 字型僅包含用於列印的 JIS X 0212。UDC 也使用 Type 1 字型。

下表說明日文點陣圖字型

表 4–1 日文點陣圖字型

完整家族名稱 

子家族 

格式 

供應商 

編碼 

sun gothic

R,B 

PCF(12,14,16,20,24) 

 

JIS X 0208-1983, 

JIS X 0201-1976 

sun minchou

PCF(12,14,16,20,24) 

 

JIS X 0208-1983, 

JIS X 0201-1976 

ricoh hg gothic b

PCF(10,12,14,16,18,20,24) 

RICOH 

JIS X 0208-1983, JIS X 0201-1976 

ricoh hg mincho l

PCF(10,12,14,16,18,20,24) 

RICOH 

JIS X 0208-1983, JIS X 0201-1976 

ricoh gothic

PCF(10,12,14,16,18,20,24) 

RICOH 

JIS X 0212-1990, JIS X 0213-2000 

ricoh mincho

PCF(10,12,14,16,18,20,24) 

RICOH 

JIS X 0212-1990, JIS X 0213-2000 

ricoh heiseimin

PCF(12,14,16,18,20,24) 

RICOH 

JIS X 0212-1990 

下列表格中說明日文 TrueType 字型。

表 4–2 日文 TrueType 字型

完整家族名稱 

子家族 

格式 

供應商 

編碼 

ricoh hg gothic b

固定的 

TrueType 

RICOH 

JIS X 0208-1983, JIS X 0201-1976 

ricoh hg mincho l

固定的 

TrueType 

RICOH 

JIS X 0208-.1983, JIS X 0201-1976 

ricoh hg gothicb sun

固定的,成比例的 

TrueType 

RICOH 

JIS X 0201-176,JIS X 0208-1983,JIS X 0213-2000 

ricoh hg minchol sun

固定的,成比例的 

TrueType 

RICOH 

JIS X 0201-1976, JIS X 0208-1983, JIS X 0213-2000 

ricoh heiseimin

固定的 

TrueType 

RICOH 

JIS X 0212-1990 

日文輸入系統

在目前 Solaris 環境中,ATOK12 是預設的日文輸入系統。若您已安裝日文語言環境,則可以在所有的日文語言環境和所有的 UTF-8 語言環境中使用 ATOK12。所有日文語言環境也可以使用 Wnn6 日文輸入系統。您可以在「桌面」功能表中切換輸入系統。Solaris 1.x BCP 支援可以使用 kkcv 日文輸入系統。

以下程序說明如何用 ATOK12 輸入法來輸入日文文字。

如何使用 ATOK 輸入法

  1. 按下 Control-空格鍵以開啟輸入轉換。

  2. 鍵入您想要轉換文字的假名字元。

    例如,鍵入漢字 henkan 的假名。

  3. 按下空格鍵以顯示假名拼寫可轉換的漢字候選字。

  4. 鍵入您想要選取的轉換候選字編號。

  5. 按下 Return 以送出整句假名拼寫的漢字。

    或是按下向下箭頭按鍵僅送出所選取的字元。

  6. 按下 Control-空格鍵以關閉輸入轉換。

日文終端機的終端機設定

您必須使用終端機設定來使行編輯正確運作,才能在以字元為基礎的終端機 (TTY) 上使用日文語言環境。

日文 iconv 模組

有多種日文字碼集轉換支援 iconv(1)iconv(3)。請參閱「iconv_ja(5) 線上說明手冊」,以取得詳細資訊。

使用者定義的字元支援

使用者定義字元公用程式 sdtudctool 可處理外框 (Type1) 和點陣圖 (PCF) 字型。使用舊版中公用程式來建立的 UDC 字型,可以使用像是 fontedittype3creator fontmanager 等公用程式來遷移。

部份和完整語言環境之間的差異

下列元件只可以在 Languages CD 的日文完整語言環境中取得:

印度文本土化

在 UTF-8 語言環境中所支援的所有印度文語言,都可以使用以語音查找為基礎的輸入法 (Shabdalipi) 和連續語音輸入法。使用此輸入法和虛擬鍵盤,可以讓您在所有 CDE 應用程式中輸入印度文字。

下列資料流程展示出印度文輸入程序的各項工作。印度文輸入程序的資料流程

如何使用印度文輸入法

  1. 按一下輸入狀態區,以顯示輸入法選擇功能表。

  2. 在功能表中選取一種輸入法。

    或是按下 F6 鍵,從可用的輸入法中選取一種輸入法。

    您也可以鍵入 Compose-hi 鍵順序,以選取前一次所使用的輸入法。

  3. 按下 F5 鍵以選取您想要使用的印度文字體。

    1. 針對以鍵盤為基礎 (印度 INSCRIPT 鍵盤) 的輸入法,請使用顯示於印度文鍵盤的鍵盤影像。

    2. 針對以語音查找為基礎的輸入法,請鍵入與目標字體中字元相對應的英文語音同義字元。

      在查找視窗的選擇清單中選取想要的字元。

    3. 針對連續語音輸入法,請連續鍵入英文語音同義字。

      目標字體中相對應的字元會顯示為預先編輯狀態,當有後續文字輸入時,該預先編輯文字會轉為明確而送出或是由您指定直接送出。請參考以連續語音為基礎之輸入法的對映中的圖解,以取得連續語音輸入法從英文代表字元對映到目標字體的 UTF-8 字碼點的說明圖例。

  4. 按下 Control-空格鍵以切換回到英文/歐洲輸入模式。

    或是按一下狀態區,在輸入模式選擇視窗中選取英文/歐洲輸入模式。

印度文鍵盤

下列圖顯示印度文輸入法的鍵盤配置。

下圖顯示孟加拉文鍵盤的配置。

孟加拉文鍵盤配置

下圖顯示梵文鍵盤的配置。

梵文鍵盤配置

下圖顯示古吉拉特文鍵盤的配置。

古吉拉特文鍵盤配置

下圖顯示果魯穆其文鍵盤的配置。

果魯穆其文鍵盤配置

下圖顯示卡納達文 鍵盤的配置。

卡納達文鍵盤配置

下圖顯示喀拉拉文鍵盤的配置。

喀拉拉文鍵盤配置

下圖顯示坦米爾文鍵盤的配置。

坦米爾文鍵盤配置

下圖顯示特拉古文鍵盤的配置。

特拉古文鍵盤配置

瞭解對映

以連續語音為基礎之輸入法的對映中的影像,顯示英文代表字元與每個受支援目標字體中同義字碼點之間的對映。CONSONANT 分類是英文代表字元與字體的子音字母之間的對映。VOWEL 分類是英文代表字元與字體的母音字母之間的對映。OTHER 分類包括不具有子音字母和母音字母 (不會依據前後字元而改變形式) 特性之字元的對映。

關鍵字 CONSONANT、VOWEL 和 OTHER 也意味著這些字元是 Unicode 標準的一部分。SPECIAL CONSONANT、SPECIAL VOWEL 或 SPECIAL OTHER 等區段,表示雖然這些字元顯示子音字母、母音字母或其他字元的特性,但這些字元不是正式的 Unicode 標準並且是字型附屬的。這些字元會在 Unicode Private User Area 中指定字碼點值。Solaris UTF-8 語言環境支援這些字元,但此對映可能不適用於其他平台。

這些對映檔與您系統上的對映檔不同,但可以就本討論內容稍加編輯,以移除不需要的關鍵字。

在 VOWELS 和 SPECIAL VOWELS 區段中,會依據上下文來顯示相同英文代表字元的獨立形式或附屬形式。請參閱連續語音輸入法的運作方式

喀拉拉文字體包含特別的 ‘CHILLU’ 區段,實際上它屬於 SPECIAL OTHER 分類。

以連續語音為基礎之輸入法的對映

下列圖解顯示英文與目標印度文字體中語音同義字元的現有對映。在您熟悉所使用之字體的所有對映之前,請使用這些圖例做為參閱。本文所提供的對映是直覺式的,因此您應該不必查找圖例即可輸入大部分的字元。


注意 –

在這些對映中,如果 ‘.’ 和 ‘|’ 等特殊字元是對映內容的一部分時,必須以 ‘\’ 字元跳過。如果沒有,當用於表示相同 UTF-8 字元的代表字元超過一個以上時,‘|’ 字元會被視為分隔符號。


圖 4–1圖 4–2圖 4–3 顯示英文與子音字母、母音字母和其他字元的孟加拉文對映。

圖 4–1 孟加拉文子音字母的對映

孟加拉文子音字母的對映圖示

圖 4–2 孟加拉文母音字母的對映

孟加拉文母音字母的對映圖示

圖 4–3 孟加拉文其他字元的對映

孟加拉文其他字元的對映圖示

圖 4–4圖 4–5圖 4–6 顯示英文與子音字母、母音字母和其他字元的古吉拉特文對映。

圖 4–4 古吉拉特文子音字母的對映

古吉拉特文子音字母的對映圖示

圖 4–5 古吉拉特文母音字母的對映

古吉拉特文母音字母的對映圖示

圖 4–6 古吉拉特文其他字元的對映

古吉拉特文其他字元的對映圖示

圖 4–7圖 4–8圖 4–9 顯示英文與子音字母、母音字母和其他字元的果魯穆其文對映。

圖 4–7 果魯穆其文子音字母的對映

果魯穆其文子音字母的對映圖示

圖 4–8 果魯穆其文母音字母的對映

果魯穆其文母音字母的對映圖示

圖 4–9 果魯穆其文其他字元的對映

果魯穆其文其他字元的對映圖示

圖 4–10圖 4–11圖 4–12 顯示英文與子音字母、母音字母和其他字元的北印度文對映。

圖 4–10 北印度文子音字母的對映

北印度文子音字母的對映圖示

圖 4–11 北印度文母音字母的對映

北印度文母音字母的對映圖示

圖 4–12 北印度文其他字元的對映

北印度文其他字元的對映圖示

圖 4–13圖 4–14圖 4–15 顯示英文與子音字母、母音字母和其他字元的卡納達文對映。

圖 4–13 卡納達文子音字母的對映

卡納達文子音字母的對映圖示

圖 4–14 卡納達文母音字母的對映

卡納達文母音字母的對映圖示

圖 4–15 卡納達文其他字元的對映

卡納達文其他字元的對映圖示

圖 4–16圖 4–17圖 4–18 顯示英文與子音字母、母音字母和其他字元的喀拉拉文對映。

圖 4–16 喀拉拉文子音字母的對映

喀拉拉文子音字母的對映圖示

圖 4–17 喀拉拉文母音字母的對映

喀拉拉文母音字母的對映圖示

圖 4–18 喀拉拉文其他字元的對映

喀拉拉文其他字元的對映圖示

圖 4–19圖 4–20 顯示英文與子音字母和母音字母的坦米爾文對映。

圖 4–19 坦米爾文子音字母的對映

坦米爾文子音字母的對映圖示

圖 4–20 坦米爾文母音字母的對映

坦米爾文母音字母的對映圖示

圖 4–21圖 4–22圖 4–23 顯示英文與子音字母、母音字母和其他字元的安得拉邦文對映。

圖 4–21 安得拉邦文子音字母的對映

安得拉邦文子音字母的對映圖示

圖 4–22 安得拉邦文母音字母的對映

安得拉邦文母音字母的對映圖示

圖 4–23 安得拉邦文其他字元的對映

安得拉邦文其他字元的對映圖示

連續語音輸入法的運作方式

針對每一個印度文字體,‘virama’ 或等號與子音字母的組合,會給出一個形式不完整 (或準備組合的形式) 的子音字母。每當鍵入子音字母相對應的多重鍵組合,子音字母 + virama 形式會輸出並符號化已準備好進行組合的字元。

初始輸入的子音字母會採用原本的不完整形式,一旦後面接著母音字母時,則會成為完整音節或子音字母的變化形式。

兩個連續的子音字母會維持準備好組合的不完整形式。不完整形式可以經由配置引擎當作已組合的單一字元來轉換或維持其可用於每一種語言之語意構造的獨立形式。

以任何母音字母做為字詞的開頭或後面接著其他母音字母時,會以獨立形式顯示。母音字母後面立即接著一個子音字母時,會採用附屬形式。

在任何環境中都不會改變其外觀形狀的字元就是其他字元。這些字元既不是子音字母也不是母音字母。

不做為字元一部分的數字和其他標點符號,是採取一對一對映。

透過這些原則,剖析器 (已寫入上述原則) 會將輸入字元剖析為這些不同分類,並輸出語言特定的 Unicode 字碼點。連續語音輸入法引擎不處理字元配置或轉譯,而是由系統中的其他模組來處理。

泰文本土化

目前 Solaris 環境支援三種泰文輸入層次與四種泰文鍵盤配置。

泰文輸入法

此發行版本支援下列泰文輸入法。在泰文資訊技術標準中,指定這些輸入法做為字元順序檢查。

  1. 直接通過層次,沒有輸入檢查

  2. 基本輸入檢查層次

  3. 詳細輸入檢查層次

與舊版 Solaris 相同,此發行版本的預設是直接通過層次,沒有輸入檢查。

您可以使用 F2 功能鍵,從目前的輸入層次切換到下一個輸入層次。

泰文鍵盤配置

泰文輸入法支援四種不同的鍵盤配置。

泰文輸入法輔助視窗

此泰文輸入法輔助視窗支援下列功能與公用程式: