本章提供有關於日文、印度文和泰文的本土化資訊。本章的內容包括:
本節說明日文特定語言環境資訊。
目前 Solaris 環境中有四種可支援不同字元編碼的日文語言環境。其中兩種是以日文 EUC 為基礎的 ja 和 ja_JP.eucJP 語言環境。ja_JP.eucJP 語言環境符合「UI-OSF 日文環境執行協定 1.1 版」,ja 語言環境符合起始於較早 Solaris 發行版本的傳統規格。另外兩種是以 PC 漢字字碼 (稱為 Shift_JIS) 為基礎的 ja_JP.PCK 語言環境以及以 UTF-8 為基礎的 ja_JP.UTF-8 語言環境。
請參閱「eucJP(5) 線上說明手冊」,以取得日文 EUC 與字元集的對映資訊。請參閱「PCK(5) 線上說明手冊」,以取得 PC 漢字字碼與字元集的對映資訊。
JIS X 0201-1976
JIS X 0208-1990
JIS X 0212-1990
JIS X 0213-2000 (僅限 Unicode 4.0 中定義的字元)
JIS X 0212-1990 在 ja_JP.PCK 語言環境中不支援。JIS X 0213-2000 只能在 ja_JP.UTF-8 語言環境中獲得支援。並非所有在 JIS X 0213-2000 中定義的字元都可以使用。只可以使用 Unicode 4.0 字元集中定義的字元。
也支援供應商定義的字元 (VDC) 以及使用者定義的字元 (UDC)。VDC 佔用 JIS X 0208-1990 或 JIS X 0212-1990 中未使用 (保留的) 的字碼點。除了那些配置給 VDC 的字碼點之外,UDC 會佔用與 VDC 相同的字碼點。
支援三種日文字型格式:點陣圖字型、TrueType 字型以及 Type1 字型。日文 Type1 字型僅包含用於列印的 JIS X 0212。UDC 也使用 Type 1 字型。
下表說明日文點陣圖字型
表 4–1 日文點陣圖字型
完整家族名稱 |
子家族 |
格式 |
供應商 |
編碼 |
---|---|---|---|---|
sun gothic |
R,B |
PCF(12,14,16,20,24) |
|
JIS X 0208-1983, JIS X 0201-1976 |
sun minchou |
R |
PCF(12,14,16,20,24) |
|
JIS X 0208-1983, JIS X 0201-1976 |
ricoh hg gothic b |
R |
PCF(10,12,14,16,18,20,24) |
RICOH |
JIS X 0208-1983, JIS X 0201-1976 |
ricoh hg mincho l |
R |
PCF(10,12,14,16,18,20,24) |
RICOH |
JIS X 0208-1983, JIS X 0201-1976 |
ricoh gothic |
R |
PCF(10,12,14,16,18,20,24) |
RICOH |
JIS X 0212-1990, JIS X 0213-2000 |
ricoh mincho |
R |
PCF(10,12,14,16,18,20,24) |
RICOH |
JIS X 0212-1990, JIS X 0213-2000 |
ricoh heiseimin |
R |
PCF(12,14,16,18,20,24) |
RICOH |
JIS X 0212-1990 |
下列表格中說明日文 TrueType 字型。
表 4–2 日文 TrueType 字型
完整家族名稱 |
子家族 |
格式 |
供應商 |
編碼 |
---|---|---|---|---|
ricoh hg gothic b |
固定的 |
TrueType |
RICOH |
JIS X 0208-1983, JIS X 0201-1976 |
ricoh hg mincho l |
固定的 |
TrueType |
RICOH |
JIS X 0208-.1983, JIS X 0201-1976 |
ricoh hg gothicb sun |
固定的,成比例的 |
TrueType |
RICOH |
JIS X 0201-176,JIS X 0208-1983,JIS X 0213-2000 |
ricoh hg minchol sun |
固定的,成比例的 |
TrueType |
RICOH |
JIS X 0201-1976, JIS X 0208-1983, JIS X 0213-2000 |
ricoh heiseimin |
固定的 |
TrueType |
RICOH |
JIS X 0212-1990 |
在目前 Solaris 環境中,ATOK12 是預設的日文輸入系統。若您已安裝日文語言環境,則可以在所有的日文語言環境和所有的 UTF-8 語言環境中使用 ATOK12。所有日文語言環境也可以使用 Wnn6 日文輸入系統。您可以在「桌面」功能表中切換輸入系統。Solaris 1.x BCP 支援可以使用 kkcv 日文輸入系統。
以下程序說明如何用 ATOK12 輸入法來輸入日文文字。
按下 Control-空格鍵以開啟輸入轉換。
鍵入您想要轉換文字的假名字元。
例如,鍵入漢字 henkan 的假名。
按下空格鍵以顯示假名拼寫可轉換的漢字候選字。
鍵入您想要選取的轉換候選字編號。
按下 Return 以送出整句假名拼寫的漢字。
或是按下向下箭頭按鍵僅送出所選取的字元。
按下 Control-空格鍵以關閉輸入轉換。
您必須使用終端機設定來使行編輯正確運作,才能在以字元為基礎的終端機 (TTY) 上使用日文語言環境。
若您的終端機是 CDE 終端機模擬器 (dtterm),請在任何一個日文語言環境 (ja、ja_JP.PCK 或 ja_JP.UTF-8) 中,以引數 -defeucw 來使用 stty(1)。例如,在 ja 語言環境中,您必須鍵入:
% setenv LANG ja % stty defeucw
若您的終端機並不是 CDE 終端機模擬器,但終端機的字碼集與目前的語言環境相同,則可以引數 -defeucw 來使用 stty(1)。
若是終端機的字碼集與目前語言環境的字碼集不相符,請使用 setterm(1) 以啟動字碼轉換。例如,若您在 ja 語言環境中,但是終端機需要 PCK (Shift_JIS 字碼),您必須鍵入:
% setenv LANG ja % setterm -x PCK
請參閱「setterm(3CURSES) 線上說明手冊」,以取得詳細資訊。
有多種日文字碼集轉換支援 iconv(1) 和 iconv(3)。請參閱「iconv_ja(5) 線上說明手冊」,以取得詳細資訊。
使用者定義字元公用程式 sdtudctool 可處理外框 (Type1) 和點陣圖 (PCF) 字型。使用舊版中公用程式來建立的 UDC 字型,可以使用像是 fontedit、type3creator 和 fontmanager 等公用程式來遷移。
下列元件只可以在 Languages CD 的日文完整語言環境中取得:
已翻譯的訊息、說明與線上說明手冊
Wnn6 日文輸入系統
日文 Solaris 1.x BCP 支援
Mincho (min*) 字體點陣圖字型
供列印使用的 JIS X 0212 Type1 字型
特定的日文無智型印表機與 postprint 支援
傳統日文公用程式,例如 Kanji(1)
在 UTF-8 語言環境中所支援的所有印度文語言,都可以使用以語音查找為基礎的輸入法 (Shabdalipi) 和連續語音輸入法。使用此輸入法和虛擬鍵盤,可以讓您在所有 CDE 應用程式中輸入印度文字。
下列資料流程展示出印度文輸入程序的各項工作。
按一下輸入狀態區,以顯示輸入法選擇功能表。
在功能表中選取一種輸入法。
或是按下 F6 鍵,從可用的輸入法中選取一種輸入法。
您也可以鍵入 Compose-hi 鍵順序,以選取前一次所使用的輸入法。
按下 F5 鍵以選取您想要使用的印度文字體。
針對以鍵盤為基礎 (印度 INSCRIPT 鍵盤) 的輸入法,請使用顯示於印度文鍵盤的鍵盤影像。
針對以語音查找為基礎的輸入法,請鍵入與目標字體中字元相對應的英文語音同義字元。
在查找視窗的選擇清單中選取想要的字元。
針對連續語音輸入法,請連續鍵入英文語音同義字。
目標字體中相對應的字元會顯示為預先編輯狀態,當有後續文字輸入時,該預先編輯文字會轉為明確而送出或是由您指定直接送出。請參考以連續語音為基礎之輸入法的對映中的圖解,以取得連續語音輸入法從英文代表字元對映到目標字體的 UTF-8 字碼點的說明圖例。
按下 Control-空格鍵以切換回到英文/歐洲輸入模式。
或是按一下狀態區,在輸入模式選擇視窗中選取英文/歐洲輸入模式。
在以連續語音為基礎之輸入法的對映中的影像,顯示英文代表字元與每個受支援目標字體中同義字碼點之間的對映。CONSONANT 分類是英文代表字元與字體的子音字母之間的對映。VOWEL 分類是英文代表字元與字體的母音字母之間的對映。OTHER 分類包括不具有子音字母和母音字母 (不會依據前後字元而改變形式) 特性之字元的對映。
關鍵字 CONSONANT、VOWEL 和 OTHER 也意味著這些字元是 Unicode 標準的一部分。SPECIAL CONSONANT、SPECIAL VOWEL 或 SPECIAL OTHER 等區段,表示雖然這些字元顯示子音字母、母音字母或其他字元的特性,但這些字元不是正式的 Unicode 標準並且是字型附屬的。這些字元會在 Unicode Private User Area 中指定字碼點值。Solaris UTF-8 語言環境支援這些字元,但此對映可能不適用於其他平台。
這些對映檔與您系統上的對映檔不同,但可以就本討論內容稍加編輯,以移除不需要的關鍵字。
在 VOWELS 和 SPECIAL VOWELS 區段中,會依據上下文來顯示相同英文代表字元的獨立形式或附屬形式。請參閱連續語音輸入法的運作方式。
喀拉拉文字體包含特別的 ‘CHILLU’ 區段,實際上它屬於 SPECIAL OTHER 分類。
下列圖解顯示英文與目標印度文字體中語音同義字元的現有對映。在您熟悉所使用之字體的所有對映之前,請使用這些圖例做為參閱。本文所提供的對映是直覺式的,因此您應該不必查找圖例即可輸入大部分的字元。
在這些對映中,如果 ‘.’ 和 ‘|’ 等特殊字元是對映內容的一部分時,必須以 ‘\’ 字元跳過。如果沒有,當用於表示相同 UTF-8 字元的代表字元超過一個以上時,‘|’ 字元會被視為分隔符號。
圖 4–1、圖 4–2 和圖 4–3 顯示英文與子音字母、母音字母和其他字元的孟加拉文對映。
圖 4–4、圖 4–5 和圖 4–6 顯示英文與子音字母、母音字母和其他字元的古吉拉特文對映。
圖 4–7、圖 4–8 和圖 4–9 顯示英文與子音字母、母音字母和其他字元的果魯穆其文對映。
圖 4–10、圖 4–11 和圖 4–12 顯示英文與子音字母、母音字母和其他字元的北印度文對映。
圖 4–13、圖 4–14 和圖 4–15 顯示英文與子音字母、母音字母和其他字元的卡納達文對映。
圖 4–16、圖 4–17 和圖 4–18 顯示英文與子音字母、母音字母和其他字元的喀拉拉文對映。
圖 4–19 和圖 4–20 顯示英文與子音字母和母音字母的坦米爾文對映。
圖 4–21、圖 4–22 和圖 4–23 顯示英文與子音字母、母音字母和其他字元的安得拉邦文對映。
針對每一個印度文字體,‘virama’ 或等號與子音字母的組合,會給出一個形式不完整 (或準備組合的形式) 的子音字母。每當鍵入子音字母相對應的多重鍵組合,子音字母 + virama 形式會輸出並符號化已準備好進行組合的字元。
初始輸入的子音字母會採用原本的不完整形式,一旦後面接著母音字母時,則會成為完整音節或子音字母的變化形式。
兩個連續的子音字母會維持準備好組合的不完整形式。不完整形式可以經由配置引擎當作已組合的單一字元來轉換或維持其可用於每一種語言之語意構造的獨立形式。
以任何母音字母做為字詞的開頭或後面接著其他母音字母時,會以獨立形式顯示。母音字母後面立即接著一個子音字母時,會採用附屬形式。
在任何環境中都不會改變其外觀形狀的字元就是其他字元。這些字元既不是子音字母也不是母音字母。
不做為字元一部分的數字和其他標點符號,是採取一對一對映。
透過這些原則,剖析器 (已寫入上述原則) 會將輸入字元剖析為這些不同分類,並輸出語言特定的 Unicode 字碼點。連續語音輸入法引擎不處理字元配置或轉譯,而是由系統中的其他模組來處理。
目前 Solaris 環境支援三種泰文輸入層次與四種泰文鍵盤配置。
此發行版本支援下列泰文輸入法。在泰文資訊技術標準中,指定這些輸入法做為字元順序檢查。
直接通過層次,沒有輸入檢查
基本輸入檢查層次
詳細輸入檢查層次
與舊版 Solaris 相同,此發行版本的預設是直接通過層次,沒有輸入檢查。
您可以使用 F2 功能鍵,從目前的輸入層次切換到下一個輸入層次。
Kedmanee (TIS820-2531) 鍵盤配置。此 Kedmanee 配置是為打字機設計的,不適用於電腦鍵盤。由於打字機鍵盤上的按鍵有限,因此這個配置無法使用部分泰文特殊字元。TIS820-2531 在電腦鍵盤上採用 Kedmanee 配置。
TIS820-2538 鍵盤配置。此增強型 Kedmanee 配置是 TIS820-2531 配置的更新版本,其中包含原本無法在舊版 Kedmanee 配置中使用的部分泰文特殊字元。TIS820-2538 是目前唯一由泰國工業標準局發佈的泰文鍵盤配置標準。
可配置的鍵盤配置。使用者可定義泰文輸入法的鍵盤配置。
輸入層次切換。您可以按一下輔助板上的輸入層次按鈕,以選擇直接通過、基本或詳細來做為您的輸入層次。
泰文虛擬鍵盤。您可以按一下鍵盤按鈕來顯示泰文虛擬鍵盤,以輸入泰文字元。