國際語言環境指南

第 4章 支援的亞洲語言環境

以下章節說明亞洲支援的語言環境

亞洲支援的語言環境

下表提供了亞洲支援的語言環境的摘要。

表 4–1 亞洲語言環境摘要

語言 

語言環境名稱 

說明 

支援的字元集 

韓文 

ko

ko.UTF-8

韓文(EUC) 

韓文(UTF-8) 

KS X 1001  

KS X 1005–1 

 

 

 

 

簡體中文 

zh_CN.EUC

zh_CN.GBK

zh_CN.GB18030

zh_CN.UTF-8

簡體中文(EUC) 

簡體中文 (GBK)  

簡體中文(GB18030–2000) 

簡體中文 (UTF-8)  

GB 2312-1980 

GBK 

GB18030–2000 

Unicode 3.1 

 

 

 

 

繁體中文 

zh_TW.EUC

zh_TW.UTF-8

zh_TW.BIG5

zh_HK.BIG5HK

zh_HK.UTF—8

繁體中文 (EUC)  

繁體中文(UTF-8) 

繁體中文 (BIG5) 

繁體中文(BIG5+HKSCS) 

繁體中文 (UTF-8) 

CNS 11643 –1992 

Unicode 3.1 

BIG5  

BIG5+HKSCS 

Unicode 3.1  

日文 

ja

ja_JP.eucJP

ja_JP.PCK

ja_JP.UTF-8

日文(EUC) 

日文(EUC) 

日文(PCK) 

日文(UTF-8) 

JIS [JIS X 0201-1976、JIS X 0208-1990 以及 JIS X 0212-1990]

JIS [JIS X 0201–1976 以及 JIS X 0208–1990]

Unicode3.1 

泰文  

th_TH.TIS620

th_TH.UTF-8

th_TH.ISO8859-11

泰文(TIS620.2533) 

泰文(UTF-8) 

泰文 (ISO8859-11)

TIS620.2533 

Unicode 3.1 

ISO8859-11

北印度文 

hi_IN.UTF-8

北印度文(UTF-8) 

Unicode 3.1 

簡體與繁體中文的輸入法輔助視窗支援

此視窗可為所有的中文客戶提供友善、可延伸的輸入法管理工具,新的輸入法輔助視窗可支援以下的新功能和公用程式:

若要獲得更多詳細資訊,請參閱簡體中文使用者指南以及繁體中文使用者指南

輸入法輔助視窗支援所有的 UTF-8 語言環境以及下列中文語言環境:

支援兩種輸入法:

下圖顯示輔助視窗支援的介面模式。

圖 4–1 輔助視窗支援的介面模型

Graphic

泰文本土化

根據「泰文 IT 標準」,有三種輸入的層次針對該泰文字元序列檢查方法:

  1. 直接通過層次,沒有輸入檢查。

  2. 基本輸入檢查層次。

  3. 詳細輸入檢查層次。

在 Solaris 9 版本中,預設的輸入檢查層次仍是直接通過層次。其表示與前一個 Solaris 版本一樣屬於相同的層次,沒有序列檢查。您可以使用 F2 功能鍵在三種層次間進行切換。

passthrough -> basic -> strict -> passthrough

泰文輸入法輔助視窗

泰文輸入法輔助視窗支援以下的新功能和公用程式:

按一下輔助軸上的輸入層次按鈕以選取特定的泰文輸入層次以及輸入檢查層次。按一下鍵盤按鈕以顯示泰文虛擬鍵盤。使用泰文虛擬鍵盤以輸入泰文字元。

簡體中文本土化

Solaris 9 環境中的簡體中文可提供四種語言環境:zh, zh.GBKzh_CN.GB18030 ,以及zh.UTF-8。 在zh語言環境中,該 EUC 機制是用來編碼 GB2312–80。 zh.GBK 語言環境可支援 GBK 字碼集,它是一種 GB2312–80 的超集合。

現在 zh_CN.GB18030語言環境已經支援新的 GB18030–2000 字碼集。

簡體中文大部分使用於中華人民共和國 (PRC) 和新加坡。

針對zh語言環境已經支援下列的輸入法:

zh_CN.GB18030 語言環境支援下列輸入法:

zh.GBK 以及zh.UTF-8語言環境同時支援下列輸入法:

中文輸入法輔助視窗可為所有的中文語言環境提供友善、可延伸的輸入法使用者介面。請參閱 簡體與繁體中文的輸入法輔助視窗支援

若要獲得更多關於中文輸入法輔助視窗的詳細資訊,請參閱簡體中文使用者指南以及繁體中文使用者指南

下表顯示了 zh 語言環境的 TrueType 字型。

表 4–2 zh_CN.EUC語言環境的 TureType 字型

完整家族名稱 

子家族 

格式 

供應商 

編碼 

 仿宋 R TrueType Hanyi GB2312.1980
 黑體  R TrueType Monotype GB2312.1980
 楷體   R  TrueType  Monotype GB2312.1980
 宋體  R TrueType  Monotype GB2312.1980

下列表格顯示zh語言環境的點陣圖字型。

表 4–3 zh_CN.EUC 語言環境的點陣圖字型

完整家族名稱 

子家族 

格式 

編碼 

 宋體 B PCF (14,16)  GB2312.1980
 宋體  R  PCF (12,14,16,20,24) GB2312.1980

下表顯示了 zh_CN.GBK 語言環境的 TrueType 字型。

表 4–4 zh_CN.GBK 語言環境的 TrueType 字型

完整家族名稱 

子家族 

格式  

供應商  

編碼 

 仿宋 R TrueType FangZheng  GBK
 黑體  R  TrueType FangZheng GBK
 楷體  R TrueType  FangZheng GBK
 Song   R TrueType FangZheng GBK

下表顯示了 zh_CN.GBK 語言環境的點陣圖字型。

表 4–5 zh_CN.GBK 語言環境的點陣圖字型

完整家族名稱 

子家族 

格式 

編碼 

 宋體  R  PCF (12,14,16,20,24) GBK

下列表格顯示zh_CN.GB18030 語言環境的 TureType 字型。

表 4–6 zh_CN.GB18030 語言環境的 TrueType 字型

家族名稱 

子家族 

格式 

供應商 

編碼 

仿宋 

TrueType 

FangZheng  

GB18030–2000 

宋體 

R  

TrueType 

FangZheng 

GB18030–2000 

黑體 

TrueType 

FangZheng  

GB18030–2000 

楷體 

TrueType 

FangZheng  

GB18030–2000 

下表顯示了 zh_CN.GB18030 語言環境的點陣圖字型。

表 4–7 zh_CN.GB18030 語言環境的點陣圖字型

家族名稱 

子家族 

格式  

編碼 

宋體 

PCF(12,14,16,20,24) 

GB18030–2000 

下列表格顯示支援的簡體中文字碼集轉換。

表 4–8 簡體中文字碼集轉換

字碼 

符號 

目標碼 

符號 

GB2312-80

zh_CN.euc

ISO 2022-7

zh_CN.iso2022-7

GB2312-80

zh_CN.euc

ISO 2022-CN

zh_CN.iso2022-CN

GB2312-80

zh_CN.euc

UTF-8

UTF-8

GB18030

zh_CN.gb18030

UTF-8

UTF-8

HZ-GB-2312

HZ-GB-2312

GB2312–80

zh_CN.euc

HZ-GB-2312

HZ-GB-2312

GBK

zh_CN.gbk

HZ-GB-2312

HZ-GB-2312

UTF-8

UTF-8

ISO2022-7

zh_CN.iso2022-7

GB2312-80

zh_CN.euc

ISO2022-CN

zh_CN.iso2022-CN

GB2312-80

zh_CN.euc

ISO2022-CN

zh_CN.iso2022-CN

UTF-8

UTF-8

ISO2022-CN

zh_CN.iso2022-CN

zh.GBK

zh_CN.gbk

UTF-8

UTF-8

GB2312-80

zh_CN.euc

UTF-8

UTF-8

GB18030

zh_CN.gb18030

UTF-8

UTF-8

ISO2022-CN

zh_CN.iso2022-CN

UTF-8

UTF-8

zh.GBK

zh_CN.gbk

zh.GBK

zh_CN.gbk

ISO2022-CN

zh_CN.iso2022-CN

zh.GBK

zh_CN.gbk

UTF-8

UTF-8

繁體中文本土化

Solaris 9 產品中的繁體中文提供五種語言環境:

繁體中文大部分使用於台灣和中國香港。zh_TW.EUC zh_TW.BIG5,以及 zh_TW.UTF-8語言環境中支援下列輸入法:

下列輸入法為 zh_HK.BIG5HK and zh_HK.UTF-8 語言環境所支援的

下表顯示了 zh_TW 語言環境的繁體中文 TrueType 字型。

表 4–9 zh_TW語言環境的繁體中文 TrueType 字型

完整家族名稱 

子家族 

格式  

供應商  

編碼 

 黑體   R  TrueType  Hanyi  CNS11643.1992
 楷體   R  TrueType Hanyi CNS11643.1992
 明體  R  TrueType  Hanyi  CNS11643.1992

下表顯示了 zh_TW 語言環境的繁體中文點陣圖字型。

表 4–10 zh_TW 語言環境的繁體中文點陣圖字型

完整家族名稱 

子家族 

格式  

編碼 

 明體   R  PCF (12,14,16,20,24)  CNS11643.1992

下表顯示了 zh_HK.BIG5HK 語言環境的 TrueType 字型。

表 4–11 zh_HK.BIG5HK 語言環境的 TrueType 字型

家族名稱 

子家族 

格式  

供應商 

編碼 

明體 

R  

TrueType 

FangZheng  

Big5–HKSCS 

黑體 

R  

TrueType 

FangZheng 

Big5–HKSCS 

楷體 

TrueType 

FangZheng 

Big5–HKSCS 

下表顯示了 zh_HK.BIG5HK 語言環境的點陣圖字型。

表 4–12 zh_HK.BIG5HK語言環境的點陣圖字型

家族名稱 

子家族 

格式  

編碼 

明體  

R  

PCF(12,14,16,20,24) 

Big5–HKSCS 

下表顯示了繁體中文所支援的字碼集轉換。

表 4–13 繁體中文的字碼集轉換

字碼  

符號 

目標碼 

符號 

BIG5

zh_TW-big5

CNS 11643

zh_TW-euc

BIG5

zh_TW-big5

ISO2022–CN

zh_TW-iso2022–CN-EXT

BIG5

zh_TW-big5

UTF-8

UTF-8

BIG5+HKSCS

zh_HK.big5hk

UTF-8

UTF-8

CNS 11643

zh_TW-euc

BIG5

zh_TW-big5

CNS 11643

zh_TW-euc

UTF-8

UTF-8

CNS 11643

zh_TW-euc

ISO2022-7

zh_TW-iso2022-7

CNS 11643

zh_TW-euc

ISO2022-CN-EXT

zh_TW-iso2022-CN-EXT

CNS 11643

zh_TW-euc

UTF-8

UTF-8

ISO2022-7

zh_TW-iso2022-7

CNS 11643

zh_TW-euc

ISO2022-7

zh_TW-iso2022-7

UTF-8

UTF-8

ISO2022-CN

zh_TW-iso2022-CN-EXT

BIG5

zh_TW-big5

ISO2022-CN-EXT

zh_TW-iso2022-CN-EXT

CNS 11643

zh_TW-euc

UTF-8

UTF-8

BIG5

zh_TW-big5

UTF-8

UTF-8

BIG5+HKSCS

zh_HK.big5hk

UTF-8

UTF-8

CNS 11643

zh_TW-euc

UTF-8

UTF-8

ISO 2022-7

zh_TW-iso2022-7

日文本土化

本節說明日文語言環境特定資訊。

日文語言環境

Solaris 9 環境中有四種可支援不同字元編碼的日文語言環境。該ja以及ja_JP.eucJP語言環境是以日文 EUC 為基礎。該ja_JP.eucJP語言環境符合「UI-OSF 日文環境執行協定 1.1 版」以及ja語言環境符合起始於較早 Solaris 版本的傳統規格。該ja_JP.PCK語言環境是 PC 漢字字碼(就是指 Shift_JIS)基礎架構,而 ja_JP.UTF-8UTF-8 基礎架構。

請參閱eucJP(5) 以獲得日文 EUC 與字元集之間的對映線上援助頁。請參閱PCK(5) 線上援助頁以獲得 PC-Kanji 與字元集之間的對映。

日文字元集

支援的日文字元集為:

JIS X 0212–1990 在ja_JP.PCK語言環境中不支援。JIS X 0213–2000 只能在 ja_JP.UTF-8 語言環境中獲得支援。並非所有在 JIS X 0213–2000 中定義的字元都可以使用。只有在 Unicode 3.1 字元集中定義的字元才能使用。

也支援供應商定義的字元(VDC)以及使用者定義的字元(UDC)。VDC 使用 JIS X 0208–1990 或 JIS X 0212–1990 未使用的(保留的)字碼點。UDC 使用與 VDC 相同的字碼點,除了那些配置給 VDC 的字碼點以外。

日文字型

支援三種日文字型格式:點陣圖、TrueType 以及 Type1。該日文 Type1 字型只包括列印用途的 JIS X 0212。UDC 也使用 Type 1 字型。

下表說明日文點陣圖字型

表 4–14 日文點陣圖字型

完整家族名稱 

子家族 

格式 

供應商 

編碼 

sun gothic

R,B 

PCF(12,14,16,20,24) 

 

JIS X 0208–1983, 

JIS X 0201–1976 

sun minchou

PCF(12,14,16,20,24) 

 

JIS X 0208–1983,  

JIS X 0201–1976 

ricoh hg gothic b

R  

PCF(10,12,14,16,18,20,24)  

RICOH  

JIS X 0208–1983, JIS X 0201–1976  

ricoh hg mincho l

R  

PCF(10,12,14,16,18,20,24)  

RICOH  

JIS X 0208–1983, JIS X 0201–1976  

ricoh gothic

R  

PCF(10,12,14,16,18,20,24)  

RICOH  

JIS X 0212–1990,JIS X 0213–2000  

ricoh mincho

R  

PCF(10,12,14,16,18,20,24)  

RICOH  

JIS X 0212–1990, JIS X 0213–2000  

ricoh heiseimin

R  

PCF(12,14,16,18,20,24)  

RICOH  

JIS X 0212–1990  

下列表格中說明日文 TrueType 字型。

表 4–15 日文 TrueType 字型

完整家族名稱 

子家族 

格式 

供應商 

編碼 

ricoh hg gothic b

固定的 

TrueType 

RICOH  

JIS X 0208–1983, JIS X 0201–1976  

ricoh hg mincho l

固定的 

TrueType  

RICOH  

JIS X 0208–.1983, JIS X 0201–1976  

ricoh gothic

固定的,成比例的 

TrueType 

RICOH  

JIS X 0201–176,JIS X 0208–1983,JIS X 0213–2000 

ricoh mincho

固定的,成比例的 

TrueType 

RICOH  

JIS X 0201–1976, JIS X 0208–1983, JIS X 0213–2000 

ricoh heiseimin

固定的 

TrueType  

RICOH  

JIS X 0212–1990  

日文輸入系統

ATOK12 是 Solaris 9 環境中預設的日文輸入系統。若您已安裝日文語言環境,則可以在所有的日文語言環境和所有的 UTF-8 語言環境中所用。所有日文語言環境也可以使用 Wnn6 日文輸入系統。您可以在「工作區」功能表中切換輸入系統。您可在 Solaris 1.x BCP 支援中使用 kkcv 日文輸入系統。

下列範例說明如何使用 ATOK12 來輸入日文。

  1. 藉由按著Control + spacebar 來開啟轉換模式。

  2. 鍵入假名字元文字(例如 kanjihenkan)。

  3. 藉由按著空白鍵以轉換至漢字字元。

    若要顯示其他的漢字字元,請按一下空格鍵來顯示轉換候選表。鍵入您想要選取的編號。

  4. 若要確定整個文字轉換至漢字字元文字,請按輸入鍵。

    按向下箭頭鍵以確定只轉換選取的字元。

  5. 按下 Control + spacebar 來關閉轉換模式。

日文終端機的終端機設定

您必須使用終端機設定來讓行編輯正確運作,才能在以字元為基礎的終端機 (TTY) 上使用日文語言環境。

日文iconv模組

iconv( 1) 以及iconv(3) 可支援某些日文字碼集轉換。請參閱 iconv_ja(5) 線上援助頁以取得詳細資訊。

使用者定義的字元支援

使用者定義字元公用程式 sdtudctool 可處理外框 (Type1) 和點陣圖 (PCF) 字型。也可以使用某些公用程式以轉移使用之前版本中舊有的公用程式所建立的 UDC 字型,像是fontedittype3creator,以及 fontmanager

部份和完整語言環境之間的差異

下列元件只可以在 Language CD 的 日文 完整語言環境中取得:

韓文本土化

韓國政府在 1995 年 12 月 頒布了標準韓文字碼集 KS X 1005–1,它是以 ISO 10646-1/Unicode 2.0 為基礎的字碼集。

該 ISO-10646 字元集使用兩種通用字元集:

該 ISO-10646 字元集不能直接用在以 IBM PC 為基礎的作業系統上。例如,kernel 和 Solaris 作業環境中的其他模組會將某些位元值解譯成控制指令,例如任何字串中的空字元 (0x00)。可以利用第一個或之後的位元組合進行 ISO-10646 字元集的編碼。在這些限制因素下,ISO-10646 字元便無法任意地在 Solaris 系統中傳送。

為了轉換路徑的建立,ISO-10646 字元集會定義 UCS 變換格式 (UTF),它不要 C0 控制 (0x00..0x1F)、C1 控制 (0x80..0x9F)、空間 (0x20),和 DEL (0x7F) 就可以重新編碼 ISO-10646 字元。

ko.UTF-8 為可支援 KS X 1005–1 (韓文標準字碼集) 的 Solaris 語言環境。此語言環境可支援上一個 KS X 1005 中的所有字元和所有 11,172 韓文字元。韓文 UTF-8 支援韓語相關的 ISO-10646 字元與字型。由於 ISO-10646 涵蓋世界上的所有字元,並提供各種輸入法和字型,所以您可以輸入和輸出任何語言的字元。在能夠使用通用 UTF/UCS 之前,韓文UTF-8 可支援與韓文字元和上一個韓文標準字碼集中的字元,以及擴充的 ASCII 相關的ISO-10646 字碼子集。

ko 語言環境中, EUC 機制是用來進行 KS X 1001 的編碼。該ko.UTF-8語言環境支援 KS X 1005–1/Unicode 2.0 字碼集,其為 KS X 1001 的超集合。這兩個語言環境外觀與一般使用者相同,但內部字元編碼並不相同。韓文 Solaris 產品支援下列輸入法:

針對ko語言環境:

針對ko.UTF-8語言環境:

下表顯示 ko 語言環境的韓文點陣圖字型。

表 4–16 ko語言環境的 Solaris 9 韓文點陣圖字型

完整家族名稱 

子家族 

格式  

編碼 

 哥德語  R/B  PCF (12,14,16,18,20,24)  KS X 1001
 圖形  R/B  PCF (12,14,16,18,20,24)  KS X 1001
 Haeso   R/B  PCF (12,14,16,18,20,24)  KS X 1001
 Kodig   R/B  PCF (12,14,16,18,20,24)  KS X 1001
 Myeongijo  R/B  PCF (12,14,16,18,20,24)  KS X 1001
 Pilki   R/B PCF (12,14,16,18,20,24) KS X 1001
 圓形哥德式 R/B  PCF (12,14,16,18,20,24)  KS X 1001

下表顯示了 ko.UTF-8 語言環境的韓文點陣圖字型。

表 4–17 ko.UTF-8 語言環境的 Solaris 韓文點陣圖字型

完整家族名稱 

子家族 

格式  

編碼 

 哥德語  R/B  PCF (12,14,16,18,20,24) KS X 1001 (Johap)
 圖形  R/B  PCF (12,14,16,18,20,24) KS X 1001 (Johap)
 Haeso   R/B PCF (12,14,16,18,20,24)KS X 1001 (Johap)
 Kodig  R/B PCF (12,14,16,18,20,24)KS X 1001 (Johap)
 Myeongijo R/B PCF (12,14,16,18,20,24) KS X 1001 (Johap)
 Pilki  R/B PCF (12,14,16,18,20,24)KS X 1001 (Johap)

下表顯示了 ko/ko.UTF-8 語言環境的韓文 TrueType 字型。

表 4–18 ko/ko.UTF-8語言環境的 Solaris 9 韓文 TrueType 字型

完整家族名稱 

子家族 

格式 

供應商 

編碼 

Kodig/Gothic 

TrueType 

Hanyang 

Unicode 

Myeongijo  

R  

TrueType 

Hanyang  

Unicode  

Haeso  

R  

TrueType  

Hanyang 

Unicode  

圓形哥德式 

R  

TrueType  

Hanyang  

Unicode  

下列表格顯示韓文iconv

表 4–19 韓文iconv

字碼 

符號 

目標碼  

符號 

IBM CP933cp933

UTF-8(Unicode 2.0)

ko_KR-UTF-8
ISO646646

KS X 1001

5601
ISO2022-KR iso2022-7

KS X 1001

ko_KR-euc
ISO2022-KR iso2022-7

UTF-8 (Unicode 2.0)

ko_KR-UTF-8
KS X 1001 5601

UTF-8

UTF-8
KS X 1001 EUC-KR

UTF-8

UTF-8
KS X 1001 KSC5601

UTF-8

UTF-8
KS X 1001 ko_KR-euc

UTF-8 (Unicode 2.0)

ko_KR-UTF-8
KS X 1001 ko_KR-euc

ISO2022-KR

ko_KR-iso2022-7
KS X 1001 ko_KR-euc

KS X 1001

ko_KR-johap
KS X 1001 ko_KR-euc

KS X 1001

ko_KR-johap92
KS X 1001 ko_KR-euc

KS X 1001

ko_KR-nbyte
KS X 1001 ko-KR-nbyte

KS X 1001

ko_KR-euc
KS X 1001 ko-KR-johap

UTF-8 (Unicode 2.0)

ko_KR-UTF-8
KS X 1001 ko-KR-johap

KS X 1001

ko_KR-euc
KS X 1001 ko-KR-johap92

UTF-8 (Unicode 2.0)

ko_KR-UTF-8
KS X 1001 ko-KR-johap92

KS X 1001

ko_KR-euc
UTF-8 UTF-8

KS X 1001

5601
UTF-8 UTF-8

KS X 1001

EUC-KR
UTF-8 UTF-8

KS X 1001

KSC5601
UTF-8 ko-KR-UTF-8

IBM CP 933

cp 933
UTF-8 ko-KR-UTF-8

KS X 1001

ko_KR-euc
UTF-8 ko-KR-UTF-8

ISO2022-KR

ko_KR-iso2022-7
UTF-8 ko-KR-UTF-8

KS X 1001

ko_KR-johap
UTF-8 ko-KR-UTF-8

KS X 1001

ko_KR-johap92