国际语言环境指南

第 4 章 支持的亚洲语言环境

下列部分描述亚洲受支持的语言环境:

亚洲受支持的语言环境

下表提供了亚洲受支持的语言环境的摘要。

表 4–1 亚洲语言环境摘要

语言  

语言环境名称 

描述 

支持的字符集 

朝鲜语 

ko

ko.UTF-8

朝鲜语 (EUC) 

朝鲜语 (UTF-8)  

KS X 1001 

KS X 1005–1 

 

 

 

 

简体中文 

zh_CN.EUC

zh_CN.GBK

zh_CN.GB18030

zh_CN.UTF-8

简体中文 (EUC) 

简体中文 (GBK) 

简体中文 (GB18030–2000) 

简体中文 (UTF-8)  

GB 2312-1980 

GBK 

GB18030–2000 

Unicode 3.1 

 

 

 

 

繁体中文 

zh_TW.EUC

zh_TW.UTF-8

zh_TW.BIG5

zh_HK.BIG5HK

zh_HK.UTF—8

繁体中文 (EUC)  

繁体中文 (UTF-8) 

繁体中文 (BIG5) 

繁体中文 (BIG5+HKSCS) 

繁体中文 (UTF-8) 

CNS 11643 –1992 

Unicode 3.1 

BIG5  

BIG5+HKSCS 

Unicode 3.1  

日语 

ja

ja_JP.eucJP

ja_JP.PCK

ja_JP.UTF-8

日语 (EUC) 

日语 (EUC) 

日语 (PCK)  

日语 (UTF-8) 

JIS [JIS X 0201-1976、JIS X 0208-1990 和 JIS X 0212-1990]

JIS [ JIS X 0201–1976 和 JIS X 0208–1990]

Unicode3.1 

泰语 

th_TH.TIS620

th_TH.UTF-8

th_TH.ISO8859-11

泰文 (TIS620.2533) 

泰文 (UTF-8) 

Thai(ISO8859-11)

TIS620.2533 

Unicode 3.1 

ISO8859-11

印地语 

hi_IN.UTF-8

印地语 (UTF-8)  

Unicode 3.1 

简体和繁体中文的输入法辅助窗口支持

该窗口为所有中文用户提供了一个友好并且可扩展的输入法管理工具。新的输入法辅助窗口支持下列新功能和公用程序:

有关更详细的信息,请参见《简体中文用户指南》和《繁体中文用户指南》。

输入法辅助窗口支持所有的 UTF-8 语言环境和下列中文语言环境:

支持两种输入法:

辅助窗口支持的接口模型如下图所示。

图形 4–1 辅助窗口支持的接口模型

Graphic

泰语本地化

根据泰语信息技术规范,泰语字符序列检查方法有三种输入级别:

  1. 传递级别,不进行任何输入检查。

  2. 基本的输入检查级别。

  3. 严格的输入检查级别。

在 Solaris 9 发行版中,缺省的输入检查级别仍为传递级别。这意味着不进行任何序列检查,这与以前的 Solaris 版本中的级别相同。 可以使用 F2 功能键在这三个级别之间进行切换:

传递 -> 基本 -> 严格 -> 传递

泰语输入法辅助窗口

泰语输入法辅助窗口支持下列新功能和公用程序:

单击辅助条上的输入级别按钮以选择特定的泰语输入级别和输入检查级别。单击键盘按钮以显示泰语虚拟键盘。使用泰语虚拟键盘输入泰语字符。

简体中文本地化

Solaris 9 环境中的简体中文提供了四种语言环境:zhzh.GBKzh_CN.GB18030 zh.UTF-8。在 zh 语言环境中,EUC 方案用于对 GB2312–80 进行编码。zh.GBK 语言环境支持 GBK 代码集,它是 GB2312–80 的超集。

现在 zh_CN.GB18030 语言环境支持新的 GB18030–2000 代码集。

简体中文主要在中华人民共和国 (PRC) 和新加坡使用。

下列输入法在 zh 语言环境中受到支持:

下列输入法在 zh_CN.GB18030 语言环境中受到支持:

下列输入法在 zh.GBK zh.UTF-8 语言环境中同时受到支持:

中文输入法的辅助窗口为所有中文语言环境提供了一个友好并且可以扩展的输入法用户界面。请参见 简体和繁体中文的输入法辅助窗口支持

有关中文输入法辅助窗口的更详细信息,请参见《简体中文用户指南》和《繁体中文用户指南》。

下表显示了 zh 语言环境的 TrueType 字体。

表 4–2 zh_CN.EUC 语言环境的 TrueType 字体

完整系列名 

子系列 

格式 

供应商  

编码  

 仿宋 R TrueType 汉仪 GB2312.1980
 黑体  R TrueType Monotype GB2312.1980
 楷体  R TrueType Monotype GB2312.1980
 宋体  R TrueType Monotype GB2312.1980

下表显示 zh 语言环境的位图字体。

表 4–3 zh_CN.EUC 语言环境的位图字体

完整系列名 

子系列 

格式 

编码 

 宋体 B PCF (14,16) GB2312.1980
 宋体  R PCF (12,14,16,20,24) GB2312.1980

下表显示 zh_CN.GBK 语言环境的 TrueType 字体。

表 4–4 zh_CN.GBK 语言环境的 TrueType 字体

完整系列名 

子系列 

格式 

供应商 

编码 

 仿宋 R TrueType 综艺  GBK
 黑体  R TrueType 综艺 GBK
 楷体  R TrueType 综艺 GBK
 宋体  R TrueType 综艺 GBK

下表显示 zh_CN.GBK 语言环境的位图字体。

表 4–5 zh_CN.GBK 语言环境的位图字体

完整系列名 

子系列 

格式 

编码 

 宋体  R PCF (12,14,16,20,24) GBK

下表显示 zh_CN.GB18030 语言环境的 TrueType 字体。

表 4–6 zh_CN.GB18030 语言环境的 TrueType 字体

系列名 

子系列 

格式 

供应商 

编码 

仿宋 

TrueType 

方正 

GB18030–2000 

宋体 

TrueType 

方正 

GB18030–2000 

黑体 

TrueType 

方正 

GB18030–2000 

楷体 

TrueType 

方正 

GB18030–2000 

下表显示 zh_CN.GB18030 语言环境的位图字体。

表 4–7 zh_CN.GB18030 语言环境的位图字体

系列名 

子系列 

格式 

编码 

宋体 

PCF(12,14,16,20,24) 

GB18030–2000 

下表显示受支持的简体中文代码集转换。

表 4–8 简体中文代码集转换

代码  

符号  

目标代码 

符号  

GB2312-80

zh_CN.euc

ISO 2022-7

zh_CN.iso2022-7

GB2312-80

zh_CN.euc

ISO 2022-CN

zh_CN.iso2022-CN

GB2312-80

zh_CN.euc

UTF-8

UTF-8

GB18030

zh_CN.gb18030

UTF-8

UTF-8

HZ-GB-2312

HZ-GB-2312

GB2312–80

zh_CN.euc

HZ-GB-2312

HZ-GB-2312

GBK

zh_CN.gbk

HZ-GB-2312

HZ-GB-2312

UTF-8

UTF-8

ISO2022-7

zh_CN.iso2022-7

GB2312-80

zh_CN.euc

ISO2022-CN

zh_CN.iso2022-CN

GB2312-80

zh_CN.euc

ISO2022-CN

zh_CN.iso2022-CN

UTF-8

UTF-8

ISO2022-CN

zh_CN.iso2022-CN

zh.GBK

zh_CN.gbk

UTF-8

UTF-8

GB2312-80

zh_CN.euc

UTF-8

UTF-8

GB18030

zh_CN.gb18030

UTF-8

UTF-8

ISO2022-CN

zh_CN.iso2022-CN

UTF-8

UTF-8

zh.GBK

zh_CN.gbk

zh.GBK

zh_CN.gbk

ISO2022-CN

zh_CN.iso2022-CN

zh.GBK

zh_CN.gbk

UTF-8

UTF-8

繁体中文本地化

Solaris 9 产品中的繁体中文提供了五种语言环境:

繁体中文主要在中国台湾和香港地区使用。下列输入法在 zh_TW.EUC zh_TW.BIG5zh_TW.UTF-8 语言环境中受到支持:

下列输入法zh_HK.BIG5HKzh_HK.UTF-8 语言环境中受到支持。

下表显示 zh_TW 语言环境的繁体中文 TrueType 字体。

表 4–9 zh_TW 语言环境的繁体中文 TrueType 字体

完整系列名 

子系列 

格式 

供应商 

编码 

 黑体  R TrueType 汉仪 CNS11643.1992
 楷体  R TrueType 汉仪 CNS11643.1992
 Ming  R TrueType 汉仪 CNS11643.1992

下表显示 zh_TW 语言环境的繁体中文位图字体。

表 4–10 zh_TW 语言环境的繁体中文位图字体

完整系列名 

子系列 

格式 

编码 

 Ming  R PCF (12,14,16,20,24) CNS11643.1992

下表显示 zh_HK.BIG5HK 语言环境的 TrueType 字体。

表 4–11 zh_HK.BIG5HK 语言环境的 TrueType 字体

系列名 

子系列 

格式 

供应商 

编码 

Ming 

TrueType 

方正 

Big5–HKSCS 

黑体 

TrueType 

方正 

Big5–HKSCS 

楷体 

TrueType 

方正 

Big5–HKSCS 

下表显示zh_HK.BIG5HK 语言环境的位图字体。

表 4–12 zh_HK.BIG5HK 语言环境的位图字体

系列名 

子系列 

格式 

编码 

Ming 

PCF(12,14,16,20,24) 

Big5–HKSCS 

下表显示受支持的繁体中文代码集转换。

表 4–13 繁体中文代码集转换

代码  

符号  

目标代码 

符号  

BIG5

zh_TW-big5

CNS 11643

zh_TW-euc

BIG5

zh_TW-big5

ISO2022–CN

zh_TW-iso2022–CN-EXT

BIG5

zh_TW-big5

UTF-8

UTF-8

BIG5+HKSCS

zh_HK.big5hk

UTF-8

UTF-8

CNS 11643

zh_TW-euc

BIG5

zh_TW-big5

CNS 11643

zh_TW-euc

UTF-8

UTF-8

CNS 11643

zh_TW-euc

ISO2022-7

zh_TW-iso2022-7

CNS 11643

zh_TW-euc

ISO2022-CN-EXT

zh_TW-iso2022-CN-EXT

CNS 11643

zh_TW-euc

UTF-8

UTF-8

ISO2022-7

zh_TW-iso2022-7

CNS 11643

zh_TW-euc

ISO2022-7

zh_TW-iso2022-7

UTF-8

UTF-8

ISO2022-CN

zh_TW-iso2022-CN-EXT

BIG5

zh_TW-big5

ISO2022-CN-EXT

zh_TW-iso2022-CN-EXT

CNS 11643

zh_TW-euc

UTF-8

UTF-8

BIG5

zh_TW-big5

UTF-8

UTF-8

BIG5+HKSCS

zh_HK.big5hk

UTF-8

UTF-8

CNS 11643

zh_TW-euc

UTF-8

UTF-8

ISO 2022-7

zh_TW-iso2022-7

日语本地化

这部分描述日语语言环境特定的信息。

日语语言环境

在 Solaris 9 环境中,可使用四种支持不同字符集的日语语言环境。jaja_JP.eucJP 语言环境基于日语 EUC。ja_JP.eucJP 语言环境符合 UI-OSF 日语环境实现协议 1.1 版,ja 语言环境符合早期 Solaris 版本中的传统规范。ja_JP.PCK 语言环境基于 PC 日文汉字代码(称为 Shift_JIS),而ja_JP.UTF-8 基于 UTF-8

有关日语 EUC 和此字符集之间的映射,请参见 eucJP(5) 手册页。 有关 PC 日文汉字代码和此字符集之间的映射,请参见 PCK(5) 手册页。

日语字符集

受支持的日语字符集有:

JIS X 0212–1990 在 ja_JP.PCK 语言环境中不受支持。 JIS X 0213–2000 仅在 ja_JP.UTF-8 语言环境中受到支持。并不是在 JIS X 0213–2000 中定义的所有字符都可用。只有那些在 Unicode 3.1 字符集中定义的字符可用。

还支持供应商定义的字符 (VDC) 和用户定义的字符 (UDC)。VDC 占用 JIS X 0208–1990 或 JIS X 0212–1990 的未使用(保留)代码点。 除了那些为 VDC 分配的代码点外,UDC 与 VDC 占用相同的代码点。

日语字体

支持三种日语字体格式。位图、TrueType 和 Type1。 日语 Type1 字体只包括用于打印的 JIS X 0212。Type1 字体还由 UDC 使用。

下表对日语位图字体进行了描述。

表 4–14 日语位图字体

完整系列名 

子系列 

格式 

供应商 

编码 

sun gothic

R、B 

PCF(12,14,16,20,24) 

 

JIS X 0208–1983、 

JIS X 0201–1976 

sun minchou

PCF(12,14,16,20,24) 

 

JIS X 0208–1983、 

JIS X 0201–1976 

ricoh hg gothic b

PCF(10,12,14,16,18,20,24) 

RICOH 

JIS X 0208–1983、JIS X 0201–1976 

ricoh hg mincho l

PCF(10,12,14,16,18,20,24) 

RICOH 

JIS X 0208–1983, JIS X 0201–1976 

ricoh gothic

PCF(10,12,14,16,18,20,24) 

RICOH  

JIS X 0212–1990、JIS X 0213–2000 

ricoh mincho

PCF(10,12,14,16,18,20,24) 

RICOH  

JIS X 0212–1990, JIS X 0213–2000 

ricoh heiseimin

PCF(12,14,16,18,20,24) 

RICOH 

JIS X 0212–1990 

下表对日语 TrueType 字体进行了描述。

表 4–15 日语 TrueType 字体

完整系列名 

子系列 

格式 

供应商 

编码 

ricoh hg gothic b

固定 

TrueType 

RICOH 

JIS X 0208–1983、JIS X 0201–1976 

ricoh hg mincho l

固定 

TrueType 

RICOH 

JIS X 0208–.1983、JIS X 0201–1976 

ricoh gothic

固定、成比例 

TrueType 

RICOH 

JIS X 0201–176、JIS X 0208–1983、JIS X 0213–2000 

ricoh mincho

固定、成比例 

TrueType 

RICOH 

JIS X 0201–1976、JIS X 0208–1983、JIS X 0213–2000 

ricoh heiseimin

固定 

TrueType 

RICOH 

JIS X 0212–1990  

日语输入系统

ATOK12 是 Solaris 9 环境中缺省的 日语输入系统。当安装了日语语言环境后,该输入系统就可用于所有日语语言环境和所有 UTF-8 语言环境。Wnn6 日语输入系统也可用于所有日语语言环境。您可以在“工作区”菜单中切换输入系统。对于日语 Solaris 1.x BCP 支持,可使用 kkcv 日语输入系统。

下面的示例描述如何使用 ATOK12 进行日语输入。

  1. Control + spacebar 打开转换模式。

  2. 键入假名字符文本(例如kanjihenkan)。

  3. 按空格键转换为(日语)汉字字符。

    要显示其它(日语)汉字字符,请按空格键显示转换候选表。键入您要选择的数字。

  4. 要将整个文本转换为(日语)汉字字符文本,请按回车键。

    按向下箭头键只转换选定的字符。

  5. Control + spacebar 关闭转换模式。

日语终端的终端设置

在基于字符的终端 (TTY) 上使用日语语言环境要求您使用终端设置以便使行编辑正确工作。

日语 iconv 模块

iconv( 1)iconv(3) 支持若干种日语代码集转换。 有关详细信息,请参见 iconv_ja(5) 手册页。

用户定义的字符支持

用户定义的字符公用程序 sdtudctool 处理轮廓 (Type1) 和位图 (PCF) 字体。 某些公用程序也可用于迁移由早期版本中的旧公用程序创建的 UDC 字体,如 fontedit, type3creator fontmanager

不完全语言环境和完全语言环境之间的差别

下列组件只在带有 Language CD 的日语 完全语言环境中可用:

朝鲜语本地化

1995 年 12 月,韩国政府公布了标准朝鲜语代码集 KS X 1005–1,它基于 ISO 10646-1/Unicode 2.0。

ISO-10646 字符集使用了两种通用字符集:

ISO-10646 字符集不能直接在基于 IBM PC 的操作系统上使用。例如,Solaris 操作环境的内核和许多其它模块将某些字节值翻译为控制指令,如所有字符串中的空字符 (0x00)。ISO-10646 字符集可以使用第一个或随后字节中的任何位组合进行编码。在存在这些限制的情况下,ISO-10646 字符不能在 Solaris 系统中自由传输。

为了建立迁移路径,ISO-10646 字符集定义了 UCS 变换格式 (UTF),它无须使用 C0 控制 (0x00..0x1F)、C1 控制 (0x80..0x9F)、空格 (0x20) 和 DEL (0x7F) 即可对 ISO-10646 字符进行重新编码。

ko.UTF-8 是一个用以支持朝鲜语标准代码集 KS X 1005–1 的 Solaris 语言环境。该语言环境支持以前的 KS X 1005 中的所有字符和全部 11172 个朝鲜语字符。朝鲜语 UTF-8 支持与朝鲜语相关的 ISO-10646 字符和字体。由于 ISO-10646 包括了世界上的所有字符,因而提供了所有的各式各样的输入法和字体,以便您可以输入和输出任何语言的任何字符。在可以使用通用的 UTF/UCS 之前,朝鲜语 UTF-8 支持与朝鲜语字符以及以前的朝鲜语标准代码集中的所有其它字符有关的 ISO-10646 代码子集,并支持扩展 ASCII。

ko 语言环境中,EUC 方案用于对 KS X 1001 进行编码。 ko.UTF-8 语言环境支持 KS X 1005–1/Unicode 3.1 代码集,它是 KS X 1001 的超集。 这两种语言环境在最终用户看来是一样的,但它们的内部字符编码并不相同。朝鲜语 Solaris 产品支持下列输入法:

对于 ko 语言环境:

对于 ko.UTF-8 语言环境:

下表显示 ko 语言环境的朝鲜语位图字体。

表 4–16 ko 语言环境的 Solaris 9 朝鲜语位图字体

完整系列名 

子系列 

格式 

编码 

 Gothic R/B PCF (12,14,16,18,20,24) KS X 1001
 Graphic R/B PCF (12,14,16,18,20,24) KS X 1001
 Haeso R/B PCF (12,14,16,18,20,24) KS X 1001
 Kodig R/B PCF (12,14,16,18,20,24) KS X 1001
 Myeongijo R/B PCF (12,14,16,18,20,24)  KS X 1001
 Pilki R/B PCF (12,14,16,18,20,24) KS X 1001
 Round gothic R/B PCF (12,14,16,18,20,24)  KS X 1001

下表显示 ko.UTF-8 语言环境的朝鲜语位图字体。

表 4–17 ko.UTF-8 语言环境的 Solaris 9 朝鲜语位图字体

完整系列名 

子系列 

格式 

编码 

 Gothic R/B PCF (12,14,16,18,20,24)KS X 1001 (Johap)
 Graphic R/B PCF (12,14,16,18,20,24)KS X 1001 (Johap)
 Haeso R/B PCF (12,14,16,18,20,24)KS X 1001 (Johap)
 Kodig R/B PCF (12,14,16,18,20,24)KS X 1001 (Johap)
 Myeongijo R/B PCF (12,14,16,18,20,24) KS X 1001 (Johap)
 Pilki R/B PCF (12,14,16,18,20,24)KS X 1001 (Johap)

下表显示 ko/ko.UTF-8 语言环境的朝鲜语 TrueType 字体。

表 4–18 ko/ko.UTF-8 语言环境的 Solaris 9 朝鲜语 TrueType 字体

完整系列名 

子系列 

格式 

供应商  

编码  

Kodig/Gothic 

TrueType 

Hanyang 

Unicode 

Myeongijo 

TrueType 

Hanyang 

Unicode  

Haeso 

TrueType 

Hanyang 

Unicode  

Round gothic 

TrueType 

Hanyang 

Unicode 

下表显示朝鲜语 iconv

表 4–19 朝鲜语 iconv

代码 

符号 

目标代码 

符号 

IBM CP933cp933

UTF-8 (Unicode 2.0)

ko_KR-UTF-8
ISO646646

KS X 1001

5601
ISO2022-KRiso2022-7

KS X 1001

ko_KR-euc
ISO2022-KRiso2022-7

UTF-8 (Unicode 2.0)

ko_KR-UTF-8
KS X 10015601

UTF-8

UTF-8
KS X 1001EUC-KR

UTF-8

UTF-8
KS X 1001KSC5601

UTF-8

UTF-8
KS X 1001ko_KR-euc

UTF-8 (Unicode 2.0)

ko_KR-UTF-8
KS X 1001ko_KR-euc

ISO2022-KR

ko_KR-iso2022-7
KS X 1001ko_KR-euc

KS X 1001

ko_KR-johap
KS X 1001ko_KR-euc

KS X 1001

ko_KR-johap92
KS X 1001ko_KR-euc

KS X 1001

ko_KR-nbyte
KS X 1001ko-KR-nbyte

KS X 1001

ko_KR-euc
KS X 1001ko-KR-johap

UTF-8 (Unicode 2.0)

ko_KR-UTF-8
KS X 1001ko-KR-johap

KS X 1001

ko_KR-euc
KS X 1001ko-KR-johap92

UTF-8 (Unicode 2.0)

ko_KR-UTF-8
KS X 1001ko-KR-johap92

KS X 1001

ko_KR-euc
UTF-8 UTF-8

KS X 1001

5601
UTF-8 UTF-8

KS X 1001

EUC-KR
UTF-8 UTF-8

KS X 1001

KSC5601
UTF-8 ko-KR-UTF-8

IBM CP 933

cp 933
UTF-8 ko-KR-UTF-8

KS X 1001

ko_KR-euc
UTF-8 ko-KR-UTF-8

ISO2022-KR

ko_KR-iso2022-7
UTF-8 ko-KR-UTF-8

KS X 1001

ko_KR-johap
UTF-8 ko-KR-UTF-8

KS X 1001

ko_KR-johap92