JavaScript is required to for searching.
跳过导航链接
退出打印视图
Oracle Solaris 11.1 国际语言环境指南     Oracle Solaris 11.1 Information Library (简体中文)
PDF
为本文档评分
search filter icon
search icon

文档信息

前言

1.  介绍

Oracle Solaris 和全球市场

国际化和本地化概述

什么是语言环境?

C 语言环境

语言环境类别

核心语言环境

受语言环境影响的行为

时间格式

日期格式

数字格式

国际货币格式

语言单词和字母差异

单词分隔符

排序顺序

字符集

西欧字母表

日文文本

韩文文本

泰文文本

中文文本

希伯来文文本

印地文文本

键盘差异

纸张大小的差异

2.  Unicode 和 UTF-8 语言环境支持

3.  使用语言和语言环境

4.  桌面键盘首选项和输入法

5.  配置字体

6.  高级主题

A.  可用语言环境

索引

请告诉我们如何提高我们的文档:
过于简略
不易阅读或难以理解
重要信息缺失
错误的内容
需要翻译的版本
其他
Your rating has been updated
感谢您的反馈!

您的反馈将非常有助于我们提供更好的文档。 您是否愿意参与我们的内容改进并提供进一步的意见?

语言单词和字母差异

本节介绍各种语言之间的重要差异。

单词分隔符

在英文中,单词通常用空格字符分隔。但是,在中文、日文和泰文等语言中,单词之间通常没有分隔符。

排序顺序

特定字符的排序顺序并非在所有语言中都相同。例如,在德国,字符 “ö” 与普通的 “o” 一起排序,而在瑞典则单独进行排序,该字符在瑞典是字母表中的最后一个字母。在某些语言中,字符具有确定字符序列优先级的权值。例如,泰文词典通过权值不同的字符序列来定义排序。

字符集

字符集可能在字母表字符数和特殊字符数方面不同。英文字母表只包含 26 个字符,而某些语言却包含更多字符。例如,日文可以包含 20,000 多个字符,而中文包含的字符可能比这一数据还要多。

西欧字母表

大多数西欧国家/地区的字母表类似于英文国家/地区使用的由 26 个字符组成的标准字母表。这些字母表通常还包含一些附加基本字符、一些带标记(或带重音)的字符和一些连字符。

日文文本

日文文本由三种不同的书写体混合而成:

尽管平假名中的每个字符在片假名中都有一个等效字符,但平假名是最常用的书写体,具有类似草书而不是块状的字母形式。日文汉字字符用于拼写词根。片假名最常用于表示“外来”词,即从日文以外的其他语言中引入的词。

日文汉字包含成千上万个字符,但其中常用字符数正在逐年持续减少。现在经常使用的字符只有 3500 个,而普通日本作家的日文汉字字符的词汇量大约为 2000 个。然而,按照日本工业标准 (Japan Industry Standard, JIS) 的要求,计算机系统必须支持 7000 个以上的字符。此外,还有大约 170 个平假名和片假名字符。平均来讲,日文文本中有 55% 是平假名,35% 是日文汉字,10% 是片假名。日文文本中也包含阿拉伯数字和罗马字母。

尽管可以完全避免使用日文汉字,但大多数日文读者发现不带任何日文汉字的文本很难理解。

韩文文本

韩文文本可使用称为朝鲜语文字的语音书写系统进行拼写。朝鲜语文字包含 11,000 个以上的字符,这些字符由称为“字母”的辅音和元音组成。韩文计算机系统中通常使用的字符大约有 3000 个,这些字符来自整个朝鲜语文字字符词汇。韩文还使用称为朝鲜语汉字的象形字,这些象形字基于中国发明的字符集。韩文文本需要 6000 多个朝鲜语汉字字符。当朝鲜语文字表意不太明确时,常使用朝鲜语汉字来避免混淆。朝鲜语文字字符由组合在一起的辅音和元音构成。两者组合在一起可构成一个音节,即朝鲜语文字字符。朝鲜语文字字符通常排列在一个方框中,以便形成的字符组与朝鲜语汉字字符占用相同的空间。韩文文本中还包含阿拉伯数字、罗马字母和特殊符号字符。

泰文文本

泰文字符可以定义为显示屏上包含四个显示单元的列位置。每个列位置最多可包含三个字符。显示单元的组成基于泰文字符的分类。某些泰文字符可由其他字符的分类组成。如果这两个字符组合在一起,则它们就位于同一单元中。否则,它们将分别位于不同的单元中。

中文文本

中文通常全部由称为汉字的象形书写体中的字符组成。

如果字符不是根字符,则它通常由两个或多个部分组成,而两个部分最为常见。在两部分字符中,一部分通常表示意义,另一部分表示发音。有时两部分都表示意义。偏旁部首是最重要的元素,并且字符传统上是按偏旁部首进行排列的,偏旁部首的数量有几百个。一个发音可用多个不同的字符表示,这些字符是不可交替使用的。一个字符可以有多个发音。

在给定上下文中使用某些字符比使用其他字符更为适合。适当的字符通过使用声调从语音上加以区分。与此相反,日文口语和韩文口语则没有声调。

多个语音系统表示中文。在中华人民共和国,最常用的是拼音(使用罗马字符),它在西方经常用于表示地点,如 Beijing。威托玛式系统是一种比较陈旧的语音系统,曾经用于表示地名(如 Peking)。在中国台湾,经常使用的则是注音(或注音符号),它是一种具有独特字母形式的语音字母表。

希伯来文文本

希伯来文文本用于拼写希伯来文和意第绪文书写体。希伯来文使用双向书写体。希伯来文字母是从右向左进行读写的,而数字则是从左向右读取的。嵌入到希伯来文文本中的所有英文文本也是从左向右读取的。

希伯来文使用 27 个字符的字母表,并使用标准拉丁文(或英文)字母表中的标点符号和数字。希伯来文文本还包含元音和发音标记。这些标记可以通过基本字符内部的点 (dagesh)、字符下的元音标记或字符左上角的重音等形式出现。这些标记通常只用于礼拜式文本中,而很少在日常生活中见到。希伯来文中没有大写字母。

印地文文本

印地文文本用称为天城书的书写体书写。印地文是一种语音语言,并通过一系列音节进行拼写。每个音节都由三种类型的字母片段(天城书字符)构成:辅音字母、独立元音和依赖元音符号。音节本身由辅音和元音核心组成,同时还包含一个可选的前缀辅音。与英文(从基准线开始)不同,天城书字符从写在字符顶部的水平线(称为头笔)悬垂向下书写。这些字符可根据它们的上下文进行组合或更改。同希伯来文一样,印地文文本不区分大小写字母。

键盘差异

美国键盘上的所有字符并非都在其他键盘中出现。同样,其他键盘经常包含许多在美国键盘上看不到的字符。

由于输入由 Oracle Solaris 操作系统 处理,因此可使用任何键盘输入任何语言环境中的字符。

纸张大小的差异

在每个国家/地区中,经常使用几种纸张大小。通常情况下,其中的某个大小要比其他的大小更通用。大多数国家/地区都遵循 ISO 标准 216:“书写纸和某些种类的打印材质-缩减大小-A 和 B 大小系列。”

国际化应用程序不应对可以使用的页大小进行假设。Oracle Solaris 系统不支持对输出页大小进行跟踪。由应用程序负责跟踪输出页大小。下表显示了通用的国际页大小。

表 1-6 通用国际页大小

纸型
尺寸
国家/地区
ISO A4
21.0 厘米 X 29.7 厘米
除美国以外的任何地方
ISO A5
14.8 厘米 X 21.0 厘米
除美国以外的任何地方
JIS B4
25.9 厘米 X 36.65 厘米
日本
JIS B5
18.36 厘米 X 25.9 厘米
日本
美国信函
8.5 英寸 X 11 英寸
美国和加拿大
美国标准
8.5 英寸 X 14 英寸
美国和加拿大