繁體中文 Solaris 使用者指南

詞匯表

ANSI

美國國家標準局 (American National Standards Institute) 的簡稱。ANSI 提出對於不同電子計算機語言的標準定義。對於 C 語言的最新標準, 是由 ANSI C X3J11 委員會所提出的,包含有國際使用的多位元組字元的電子計算機程式庫功能, 如同一個新的 wchar_t 資料類型,用來處理 4 位元組字元。這個標準並不完整,因此又稱為 “proposed ANSI C standard” 或 ANSI C-X3J11。

ASCII

美國標準資訊交換碼(American Standard Code for Information Interchange)的簡稱。包含英文大小寫字母、標點、數字與控制碼的 7 位元字碼。不同的應用程式會使用每一個位元組的第 8 個位元來作同位檢查,通信與訊息傳送協定,壓縮資料或其他的目的。欲進行國際化的應用程式如果要使用多重字碼集或多位元組字元,以及處理多重字碼集或多位元組字元的公用程式,則不能利用這個位元。

BIG5

台灣通用的字碼集。

種類

在繁體中文版 Solaris 文件集中,種類和本土化相關。種類是國家的語言表示及文化慣例的一部份。 例如,在美國,日期的表示方式會是 ; 而另一個國家可能會是 。 日期和時間可視為局部語言的一個種類。 種類也意指程式種類,環境變數與種類相關, 而 ANSI 的本土化表格是為了每一個種類而產生的。

字元集

字元集定義為一組用來組織、 控制,或表示資料的元素。字元集可由英文字母、符號或其它單位組成。 這可能會是有些開放的,但是字元集可能包含其它字元集,因此沒有清楚的限制。 例如,CNS 11643 字元集包含了英文、希臘文,以及中文字元集, 此外還包括中文字根及其它字元。

CNS

台灣的中文國家標準 (Chinese National Standard) 簡稱。相當於台灣的 ASCII 碼。 在本文件集中,它指 CNS 11643 定義的字碼集。 它包含了中文字元、注音符號及字根、控制碼、標點符號, 以及西歐字母(包含羅馬及希臘字元)。每一個字元長度為 2 位元組, 每一個位元組擁有從最高或最大的位元到 0 位元。換句話說,它使用每一個位元組中的低位 7 位元。 依據台灣中文字元集的大小,分成多重的字碼面,預設的字碼面包含一般使用的字元。 ISO 2022 提供從某個字碼面移位到另一個的機制。

在 1992 年的修訂以後,CNS 11643 定義了 48,000 個字元,畫分了字碼面 1-7,以及未定義的字碼面 8-16,且含括字碼集架構 。 字碼面 1 及 2 (一般幾乎很少使用字元) 並沒有受到修訂的影響。 在字碼面 14(一個暫時的使用者定義的字碼面)的字元,已標準化成為字碼面 3,溢位在字碼面 4。

字碼集

又名編碼字集,是一組非常清楚的規則, 建立字元集以及在字元集與其位元表示中每一個字元彼此的關係 。 例如,英文字元集包含了標點與數字可對映 ASCII 字碼集,如此一來, 每一個字元只對應一個位元字碼,而沒有一個位元字碼對應一個以上的字元。

EUC

擴充的 UNIX 字碼。即在 ISO-2022 上的 4 個字碼集模型。 每一個字碼集包含一個或一個以上不同的字元集,例如在 KS C 5601 中的 Hangul 及 Hanja 字元集。 這 4 個字碼集為字碼集 0、1、2,以及 3,此外它們有時縮寫成 cs0、cs1、cs2,以及 cs3。 其它國際化的字碼集也稱這些為 g0、g1、g2,以及 g3。字碼集 0 也稱為主要字碼集, 而字碼集 1、2,以及 3 則稱為補充字碼集。 在韓文及中文實行的 EUC 字碼,主要字碼集 (cs0) 包含 ASCII 以及在大多數位元中開始於 0 的位元。

EUC-CNS

即 CNS 11643 的 EUC 表示。字碼集 1 為一般的 CNS 字碼,其每一個位元組存在一個主要的位元。 也就是說,EUC-CNS 等於 CNS 加上 0x8080。例如,CNS 字元 0x212A 變成 EUC-CNS 字元 0xA1AA。 或者,換成二進位表示時,00100001 00101010 變成 10100001 10101010。 字碼集 2 和 3,字元前置單一移位的位元組 SS2 和 SS3。此外,字碼集 2 需要一個字碼面位元組。 字碼集-2 字元的字碼為 SS2 遵循字碼面位元組亦遵循 EUC-CNS。 字碼面位元組為字面數字增加為 0xA0; 例如字面 2 為 字碼面 0xA2。

ISO

國際標準組織 (International Standards Organization) 的簡稱。 是由許多專業的協會與公司所組成的 ,它們針對國際性的議題進行研討並提出建議。 ISO 2022 提出並詳細解釋了擴充的 UNIX 字碼。其它的 ISO 提出包含歐洲 8 位元字碼, 以及國際化的通信協定。

語言環境

語言環境說明一種語言或文化的環境。它的設定會影響語言相關功能的顯示或處理。繁體中文版 Solaris 軟體提供 C 表示美式英文語言環境,zh_TW 表示繁體中文版擴充 UNIX 字元碼、以及 zh_TW.BIG5 表示繁體中文 Big5 語言環境。

POSIX

電腦環境的可攜性作業系統(Portable Operating System for Computer Environments)的簡稱。 IEEE 標準組織由 7 個委員會組成,負責建立 UNIX 標準化與國際化的文件。POSIX 文件 1003.1 內容為核心與系統呼叫相關資訊。 1003.2 內容為 C shell 及標準程式庫。其它五個文件內容為即時運算、通信與網路、以及其它議題。

Unicode

統一字元編碼公會 (Unicode Consortium) 開發的國際字元集與編碼。

寬字元字元碼 (WC)

是一種固定寬度 4 位元的字碼,在亞洲版的 Solaris 文件稱為 WC, 於 EUC 字碼的內部表示以使用新的 ANSI-C 資料類型 wchar_t。雖然 EUC 並不特別指定輔助字碼集 (字碼集 0 永遠為 1 位元) 的大小限制 , WC 會指定一個有 4 位元的字元。 如果環境以 ASCII 為主,則標準化 4 位元將花費更多所需的記憶體空間, 但是對於混合字元的字串也會加速處理時間; 第 1000 個字元永遠都會開始於位元組 4000的地方。( 而第 0 個字元將始於位元組 0)。這在應用程式中提供任何類型的索引非常有用。

X/Open

X/Open 是由來自歐洲、美國,以及亞洲的 UNIX 供應商組成的國際公會組織。 它現在是主要標準組織(像 POSIX 和 ANSI)中的一個;是 X/Open 系統介面可攜性指南的來源。