繁體中文 Solaris 使用者指南

名詞解釋

ANSI

美國國家標準局 (American National Standards Institute) 的簡稱。ANSI 提出對於不同電子計算機語言的標準定義。對於 C 語言的最新標準, 是由 ANSI C X3J11 委員會所提出的,包含有國際使用的多位元組字元的電子計算機程式庫功能, 如同一個新的 wchar_t 資料類型,用來處理 4 位元組字元。這個標準並不完整,因此又稱為「proposed ANSI C standard」或 ANSI C-X3J11。

ASCII

美國標準資訊交換碼(American Standard Code for Information Interchange)的簡稱。包含英文大小寫字母、標點、數字與控制碼的 7 位元程式碼。不同的應用程式會使用每一個位元組的第 8 個位元來作同位檢查,通信與訊息傳送協定,壓縮資料或其他的目的。 如果要使用多重程式碼集或多位元組字元,與處理多重程式碼集或多位元組字元的公用程式,則想要國際化的應用程式不能利用這個位元。

BIG5

台灣通用的程式碼集。

種類

在繁體中文 Solaris 文件集中,種類和本土化相關。種類是國家的語言表示及文化慣例的一部份。 例如,在美國,日期的表示方式會是 month, day, year; 而另一個國家可能會是 day, month, year。 日期和時間可視為局部語言的一個種類。 種類也意指程式種類,環境變數與種類相關, 而 ANSI 的本土化表格是為了每一個種類而產生的。

字元集

字元集定義為一組用來組織、 控制,或表示資料的元素。字元集可由英文字母、符號或其它單位組成。 這可能會是有些開放的,但是字元集可能包含其它字元集,因此沒有清楚的限制。 例如, CNS 11643 字元集包含了英文、希臘文,以及中文字元集, 此外還包括中文字根及其它字元。

CNS

台灣的中文國家標準 (Chinese National Standard) 的簡稱。相當於台灣的 ASCII 碼。 在本文件集中,它指 CNS 11643 定義的字碼集。 它包含了中文字元、注音符號及字根、控制碼、標點符號, 以及西歐字母(包含羅馬及希臘字元)。每一個字元長度為 2 位元組, 每一個位元組擁有從最高或最大的位元到 0 位元。換句話說,它使用每一個位元組中的低位 7 位元。 依據台灣中文字元集的大小,分成多重的程式碼面,預設的程式碼面包含一般使用的字元。 ISO 2022 提供從某個程式碼面移位到另一個的機制。

在 1992 年的修訂以後, CNS 11643 定義了 48,000 個字元, 畫分了字碼面 1-7, 以及未定義的字碼面 8-16, 且含括程式碼集架構 。 字碼面 1 及 2 (一般幾乎很少使用字元) 並沒有受到修訂的影響。 在字碼面 14(一個暫時的使用者定義的字碼面)的字元, 已標準化成為字碼面 3, 溢位在字碼面 4。

程式碼集

又名編碼字集,是一組非常清楚的規則, 建立字元集以及在字元集與其位元表示中每一個字元彼此的關係 。 例如,英文字元集包含了標點與數字可對映 ASCII 程式碼集,如此一來, 每一個字元只對應一個位元程式碼,而沒有一個位元程式碼對應一個以上的字元。

EUC

擴充的 UNIX 程式碼。即在 ISO-2022 上的 4 個程式碼集模型。 每一個程式碼集包含一個或一個以上不同的字元集,例如在 KS C 5601 中的 Hangul 及 Hanja 字元集。 這 4 個程式碼集為程式碼集 0、1、2,以及 3,此外它們有時縮寫成 cs0、cs1、cs2,以及 cs3。 其它國際化的程式碼集也稱這些為 g0、g1、g2,以及 g3。程式碼集 0 也稱為主要程式碼集, 而程式碼集 1、2,以及 3 則稱為補充程式碼集。 在韓文及中文實行的 EUC 程式碼,主要程式碼集 (cs0) 包含 ASCII 以及在大多數位元中開始於 0 的位元。

EUC-CNS

即 CNS 11643 的 EUC 表示。程式碼集 1 為一般的 CNS 程式碼,其每一個位元組存在一個主要的位元。 也就是說,EUC-CNS 等於 CNS 加上 0x8080。例如,CNS 字元 0x212A 變成 EUC-CNS 字元 0xA1AA。 或者,換成二進位表示時,00100001 00101010 變成 10100001 10101010。 程式碼集 2 和 3,字元前置單一移位的位元組 SS2 和 SS3。此外,程式碼集 2 需要一個程式碼面位元組。 程式碼集-2 字元的程式碼為 SS2 遵循程式碼面位元組亦遵循 EUC-CNS。 程式碼面位元組為字面數字增加為 0xA0; 例如字面 2 為 程式碼面 0xA2。

ISO

國際標準組織 (International Standards Organization) 的簡稱。 是由許多專業的協會與公司所組成的 ,它們針對國際性的議題進行研討並提出建議。 ISO 2022 提出並詳細解釋了擴充的 UNIX 程式碼。其它的 ISO 提出包含歐洲 8 位元程式碼, 以及國際化的通信協定。

語言環境

語言環境說明一種語言或文化的環境。它的設定會影響語言相關功能的顯示或處理。繁體中文 Solaris 軟體提供 C 表示美式英文語言環境,zh_TW 表示繁體中文擴充 UNIX 字元碼、以及 zh_TW.BIG5 表示繁體中文 Big5 語言環境。

POSIX

電腦環境的可攜性作業系統(Portable Operating System for Computer Environments)的簡稱。 IEEE 標準組織由 7 個委員會組成,負責建立 UNIX 標準化與國際化的文件。POSIX 文件 1003.1 內容為核心與系統呼叫相關資訊。 1003.2 內容為 C shell 及標準程式庫。其它五個文件內容為即時運算、通信與網路、以及其它議題。

Unicode

統一字元編碼公會 (Unicode Consortium) 開發的國際字元集與編碼。

寬字元字元碼 (WC)

是一種固定寬度 4 位元的程式碼,在亞洲版的 Solaris 文件稱為 WC, 於 EUC 程式碼的內部表示以使用新的 ANSI-C 資料類型 wchar_t。雖然 EUC 並不特別指定輔助程式碼集 (程式碼集 0 永遠為 1 位元) 的大小限制 , WC 會指定一個有 4 位元的字元。 如果環境以 ASCII 為主, 則標準化 4 位元將花費更多所需的記憶體空間, 但是對於混合字元的字串也會加速處理時間; 第 1000 個字元永遠都會開始於位元組 4000的地方。 ( 而第 0 個字元將始於位元組 0)。這在應用程式中提供任何類型的索引非常有用。

X/Open

X/Open 是由來自歐洲、美國,以及亞洲的 UNIX 供應商組成的國際公會組織。 它現在是主要標準組織(像 POSIX 和 ANSI)中的一個;是 X/Open 系統介面可攜性指南的來源。