繁體中文 Solaris 使用者指南

字彙表

ANSI

美國國家標準局 (American National Standards Institute) 的簡稱。ANSI 提出對於不同電子計算機語言的標準定義。對於 C 語言的最新標準, 是由 ANSI C X3J11 委員會所提出的,包含有國際使用的多位元組字元的電子計算機程式庫功能, 如同一個新的 wchar_t 資料類型,用來處理 4 位元組字元。這個標準並不完整,因此又稱為 “proposed ANSI C standard” 或 ANSI C-X3J11。

ASCII

美國標準資訊交換碼(American Standard Code for Information Interchange)的簡稱。ASCII 包含英文大小寫字母、標點、數字與控制碼的 7 位元字碼。不同的應用程式會使用每一個位元組的第 8 個位元來做同位檢查,通信與訊息傳送協定,壓縮資料或其他的目的。欲進行國際化的應用程式不能使用這個位元,而要使用多重字碼集或多位元組字元,以及處理多重字碼集或多位元組字元的公用程式。

BIG5

台灣通用的字碼集。

類別

在繁體中文版 Solaris 文件集中,類別和本土化相關。類別是國家的語言表示及文化慣例的一部份。例如,美國的日期表示是,但另一個國家則是 。日期和時間可視為局部語言的一個類別。類別也意指程式類別,環境變數與類別相關, 而 ANSI 的本土化表格是為了每一個類別而產生的。

字元集

一組用來組織、控制或表示資料的元素。字元集可由英文字母、符號或其它單位組成。字元集可能包含其他字元集,而造成不清楚的界限。例如,CNS 11643 字元集包含了英文、希臘文,以及中文字元集, 此外還包括中文字根及其它字元。

CNS

台灣的中文國家標準 (Chinese National Standard) 簡稱。這個標準相當於台灣的 ASCII 碼。在此文件集中,CNS 參照 CNS 11643 定義的字碼集,其中包含中文字元、語音符號和字根、控制碼、標點符號和西歐字母 (包含羅馬和希臘字元)。每一個字元長度為 2 位元組, 每一個位元組擁有從最高或最大的位元到 0 位元。換句話說,CNS 使用每一個位元組中的低位 7 位元。依據台灣中文字元集的大小,這些字元集分成多重的字碼面,預設的字碼面包含一般使用的字元。ISO 2022 提供從某個程式碼面移位到另一個的機制。

在 1992 年的修訂以後,CNS 11643 定義了 48,000 個字元,畫分了字碼面 1-7,以及未定義的字碼面 8-16,且含括字碼集架構 。字碼面 1 及 2 (一般幾乎很少使用字元) 並沒有受到修訂的影響。在字碼面 14(一個暫時的使用者定義的字碼面)的字元,已標準化成為字碼面 3,其中有些字碼則歸入字碼面 4。

字碼集

一組非常清楚的規則, 建立字元集以及在字元集與其位元表示中每一個字元彼此的關係 。例如,英文字元集包含了標點與數字可對映 ASCII 字碼集,如此一來, 每一個字元只對應一個位元字碼,而沒有一個位元字碼對應一個以上的字元。字碼集也稱為編碼的字元集。

確定

在預先編輯區域內輸入的字元放置於文字區塊內,為應用程式進行組譯。

EUC

擴充的 UNIX 字碼。描述以 ISO-2022 為模型建立的四種字碼集。每種字碼集可以包含一種或多種不同的字碼集,像是 KS C 5601 中的韓文和漢字字碼集。這四種字碼集是表示為字碼集 0、1、2 和 3。在本指南中,這些字碼集有時候簡寫為 cs0、cs1、cs2、和 cs3。其他國際化版本有時稱這些字碼集為 g0、g1、g2 和 g3。字碼集 0 也稱為主字碼集,而字碼集 1、2 和 3 則稱為輔字碼集。在韓文及中文實行的 EUC 字碼,主要字碼集 (cs0) 包含 ASCII 以及在大多數位元中開始於 0 的位元。

EUC-CNS

CNS 11643 的 EUC 表示。對於字碼集 1,這個標準是一般的 CNS 字碼,具有每個位元組中最顯著位元的其中一個。換句話說,EUC-CNS 等同於 CNS 加上 0x8080。例如,CNS 字元 0x212A 會變成 EUC-CNS 字元 0xA1AA。或是在二進制中,00100001 00101010 會變成 10100001 10101010。對於字碼集 2 和 3,字元前面會加上單一移位位元組 SS2 與 SS3 的字首。除此之外,字碼集 2 還需要字碼面位元組。字碼集 2 字元的字碼是 SS2,後面跟著字碼面位元組,再跟著 EUC-CNS。字碼面位元組是新增到 0xA0 的字面編號。例如,字面 2 有字碼面位元組 0xA2。

ISO

國際標準組織 (International Standards Organization) 的簡稱。是由許多專業的協會與公司所組成的 ,它們針對國際性的議題進行研討並提出建議。ISO 2022 提出並詳細解釋了擴充的 UNIX 字碼。其它的 ISO 提出包含歐洲 8 位元字碼, 以及國際化的通信協定。

語言環境

語言環境說明一種語言或文化的環境。它的設定會影響語言相關功能的顯示或處理。繁體中文版 Solaris 軟體提供 C 表示美式英文語言環境,zh_TW 表示繁體中文版擴充 UNIX 字元碼以及 zh_TW.BIG5 表示繁體中文 Big5 語言環境。

POSIX

電腦環境的可攜性作業系統(Portable Operating System for Computer Environments)的簡稱。IEEE 標準組織由 7 個委員會組成,負責建立 UNIX 標準化與國際化的文件。POSIX 文件 1003.1 內容為核心與系統呼叫相關資訊。1003.2 內容為 C shell 及標準程式庫。其它五個文件內容為即時運算、通信與網路以及其它議題。

Unicode

統一字元編碼公會 (Unicode Consortium) 開發的國際字元集與編碼。

寬字元字元碼 (WC)

是一種固定寬度 4 位元的字碼,在亞洲版的 Solaris 文件稱為 WC, 於 EUC 字碼的內部表示以使用新的 ANSI-C 資料類型 wchar_t。雖然 EUC 並不特別指定輔助字碼集 (字碼集 0 永遠為 1 位元) 的大小限制 , WC 會指定一個有 4 位元的字元。如果環境以 ASCII 為主,則標準化 4 位元將花費更多所需的記憶體空間, 但是對於混合字元的字串也會加速處理時間。第 1000 個字元永遠都會開始於位元組 4000 的地方 (而第 0 個字元將始於位元組 0)。這對於在應用程式中提供任何類型的索引非常有用。

X/Open

X/Open 是由來自歐洲、美國,以及亞洲的 UNIX 供應商組成的國際公會組織。它現在與 POSIX 和 ANSI 一樣成為其中一種主要標準組織;是「X/Open System Interface Portability Guide」的提供組織。