本節說明萬用字元與字串輸入輸出、字元分類的函式,以及韓文或中文字元集的轉換函式。亞洲版 Solaris 軟體實作了一個萬用字元程式庫, 以處理符合工業標準之韓文或中文程式碼。
韓文或中文語言專用的常式存放在該語言專用的程式庫,並由相應的 C 編譯程式選項連結。在繁體中文 Solaris 軟體中,libhle 是與 -lhle 連結的。請參閱適當的線上援助頁來取得詳細資訊。
亞洲版 Solaris 軟體將 WC 定義為固定寬度的 4 位元組代碼。WC 使用 ANSI C 資料類型 wchar_t,它在 Solaris 軟體的 wchar.h 中定義如下:
typedef long wchar_h; |
在Solaris 軟體,long 為四個位元組。
您可以使用本節說明的轉換公用程式,不過您應該使用 iconv 當作標準函式。
亞洲版 Solaris 軟體提供各種轉換設備,例如:
字元集中的字元,例如將大寫 ASCII 轉換為小寫。
國家標準字元集之間的不同慣例,例如:
在 Combination 與 Completion 碼之間,含 KS C 5601-1987 與 KS C 5601-1992。
GB 與 EUC 之間。
CNS 11643 碼與 BIG5 之間。
在程式碼格式 (如 EUC 與 WC) 之間。
使用一般多位元組轉換公用程式的程式應該含括標頭檔 widec.h 與 wctype.h。繁體中文 Solaris 常式 (如 ishxxx) 是在 zh_TW/xctype.h 中宣告的。
使用一般多位元組轉換公用程式的程式應該含括三個標頭檔:wctype.h、widec.h 以及 zh_TW/xctype.h。
如前一節的分類函式的說明,這些公共程式的使用可用 setlocale 功能來控制。語言環境專用的常式儲存在語言環境專用的程式庫中。對於繁體中文,該程式庫是 libhle。在編譯時,可使用 C 編譯程式常式選項 -lhle 來連結該程式庫。
多位元組轉換函式和 1 位元組轉換函式 toupper() 及 tolower() 類似。這些函式將萬用字元轉換為其它萬用字元。如需有關轉換常式的更多資訊,請參閱所有語言環境的「wconv(3) 線上說明手冊」與繁體中文的「hconv(3) 線上說明手冊」。
下表中列出的常式位於標準中文 C 程式庫內:
表 A–2 中文 C 程式庫轉換常式
功能 |
描述 |
---|---|
tohupper() |
將字碼集 1 羅馬字母小寫轉換為大寫。 |
tohlower () |
將字碼集 1 羅馬字母大寫轉換為小寫。 |
下表中列出的常式可在 CNS-11643 字元集上執行字元碼轉換。它們可將字元集中的字元轉換為 CNS-11643、EUC 與 Big5 的格式。使用這些常式時,必須用 C 編譯程式常式選項 -lhle 連結程式庫 hle。如需更多資訊,請參閱「hconv(3x) 線上說明手冊」。
表 A–3 基於字元的程式碼轉換常式
功能 |
描述 |
---|---|
cbig5toeuc () |
將 BIG5 字元轉換為 EUC |
ccnstoeuc () |
將 CNS 字元轉換為 EUC |
ceuctobig5 () |
將 EUC 字元轉換為 BIG5 |
ceuctocns () |
將 EUC 字元轉換為 CNS |
表 A–4 基於字元的程式碼轉換常式 (續)
功能 |
描述 |
---|---|
big5toeuc () |
將 BIG5 字串轉換為 EUC。 |
cnstoeuc () |
將 CNS 字串轉換為 EUC。 |
euctobig5 () |
將 EUC 字串轉換為 BIG5。 |
euctocns () |
將 EUC 字串轉換為 CNS。 |