日本語専用ライブラリは、文字の分類機能を提供します。これらの関数を使用する場合は、/usr/include/jctype.h を取り込んでください。
表 A-4 ワイド文字分類関数
関数 |
機能 |
---|---|
JIS X 0208 で定義される文字を表すワイド文字のとき、真を返す |
|
JIS X 0208 で定義される英語のアルファベット文字を表すワイド文字のとき、真を返す |
|
JIS X 0208、JIS X 0212 で定義されるアルファベットの大文字を表 すワイド文字のとき、真を返す |
|
JIS X 0208、JIS X 0212 で定義されるアルファベットの小文字を表すワイド文字のとき、真を返す |
|
JIS X 0208 で定義される数字を表すワイド文字のとき、真を返す |
|
JIS X 0208 で定義される空白文字を表すワイド文字のとき、真を返す |
|
JIS X 0208、JIS X 0212 で定義される記述記号を表すワイド文字のとき、真を返す |
|
JIS X 0208 で定義される括弧記号を表すワイド文字のとき、真を返す |
|
JIS X 0208 で定義される罫線けい線素片を表すワイド文字のとき、真を返す |
|
JIS X 0208 で定義される単位記号を表すワイド文字のとき、真を返す |
|
JIS X 0208 で定義される学術記号を表すワイド文字のとき、真を返す |
|
JIS X 0208、JIS X 0212 で定義される一般記号を表すワイド文字のとき、真を返す |
|
JIS X 0208、JIS X 0212 で定義される漢字を表すワイド文字のとき、真を返す |
|
JIS X 0208 で定義される特殊文字を表すワイド文字のとき、真を返す |
|
JIS X 0208 で定義されるギリシャ文字を表すワイド文字のとき、真を返す |
|
JIS X 0208 で定義されるロシア文字を表すワイド文字のとき、真を返す |
|
JIS X 0208 で定義されるカタカナ、濁点、半濁点、長音記号、カタカナ繰り返し記号を表すワイド文字のとき、真を返す |
|
JIS X 0208 で定義されるひらがな、濁点、半濁点、長音記号、ひらがな繰り返し記号を表すワイド文字のとき、真を返す |
|
JIS X 0201 で定義されるカタカナ用図形文字に属する文字を表すワイド文字のとき、真を返す |
|
isjhankana() |
isj1bytekana() と同様 |
次に、これらのワイド文字分類関数を使用して、JIS X 0208 の英語のアルファベット文字と数字を、ASCII の英語のアルファベットと数字に変換するプログラムを紹介します。このプログラム例では、getws(3C) 関数で行単位にファイルを読み込んだ後に、isjalpha(3X) と isjdigit(3X) でワイド文字を分類し、jistoa(3X) 関数を使って ASCII に変換しています。
sun% cat example3.c #include <stdio.h> #include <locale.h> #include <jctype.h> main() { wchar_t wbuf[1024]; wchar_t *wptr; setlocale(LC_ALL, ""); while (getws(wbuf) != NULL) { wptr = wbuf; while (*wptr) { if (isjdigit(*wptr) || isjalpha(*wptr)){ printf(%"wc", jistoa(*wptr)); }else { printf(%"wc", *wptr); } *wptr++; } putchar('¥n'); } } sun% cat input_file3 Sun Microsystems 0123456789 sun% cc -o example3 example3.c -lw -ljapanese sun% ./example3 < input_file3 Sun Microsystems 0123456789 sun%