국제 언어 환경 설명서

코드 변환

Unicode 로켈 지원은 iconv( 1), iconv( 3C)sdtconvtool(1)을 통해 많은 국가의 주요 코드 세트 사이의 다양한 코드 변환을 추가합니다.

Solaris 9 환경에서 유틸리티 geniconvtbl을 사용하여 사용자 정의 코드 변환이 가능합니다. geniconvtbl 유틸리티를 사용하여 작성된 사용자 정의 코드 변환은 iconv(1) 및 iconv(3) 모두와 함께 사용될 수 있습니다. 이 유틸리티에 대한 자세한 내용은geniconvtbl( 1) geniconvtbl( 4) 설명서 페이지를 참조하십시오.

iconv(1), iconv_open (3C) 및 sdtconvtool(1)에 적용할 수 있는 사용 가능한 fromcodetocode 이름이 부록 A의 표에서 표시됩니다. iconv 코드 변환에 대한 자세한 내용은 iconv( 1), iconv_open( 3C), iconv ( 3) , iconv_close( 3C ) geniconvtbl( 1 ) geniconvtbl( 4 ) sdtconvtool(1) 설명서 페이지를 참조하십시오. 사용 가능한 코드 변환에 대한 자세한 내용은 iconv_en_US.UTF-8(5), iconv(5), iconv_ja (5), iconv_ko(5), iconv_zh(5) 및 iconv_zh_TW(5) 설명서 페이지를 참조하십시오. 부록 A도 참조하십시오.


주 –

UCS-2, UCS-4, UTF-16과 UTF-32는, 문자 스트림의 시작이 Unicode 3.1과 ISO/IEC 10646-1:2000에서 정의한 BOM(Byte Order Mark)일 경우, 이 문자를 인식하는 Unicode/ ISO/IEC 10646의 형식입니다. UCS-2BE, UCS-4BE, UTF-16BE, UTF-32BE와 같은 다른 형식은 모두 BOM 문자를 인식하지 않는 고정 너비 Unicode/ISO/IEC 10646 표현 형식이고 또한 빅 엔디언 바이트 순서를 가정합니다. 반면 UCS-2LE, UCS-4LE, UTF-16LE, UTF-32LE 같은 표현 형식은 리틀 엔디언 바이트 정렬을 가정합니다. 또한 BOM 문자를 인식하지 않습니다.

ISO8859–* 및 KO18–*의 관련 스크립트 및 언어에 대해서는 http://czyborra.com/charsets/iso8869.html을 참조하십시오.