여기에서는 한국어 Solaris 운영 체제(Solaris OS)의 기능을 소개합니다.
한국어 Solaris 운영 체제는 Solaris 운영 체제 및 공통 데스크탑 환경(CDE) 창 시스템을 국제화 및 한국어로 지역화한 것입니다.
이 장에서는 한국어 Solaris 운영 체제에서 사용 가능한 새 기능과 언어 지원에 대하여 설명합니다.
한국어 입력기는 SunIM I/F (Sun Internet Intranet Input Method Interface)이 기반하며, 현재 Solaris 릴리스에서 사용가능합니다. 여기에는 새 기능과 많은 개선 내용이 있습니다.
현재 Solaris 한국어 언어 엔진에서는 두 가지 새 키보드 레이아웃을 지원합니다.
3벌식 390
3벌식 최종
다음 작업을 수행할 수 있는 보조 창이 포함됩니다.
입력기 옵션을 변경하여 입력기의 작동을 조정합니다.
가상 키보드에서 문자를 입력합니다.
한 번의 마우스 누름으로 현재 문자 세트에 포함된 모든 기호에 액세스합니다.
온라인 도움말 메뉴를 사용하여 보조 창에 대한 질문의 답을 찾습니다.
다음 작업을 수행할 수 있는 기능을 지원합니다.
개별 문자를 자동으로 실행하는 옵션을 사용 또는 사용 안 하도록 설정합니다.
다양한 옵션을 사용하여 한글에서 한자로 문자와 단어를 변환합니다.
2벌식, 3벌식 390 및 3벌식 최종 등, 다양한 키보드 레이아웃을 선택할 수 있습니다.
반자 및 전자 모드 사이에서 전환할 수 있습니다.
유니코드 3.2 지원. ko_KR.UTF-8 (ko.UTF-8) 로켈이 새 3.2 버전의 유니코드 표준을 지원하도록 업데이트되었습니다. 새 버전에는 추가의 새 문자가 1,016개 소개되었으며 다양한 공식 및 비공식 변경 사항이 포함되었습니다.
유니코드 3.2는 또한 다음의 UTF-8 바이트 시퀀스를 무효로 정의합니다.
첫 바이트의 0xED.
두 번째 바이트의 0xA0에서 0xBF.
이들 시퀀스에서는 U+D800와 U+DFFF 사이의 대리 코드 지점이 제외됩니다. 새 정의를 준수하기 위하여 모든 한국어 UTF-8 iconv 모듈이 새로 정의된 무효 UTF-8 바이트 시퀀스를 감지하도록 기능이 강화되었습니다.
현재 Solaris 릴리스에서 xetops 및 xutops 유틸리티 대신 mp 인쇄 유틸리티가 사용됩니다.
한국어 Solaris 운영 체제에서는 더 이상 xetops 및 xutops 인쇄 유틸리티를 지원하지 않습니다. 이 유틸리티는 원래 한국어 텍스트 파일을 PostScript으로 변환하는 데 사용되었습니다. 변환을 사용하면 상주하는 아시아 글꼴 없이 한국어 문자를 PostScript 프린터로 인쇄할 수 있습니다. xetops 유틸리티가 ko_KR.EUC 로켈에서 사용되었습니다. xutops 유틸리티는 ko_KR.UTF-8 로켈에서 사용되었습니다.
mp 인쇄 유틸리티는 Solaris 9 운영 체제에서 처음 사용되었습니다.
Solaris 운영 체제에서는 내재된 국제화 기능을 모든 지역화된 제품에 구축했습니다. 이 지역화 특성은 로켈 및 그와 관련된 범주를 정의하는 국제화 및 지역화에 대한 ANSI C 권장 사항을 지원합니다.
로켈에는 문화적으로 특정한 언어 정보 및 고유 지역에 대한 규약이 포함되어 있습니다. Solaris 운영 체제의 각 프로세스에는 다음의 로켈 속성 세트가 있습니다.
로켈 설정 - 명령줄에서 프로세스를 시작하기 전에 로켈의 속성을 나열하고 로켈의 속성을 바꿀때 사용하는 locale 및 setlocale.
예를 들어 한국어 로켈과 영어/ASCII 로켈에는 모두 문화적 형식에 따른 시간 및 날짜 표시뿐 아니라 사긴 및 날짜용 실제 한국어 또는 영어/ASCII 문자 표시를 정의하는 카테고리가 있습니다.
KS X 1001 및 KS X 1005-1 문자 세트용 코딩 변환을 지원하는 코드 세트. 이들 코드 세트를 사용하여 파일 이름, 시스템 메시지, 터미널(TTY), 전자 메일 및 데이터 파일 내용에서 한국어를 입력, 표시 및 인쇄할 수 있습니다.
한국어 Solaris 운영 체제용 한국어 입력을 처리하는 htt 입력기 서버. htt 서버는 키보드 입력을 수신하고 이를 한국어 Solaris 응용 프로그램에서 사용되는 한국어 문자로 변환합니다.
1995년 12월 한국어 정부는 ISO 10646-1/유니코드 2.0을 기반으로 한 표준 한국어 코드 세트인 KS X 1005–1을 발표했습니다.
ISO-10646 문자 세트는 두 가지 공통 문자 세트를 사용합니다:
UCS-2. 범용 문자 집합(2바이트 형식)
UCS-4. 범용 문자 집합(4바이트 형식)
IBM PC 기반 운영 체제에서는 ISO-10646 문자 집합을 직접 사용할 수 없습니다. 예를 들어 한국어 Solaris 운영 체제의 커넬 및 기타 많은 모듈은 특정 바이트 값을 문자열의 null 문자(0x00)와 같은 제어 명령으로 해석합니다. ISO-10646 문자 세트는 첫 번째 또는 두 번째 바이트에서 어떤 비트 조합으로든 코드화할 수 있습니다. ISO-10646 문자는 이러한 제한을 갖고 있는 Solaris 시스템에서 자유롭게 전송할 수 없습니다.
이전 경로를 확립하기 위하여 ISO-10646 문자 세트는 C0 제어 (0x00..0x1F), C1 제어 (0x80..0x9F), 공백 (0x20) 및 DEL (0x7F)을 사용하지 않고 ISO-10646 문자를 인코드하는 UCS 변환 형식(UTF)을 정의합니다.
ko_KR.UTF-8 로켈은 KS X 1005–1인 한국어 표준 코드 세트를 지원합니다. 이 로켈은 이전 KS X 1005 코드 세트, 11,172 한국어 문자 모두 및 확장 ASCII 코드 세트를 지원합니다. 범용 UTF/UCS를 사용할 수 있을 때까지 ko_KR.UTF-8 로켈이 한국어 문자 및 글꼴과 관련된 ISO-10646 코드 하위 집합을 지원합니다. ISO-10646 표준에는 세계의 모든 문자가 포함됩니다. 이 릴리스에서 제공되는 입력기와 글꼴을 사용하여 원하는 언어의 문자를 입력, 표시 및 인쇄할 수 있습니다.
ko_KR.EUC 로켈에서 EUC 스키마는 KS X 1001을 인코드하는 데 사용됩니다. ko_KR.UTF-8 로켈은 KS X 1005–1/유니코드 3.2 코드 세트를 지원하며, 이는 KS X 1001의 상위 집합입니다. 이 두 가지 로켈은 사용자가 보기에 동일해 보이지만 내부 문자 인코딩이 다릅니다.
한국어 Solaris 운영 체제에서는 다음 표의 로켈을 동시에 지원합니다. 이 두 로켈은 최종 사용자에게 동일해 보이지만, 내부 문자의 문자 인코딩 방식은 다릅니다.
표 1–1 한국어 로켈
로켈 |
설명 |
---|---|
ko_KR.EUC (ko) |
한국어 EUC (KS X) |
ko_KR.UTF-8 (ko.UTF-8) |
한국어 UTF-8 (Unicode 3.2) |
각 한국어 로켈용으로 지원되는 코드 세트는 다음 표의 목록과 같습니다.
표 1–2 한국어 코드 세트
로켈 |
코드 세트 |
---|---|
ko_KR.EUC (ko) |
KS X 1001 |
ko_KR.UTF-8 (ko.UTF-8) |
KS X 1005–1/유니코드 3.2 |
한국어 Solaris 운영 체제에서는 ISO-10646 표준에서 다루는 모든 문자용 입력기와 글꼴이 제공됩니다. 이들 입력기와 글꼴을 사용하여 원하는 언어의 문자를 입력, 표시 및 인쇄할 수 있습니다.
ko_KR.EUC (ko) 및 ko_KR.UTF-8 (ko.UTF-8) 로켈용으로 사용할 수 있는 한국어 입력기는 다음의 기능을 지원합니다.
한글 2벌식 키보드 지원
한글 3벌식 390 키보드 지원
한글 3벌식 최종 키보드 지원
한글-한자 변환
특수 문자 입력
16진수 코드를 사용한 문자 입력
ko_KR.EUC (ko) 및 ko_KR.UTF-8 (ko.UTF-8) 로켈에서 지원되는 확장 가능한 비트맵 글꼴의 전체 목록은 제 10 장, 글꼴을 참조하십시오.
한글 또는 표준 Sun 키보드를 사용하여 한국어 텍스트를 입력할 수 있습니다.
한국어 Solaris 운영 체제에서 한국어 및 영어 로켈용으로 ANSI C가 정의한 다음의 일반 및 특정 범주를 사용할 수 있습니다.
환경의 로켈 관련 측면을 위한 모든 범주들을 호출하는 일반 LC_ALL 설정.
다음을 포함한 환경의 특정 측면을 위한 구체적인 설정:
LC_CTYPE
LC_TIME
LC_NUMERIC
LC_MONETARY
LC_COLLATE
LC_MESSAGES
예를 들어 한국어 로켈과 영어/ASCII 로켈에는 모두 문화적 형식에 따른 시간 및 날짜 표시뿐 아니라 시간 및 날짜용 실제 한국어 또는 영어/ASCII 문자 표시를 정의하는 LC_TIME 범주가 있습니다.
로켈 수정기를 사용하여 로켈을 구분하는 작업을 수정할 수 있습니다. 로켈 명령의 출력은 다음과 같습니다.
system % locale LANG=ko_KR.EUC LC_CTYPE="ko_KR.EUC" LC_NUMERIC="ko_KR.EUC" LC_TIME="ko_KR.EUC" LC_COLLATE="ko_KR.EUC" LC_MONETARY="ko_KR.EUC" LC_MESSAGES="ko_KR.EUC" LC_ALL=ko_KR.EUC |
system % cat data_file |
data_file을 sort하는 경우 정렬 결과는 다음과 같습니다.
system % sort data_file |
이 경우 텍스트는 현재 로켈인 ko (ko_KR.EUC)에 정의된 대로 각 문자의 코드 점 값에 따라 정렬됩니다. 이 결과가 원하는 결과가 아닐 수 있습니다.
Solaris 운영 체제에서는 로켈 수정기가 제공됩니다. 보이는 것과 같이 현재 로켈을 ko에서 ko_KR.EUC@dict으로 변경하여 sort의 작동을 수정할 수 있습니다.
system % env LANG=ko_KR.EUC@dict sort data_file |