한국어 Solaris 사용 설명서

부분 I 기능 개요

여기에서는 한국어 Solaris 운영 체제(Solaris OS)의 기능을 소개합니다.

1장 기능의 개요

한국어 Solaris 운영 체제는 Solaris 운영 체제 및 공통 데스크탑 환경(CDE) 창 시스템을 국제화 및 한국어로 지역화한 것입니다.

이 장에서는 한국어 Solaris 운영 체제에서 사용 가능한 새 기능과 언어 지원에 대하여 설명합니다.

새로 지역화된 기능들

한국어 입력기는 SunIM I/F (Sun Internet Intranet Input Method Interface)이 기반하며, 현재 Solaris 릴리스에서 사용가능합니다. 여기에는 새 기능과 많은 개선 내용이 있습니다.
- 현재 Solaris 한국어 언어 엔진에서는 두 가지 새 키보드 레이아웃을 지원합니다.
  - 3벌식 390
  - 3벌식 최종
- 다음 작업을 수행할 수 있는 보조 창이 포함됩니다.
  - 입력기 옵션을 변경하여 입력기의 작동을 조정합니다.
  - 가상 키보드에서 문자를 입력합니다.
  - 한 번의 마우스 누름으로 현재 문자 세트에 포함된 모든 기호에 액세스합니다.
  - 온라인 도움말 메뉴를 사용하여 보조 창에 대한 질문의 답을 찾습니다.
- 다음 작업을 수행할 수 있는 기능을 지원합니다.
  - 개별 문자를 자동으로 실행하는 옵션을 사용 또는 사용 안 하도록 설정합니다.
  - 다양한 옵션을 사용하여 한글에서 한자로 문자와 단어를 변환합니다.
  - 2벌식, 3벌식 390 및 3벌식 최종 등, 다양한 키보드 레이아웃을 선택할 수 있습니다.
  - 반자 및 전자 모드 사이에서 전환할 수 있습니다.
유니코드 3.2 지원. ko_KR.UTF-8 (ko.UTF-8) 로켈이 새 3.2 버전의 유니코드 표준을 지원하도록 업데이트되었습니다. 새 버전에는 추가의 새 문자가 1,016개 소개되었으며 다양한 공식 및 비공식 변경 사항이 포함되었습니다.

유니코드 3.2는 또한 다음의 UTF-8 바이트 시퀀스를 무효로 정의합니다.
- 첫 바이트의 0xED.
- 두 번째 바이트의 0xA0에서 0xBF.
  
  이들 시퀀스에서는 U+D800와 U+DFFF 사이의 대리 코드 지점이 제외됩니다. 새 정의를 준수하기 위하여 모든 한국어 UTF-8 iconv 모듈이 새로 정의된 무효 UTF-8 바이트 시퀀스를 감지하도록 기능이 강화되었습니다.
현재 Solaris 릴리스에서 xetops 및 xutops 유틸리티 대신 mp 인쇄 유틸리티가 사용됩니다.

주 –
한국어 Solaris 운영 체제에서는 더 이상 xetops 및 xutops 인쇄 유틸리티를 지원하지 않습니다. 이 유틸리티는 원래 한국어 텍스트 파일을 PostScript으로 변환하는 데 사용되었습니다. 변환을 사용하면 상주하는 아시아 글꼴 없이 한국어 문자를 PostScript 프린터로 인쇄할 수 있습니다. xetops 유틸리티가 ko_KR.EUC 로켈에서 사용되었습니다. xutops 유틸리티는 ko_KR.UTF-8 로켈에서 사용되었습니다.

mp 인쇄 유틸리티는 Solaris 9 운영 체제에서 처음 사용되었습니다.

언어 지원

Solaris 운영 체제에서는 내재된 국제화 기능을 모든 지역화된 제품에 구축했습니다. 이 지역화 특성은 로켈 및 그와 관련된 범주를 정의하는 국제화 및 지역화에 대한 ANSI C 권장 사항을 지원합니다.

로켈 속성

로켈에는 문화적으로 특정한 언어 정보 및 고유 지역에 대한 규약이 포함되어 있습니다. Solaris 운영 체제의 각 프로세스에는 다음의 로켈 속성 세트가 있습니다.

로켈 설정 - 명령줄에서 프로세스를 시작하기 전에 로켈의 속성을 나열하고 로켈의 속성을 바꿀때 사용하는 locale 및 setlocale.

예를 들어 한국어 로켈과 영어/ASCII 로켈에는 모두 문화적 형식에 따른 시간 및 날짜 표시뿐 아니라 사긴 및 날짜용 실제 한국어 또는 영어/ASCII 문자 표시를 정의하는 카테고리가 있습니다.
KS X 1001 및 KS X 1005-1 문자 세트용 코딩 변환을 지원하는 코드 세트. 이들 코드 세트를 사용하여 파일 이름, 시스템 메시지, 터미널(TTY), 전자 메일 및 데이터 파일 내용에서 한국어를 입력, 표시 및 인쇄할 수 있습니다.
한국어 Solaris 운영 체제용 한국어 입력을 처리하는 htt 입력기 서버. htt 서버는 키보드 입력을 수신하고 이를 한국어 Solaris 응용 프로그램에서 사용되는 한국어 문자로 변환합니다.

한국어 로켈

1995년 12월 한국어 정부는 ISO 10646-1/유니코드 2.0을 기반으로 한 표준 한국어 코드 세트인 KS X 1005–1을 발표했습니다.

ISO-10646 문자 세트는 두 가지 공통 문자 세트를 사용합니다:

UCS-2. 범용 문자 집합(2바이트 형식)
UCS-4. 범용 문자 집합(4바이트 형식)

IBM PC 기반 운영 체제에서는 ISO-10646 문자 집합을 직접 사용할 수 없습니다. 예를 들어 한국어 Solaris 운영 체제의 커넬 및 기타 많은 모듈은 특정 바이트 값을 문자열의 null 문자(0x00)와 같은 제어 명령으로 해석합니다. ISO-10646 문자 세트는 첫 번째 또는 두 번째 바이트에서 어떤 비트 조합으로든 코드화할 수 있습니다. ISO-10646 문자는 이러한 제한을 갖고 있는 Solaris 시스템에서 자유롭게 전송할 수 없습니다.

이전 경로를 확립하기 위하여 ISO-10646 문자 세트는 C0 제어 (0x00..0x1F), C1 제어 (0x80..0x9F), 공백 (0x20) 및 DEL (0x7F)을 사용하지 않고 ISO-10646 문자를 인코드하는 UCS 변환 형식(UTF)을 정의합니다.

ko_KR.UTF-8 로켈은 KS X 1005–1인 한국어 표준 코드 세트를 지원합니다. 이 로켈은 이전 KS X 1005 코드 세트, 11,172 한국어 문자 모두 및 확장 ASCII 코드 세트를 지원합니다. 범용 UTF/UCS를 사용할 수 있을 때까지 ko_KR.UTF-8 로켈이 한국어 문자 및 글꼴과 관련된 ISO-10646 코드 하위 집합을 지원합니다. ISO-10646 표준에는 세계의 모든 문자가 포함됩니다. 이 릴리스에서 제공되는 입력기와 글꼴을 사용하여 원하는 언어의 문자를 입력, 표시 및 인쇄할 수 있습니다.

ko_KR.EUC 로켈에서 EUC 스키마는 KS X 1001을 인코드하는 데 사용됩니다. ko_KR.UTF-8 로켈은 KS X 1005–1/유니코드 3.2 코드 세트를 지원하며, 이는 KS X 1001의 상위 집합입니다. 이 두 가지 로켈은 사용자가 보기에 동일해 보이지만 내부 문자 인코딩이 다릅니다.

한국어 Solaris 운영 체제에서는 다음 표의 로켈을 동시에 지원합니다. 이 두 로켈은 최종 사용자에게 동일해 보이지만, 내부 문자의 문자 인코딩 방식은 다릅니다.

표 1–1 한국어 로켈


로켈	설명
`ko_KR.EUC (ko)`	한국어 EUC (KS X)
`ko_KR.UTF-8 (ko.UTF-8)`	한국어 UTF-8 (Unicode 3.2)

한국어 코드 세트

각 한국어 로켈용으로 지원되는 코드 세트는 다음 표의 목록과 같습니다.

표 1–2 한국어 코드 세트


로켈	코드 세트
`ko_KR.EUC (ko)`	KS X 1001
`ko_KR.UTF-8 (ko.UTF-8)`	KS X 1005–1/유니코드 3.2

한국어 입력기 및 글꼴

한국어 Solaris 운영 체제에서는 ISO-10646 표준에서 다루는 모든 문자용 입력기와 글꼴이 제공됩니다. 이들 입력기와 글꼴을 사용하여 원하는 언어의 문자를 입력, 표시 및 인쇄할 수 있습니다.

ko_KR.EUC (ko) 및 ko_KR.UTF-8 (ko.UTF-8) 로켈용으로 사용할 수 있는 한국어 입력기는 다음의 기능을 지원합니다.

한글 2벌식 키보드 지원
한글 3벌식 390 키보드 지원
한글 3벌식 최종 키보드 지원
한글-한자 변환
특수 문자 입력
16진수 코드를 사용한 문자 입력

ko_KR.EUC (ko) 및 ko_KR.UTF-8 (ko.UTF-8) 로켈에서 지원되는 확장 가능한 비트맵 글꼴의 전체 목록은 제 10 장, 글꼴을 참조하십시오.

주 –

한글 또는 표준 Sun 키보드를 사용하여 한국어 텍스트를 입력할 수 있습니다.

로켈 범주

한국어 Solaris 운영 체제에서 한국어 및 영어 로켈용으로 ANSI C가 정의한 다음의 일반 및 특정 범주를 사용할 수 있습니다.

환경의 로켈 관련 측면을 위한 모든 범주들을 호출하는 일반 LC_ALL 설정.
다음을 포함한 환경의 특정 측면을 위한 구체적인 설정:
- LC_CTYPE
- LC_TIME
- LC_NUMERIC
- LC_MONETARY
- LC_COLLATE
- LC_MESSAGES

예를 들어 한국어 로켈과 영어/ASCII 로켈에는 모두 문화적 형식에 따른 시간 및 날짜 표시뿐 아니라 시간 및 날짜용 실제 한국어 또는 영어/ASCII 문자 표시를 정의하는 LC_TIME 범주가 있습니다.

로켈 수정기

로켈 수정기를 사용하여 로켈을 구분하는 작업을 수정할 수 있습니다. 로켈 명령의 출력은 다음과 같습니다.

system % locale
LANG=ko_KR.EUC
LC_CTYPE="ko_KR.EUC"
LC_NUMERIC="ko_KR.EUC"
LC_TIME="ko_KR.EUC"
LC_COLLATE="ko_KR.EUC"
LC_MONETARY="ko_KR.EUC"
LC_MESSAGES="ko_KR.EUC"
LC_ALL=ko_KR.EUC

system % cat data_file

data_file을 sort하는 경우 정렬 결과는 다음과 같습니다.

system % sort data_file

이 경우 텍스트는 현재 로켈인 ko (ko_KR.EUC)에 정의된 대로 각 문자의 코드 점 값에 따라 정렬됩니다. 이 결과가 원하는 결과가 아닐 수 있습니다.

Solaris 운영 체제에서는 로켈 수정기가 제공됩니다. 보이는 것과 같이 현재 로켈을 ko에서 ko_KR.EUC@dict으로 변경하여 sort의 작동을 수정할 수 있습니다.

system % env LANG=ko_KR.EUC@dict sort data_file