이 장에서는 일본어, 인도어, 태국어에 대한 지역화 관련 정보를 제공합니다. 이 장의 단원은 다음과 같습니다.
이 절에서는 일본어 로켈 관련 정보를 설명합니다.
서로 다른 문자 코드화를 지원하는 네 가지 일본어 로켈을 현재 Solaris 환경에서 이용할 수 있습니다. ja와 ja_JP.eucJP 로켈은 일본어 EUC를 바탕으로 합니다. ja_JP.eucJP 로켈은 UI-OSF Japanese Environment Implementation Agreement 버전 1.1을, ja 로켈은 이전 Solaris 릴리스의 전통적인 사양을 준수합니다. ja_JP.PCK 로켈은 PC-간지 코드(Shift_JIS)를 바탕으로 하며, ja_JP.UTF-8은 UTF-8을 바탕으로 합니다.
일본어 EUC와 문자 세트를 보여주는 맵은 eucJP(5) 설명서 페이지를 참조하십시오. PC-간지 코드와 문자 세트를 보여주는 맵은 PCK(5) 설명서 페이지를 참조하십시오.
JIS X 0201–1976
JIS X 0208–1990
JIS X 0212–1990
JIS X 0213–2000 (유니코드 4.0에서 정의된 문자만 해당)
JIS X 0212–1990은 ja_JP.PCK 로켈에서 지원되지 않습니다. JIS X 0213–2000은 ja_JP.UTF-8 로켈에서만 지원됩니다. JIS X 0213–2000에서 정의된 모든 문자를 사용할 수 있는 것은 아닙니다. 유니코드 4.0 문자 세트에 정의된 문자만 사용 가능합니다.
판매자 정의 문자(VDC) 및 사용자 정의 문자(UDC)도 지원됩니다. VDC는 JIS X 0208–1990 또는 JIS X 0212–1990의 미사용(예약된) 코드 지점을 점유합니다. UDC는 VDC에 대하여 할당된 코드 포인트를 제외하고 VDC와 동일한 코드 지점을 점유합니다.
세 가지 일본어 글꼴 형식(bitmap, TrueType 및 Type1. 일본어 Type1 글꼴은 인쇄용 JIS X 0212만을 포함합니다. Type1 글꼴은 UDC에 의해서도 사용됩니다.
일본어 비트맵 글꼴은 다음 표에서 설명합니다.
표 4–1 일본어 비트맵 글꼴
전체 패밀리 이름 |
하위 패밀리 |
형식 |
판매업체 |
코드화 |
---|---|---|---|---|
sun gothic |
R, B |
PCF(12,14,16,20,24) |
|
JIS X 0208–1983, JIS X 0201–1976 |
sun minchou |
R |
PCF(12,14,16,20,24) |
|
JIS X 0208–1983, JIS X 0201–1976 |
ricoh hg gothic b |
R |
PCF(10,12,14,16,18,20,24) |
RICOH |
JIS X 0208–1983, JIS X 0201–1976 |
ricoh hg mincho l |
R |
PCF(10,12,14,16,18,20,24) |
RICOH |
JIS X 0208–1983, JIS X 0201–1976 |
ricoh gothic |
R |
PCF(10,12,14,16,18,20,24) |
RICOH |
JIS X 0212–1990, JIS X 0213–2000 |
ricoh mincho |
R |
PCF(10,12,14,16,18,20,24) |
RICOH |
JIS X 0212–1990, JIS X 0213–2000 |
ricoh heiseimin |
R |
PCF(12,14,16,18,20,24) |
RICOH |
JIS X 0212–1990 |
일본어 트루 타입 글꼴은 다음 표에서 설명합니다.
표 4–2 일본어 트루 타입 글꼴
전체 패밀리 이름 |
하위 패밀리 |
형식 |
판매업체 |
코드화 |
---|---|---|---|---|
ricoh hg gothic b |
고정 |
트루 타입 |
RICOH |
JIS X 0208–1983, JIS X 0201–1976 |
ricoh hg mincho l |
고정 |
트루 타입 |
RICOH |
JIS X 0208–.1983, JIS X 0201–1976 |
ricoh hg gothicb sun |
고정, 비례 |
트루 타입 |
RICOH |
JIS X 0201–176, JIS X 0208–1983, JIS X 0213–2000 |
ricoh hg minchol sun |
고정, 비례 |
트루 타입 |
RICOH |
JIS X 0201–1976, JIS X 0208–1983, JIS X 0213–2000 |
ricoh heiseimin |
고정 |
트루 타입 |
RICOH |
JIS X 0212–1990 |
ATOK12는 현재 Solaris 환경의 기본 일본어 입력 시스템입니다. ATOK12는 일본어 로켈이 설치되어 있으면 모든 일본어 로켈과 UTF-8 로켈용으로 사용할 수 있습니다. Wnn6 일본어 입력 시스템도 모든 일본어 로켈에서 사용할 수 있습니다. 데스크탑 메뉴에서 입력 시스템을 전환할 수 있습니다. kkcv 일본어 입력 시스템은 일본어 Solaris 1.x BCP 지원용으로 사용할 수 있습니다.
다음 절차는 ATOK12 입력 방법으로 일본어 텍스트를 입력하는 방법에 대해 설명합니다.
Control-스페이스바를 눌러 입력 변환을 설정하십시오.
변환하려는 텍스트에 대하여 가나 문자를 입력하십시오.
예를 들어, 간지 henkan 대신 가나를 입력할 수 있습니다
스페이스바를 눌러 가나 철자에 대신 사용 가능한 간지 변환 후보를 표시하십시오.
선택하려는 변환 후보의 번호를 입력하십시오.
Return을 눌러 간지에 대한 완전한 가나 철자를 실행하십시오.
또는 아래쪽 화살표를 눌러 선택한 문자만 실행하십시오 .
스페이스바를 눌러 입력 변환을 해제하십시오.
문자 기반 단말기(TTY)에서 일본어 로켈을 사용하려면 라인 편집이 올바로 작동되도록 단말기를 설정해 사용해야 합니다.
단말기가 CDE 단말기 에뮬레이터인 경우에는 (dtterm ) 일본어 로켈(ja, ja_JP.PCK 또는 ja_JP.UTF-8)에서 인자 -defeucw 와 함께 stty(1)를 사용하십시오. 예를 들어, ja 로켈에서 다음을 입력합니다.
% setenv LANG ja % stty defeucw
단말기가 CDE 단말기 에뮬레이터가 아니지만 터미널의 코드 세트가 현재 로켈의 코드 세트와 동일하다면 인자 -defeucw와 함께 stty(1)를 사용하십시오.
단말기의 코드 세트가 현재 로켈의 코드 세트와 같지 않다면 setterm(1)을 사용해 코드 변환을 활성화시킵니다. 예를 들어, ja 로켈에 있지만 단말기가 PCK (Shift_JIS code)를 필요로 하면 다음과 같이 입력합니다:
% setenv LANG ja % setterm -x PCK
자세한 내용은 setterm(3CURSES) 설명서 페이지를 참조하십시오.
여러 일본어 코드 세트 변환이 iconv(1) 및 iconv(3)와 함께 지원됩니다. 자세한 내용은 iconv_ja(5) 설명서 페이지를 참조하십시오.
사용자 정의 문자 유틸리티인 sdtudctool은 윤곽선 글꼴(Type1)과 비트맵 글꼴(PCF)을 모두 처리합니다. fontedit, type3creator 및 fontmanager와 같은 일부 유틸리티를 사용해 이전 릴리스의 구식 유틸리티로 작성된 UDC 글꼴을 이전할 수도 있습니다.
다음 구성 요소는 일본어 Languages CD가 있는 전체 로켈 환경에서만 사용할 수 있습니다:
번역된 메시지, 도움말 및 설명서 페이지
Wnn6 일본어 입력 시스템
일본어 Solaris 1.x BCP 지원
Mincho (min*) 서체 비트맵 글꼴
JIS X 0212 Type1 인쇄용 글꼴
일본어 지향 단순 프린터 및 postprint 지원
Kanji(1)와 같은 레거시 일본어 유틸리티
입력 방법(Shabdalipi)과 연속 음성 입력 방법을 바탕으로 하는 음성 조회는 UTF-8 로켈에서 지원되는 모든 인도어 언어에 대하여 사용 가능합니다. 입력 방법과 가상 키보드를 사용하여 모든 CDE 응용 프로그램에서 인도어 텍스트를 입력할 수 있습니다.
다음 데이터 흐름은 인도어 입력 프로세스의 작동을 예시합니다.
입력 상태 영역을 눌러 입력 방법 선택 메뉴를 표시하십시오.
메뉴에서 입력 방법을 선택하십시오.
또는, F6 키를 눌러 사용 가능한 입력 방법 중에서 선택할 수 있습니다.
작성-hi 키 시퀀스를 입력하여 이전에 사용한 입력 방법을 선택할 수도 있습니다.
F5 키를 눌러 사용하려는 인도어 스크립트를 선택하십시오.
키보드 기반(인도어 INSCRIPT 키보드) 입력 방법의 경우 인도어 키보드에 표시된 키보드 이미지를 사용하십시오.
음성 조회 기반 입력 방법의 경우 대상 스크립트의 문자에 해당하는 첫번째 영어 음성 대응 문자를 입력하십시오.
조회 창에 표시된 선택 목록 중에서 선택하십시오.
연속 음성 입력 방법의 경우에는 영어 음성 해당자를 입력하십시오.
대상 스크립트의 해당하는 문자는 사전 편집으로 표시되고 이후 입력으로 인해 사전 편집 텍스트가 모호해질 경우 또는 명백한 실행에 의해 실행됩니다. 연속 음성 입력 방법의 경우 대상 스크립트의 영어 토큰과 UTF-8 코드 지점의 매핑 예는 연속 음성 기반 입력 방법에 대한 매핑을 참조하십시오.
Control-스페이스바를 눌러 영어/유럽어 입력 모드로 전환하십시오.
또는, 상태 영역을 눌러 입력 모드 선택 창에서 영어/유럽어 입력 모드를 선택하십시오.
다음 그림은 인도어 입력 방법용으로 사용 가능한 키보드 레이아웃을 보여줍니다.
다음 그림은 Bengali 키보드의 레이아웃을 보여줍니다.
다음 그림은 Devanagari 키보드의 레이아웃을 보여줍니다.
다음 그림은 Gujarati 키보드의 레이아웃을 보여줍니다.
다음 그림은 Gurmukhi 키보드의 레이아웃을 보여줍니다.
다음 그림은 Kannada 키보드의 레이아웃을 보여줍니다.
다음 그림은 Malayalam 키보드의 레이아웃을 보여줍니다.
다음 그림은 Tamil 키보드의 레이아웃을 보여줍니다.
다음 그림은 Teluga 키보드의 레이아웃을 보여줍니다.
연속 음성 기반 입력 방법에 대한 매핑의 이미지는 영어 토큰과 지원되는 각 대상 스크립트의 해당하는 코드 지점 사이의 매핑을 보여줍니다. 자음 범주는 영어 토큰과 스크립트의 자음 사이에 매핑이 이루어진다는 뜻입니다. 모음 범주는 영어 토큰과 스크립트의 모음 사이에 매핑이 이루어진다는 뜻입니다. 기타 범주는 자음과 모음의 특성을 나타내지 않는 문자의 매핑을 포함합니다(주변 문자에 따라 형태가 변하지 않음).
키워드 자음, 모음 및 기타는 이들 문자가 유니코드 표준의 일부라는 의미도 됩니다. 특수 자음, 특수 모음 또는 특수 기타 부분은 원칙적으로 이들 문자가 자음, 모음 또는 기타의 특성을 표시한다고 해도 그것들이 공식적으로 유니코드 표준의 부분이 아니고 글꼴 종속적임을 뜻합니다. 그러한 문자에는 유니코드 개인 사용자 영역의 코드 지점 값이 할당됩니다. 해당 문자들은 Solaris UTF-8 로켈에서 지원되고 다른 플랫폼에서는 매핑이 작동하지 않습니다.
이러한 맵 파일은 시스템의 맵 파일과 동일하지 않지만 이 논의의 맥락에서 불필요한 키워드를 제거하기 위해 약간 편집된 파일입니다.
모음과 특수 모음 부분에서는 독립 형태와 종속 형태가 문맥에 따라 동일한 영어 토큰에 대하여 표시됩니다. 연속 음성 입력 방법이 작동하는 방법을 참조하십시오.
malayalam 스크립트는 실제로는 특수 기타 범주인 특수 ’CHILLU’ 부분을 포함합니다.
다음 그림은 대상 인도어 스크립트의 음성 해당 문자와 영어의 기존 매핑을 보여줍니다. 사용하는 스크립트의 모든 매핑을 알 때까지 이 예를 참조로 사용하십시오. 여기서 제공된 매핑은 직관적이므로 예를 찾지 않고 대부분의 문자를 입력할 수 있습니다.
이 매핑에서 매핑의 일부로 포함된 ’,’ 및 ’|’와 같은 특수 문자는 ’\’ 문자로 제어됩니다. 제어되지 않을 경우 ’|’ 문자는 하나 이상의 토큰이 동일한 UTF-8 문자를 나타낼 때 구분자로 작용합니다.
그림 4–1, 그림 4–2 및 그림 4–3은 자음, 모음 및 기타에 대한 영어 대 Bengali 매핑을 보여줍니다.
그림 4–4, 그림 4–5 및 그림 4–6은 자음, 모음 및 기타에 대한 영어 대 Gujarati 매핑을 보여줍니다.
그림 4–7, 그림 4–8 및 그림 4–9 은 자음, 모음 및 기타에 대한 영어 대 Gurmukhi 매핑을 보여줍니다.
그림 4–10, 그림 4–11 및 그림 4–12은 자음, 모음 및 기타에 대한 영어 대 힌두어 매핑을 보여줍니다.
그림 4–13, 그림 4–14 및 그림 4–15은 자음, 모음 및 기타에 대한 영어 대 Kannada 매핑을 보여줍니다.
그림 4–16, 그림 4–17 및 그림 4–18은 자음, 모음 및 기타에 대한 영어 대 Malayalam 매핑을 보여줍니다.
그림 4–19 및 그림 4–20는 자음 및 모음에 대한 영어 대 타밀어 매핑을 보여줍니다.
그림 4–21,그림 4–22 및 그림 4–23은 자음, 모음 및 기타에 대한 영어 대 Telugu 매핑을 보여줍니다.
각 인도어 스크립트의 경우 ’virama’ 또는 자음과 결합된 동등한 기호는 자음의 반형태(또는 형태 결합이준비된)를 제공합니다. 자음에 상응하는 여러 키 조합이 입력될 때마다 자음 + virama 형태가 출력되어 문자가 결합될 준비가 되었음을 나타냅니다.
자음은 초기 입력시 반형태를 나타내고 모음이 뒤에 오면 완전한 음절이나 변화형이 됩니다.
두 개의 연속된 자음은 반형태 결합 준비 상태로 남습니다. 반형태는 레이아웃 엔진에 의해 단일 결합 문자로 변환되거나 모든 언어에 대하여 통사적으로도 유효한 독립 형태로 남을 수 있습니다.
단어의 시작을 이루거나 뒤에 또 다른 모음이 오는 모음은 독립 형태로 나타납니다. 자음 바로 뒤에 오는 모음은 종속 형태로 나타납니다.
어떤 컨텍스트에서도 모양이 변하지 않는 문자를 기타라고 합니다. 이런 문자들은 자음도 모음도 아닙니다.
숫자와 문자의 일부를 이루지 않는 기타 구두점은 일대일로 매핑됩니다.
이러한 원칙을 사용하여 입력을 이러한 여러 범주로 구문 분석하고 언어 특정 유니코드 코드 지점으로 출력하는 구문 분석기가 작성됩니다. 연속 음성 입력 방법 엔진은 시스템의 다른 모듈에 의한 레이아웃이나 렌더링을 처리하지 않습니다.
현재 Solaris 환경은 세 가지 태국어 입력 레벨과 네 가지 태국어 키보드 레이아웃을 지원합니다.
다음 태국어 입력 방법은 이 릴리스에서 지원됩니다. 이러한 입력 방법은 문자 시퀀스 검사용 태국어 IT 표준에서 지정되었습니다.
통과 레벨, 입력 검사 하지 않음.
기본 입력 검사 레벨.
엄격한 입력 검사 레벨.
시퀀스 검사가 없는 통과 레벨은 이전 Solaris 릴리스에서와 같이 이 릴리스에서 기본값입니다.
F2 기능 키를 사용하여 한 입력 레벨에서 다음 입력 레벨로 전환할 수 있습니다.
네 가지 다른 키보드 레이아웃이 태국어 입력 방법에 대하여 지원됩니다.
Kedmanee (TIS820-2531) 키보드 레이아웃. Kedmanee 레이아웃은 컴퓨터 키보드가 아닌 타이프라이터용으로 설계되었습니다. 타이프라이터 키보드의 키 수가 제한되었다는 것은 일부 태국어 특수 문자는 이 레이아웃에서 사용할 수 없다는 뜻입니다. TIS820-2531은 컴퓨터 키보드와 함께 사용하기 위해 Kedmanee 레이아웃을 채택했습니다.
TIS820-2538 키보드 레이아웃. 이 향상된 Kedmanee 레이아웃은 원래 Kedmanee 레이아웃에서 사용할 수 없었던 일부 태국어 특수 문자를 포함하는 TIS820-2531 레이아웃의 업데이트 버전입니다. 현재, TIS820-2538은 태국 산업 표준 협회에서 발행한 유일한 태국어 키보드 레이아웃 표준입니다.
Pattajoti 키보드 레이아웃. Pattajoti 레이아웃도 타이프라이터용으로 설계되었지만 손가락 하중 배분이 더 우수합니다.
구성 가능한 키보드 레이아웃. 태국어 입력 방법용 사용자 정의 키보드 레이아웃.
태국어 입력 방법 보조 창은 다음 기능과 유틸리티를 지원합니다.
입력 레벨 전환. 보조 팔레트의 입력 레벨 버튼을 눌러 통과, 기본 또는 엄격한 입력 레벨 중에서 선택할 수 있습니다.
태국어 가상 키보드키보드 버튼을 눌러 태국어 문자를 입력하는 데 사용하는 태국어 가상 키보드를 표시할 수 있습니다.