국제 언어 환경 설명서

1장 Solaris 국제화 개요

이 절에서는 국제화 및 지역화에 관한 일부 일반 정보에 대해 논의합니다.

Solaris 9 제품에는 선택된 로켈용으로 유니코드 및 ISO/IEC 10646에 규정되어 있는 전체 유니코드 3.1 지원이 포함되어 있습니다. Solaris 9 릴리스는 Sun의 국제 시장을 위한 주요 릴리스입니다. 여기에는 몇 가지 새로운 기능이 포함되어 있습니다.

Solaris 9 운영 환경은 처음부터 세계 각국의 언어를 이용할 수 있도록 설계되었습니다. 국제화에 대해 플러그 가능, 서비스 기반 방식으로 접근함으로써 Solaris 국제화 아키텍처는 전 세계적인 응용프로그램 및 언어 서비스의 개발, 배치 및 관리를 쉽게 해 줍니다. 간편한 단일 다국어 제품을 통해 사용자들은 태국어 및 힌디어를 지원하기 위해 필요한 복잡한 텍스트 레이아웃 환경과 아랍어 및 히브리어와 같은 언어를 위한 양방향 레이아웃 환경을 포함해 39개 언어와 162개 로켈에 대한 폭 넓은 지원의 혜택을 누리게 됩니다.

Solaris 국제화 아키텍처는 입력 방식, 문자 세트 코드화, 코드 세트 변환 및 언어 서비스의 기본적인 측면들을 처리하는 유연하고 플러그 가능한 메소드를 제공합니다. 이미 제공된 강력한 도구들을 사용하거나 자신의 환경을 사용자 정의할 수 있습니다. 입력 방식의 작동 방식이나 활성화해야 할 코드 세트 변환기에 대한 지식이 없어도 간단히 표준 API로 여러 개의 언어 환경에서 응용프로그램을 배치할 수 있습니다. 또한 특정 언어 속성을 사용자 정의할 수도 있습니다. 이 아키텍처는 사용자의 변환기 테이블 변경 또는 새 입력 방식 편집기 추가가 가능합니다.

Solaris X 국제화 프레임워크의 소스 코드는 2000년 가을에 open community에 릴리스되었습니다. 공통 구현 참조 사례에 따라 코드 기반의 진화에 참여함으로써 세계적 응용프로그램의 호환성과 상호 운영성이 개선 가능하게 되었습니다. 특정 코드셋에 의존하지 않는 국제화에 대한 접근 방식은 사용자가 아키텍처 고유의 코드 환경에서 작업하거나, 급성장하고 있는 유니코드의 세계에 참여할 수 있도록 해 줍니다. Solaris 프레임워크는 다양한 코드화 및 플랫폼(예: Microsoft Windows 또는 Macintosh) 간의 상호 운영성의 보장을 위해 설계된 풍부한 데이터 변환기 모음으로 플랫폼에 구애받지 않고 확장할 수 있는 강력한 능력을 제공합니다.

또한 Solaris는 다국적 기업들의 전 세계 서버 관리 확장을 도와줍니다. 경쟁 플랫폼들과 달리 Solaris 플랫폼은 언어 서비스 관리에 서비스 기반 접근 방식을 사용합니다. 서버 관리자들은 클라이언트 시스템에 관계 없이 전세계 네트워크를 통해 언어 서비스를 활성화시킬 수 있습니다. 클라이언트 독립적 접근 방식은 클라이언트 응용프로그램을 변경하지 않아도 시스템을 쉽게 업그레이드 가능하게 합니다. 예를 들어, 파리의 인터넷 카페에서 보내온 전자 우편을 읽어야 하는 아랍어 사용자는 로컬 클라이언트 응용프로그램을 수정하지 않고도 자신의 언어로 해당 전자 우편을 읽을 수 있습니다.

새로운 국제화 및 지역화 기능

다음은 Solaris 9 릴리스의 새로운 기능입니다.

국제화 및 지역화의 개념

국제화와 지역화는 서로 차이가 있습니다. 국제화란 언어나 지역 간에 소프트웨어를 이식 가능한 상태로 만드는 과정인 반면 지역화란 소프트웨어를 특정 언어나 지역에 적응시키는 과정입니다. 국제화된 소프트웨어는, 특정 문화의 요구에 맞도록 프로그램의 동작 방식을 변경시켜주는 인터페이스를 이용해 개발될 수 있습니다. 지역화는 로켈이라 부르는 언어나 지역을 지원하는 온라인 정보를 구축하는 것과 관련됩니다.

모국어 및 사용자가 달라지면 완전히 재작성해야 하는 소프트웨어와 달리 국제화된 소프트웨어는 재작성이 필요없습니다. 국제화된 소프트웨어는 하나의 로켈에서 다른 로켈로 아무런 변경없이 이식할 수 있습니다. Solaris 시스템은 국제화되어 있어 국제화된 소프트웨어를 작성하기 위해 필요한 인프라와 인터페이스를 제공합니다.

국제화 기본 절차

국제화된 응용프로그램의 실행 가능 이미지는 언어와 지역에 따라 이식 가능합니다. 소프트웨어를 국제화하려면 다음을 수행해야 합니다:

메시지 문자열을 언어나 지역에 맞추어 번역합니다. 로켈에는 메시지 스트링과 정렬 방식을 지정하는 메소드가 포함됩니다.

지역화된 버전의 소프트웨어를 사용하려면 사용자가 특정 환경 변수를 설정해야 합니다. 그러면, 제품은 메시지를 그에 해당하는 번역된 형식으로 표시합니다. 날짜, 시간, 통화 및 기타 정보는 로켈별 규약에 따라 포맷 및 표시됩니다. 메시지 번역과 온라인 도움말 컨텐트는 다음 도표에서 설명하는 바와 같이 서로 다른 계층에서 제공됩니다.

그림 1–1 Solaris 운영 환경의 로켈 기능과 구조

Graphic

Solaris 인터페이스의 지역화 기능

OS 로켈 층은 기초 로켈 데이터베이스와, 응용프로그램의 런타임에 OS 시스템 인터페이스에 연결되는 함수들을 제공합니다. 응용프로그램들은 이 OS 로켈 모듈에 표준 API를 통해 액세스합니다.

X11 로켈 계층은 X 입력 방식 및 X 출력 메소드에 인터페이스를 제공해 X11 응용프로그램이 로컬 텍스트를 입력 및 표시할 수 있게 합니다. 응용프로그램이 다양한 언어로 문자를 표시할 수 있게 하는 글꼴이 제공됩니다.

CDE/Motif는 X11 윈도우 시스템을 기반으로 설계되었습니다. 따라서 X11 API를 통해 X11 로켈을 활용할 수 있습니다. Solaris 지역화는 대상 로켈에서 데스크탑이 작동되도록 하기 위해 다양한 로켈별 CDE 응용프로그램 구성을 갖고 있습니다. 메시지 번역과 온라인 도움말 컨텐트는 서로 다른 계층에서 제공됩니다.

로켈이란?

응용프로그램의 핵심 개념은 프로그램 로켈의 개념과 같습니다. 로켈은 모국어 환경의 명시적 모델 및 개념입니다. 로켈의 개념은 ANSI C 언어 표준 라이브러리 정의에 명확히 정의되어 있습니다.

로켈은 국가별로 다른 형식이나 기타 사양을 갖는 여러 개의 범주로 구성됩니다. 프로그램의 로켈은 해당 로켈의 코드 세트, 날짜 및 시간 형식 규약, 통화 규약, 10진수 형식 규약 및 조합(정렬) 순서 등을 정의합니다.

로켈은 기본 언어와 그 언어가 쓰이는 나라(영역)로 이루어지며, 선택적으로 코드 세트가 포함될 수 있습니다. 대개의 경우 코드 세트가 포합됩니다. 예를 들어, 독일어는 de로서 Deutsch의 약어이고 스위스 독일어는 de_CH로서 이 때 CH는 Confederation Helvetica의 약어입니다. 이로 인해 통화 단위 표기법과 같이 국가별로 차이를 둘 수 있습니다.

둘 이상의 로켈을 특정 언어와 연결하여 지리적 차이를 둘 수 있습니다. 예를 들어, 미국에서 영어를 사용하는 사용자는 en_US 로켈(미국 영어)을 선택할 수 있고 영국의 영어 사용자는 en_GB(영국 영어)를 선택할 수 있습니다.

일반적으로 로켈 이름은 LANG 환경 변수에 의해 지정됩니다. 로켈 범주는 LANG에 종속되지만 별도로 설정할 수 있는데, 이 경우 LANG은 무시됩니다. 만약 환경변수 LC_ALL을 어떤 로케일로 설정하면, 그 변수의 값뿐만 아니라 별개의 모든 로켈 범주의 값도 그 값으로 바뀝니다.

로켈 이름 지정 규약은 다음과 같습니다:

language[_territory][. codeset] [@modifier]

두 자의 language 코드는 ISO 639, 두 자의 territory 코드는 ISO 3166의 코드이며, codeset은 로켈에서 사용될 코드 세트 이름이고, modifier는 그 수정자(modifier)가 없는 로켈에 별도로 존재하는 특성의 이름입니다.

모든 Solaris 제품 로켈은 US-ASCII 코드 값과 함께 PCS(Portable Character Set) 문자를 보존합니다.

PCS(Portable Character Set)에 대한 자세한 정보는 “X/Open CAE Specification: System Interface Definitions, Issue 5” (ISBN 1–85912–186–1)을 참조하십시오.

단일 로켈이 하나 이상의 로켈 이름을 가질 수 있습니다. 예를 들어, POSIXC와 동일합니다.

전체 및 부분 로켈

전체 Solaris 로켈은 관련 언어에서 나열된 모든 기능과 지역화된 시스템 메시지를 갖습니다. 부분 로켈은 아무런 메시지도 설치되지 않습니다. Solaris 환경의 모든 로켈들은 관련 언어용 지역화된 메시지가 설치만 되어 있다면 지역화된 메시지를 표시할 수 있습니다. 예를 들어, 다음 로켈은 부분 또는 전체 로켈일 수 있습니다:

Language CD를 사용해 독일어 메시지 번역을 설치하면 위의 모든 로켈이 완전히 번역된 데스크탑에 액세스할 수 있어 전체 로켈이 됩니다. Language CD에는 다음 언어 및 로켈용 메시지 번역이 포함되어 있습니다:

모든 부분 로켈은 소프트웨어 CD에 포함되어 있습니다. 메시지 번역은 Language CD에 포함되어 있습니다.

모든 영어 로켈은 전체 로켈이며 소프트웨어 CD에 포함되어 있습니다.

로켈의 영향을 받는 동작

문화에 따라 날짜 및 시간 기록, 숫자 형식, 단어와 구 구분 및 자료 인용 등을 위한 규약이 달라집니다. 시스템 전체적으로 로켈은 다음 항목의 동작을 결정합니다:

Solaris 환경은 언어와 문화에 따른 정보를 응용프로그램에서 분리하여 응용프로그램 밖에 저장합니다. 이렇게 함으로써 각 시장에 맞추어 응용프로그램을 번역, 재작성 및 재컴파일할 필요성을 제거합니다. 새로운 시장에 진출할 때 필요한 것은 외부 정보를 현지 언어 및 고객에 맞게 지역화하는 것 뿐입니다.

로켈 범주

로켈 범주는 다음과 같습니다:

LC_CTYPE

문자 처리 기능의 동작을 제어합니다.

LC_TIME

달과 요일 이름, 공통된 전체 표현 및 약식 표현을 포함한 날짜와 시간 형식을 지정합니다.

LC_MONETARY

로켈용 통화 기호, 1000 구분자, 기호 위치, 분수 자리수 등을 포함한 통화 형식을 지정합니다.

LC_NUMERIC

10진수 분리자(또는 기수 문자), 1000 단위 구분자 및 그룹화를 지정합니다.

LC_COLLATE

조합 순서 및 로켈용 정규 표현 정의를 지정합니다.

LC_MESSAGES

지역화된 메시지를 표시하는 언어, 로켈의 긍정과 부정 응답(yesno 문자열과 표현)을 지정합니다.

LO_LTYPE

언어 렌더링에 관한 정보를 제공하는 레이아웃 엔진을 지정합니다. 언어 렌더링(또는 텍스트 렌더링)은 텍스트 모양과 방향으로 구성됩니다.

지역화용 로켈 범주 사용

제품의 지역화는 대상 언어나 지역의 원 사용자의 자문을 얻어 수행해야 합니다. 특정 정보 유형과 형식은 개발자에겐 완전히 명백하고 보편적인 것으로 보일 수 있지만 사용자에겐 모호하고 잘못되었거나 심지어 불쾌하게까지 느껴질 수 있습니다. 다음 절에서는 제품을 성공적으로 지역화할 수 있도록 제어 및 지정할 수 있는 Solaris 운영 환경의 요소들을 설명합니다.

시간 형식

다음 표는 개별 로켈이 11:59 P.M.을 쓰는 방식 중 일부를 보여줍니다.

표 1–1 국제 시간 형식

로켈 

형식 

캐나다어 

23:59  

핀란드어 

23.59  

독일어 

23.59 Uhr  

노르웨이어 

23.59  

태국어 

23:59 

영국 

23:59  

시간은 12 시간 시계 및 24 시간 시계로 표현됩니다. 시간 및 분 구분자는 콜론 ( : ) 또는 마침표( . )를 사용할 수 있습니다.

시간대 구분은 국가별로 이루어집니다. 시간대는 협정 세계시인 UTC (또는 그리니치 표준시인 GMT)에서 몇 시간 앞인지, 또는 뒤인지에 따라 설명할 수 있지만 이 숫자는 항상 정수인 것은 아닙니다. 예를 들어, 뉴펀들랜드는 인접 시간대와 30분 차이가 있는 시간대입니다.

일광 절약 시간(DST)은 국가별로 서로 다른 날짜에 시작하거나 끝납니다. 많은 국가들은 아예 DST를 설정하지 않습니다. 아울러 일광 절약 시간은 시간대 안에서도 다를 수 있습니다. 미국에서는 주 정부가 이를 결정합니다.

날짜 형식

다음 표는 전 세계적으로 사용되는 날짜 형식 중 일부를 보여줍니다. 한 국가 안에서도 날짜 형식에 차이가 있을 수 있다는 점에 주목하십시오.

표 1–2 국제 날짜 형식

로켈 

규약 

예 

캐나다(영어) 

dd/mm/yy  

24/08/01 

덴마크어 

yyyy-mm-dd 

2001–08–24 

핀란드어 

dd.mm.yyyy 

24.08.2001 

프랑스어 

dd/mm/yyyy 

24/08/2001 

독일어 

yyyy-mm-dd 

2001–08–24 

이탈리아어 

dd/mm/yy 

24/08/01 

노르웨이어 

dd-mm-yy 

24–08–01 

스페인어 

dd-mm-yy 

24-08-01 

스웨덴어 

yyyy-mm-dd 

2001-08-24 

영국 

dd/mm/yy 

24/08/01  

미국 

mm-dd-yy 

08-24-01 

태국어 

dd/mm/yyyy 

24/08/2001 

숫자

영국과 미국은 소수 자릿수를 마침표를 사용해 표시하는 몇 안 되는 국가들 중 두 국가입니다. 그 밖의 많은 국가들은 마침표 대신 콤마를 사용합니다. 소수 구분 기호는 기수 문자라고도 부릅니다. 마찬가지로 영국과 미국은 콤마를 사용해 1000 단위 그룹을 구분하지만 다른 많은 국가들은 대신 마침표를 사용하고 일부 국가는 1000 단위를 좁은 공백으로 구분합니다.

로켈 지향 형식을 포함한 데이터 파일은 다른 로켈의 시스템으로 전달될 때 잘못 해석되는 경우가 종종 발생합니다. 예를 들어, 프랑스어 형식의 숫자를 포함하고 있는 파일은 영국 프로그램에는 적합하지 않습니다.

다음 표는 흔히 사용되는 숫자 형식 일부를 보여줍니다.

표 1–3 국제 숫자 규약

로켈 

큰 숫자  

캐나다(영어) 

4,294,967.00 

덴마크 

4.294 967.295,00 

핀란드 

4 294 967 295,00 

프랑스어 

4 294 967 295,00 

독일어 

4,294,967.00 

이탈리아어 

4.294.967,00 

노르웨이어 

4.294.967.295,00 

스페인어 

4.294.967.295,00  

스웨덴어 

4 294 967 295,00 

영국 

4,294,967,295.00 

미국 

4,294,967,295.00 

태국어 

4,294,967,295.00 


주 –

목록의 숫자를 구분하는 방법을 지정하는 특별한 로켈 규약은 없습니다.


통화

통화 단위 및 표현 순서는 전 세계적으로 큰 차이가 있습니다. 현지 통화 기호와 국제적으로 통용되는 통화 기호가 서로 다를 수 있습니다. 다음 표는 일부 국가의 통화 형식을 보여줍니다.

표 1–4 국제 통화 규약

로켈 

통화 

예제 

캐나다(영어) 

달러 ($) 

$1,234.56 

캐나다(프랑스어) 

달러 ($) 

1 234,56$ 

덴마크어 

크로네(kr) 

Kr 1.234,56  

핀란드어  

유로(Graphic)

Graphic1 234,56

프랑스어 

유로(Graphic)

Graphic1,234

일본어 

엔(¥) 

¥ 1,234  

노르웨이어 

크로네 (kr) 

kr 1.234,56  

스웨덴어 

크로너 (Kr) 

1 234,56 Kr 

영국 

파운드 (£) 

£1,234.56  

미국 

달러 ($) 

$1,234.56  

태국어 

바트 

2539 바트 

유로 

유로 (Graphic)

Graphic5,000

Solaris 9 소프트웨어는 유로 통화를 지원합니다. 하지만 역 호환성을 위해 현지 통화 기호도 사용할 수 있습니다.

표 1–5 유로 통화를 지원하는 사용자 로켈

지역 

로켈 이름 

ISO 코드 세트 

오스트리아 

de_AT.ISO8859-15

8859-15 

벨기에(프랑스어) 

fr_BE.ISO8859-15

8859-15 

벨기에(플란더즈어) 

nl_BE.ISO8859-15

8859-15 

덴마크 

da_DK.ISO8859-15

8859-15 

핀란드 

fi_FI.ISO8859-15

8859-15 

프랑스 

fr_FR.ISO8859-15

8859-15 

독일 

de_DE.ISO8859-15

8859-15 

아일랜드 

en_IE.ISO8859-15

8859-15 

이탈리아 

it_IT.ISO8859-15

8859-15 

네덜란드 

nl_NL.ISO8859-15

8859-15 

포르투갈 

pt_PT.ISO8859-15

8859-15 

카탈로니아어 스페인 

ca_ES.ISO8859-15

8859–15 

에스토니아 

et_EE.ISO8859–15

8859–15 

스페인 

es_ES.ISO8859-15

8859-15 

스웨덴 

sv_SE.ISO8859-15

8859-15 

영국 

en_GB.ISO8859-15

8859-15 

미국 

en_US.ISO8859-15

8859-15 

유로 로켈은 ISO8859–15 코드 세트를 기본으로 합니다.

변환된 통화량은 원래의 양보다 많거나 적은 공간을 차지할 수 있다는 점에 주의하십시오. 예: $1,000는 Graphic1.307.000이 될 수 있습니다.

현재 유로 사용 지역 내의 로켈용 로켈 설정 상태 예는 로켈 유틸리티의 LC_MONETARY 피연산자에 대한 것입니다. 예를 들어, 독일의 상태는 다음 표에 표시되어 있습니다.

표 1–6 독일어 로켈과 관련 LC_MONETARY

로켈 

LC_MONETARY 

de_DE.ISO8859–1

DM 

de_DE.ISO8859–15

유로 

de_DE.UTF-8

유로 

de_DE.ISO8859–15@euro

유로 

de_DE.UTF-8@euro

유로 

언어 단어 및 글자 차이

이 절에서는 언어간의 중요한 차이점을 설명합니다.

단어 분리자

영어에서 단어는 보통 공백 문자에 의해 구분됩니다. 하지만 중국어, 일본어 및 태국어와 같은 언어에서는 단어 사이에 분리자가 없는 경우가 많습니다.

정렬 순서

특정 문자용 정렬 순서는 언어별로 차이가 있습니다. 예를 들어, 문자 “ö”는 독일에서 보통의 “o”와 같이 분류됩니다. 하지만 스웨덴에서는 별개의 문자로 분류되며 알파벳의 끝 문자에 해당합니다. 일부 언어에서 문자에는 문자 시퀀스의 우선 순위를 결정하기 위해 가중치가 주어집니다. 예를 들어, 태국어 사전은 서로 가중치가 다른 문자들의 순서를 통해 정렬을 규정합니다.

문자 세트

문자 세트는 영문자와 특수 문자에서 서로 다를 수 있습니다. 영문자에는 26개 문자가 포함되지만 일부 언어에는 훨씬 많은 문자가 포함됩니다. 예를 들어, 일본어는 20,000자 이상이 포함될 수 있으며 중국어에는 이보다도 더 많은 문자가 포함될 수 있습니다.

서유럽 문자

대부분의 서유럽 국가들의 문자는 영어를 사용하는 국가들에서 사용되는 표준 26개 문자와 유사하지만 때로는 일부 기본 문자와 기호가 표시된(또는 악센트 부호가 있는) 문자 및 일부 연결 문자가 추가됩니다.

일본어 텍스트

일본어 텍스트는 세 가지 스크립트가 혼합되어 구성됩니다: 한자로부터 발생된 간지 표의 문자 및 두 가지 표음 문자(또는 음절 문자표)인 히라가나와 가타카나.

히라가나의 각 문자는 가타카나에도 상응하는 문자가 있지만 히라가나는 가장 공통된 문자이고 블록체보다는 초서체에 가깝습니다. 간지 문자는 핵심 단어를 쓰는데 사용됩니다. 가타카나는 대개 “외래어”, 다시 말해 일본어 이외의 언어에서 “수입된” 단어를 표현하는데 사용됩니다.

간지는 수 만개의 문자를 갖고 있지만 시간이 지날수록 자주 사용되는 문자 수는 줄어들고 있습니다. 평균적인 일본어 작가들은 대략 2000자의 간지 문자를 사용할 수 있는 어휘력을 갖고 있지만 지금은 약 3500자만이 자주 사용되고 있습니다. 하지만 컴퓨터 시스템은 일본 공업 표준(JIS)이 요구하는 7000자 이상을 지원해야 합니다. 아울러 약 170개의 히라가나와 가타카나 문자가 있습니다. 평균적으로 일본어 텍스트의 55%가 히라가나이며 35%는 간지 그리고 10%가 가타카나입니다. 아라비아 숫자와 로마 문자 역시 일본어 텍스트에 사용됩니다.

간지를 전혀 사용하지 않는 것도 가능하지만 대부분의 일본 독자들은 간지를 전혀 사용하지 않고 작성한 텍스트는 이해하기 힘들어 합니다.

한국어 텍스트

한국어 텍스트는 한글이라 불리는 표음 문자 체계를 사용해 쓸 수 있습니다. 한글은 자모로 알려져 있는 자음과 모음으로 구성된 11,000자 이상의 문자를 갖고 있습니다. 전체 한글 문자 사전 중에서 대략 3000자가 한국어 컴퓨터 시스템에서 일상적으로 사용됩니다. 한국인들은 중국에서 발명된 문자를 바탕으로 한 한자라는 표의 문자도 사용합니다. 한국어 텍스트에는 6,000자 이상의 한자 문자가 필요합니다. 한자는 대개 한글의 의미가 모호할 때 혼동을 방지하기 위해 사용됩니다. 한글 문자는 자음과 모음을 결합하여 형성됩니다. 결합한 뒤에는 한 개의 음절을 구성할 수 있는데 이것이 한글 문자입니다. 한글 문자는 보통 사각형으로 배열되며 이 그룹은 한자 문자와 동일한 공간을 점유합니다. 아라비아 숫자, 로마 문자 및 특수 기호 문자도 한국어 텍스트에 사용됩니다.

태국어 텍스트

태국어 문자는 디스플레이 화면에 네 개의 디스플레이 셀로 구성되는 열 위치로 정의할 수 있습니다. 각 열 위치에 최대 세 개의 문자를 표현할 수 있습니다. 디스플레이 셀의 구성은 태국어 문자의 분류법에 따릅니다. 일부 태국어 문자는 다른 문자의 분류법과 함께 구성될 수 있습니다. 함께 구성할 수 있는 경우에는 두 문자가 동일한 셀에 표시됩니다. 그렇지 않으면 별개의 셀들에 표시됩니다.

중국어 텍스트

중국어는 보통 hanzi라는 표의 문자로만 구성됩니다.

특정 문자가 기본 문자가 아닌 경우에는 대개 두 개 이상의 부분으로 구성되며 이 중 두 자는 매우 자주 쓰이는 문자입니다. 두 부분으로 구성된 문자에서 한 부분은 보통 의미를, 다른 한 부분은 발음을 나타냅니다. 두 부분이 모두 의미를 나타내는 경우도 있습니다. 부수는 가장 중요한 요소이며 문자는 전통적으로 부수별로 정렬되며 수 백개의 부수 문자가 있습니다. 하나의 음은 서로 상호 교환해 사용할 수 없는 여러 개의 서로 다른 문자들로 표현될 수 있습니다. 하나의 문자는 여러 가지 음을 가질 수 있습니다.

일부 문자가 문맥에 따라 다른 문자보다 적합할 수 있습니다—어떤 문자가 적합한지는 성조의 사용에 의해 발음에 따라 구분됩니다. 이와 대조적으로 일본어와 한국어는 성조가 많지 않습니다.

중국어를 표현하는 음성학적 체계가 몇 개 있습니다. 중국에서 가장 흔한 것은 pinyin으로서 로마 문자를 사용하며 Beijing과 같은 장소 이름을 표기하기 위해 서구에서 널리 사용되고 있습니다. Wade-Giles 체계는 이보다 오래된 음성학적 체계로서 과거에 Peking과 같이 장소 이름에 사용되었습니다. 대만에서는 대신 zhuyin (또는 bopomofo)이라는 고유 문자 형태를 갖고 있는 표음 문자가 자주 사용됩니다.

히브리어 텍스트

히브리어 텍스트는 히브리어와 이디시 언어에서 글을 쓰기 위해 사용되며 영어보다 수 천년 앞서 생겼습니다. 히브리어는 글자는 오른쪽에서 왼쪽으로 쓰고 읽고, 숫자는 왼쪽에서 오른쪽으로 읽는다는 점에서 양방향 문자에 속합니다. 히브리어 텍스트에 포함된 모든 영어 텍스트 역시 왼쪽에서 오른쪽으로 읽습니다.

히브리어는 27개 문자를 사용하며 표준 라틴(또는 영어) 문자의 구두점과 숫자를 사용합니다. 히브리어 텍스트에는 또한 모음과 발음 기호가 포함되어 있습니다. 이 기호들은 기본 문자 안의 점(Dagesh), 문자 아래의 모음 기호 또는 문자 상단 왼쪽의 악센트 기호로 표시됩니다. 이 기호들은 보통 예배용 텍스트에서만 사용되며 일상적으로는 거의 사용되지 않습니다. 히브리어에서는 대문자를 사용하지 않습니다.

힌디어 텍스트

힌디어 텍스트는 "신의 기록"이라는 의미를 갖고 있는 Devanagari라 부르는 문자로 작성됩니다. 힌디어는 표음 언어로서 연속적인 음절로 쓰여집니다. 각각의 음절은 다음 세 가지 문자 조각(Devanagari 문자)으로 구성됩니다:자음 문자, 독립 모음 및 종속 모음 기호. 음절 자체는 자음과 기본 모음으로 구성되며 별도이 전치 모음이 있을 수 있습니다. 기준선에서 시작되는 영어와 달리 Devanagari 문자는 문자의 상단에 쓰여 있는 가로선(head stroke)에 매달려 있습니다. 이 문자들은 문맥에 따라 결합하거나 모양을 변경할 수 있습니다. 히브리어와 마찬가지로 힌디어 텍스트는 대소문자 구분을 하지 않습니다.

키보드 차이점

미국 키보드상의 모든 문자가 다른 키보드에 나타나지는 않습니다. 마찬가지로 다른 키보드에는 미국 키보드에서 볼 수 없는 많은 문자들이 포함되곤 합니다.


주 –

SPARCTM 시스템에서는 Compose 키를 사용해 지원되는 ISO8859 문자 세트의 분음 부호를 갖고 있는 라틴 문자를 만들 수 있습니다.

Compose 키는 라틴 기반 로켈과 사용할 수 있지만 UTF-8 로켈을 제외한 한국어, 중국어 또는 일본어 로켈과는 사용할 수 없습니다.

입력은 Solaris 운영 환경에 의해 처리되기 때문에 어떤 로켈의 입력 문자든 임의의 키보드를 사용해 입력할 수 있습니다.


용지 크기의 차이

각 국가별로 일반적으로 사용되는 용지 크기들이 몇 개 있습니다. 일반적으로 이 크기 중 한 가지가 다른 것들보다 훨씬 일반적입니다. 대부분의 국가들은 ISO 표준 216을 준수합니다: “Writing paper and certain classes of printed matter-Trimmed sizes-A and B series.”

국제화된 응용프로그램들은 이용 가능한 페이지 크기에 대해 가정해선 안 됩니다. Solaris 시스템은 출력 페이지 크기 추적을 지원하지 않습니다. 페이지 크기 추적은 응용프로그램의 책임입니다. 다음 표는 공통적인 국제 페이지 크기를 보여줍니다.

표 1–7 공통 국제 페이지 크기

용지 유형 

규격 

국가 

ISO A4 

21.0 cm X 29.7 cm  

미국을 제외한 모든 국가 

ISO A5 

14.8 cm X 21.0 cm  

미국을 제외한 모든 국가 

JIS B4 

25.9 cm X 36.65 cm 

일본  

JIS B5 

18.36 cm X 25.9 cm 

일본  

U.S. Letter  

8.5 인치 X 11 인치 

미국 및 캐나다 

U.S. Legal 

8.5 인치 X 14 인치 

미국 및 캐나다