한국어 Solaris 사용 설명서

용어집

ANSI

ANSI(American National Standards Institute). ANSI는 서로 다른 컴퓨팅 언어에 대한 표준 정의를 제안합니다. ANSI C X3J11 위원회가 만든 가장 최근의 C 언어 표준에는 4바이트 문자를 처리하는 새로운 데이터 유형인 wchar_t뿐만 아니라 국제적으로 사용하기 위해 멀티바이트 문자로 계산하는 라이브러리 기능도 포함되어 있습니다. 이 표준은 확정된 것이 아니므로 “제안된 ANSI C 표준 ” 또는ANSI C-X3J11이라고 부릅니다.

ASCII

정보 교환에 관한 미국 표준 코드. 영어 대문자, 소문자, 구두점, 숫자 및 제어 코드를 포함한 7비트 코드입니다. 각 바이트의 8번째 비트는 기우 검사, 통신과 메시지 전달 프로토콜, 데이터 결합, 또는 다른 목적을 위한 다양한 응용프로그램에서 사용됩니다. 다중 코드 세트나 멀티바이트 문자 또는 이들을 처리하는 유틸리티를 사용할 때는 이 비트를 국제화된 응용프로그램에서 사용할 수 없습니다.

범주

한국어 Solaris 설명서 세트에서 범주는 지역화와 관련됩니다. 범주는 국가 언어 표현과 문화적 규약의 한 부분입니다. 예를 들어 미국의 경우 날짜는 월, 일, 으로 표시되지만 다른 국가에서는 , , 로 표시될 수 있습니다. 날짜와 시간은 지역 언어의 한 범주로 생각할 수도 있습니다. 범주는 프로그램 범주, 범주와 관련된 환경 변수 및 각 범주의 ANSI 지역화 표를 의미하기도 합니다.

문자 세트

문자 세트는 조직, 제어, 또는 데이터의 표현을 위해 사용한 일련의 구성 요소 세트로 정의됩니다. 문자 세트는 알파벳, 표의 문자, 또는 다른 단위로 구성되기도 합니다. 이것은 다소 개방적인 것으로 보일 수도 있지만 문자 세트가 다른 문자 세트로 구성될 수도 있어 경계가 모호해질 수도 있습니다. 예를 들어, KS C 5601 문자 세트는 한글 음절(자음과 모음 조합), 한자 표의 문자(중국어 문자), 영어, 그리스어, 러시아어 및 일본어 문자 세트를 비롯한 다른 많은 문자들로 구성되어 있습니다.

코드 세트

코드 세트는 입력된 문자 세트라고도 합니다. 문자 세트와 그 문자 세트의 해당 비트 표시의 일대일 관계를 설정하는 일련의 규칙입니다. 예를 들어, 구두점과 숫자를 포함하는 영어 문자 세트는 각 문자와 비트 코드가 일대일 대응되는 방식으로 ANCII 코드 세트에 연결될 수 있습니다.

조합 코드

팩 코드 또는 조합 코드의 다른 이름은 아래의 설명과 같습니다.

완성형 코드

완성형이라고도 부릅니다. 완성형 코드는 한국어 문자 세트의 미리 정의된 세트로 미리 선택된 한글, 한자, 특수 기호, 다른 언어의 철자 등을 2바이트 코딩 공간으로 매핑합니다. 이러한 표기 방법은 KS C 5601에 정의되었으며 한국어 Solaris 운영 체제에서는 EUC 코드 세트 1로 사용됩니다.

EUC

확장된 UNIX 코드. ISO-2022에서 모델링된 네 가지 코드 세트를 설명합니다. 각 코드 세트에는 KS C 5601의 한글 및 한자 문자 세트와 같이 서로 다른 문자 세트를 하나 이상 포함할 수 있습니다. 네 가지 코드 세트는 코드 세트 0, 1, 2, 및 3으로 참조되며, 여기에서는 때로 cs0, cs1, cs2 및 cs3으로 간단히 표시합니다. 다른 국제화 과정에서는 g0, g1, g2 및 g3으로 표시하는 경우도 있습니다. 또한 코드 세트 0은 기본 코드 세트라고 하며, 코드 세트 1, 2 및 3은 보완 코드 세트라고 합니다. EUC 코드의 한국어 및 중국어 구현의 경우 기본 코드 세트(cs0)에 ASCII가 포함되며 가장 높은 비트는 0으로 시작됩니다.

한글

한글은 한국에서 통용되는 표음 문자입니다. 각 문자는 보통 자음-모음 또는 자음-모음-자음의 구어 음절로 구성되어 있습니다. KS C 5601은 표준 계산에서 사용된 2350개의 한글 문자를 정의합니다.

한자

한자 문자는 한국어 표의 문자로 고대 중국에서 기원(단어 자체가 중국어 문자를 의미)했습니다. 한자는 수세기 전에 받아들여져서 중국과 한국에서 다소 다른 의미로 발전했습니다. 그러나 이 문자는 소리를 기반으로하지 않으므로 중국어 및 한국어 한자는 같은 기간 동안 별도의 언어로 진화한 이탈리아어, 프랑스어 및 스페인어와 달리 의미에서 더 밀접한 관계를 유지했습니다. 한국어 산업 표준에서는 KS C 5601 표준에 4888 개의 가장 자주 사용되는 한자를 정의했습니다.

ISO

국제 표준 기구. 많은 전문 단체와 집단으로 구성된 국제 표준 기구로서 국제화 문제에 대해 연구하고 조언을 합니다. ISO 2022는 확장된 UNIX 코드를 제시하고 설명합니다. ISO의 제안사항에는 유럽의 8 비트 코드와 국제화를 위한 통신 프로토콜도 있습니다.

조합 코드

조합 코드는 팩형 코드(조합형 코드라고도 함)로서 KS C 5601-1992 문서에 정의되어 있습니다. KS C 5601-1987에서 지정된 조합형 코드와는 달리, 이 조합형 코드에는 한자와 특수 문자 세트가 있습니다.

KSC

한국어 산업 표준 코드 세트. 이는 ASCII에 대응되는 한국어입니다. KSC는 한국어 환경에서의 컴퓨팅 표준을 기술합니다. KS C 5601은 한글과 한자, 그래픽과 구두점 문자, 두 개의 일본어 표음 문자(히라가나와 가타카나), 제어 코드 및 일부 서구 알파벳(로마, 러시아 및 그리스 문자) 등에 대한 완성형 코드 및 코드 지정을 포함합니다. 이 표준은 2350개의 한글 문자, 4888개의 한자 문자 및 986개의 추가 문자(구두점, 외국어 알파벳, 숫자, 그래픽 등)를 정의합니다. 각각의 문자는 2바이트이고, 각 바이트의 최상위 비트는 사용하지 않습니다. 다시 말해, 각 바이트의 하위 7비트를 사용하여 문자를 지정합니다.

로켈

로켈은 언어 또는 문화적 환경을 말합니다. 이 설정은 언어 의존 특성의 표시나 조작에 영향을 줍니다. 한국어 Solaris 소프트웨어에서는 미국용 C, 한국어용 ko, 확장 UNIX 코드 및 한국어 범용 복수 8진 코드 문자 세트 전송 형식(Universal Multiple Octet Coded Character Set Transmission Format)용 ko.UTF-8을 제공합니다.

N 바이트 코드

이 코딩 시스템에서는 각 한국어 철자 자음 또는 모음을 1바이트 코드로 할당합니다. 이 코드들은 한글 자동 조작에 의해 한글 음절 문자로 만들어집니다.

팩형 코드

팩형 코드(조합형 코드)는 2바이트 코드로 한글 음절 문자를 입력하는 체계적 방식입니다. 각 16비트(2바이트) 문자는 상위 비트나 최상위 비트(1) 그리고 세 개의 5비트 필드를 포함합니다. 이들 필드에는 다음과 같이 시작 자음(x), 중간 모음(y) 및 선택의 끝 자음(z)용 코드가 포함됩니다. 1xxxxxyyyyyzzzzz. 한자 문자는 대부분이 하나의 음성 발음으로 표시되기 때문에 팩형 코드로는 표시될 수 없습니다. 팩형 코드는 KS C 5601-1987에서 정의되고 이전의 조합형 코드는 보완 코드 세트로 정의됩니다.

POSIX

컴퓨터 환경의 휴대용 운영 시스템. UNIX 표준화와 국제화를 위한 문서를 작성하는 7개의 위원회로 구성된 IEEE 표준 그룹을 의미합니다. POSIX 문서 1003.1 은 커널과 시스템 호출을 다룹니다. 1003.2는 C 쉘과 표준 라이브러리를 다룹니다. 나머지 5개에서는 실시간 계산, 통신과 네트워크 및 다른 문제를 다룹니다.

UTF-8

한국어 일반 다중 옥텟 코드 문자 세트(UCS) 전송 형식. ko-UTF-8에는 이 표준의 한국어 관련 문자가 제공됩니다. UTF-8은 유니코드의 표시입니다.

유니코드

유니코드 협회가 개발한 국제 문자 세트와 코드화

넓은 문자 코드(WC)

아시아판 Solaris 설명서에서 WC라고 부르는 고정 너비 4바이트의 코드는 새로운 ANSI-C 데이터 유형 wchar_t을 사용하는 EUC 코드의 내부 표시 방법입니다. EUC에서 보완 코드 세트(코드 세트 0은 항상 1바이트)의 크기를 제한하지 않으나 WC에서는 한 문자를 4바이트로 지정합니다. 환경이 주로 ASCII인 경우 4바이트로 표준화하면 필요한 것보다 더 많은 메모리가 사용되지만 문자가 혼합된 문자열의 처리 시간이 빨라집니다. 1000번째 문자는 항상 바이트 4000로 시작(또한 0번째 문자는 바이트 0에서 시작)합니다. 이 코드는 응용프로그램에서의 어떤 유형의 인덱스에서도 사용할 수 있습니다.

X/Open

X/Open은 유럽, 미국 및 아시아의 국제 UNIX 판매자 협회로 시작했습니다. 이는 이제 POSIX 및 ANSI 등의 주요 표준 단체 중 하나이며, X/Open System Interface Portability Guide의 소스입니다.