한국어 Solaris 사용 설명서

용어 설명

ANSI

미국 표준 규격 협회 ANSI는 다양한 컴퓨터 언어에 대해 표준을 정의합니다. ANSI C X3J11 위원회가 만든 가장 최근의 C 언어 표준에는 4바이트 문자를 처리하는 새로운 데이터 유형인 wchar_t뿐만 아니라 국제적으로 사용하기 위해 멀티바이트 문자로 계산하는 라이브러리 기능도 포함되어 있습니다. 이 표준은 확정된 것이 아니므로 "제안된 ANSI C 표준 " 또는ANSI C-X3J11이라고 부릅니다.

ASCII

ASCII 정보 교환에 관한 미국 표준 코드. 영어 대문자, 소문자, 구두점, 숫자 및 제어 코드를 포함한 7비트 코드입니다. 각 바이트의 8번째 비트는 기우 검사, 통신과 메시지 전달 프로토콜, 데이터 결합, 또는 다른 목적을 위한 다양한 응용프로그램에서 사용됩니다. 다중 코드 세트나 멀티바이트 문자 또는 이들을 처리하는 유틸리티를 사용할 때는 이 비트를 국제화된 응용프로그램에서 사용할 수 없습니다.

범주

한국어 Solaris 문서 세트에서, 범주는 지역화와 관련됩니다. 범주는 국가 언어 표현과 문화적 규약의 한 부분입니다. 예를 들어, 미국에서는 날짜를 주로 월, 일, 연도로 표시합니다. 반면 , , 연도로 표시하는 나라도 있습니다. 날짜와 시간은 지역 언어의 한 범주로 생각할 수도 있습니다. 범주는 프로그램 범주, 범주와 관련된 환경 변수 및 각 범주의 ANSI 지역화 표를 의미하기도 합니다.

문자 세트

문자 세트는 조직, 제어, 또는 데이터의 표현을 위해 사용한 일련의 구성 요소 세트로 정의됩니다. 문자 세트는 알파벳, 표의 문자, 또는 다른 단위로 구성되기도 합니다. 이것은 다소 개방적인 것으로 보일 수도 있지만 문자 세트가 다른 문자 세트로 구성될 수도 있어 경계가 모호해질 수도 있습니다. 예를 들어, KS C 5601 문자 세트는 한글 음절(자음과 모음 조합), 한자 표의 문자(중국어 문자), 영어, 그리스어, 러시아어 및 일본어 문자 세트를 비롯한 다른 많은 문자들로 구성되어 있습니다.

코드 세트

코드 세트는 입력된 문자 세트라고도 합니다. 문자 세트와 그 문자 세트의 해당 비트 표시의 일대일 관계를 설정하는 일련의 규칙입니다. 예를 들어, 구두점과 숫자를 포함하는 영어 문자 세트는 각 문자와 비트 코드가 일대일 대응되는 방식으로 ANCII 코드 세트에 연결될 수 있습니다.

조합 코드

조합형 코드는 아래 설명에서와 같이 팩형 코드 또는 조합형 코드와 동의어입니다.

완성형 코드

완성형이라고도 부릅니다. 완성형 코드는 한국어 문자 코드의 사전 정의된 세트를 말합니다. 이것은 사전 선택된 한글, 한자, 특수 문자, 다른 언어의 알파벳 및 2바이트 코딩 공백으로 연결됩니다. 이 표시는 한국어 Solaris 운영 환경에 의해 KS C 5601에서 정의되고 EUC 코드 세트 1로서 사용됩니다.

EUC

확장된 UNIX 코드. 확장된 UNIX 코드로ISO-2022를 본뜬 4개의 코드 세트를 의미합니다. 각 코드 세트는 KS C 5601의 한글과 한자 문자 세트처럼 하나 이상의 동일한 다른 문자 세트를 포함할 수 있습니다. 4개의 코드 세트는 코드 세트 0, 1, 2 및 3을 의미하며, 이 텍스트에서는 때로 cs0, cs1, cs2 및cs3으로 축약되기도 합니다. 국제적으로는 g0, g1, g2 및 g3이라고도 부릅니다. 코드 세트 0은 주 코드 세트라고 하고, 코드 세트 1, 2 및 3은 보완 코드 세트라고 합니다. EUC 코드의 한국어와 중국어 실행에서 주 코드 세트(cs0)는 ASCII를 포함하고 가장 높은 비트의 0에서 시작합니다.

한글

한글은 한국에서 통용되는 표음 문자입니다. 각 문자는 보통 자음-모음 또는 자음-모음-자음의 구어 음절로 구성되어 있습니다. KS C 5601은 표준 계산에서 사용된 2350개의 한글 문자를 정의합니다.

한자

한자는 한국어 표의 문자로 원래 고대 중국(자체로 중국어 문자를 의미)으로부터 전해진 것입니다. 한자는 수세기 전에 받아들여져서 중국과 한국에서 다소 다른 의미로 발전했습니다. 그러나 표음 문자가 아니기 때문에 이탈리아어, 프랑스어 및 스페인어가 라틴어에서 완전히 다른 언어로 파생한 것에 비해 중국과 한국의 한자는 그 의미상으로는 차이가 그다지 크지 않습니다. 한국 산업 표준에서는 KS C 5601 표준에서 가장 자주 사용하는 4888개의 한자 문자를 지정하고 있습니다.

ISO

국제 표준 기구. 많은 전문 단체와 집단으로 구성된 국제 표준 기구로서 국제화 문제에 대해 연구하고 조언을 합니다. ISO 2022는 확장된 UNIX 코드를 제시하고 설명합니다. ISO의 제안사항에는 유럽의 8 비트 코드와 국제화를 위한 통신 프로토콜도 있습니다.

조합 코드

조합 코드는 팩형 코드(조합형 코드라고도 함)로서 KS C 5601-1992 문서에 정의되어 있습니다. KS C 5601-1987에서 지정된 조합형 코드와는 달리, 이 조합형 코드에는 한자와 특수 문자 세트가 있습니다.

KS C

한국 산업 표준 코드 세트 KS C는 ASCII의 한국어판입니다. KS C는 한국어 환경에서의 계산을 위한 표준을 설명합니다. KS C 5601은 한글과 한자, 그래픽과 구두점 문자, 두 개의 일본어 표음 문자(히라가나와 가타카나), 제어 코드 및 일부 서구 알파벳(로마, 러시아 및 그리스 문자) 등에 대한 완성형 코드 및 코드 지정을 포함합니다. 이 표준은 2350개의 한글 문자, 4888개의 한자 문자 및 986개의 추가 문자(구두점, 외국어 알파벳, 숫자, 그래픽 등)를 정의합니다. 각각의 문자는 2바이트이고, 각 바이트의 최상위 비트는 사용하지 않습니다. 다시 말해, 각 바이트의 하위 7비트를 사용하여 문자를 지정합니다.

로켈

로켈은 언어 또는 문화적 환경을 말합니다. 이 설정은 언어 의존 특성의 표시나 조작에 영향을 줍니다. 한국어 Solaris 소프트웨어는 미국에 C를, 한국어 확장 UNIX 코드에 ko를 그리고 한국어 일반 다중 Octet 코드 문자 세트 전송 형식에 ko.UTF-8을 제공합니다.

N 바이트 코드

단일 바이트 코드는 각각의 바이트가 자음이나 모음을 나타냅니다. 이 코드들은 한글 자동 조작에 의해 한글 음절 문자로 만들어집니다.

팩형 코드

팩형 코드(조합형 코드)는 2바이트 코드로 한글 음절 문자를 입력하는 체계적 방식입니다. 각 16비트(2바이트) 문자는 상위 비트나 최상위 비트(1) 그리고 세 개의 5비트 필드를 포함합니다. 이 필드는 1xxxxxyyyyyzzzzz과 같이 초성(x), 중성(y), 종성(z)을 위한 코드를 포함하고 있습니다. 한자 문자는 대부분이 하나의 음성 발음으로 표시되기 때문에 조합형 코드로는 표시될 수 없습니다. 조합형 코드는 KS C 5601-1987에서 정의되고 이전의 조합형 코드는 보완 코드 세트로 정의됩니다.

POSIX

컴퓨터 환경의 휴대용 운영 시스템 UNIX 표준화와 국제화를 위한 문서를 작성하는 7개의 위원회로 구성된 IEEE 표준 그룹을 의미합니다. POSIX 문서 1003.1 은 커널과 시스템 호출을 다룹니다. 1003.2는 C 쉘과 표준 라이브러리를 다룹니다. 나머지 5개에서는 실시간 계산, 통신과 네트워크 및 다른 문제를 다룹니다.

ko.UTF-8

한국어 일반 다중 옥텟 코드 문자 세트(UCS) 전송 형식. ko-UTF-8은 이 표준에서 한국어 관련 문자를 제공합니다. UTF-8은 유니코드의 표시입니다.

유니코드

유니코드 협회가 개발한 국제 문자 세트와 인코딩

넓은 문자 코드(WC)

아시아판 Solaris 설명서에서 WC라고 부르는 고정 너비 4바이트의 코드는 새로운 ANSI-C 데이터 유형 wchar_t을 사용하는 EUC 코드의 내부 표시 방법입니다. EUC는 보완 코드 세트(코드 세트 0은 항상 1바이트) 크기를 제한하지 않지만, WC는 한 문자를 4바이트로 지정합니다. 4바이트 표준화는 기본적으로 환경이 ASCII일 경우 필요량 이상의 메모리 용량을 갖지만 혼합 문자열 처리 시간을 줄여줍니다. 1000번째 문자는 항상 4000바이트에서 시작합니다(0번째 문자는 0바이트에서 시작합니다). 이 코드는 응용프로그램에서의 어떤 유형의 인덱스에서도 사용할 수 있습니다.

X/Open

X/Open은 유럽, 미국 및 아시아의 국제 UNIX 판매자 협회로 시작했습니다. 현재는 POSIX와 ANSI 같은 중요한 표준 기구 중의 하나이며 X/Open 시스템 인터페이스 이식성 설명서를 제공합니다.