중국어는 보통 hanzi라는 표의 문자로만 구성됩니다.
중화인민공화국(PRC)에는 유니코드 3.0에 정의된 모든 CJK 확장 A 문자를 포함하여 GB2312(zh 로켈)의 공통적으로 사용되는 Hanzi 문자 7000개와 GBK 문자 세트(zh.GBK 로켈)의 20,000개 이상의 문자와 GB18030-2000 문자 세트(zh_CN.GB18030 로켈)의 약 30,000개 문자가 있습니다.
대만에서 가장 많이 사용되는 문자 세트는 CNS11643-1992 (zh_TW 로켈) 및 Big5(zh_TW.BIG5 로켈)입니다. 이들은 약 13,000자의 Hanzi 문자를 공유합니다.
홍콩에서는 4702개 문자가 Big5 문자 세트에 추가되어 Big5-HKSCS 문자 세트(zh_HK.BIG5HK)가 되었습니다.
특정 문자가 기본 문자가 아닌 경우에는 대개 두 개 이상의 부분으로 구성되며 이 중 두 자는 매우 자주 쓰이는 문자입니다. 두 부분으로 구성된 문자에서 한 부분은 보통 의미를, 다른 한 부분은 발음을 나타냅니다. 두 부분이 모두 의미를 나타내는 경우도 있습니다. 부수는 가장 중요한 요소이며 문자는 전통적으로 부수별로 정렬되며 수 백개의 부수 문자가 있습니다. 하나의 음은 서로 상호 교환해 사용할 수 없는 여러 개의 서로 다른 문자들로 표현될 수 있습니다. 하나의 문자는 여러 가지 음을 가질 수 있습니다.
어떤 문자가 주어진 컨텍스트에서 다른 것보다 더 적합합니다. 적합한 문자는 음조 사용으로 음성적으로 구분됩니다. 이와 대조적으로 일본어와 한국어는 성조가 많지 않습니다.
몇 가지 음성 체계가 중국어를 나타냅니다. 중국에서 가장 흔한 것은 pinyin으로서 로마 문자를 사용하며 Beijing과 같은 장소 이름을 표기하기 위해 서구에서 널리 사용되고 있습니다. Wade-Giles 체계는 이보다 오래된 음성학적 체계로서 과거에 Peking과 같이 장소 이름에 사용되었습니다. 대만에서는 대신 고유한 문자 형식의 음성 알파벳zhuyin (또는 bopomofo)이 사용됩니다.