중국어는 보통 hanzi라는 표의 문자로만 구성됩니다.
중국(PRC)에는 유니코드 3.0에 정의되어 있는 모든 CJK 확장 A 문자를 포함해 자주 사용되는 대략 7000자의 GB2312 (zh 로켈) hanzi 문자, GBK 문자 세트(zh.GBK 로켈) 20,000개 문자 그리고 GB18030-2000 문자 세트( zh_CN.GB18030 로켈) 약 30,000개 문자가 있습니다.
대만에서 가장 많이 사용되는 문자 세트는 CNS11643-1992 (zh_TW 로켈) 및 Big5(zh_TW.BIG5 로켈)입니다. 이들은 약 13,000자의 hanzi 문자를 공유합니다.
홍콩에서는 4702개 문자가 Big5 문자 세트에 추가된 Big5-HKSCS 문자 세트(zh_HK.BIG5HK)가 사용됩니다.
특정 문자가 기본 문자가 아닌 경우에는 대개 두 개 이상의 부분으로 구성되며 이 중 두 자는 매우 자주 쓰이는 문자입니다. 두 부분으로 구성된 문자에서 한 부분은 보통 의미를, 다른 한 부분은 발음을 나타냅니다. 두 부분이 모두 의미를 나타내는 경우도 있습니다. 부수는 가장 중요한 요소이며 문자는 전통적으로 부수별로 정렬되며 수 백개의 부수 문자가 있습니다. 하나의 음은 서로 상호 교환해 사용할 수 없는 여러 개의 서로 다른 문자들로 표현될 수 있습니다. 하나의 문자는 여러 가지 음을 가질 수 있습니다.
일부 문자가 문맥에 따라 다른 문자보다 적합할 수 있습니다—어떤 문자가 적합한지는 성조의 사용에 의해 발음에 따라 구분됩니다. 이와 대조적으로 일본어와 한국어는 성조가 많지 않습니다.
중국어를 표현하는 음성학적 체계가 몇 개 있습니다. 중국에서 가장 흔한 것은 pinyin으로서 로마 문자를 사용하며 Beijing과 같은 장소 이름을 표기하기 위해 서구에서 널리 사용되고 있습니다. Wade-Giles 체계는 이보다 오래된 음성학적 체계로서 과거에 Peking과 같이 장소 이름에 사용되었습니다. 대만에서는 대신 zhuyin (또는 bopomofo)이라는 고유 문자 형태를 갖고 있는 표음 문자가 자주 사용됩니다.