在中華人民共和國 (PRC),大約有 7000 個常用漢字字元使用於 GB2312 (zh 語言環境),超過 20,000 個字元使用於 GBK 字元集 (zh.GBK 語言環境)以及大約 30,000 字元使用於 GB18030-2000 字元集 (zh_CN.GB18030 語言環境),包括 Unicode 3.0 中定義的所有 CJK 擴充 A 字元。
在台灣,最常使用的字元集為 CNS11643-1992 (zh_TW 語言環境) 和 Big5 (zh_TW.BIG5 語言環境)。它們共用大約 13,000 個漢字字元。
在香港,Big5-HKSCS 字元集 (zh_HK.BIG5HK) 是在 Big5 字元集中加入 4702 個字元而成的。
如果字元並不是根字元,則它通常是由兩個或更多部分所組成,兩個為最常見。在兩部分的字元中,其中一個部分是用來表意,而另一個則用來表音。偶爾兩部份同時用來表意。部首為最重要的元素,而字元通常也是以部首來編排,部首的數量約為數百個。單一音調可以藉由許多不同的字元來表示,這些字元在用法上無法互相交換。單一字元可以擁有不同的音調。
部分字元比其他字元更相稱於給定的文意。此相稱字元使用音調來作語音上的區別。相比之下,日文與韓文口語中並沒有音調。
有數種語音系統可用來表示中文。在中華人民共和國最普遍的是拼音,其使用羅馬字元,並廣泛的在西方針對地名使用,例如 Beijing (北京)。威妥系統是較古老的語音系統,從前使用在地名上,像是 Peking。在台灣則是使用注音 (或 ㄅㄆㄇㄈ),這種具有獨特文字形式的語音字母來取代拼音。