6つの日本語の漢字の句(「自然言語処理」)が、カンマによって区切られ、2文字ずつの3つのトークンとして索引付けされています。