この章では、ATOK12 の日本語処理の特長を紹介します。
ATOK12 は、入力された文章の分野を自動的に判断し、文脈情報に基づいて同音語処理を行います。
文脈解析変換をさらに強化し、文章中の指示詞 (「これ」、「それ」、「あれ」、「この」、「その」、「あの」など) と、それらが指し示す言葉との関係を適切に判断して、同音語を正しく識別します。
「それ」が「授業の問題」を指すことを認識し、「解いた」に正しく変換します。
「その」が「大幅な減税」を指すことを認識し、「政策」に正しく変換します。
「あの」が「姫路城」を指すことを認識し、「城」に正しく変換します。
文章の差異による同音語の違いを的確に判断して変換します。
それぞれの文節が文章の中でどのような係り受け関係になっているかを解析し、高い変換効率を実現しています。
「窓を」が「開けておきました」に、「夜が」が「明けるまでに」に係っているのを正しく認識します。
構文意味解析により、判断しづらい文節の区切りも的確に判断します。
「磨いた」と「訪ねた」の動詞の違いにより、文節の区切りを正しく判断しています。
数詞交じりの文章で、前後の関係から助数詞の表記を的確に判断します。
たとえば、次のような数字交じりの文章もより正確に変換できるようになりました。