33.2 テキスト・マイニングとOracle Textについて

テキスト・マイニングおよびOracle Textについて理解します。

テキスト・マイニングとは、データ・マイニング手法をテキスト用語(テキストの特徴またはテキスト・トークンとも呼ばれる)に適用するプロセスです。テキスト用語とは、テキスト・ドキュメントから抽出して、量的な重みを割り当てられた単語または単語のグループです。テキスト用語は、操作および分析の対象となるテキストの基本単位です。

Oracle Textとは、用語抽出、単語とテーマの検索およびその他のテキスト問合せ用ユーティリティを提供するデータベース・テクノロジです。トレーニング・データにテキストの列が存在する場合、Oracle Data MiningはOracle Textのユーティリティと用語の重み付け方針を使用して、テキストをマイニング用に変換します。Oracle Data Miningは、ユーザー提供の構成情報をOracle Textに渡し、その結果をモデル作成プロセスで使用します。