エンティティ抽出とは、テキスト内の名前付きエンティティを識別して抽出する機能です。エンティティは、主に名詞および名詞句です。これらには、名前、場所、時間、コード化された文字列(電話番号や郵便番号など)、割合、金額およびその他多くのものが含まれます。CTX_ENTITY
パッケージは、組込み辞書および英語テキストのルールのセットを使用して、エンティティ抽出を実装します。機能は、ユーザー提供のアドオン辞書およびルール・セットを使用して、英語やその他の言語用に拡張できます。
関連項目:
エンティティ抽出の使用の詳細は、『Oracle Textリファレンス』のCTX_ENTITYパッケージに関する項およびエンティティ抽出ユーザー辞書ローダー(ctxload)に関する項を参照してください。
この項には次の例が含まれます: