プライマリ・コンテンツに移動
Oracle® Big Data Discovery Cloud Service Studioユーザー・ガイド

E65365-05
目次へ
目次
索引へ移動
索引

前
次
機械翻訳について

属性値からの人、場所または組織の名前の抽出

「エンティティ抽出」変換では、個人、事業所または組織の名前を属性で検索します。 結果の属性には、検出されたエンティティの区切りリストが含まれます。 変換でエンティティが検出されない場合、結果の属性は空になります。

例: テキスト : "ニューヨークでは、メトロポリタン・メームが最大の音キューです。 その他の一般的な音楽には、Guggenheim (Frank Lloyd Wrightで設計)とModern ArtのMuseumが含まれています。
  • 「エンティティ抽出」を実行して場所を抽出する場合、生成される値は"New York, Metropolitan Museum of Art, Guggenheim, Museum of Modern Art"のようになります。
  • 「エンティティ抽出」を実行して人々を抽出すると、結果の値はFrank Lloyd Wrightになります。

属性値からエンティティ名を抽出するには:

  1. カタログでプロジェクトを選択します。
  2. 「変換」を選択します。
  3. 抽出するエンティティ情報を含む文字列タイプの属性を見つけて、列を選択します。
  4. 変換メニューから、「詳細」 > 「エンティティの抽出」を選択します。
  5. 抽出するエンティティのタイプ(人、場所または組織)を選択します。 使用可能なエンティティの1つまたはすべてを選択します。
  6. 新しい属性のプレフィクスを指定します。
    Studioでは、<prefix>_person (ユーザー)、<prefix>_location (場所用)および<prefix>_organization (組織用)のサフィクスと値を組み合せた新しい属性を作成します。
  7. 変換の実行結果をプレビューする場合は「プレビュー」をクリックし、変換ステップをスクリプトに保存する場合は「スクリプトに追加」をクリックします。

プロジェクト・データ・セットに変更を加えた場合は、変更をコミットできます。 「プロジェクト・データ・セットに対する変換スクリプトの実行」を参照してください。