データをロードしています

ローカル・デバイスのファイル、リモート・データベース、またはディレクトリや共有プロバイダからのクラウド・ストレージ・バケットからデータをロードできます。ロードできるファイル形式は、CSV、XLSX、TSV、TXT、XML、JSON、GEOJSON、AVRO、PARQUET、GZ、GZIP、ZIP、PDF、PNG、JPG、JPEGおよびTIFFです。

データ・ロード・ツールでは、ブール形式のソース・ファイルのロードがサポートされています。ブール・データ型の真理値はTRUEおよびFALSEです。NOT NULL制約がない場合、ブール・データ型では真理値UNKNOWNもNULL値としてサポートされます。ブール・データ型は、Oracle SQL構文でデータ型が出現するたびに使用できます。

また、Oracle Database表内にベクトル埋込みを直接格納できるVECTORデータ型もサポートされています。

次のトピックでは、これらのアクションのインタフェースについて説明します。

Data StudioでのOCI言語サービス機能の使用

センチメント分析、キー・フレーズ抽出、言語検出などのOCI言語サービス機能を利用して、機械学習(ML)や人工知能(AI)の専門知識がなくてもデータを分析できます。

たとえば、製品のフィードバックに使用できます。電話メーカーは、新しい電話モデルを立ち上げ、顧客のセンチメントが製品に何であるかを知りたいと考えています。センチメントの大部分が負の場合、Quality Control(QC)で検出されなかったカメラの潜在的な障害を示す可能性があります。

センチメント分析、キー・フレーズ抽出および言語検出の概要

センチメント分析、キー・フレーズ抽出および言語検出は、現在、ローカル・ファイルからのデータのロードおよびクラウド・ストレージからのデータのロードでサポートされています。

感情分析

センチメント分析では、テキストを分析して、トピックまたは製品に関するセンチメントを定義します。言語サービスのセンチメント分析では、自然言語処理(NLP)を使用します。Data Studioツールは、Oracle Cloud Infrastructure (OCI) Languageサービスを使用して、入力データを分析および理解します。Data Studioツールは、OCI Languageサービスの出力を含む新しい列をデータ・ロードに動的に追加します。ソース・データの任意の列のセンチメントを検出できます。たとえば、アプリケーションのレビューを含む列を検索する場合は、アプリケーションに関する一般的な意見が必要であると想定します。Data Studioツールは、入力データに対してセンチメント分析を実行し、センチメントで構成されるターゲット表に定義された新しい式列を作成します。

詳細は、OCIでのセンチメント分析を参照してください。

キー・フレーズの抽出

キー・フレーズ抽出は、テキストの主な概念を識別します。キーワード抽出は、入力テキストから、最も関連性の高い単語および表現を抽出する自動プロセスです。これは、コンテンツを要約して、主要トピックを認識するのに役立ちます。ワード・クラウドは、主要なフレーズを使用して生成でき、主要な概念をテキスト・コメントまたはフィードバックで視覚化するのに役立ちます。たとえば、ムービー・レビューでは、コメントで識別されたキー・フレーズに基づいてワード・クラウドを生成し、方向性、演技および撮影スタッフについて最も頻繁にコメントしていることがわかります。

詳細は、OCIでのキー・フレーズ抽出を参照してください。

言語の検出

言語検出などのOCI言語サービス機能を使用して、入力テキストの言語を検出できます。テキストがどの自然言語にあるかを返します。それを使用して言語の障壁を克服し、他の国の人々とのコミュニケーションを改善することができます。入力テキストの言語を決定し、コンテンツを異なる言語に翻訳できます。詳細は、OCIでの言語抽出を参照してください。

開始する前に:
  • ローカル・ファイルまたはクラウド・ストレージからのデータのロード:分析するデータを、ローカル・ファイルまたはクラウド・ストレージからOracle Autonomous Databaseにロードします。データがエラーなしでデータ・ロード・カートにロードされていることを確認します。マッピング・エラーは、「クラウド・ストアの場所からのデータのロード」「エラー」クイック・フィルタから表示および修正できます。データ・ロード・ツールにデータをロードした後、
    • データ・ロード・ジョブ・カートの「設定」アイコンをクリックして、設定を確認します。
    • クラウド・ストアの場所からデータをロード・ウィザードの「設定」ペインで、マッピング・エラーがある場合、マッピング・グリッド・セルが赤で強調表示され、修正する必要のある無効な値が示されます。
      mapping-error.pngの説明が続きます

    • 「エラー」クイック・フィルタをクリックすると、エラーのある列のみが表示されます。
      mapping-error-columns.pngの説明が続きます

  • ツールは、データ・ロード・ジョブの設定を指定する際に、センチメント分析、キー・フレーズの抽出および言語検出を実行します。

データを分析するためのパラメータ

「設定」タブから「式の追加」を起動する場合は、パラメータを使用してモデルを構成する必要があります。

表3-3センチメント分析、キー・フェーズ抽出および言語検出のパラメータ

パラメータ 説明
式タイプ

入力テキストに対して実行する操作として、「センチメント分析」、「キー・フレーズ抽出」および「言語検出」のいずれかを選択します。

入力列

分析する列を選択します。

入力列のドロップダウンには、センチメント分析、キー・フレーズ抽出および言語検出がサポートする列のみが含まれます。

センチメント分析の場合、入力ドロップダウンにはVARCHAR2、NVARCHAR2、CLOBまたはNCLOBターゲット列のみが表示されます。

ターゲット列
  • ターゲット表に定義された新しく作成された式列の名前を入力します。
  • センチメント分析の場合、この列には入力列のセンチメントが表示されます。ツールで識別されるセンチメントの種類は次のとおりです。
    • 良い
    • 中立
    • 混合
    • 否定

      ツールが入力列のセンチメントを判別できない場合は、式列にNULLを返します。

  • 「キー・フレーズ抽出」の場合、この列には、選択した入力列のキー・フレーズが表示されます。
  • 言語検出の場合、この列には、選択した入力列の言語が表示されます。

感情分析の実行

入力データのセンチメントを決定するには:

  1. ローカル・ファイルまたはクラウド・ストレージからデータ・ロード・カートにデータをロードした後、カート内のファイルを表示できます。「設定」アイコンをクリックします。
    settings.pngの説明が続きます

  2. 「設定」アイコンをクリックすると、ローカル・ファイルからのデータのロード・ウィザードが開きます。この例では、ローカル・ファイルからデータをロードしています。
  3. ウィザードの「設定」タブで、「マッピング」セクションの「式の追加」をクリックします。
    add-expression.pngの説明が続きます

    これにより、「式の追加」ダイアログ・ボックスが開きます。


    add-sentiment.pngの説明が続きます

  4. 「式の追加」ダイアログで、次のフィールドを指定します:
    • 式タイプ:「式タイプ」ドロップダウンから「センチメント分析」を選択します。
    • 入力列:分析する列をドロップダウンから選択します。例: CONTENT
    • ターゲット列:新しく作成した式列の名前を入力します。たとえば、CONTENT_SENTIMENT。

      詳細は、「データを分析するためのパラメータ」を参照してください。

  5. 「OK」をクリックしますマッピング・グリッドに新しい行が追加されます。この行は、OCI Languageサービスによって生成される出力式列を決定します。
    map-sentiment.pngの説明が続きます

  6. 「閉じる」をクリックします
  7. 「データ・ロード」メニュー・カートの「開始」をクリックして、ローカル・ファイルからデータをロードします。ローカル・ファイルからのロードを開始するかどうかを確認する確認メッセージが表示されます。
  8. 実行」をクリックして確認します。

データ・ロード・ジョブが完了すると、「データ・ロード」ページの「表およびビュー・ロード」に、ツールにロードされるソース表の詳細が表示されます。行と列の数とアップロードが完了した日時が表示されます。

OCIセンチメント分析から生成された出力データ

OCI Language Serviceモデルを使用して列を分析すると、Data Studioによって新しい式列が生成され、更新された表に結果が保存されます。

生成された式列を検索するには、「データベース・アクション起動パッド」から「データ・ロード」にナビゲートします。「表およびビュー・ロード」セクションでロードする表を選択します。

ロード名の横にある3つの垂直ドットをクリックし、「表」をクリックして「表示」を選択します。
view-details.pngの説明が続きます

これにより、データ・ロードの「プレビュー」タブが開き、更新されたソース・ファイルが表示されます。たとえば、Instagramアプリケーションのセンチメント分析からの出力データセットを次に示します。ここで、CONTENTはターゲット列、CONTENT_SENTIMENTは入力列のセンチメント分析です。この列には、正、中性、混合、負などの次のいずれかの値が表示されます。ツールでセンチメントを判別できない場合、Nullが表示されます。
content-analysis.pngの説明が続きます

キー・フレーズ抽出の実行

入力データからキー・フレーズ情報を抽出するには:

  1. ローカル・ファイルまたはクラウド・ストレージからデータ・ロード・カートにデータをロードした後、カート内のファイルを表示できます。「設定」アイコンをクリックします。
    settings.pngの説明が続きます

  2. 「設定」アイコンをクリックすると、ローカル・ファイルからのデータのロード・ウィザードが開きます。この例では、ローカル・ファイルからデータをロードしています。
  3. ウィザードの「設定」タブで、「マッピング」セクションの「式の追加」をクリックします。
    add-expression.pngの説明が続きます

    これにより、「式の追加」ダイアログ・ボックスが開きます。


    add-key.pngの説明が続きます

  4. 「式の追加」ダイアログで、次のフィールドを指定します。
    • 式タイプ:「式タイプ」ドロップダウンから「キー・フレーズ抽出」を選択します。
    • 入力列:分析する列をドロップダウンから選択します。例: CONTENT
    • ターゲット列:新しく作成した式列の名前を入力します。たとえば、CONTENT_KEY_PHRASE_EXTRACTION。

    詳細は、「データを分析するためのパラメータ」を参照してください。

  5. 「OK」をクリックしますマッピング・グリッドに新しい行が追加されます。この行は、OCI Languageサービスによって生成される出力式列を決定します。
    map-key.pngの説明が続きます

  6. 「閉じる」をクリックします
  7. 「データ・ロード」メニュー・カートの「開始」をクリックして、ローカル・ファイルからデータをロードします。ローカル・ファイルからのロードを開始するかどうかを確認する確認メッセージが表示されます。
  8. 実行」をクリックして確認します。

データ・ロード・ジョブが完了すると、「データ・ロード」ページの「表およびビュー・ロード」に、ツールにロードされるソース表の詳細が表示されます。行と列の数とアップロードが完了した日時が表示されます。

OCIキー・フレーズ抽出から生成された出力データ

OCI Language Serviceモデルを使用して列を分析すると、Data Studioによって新しい式列が生成され、更新された表に結果が保存されます。

生成された式列を検索するには、「データベース・アクション起動パッド」から「データ・ロード」にナビゲートします。「表およびビュー・ロード」セクションでロードする表を選択します。

ロード名の横にある3つの垂直ドットをクリックし、「表」をクリックして、「表示」を選択します。
view-details.pngの説明が続きます

たとえば、Instagramアプリケーションのセンチメント分析からの出力データセットを次に示します。ここで、CONTENTはターゲット列で、CONTENT_KEY_PHRASE_EXTRACTION列には入力列から抽出されたキー・フレーズが表示されます。
key-output.pngの説明が続きます

言語検出の実行

Data Studioでは、複数の言語の検出がサポートされています。

入力テキストの言語を決定するには:
  1. クラウド・ストレージからデータ・ロード・カートにデータをロードした後、カート内のファイルを表示できます。「設定」アイコンをクリックします。
    settings-icon-language.bmpの説明が続きます

  2. 「設定」アイコンをクリックすると、クラウド・ストアの場所からのデータのロード・ウィザードが開きます。
  3. ウィザードの「設定」タブで、「マッピング」セクションの「式の追加」をクリックします。
    settings-language.bmpの説明が続きます

    これにより、「式の追加」ダイアログ・ボックスが開きます。「AI式」を選択します。
    add-expn-lang.bmpの説明が続きます

  4. 「式の追加」ダイアログで、次のフィールドを指定します。
    • 式タイプ:「式タイプ」ドロップダウンから「言語検出」を選択します。
    • 入力列:分析する列をドロップダウンから選択します。この場合、「レビュー」列の言語を検出する必要があります。例: REVIEW
    • ターゲット列:新しく作成した式列の名前を入力します。たとえば、REVIEW_LANGUAGE_DETECTION。

    詳細は、「データを分析するためのパラメータ」を参照してください。

  5. 「OK」をクリックしますマッピング・グリッドに新しい行が追加されます。この行は、OCI Languageサービスによって生成される出力式列を決定します。
    new-column-language.bmpの説明が続きます

  6. 「閉じる」をクリックします
  7. 「データ・ロード」メニュー・カートの「開始」をクリックして、ローカル・ファイルからデータをロードします。ローカル・ファイルからのロードを開始するかどうかを確認する確認メッセージが表示されます。
  8. 実行」をクリックして確認します。

データ・ロード・ジョブが完了すると、「データ・ロード」ページの「表およびビュー・ロード」に、ツールにロードされるソース表の詳細が表示されます。行と列の数とアップロードが完了した日時が表示されます。

OCI言語検出から生成された出力データ

OCI Language Serviceモデルを使用して列を分析すると、Data Studioによって新しい式列が生成され、更新された表に結果が保存されます。

生成された式列を検索するには、「データベース・アクション起動パッド」から「データ・ロード」にナビゲートします。「表およびビュー・ロード」セクションでロードする表を選択します。

ロード名の横にある3つの垂直ドットをクリックし、「表」をクリックして、「詳細の表示」を選択します。


view-details-language.bmpの説明が続きます

たとえば、「レビュー」列の言語検出からの出力データセットを次に示します。ここで、REVIEWはターゲット列で、REVIEW_LANGUAGE_DETECTION列には入力列から検出された言語が表示されます。
output-language.bmpの説明が続きます

OCI Document Understandingを使用したイメージからの表の抽出

表抽出などのOracle Cloud Infrastructure(OCI) Document Understandingの機能を使用すると、ロードしたデータから表を検出できます。

この機能を使用するためにサポートされているファイル形式は、PDF、JPEG、JPG、PNGおよびタグ・イメージ・ファイル形式(TIFF)です。

たとえば、PDF文書が採用日や給与を含むすべての従業員詳細で構成されている場合、文書の理解によって表が識別され、表構造が抽出されます。セルの行と列の関係を維持しながら、表のコンテンツを抽出します。

このセクションでは、次のトピックについて説明します。

表抽出の概要

データのロード・ツールは、ローカル・ファイルからデータをロードし、クラウド・ストレージからデータをロードする際に、表抽出をサポートします。

表抽出

OCI Document Understandingサービスにより、お客様はディープ・ラーニング・モデルを活用した非構造化ドキュメントのインサイトを発見できます。テキスト、表を抽出し、他の優れた機能の中でドキュメント・タイプを識別できます。表抽出では、ドキュメント内のすべての表が識別され、行/列の関係を維持した状態でコンテンツが表形式で抽出されます。

ノート

このサービスは、ソース・データの英語でのみ使用できます。

詳細は、表抽出を参照してください。

イメージからの表抽出の実行

サンプルPDFでテーブル抽出を実行します。

次のPDFに表が表示されます。


image1-pdf.pngの説明が続きます

クラウド・ストレージの場所にあるPDFから表を抽出するには:
  1. PDFファイルをクラウド・ストレージから「データ・ロード」カートにロードします。ファイルをナビゲータからカートにドラッグ・アンド・ドロップできます。


    drag-image.pngの説明が続きます

  2. 「開始」をクリックしてデータをロードします。データのロードを開始するかどうかを確認する通知を受信します。「実行」をクリックして続行します。


    drag-image.pngの説明が続きます

  3. ロードが完了したら、「データ・ロード」ダッシュボードの「表」および「ロードの表示」でロードされたファイルを表示できます。


    table-image-load.pngの説明が続きます

  4. 自律型データベースにロードしたPDFから表を抽出します。
    • ブレッドクラムで「データベース・アクション」をクリックします。
    • 「開発」「SQL」の順に選択します。
    • オブジェクト・ドロップダウンから、左側のナビゲータで「表」を選択します。使用可能な表のリストから、EMP_ALL表をワークシートにドラッグ・アンド・ドロップします。


      emp-all.pngの説明が続きます

      使用可能な挿入のタイプを示すダイアログが表示されます。


      select.pngの説明が続きます

      「選択」をクリックして、「適用」をクリックします。

    • 「実行」(ワークシートの上部にある矢印アイコン)をクリックします。抽出された表が「問合せ結果」タブに表示されます。


      run-image.pngの説明が続きます

データ・ロードでのGeoJSONの使用

GeoJSONオブジェクトは、特定のジオメトリに関する情報(ポイント、線、ポリゴンなど)とオプションのメタデータ(IDなど)を格納します。

GeoJSONファイルの拡張子は*.geojsonです。GeoJSONデータは、Data Studioのデータ・ロードを使用してAutonomous Databaseにロードできます。表にGeoJSONデータが含まれている場合、データは、SQLデータ型SDO_GEOMETRYのドキュメント・セットからGeoJSONデータを投影する列にロードされます。

GeoJSONデータを含む表のロード

GeoJSONデータを使用してData Studioで表をロードし、その設定を確認すると、GeoJSONデータの列geometryを持つ表Brazil_Geoが作成されることがわかります。


settings-geo.pngの説明が続きます

BRAZIL_GEOをロードすると、ツールによってGeoJSONオブジェクトがデータ型SDO_GEOMETRYの新しい列geometryにロードされることがわかります。
edittable-geo.pngの説明が続きます

表ロードの実行後に表ロードの「詳細の表示」を実行するときに、「データ定義」タブで同じものを表示することもできます。
datadefinition-geo.pngの説明が続きます

GeoJSON列の空間式の追加

Oracle Spatialは、ロケーション対応アプリケーションおよび地理情報システム(GIS)・アプリケーションのユーザーが、空間データを簡単かつ自然に管理できるように設計されています。

空間データがOracleデータベースに格納されると、データベースに格納されている他のすべてのデータと容易に操作、取得および関連付けることができます。

Oracle Spatialの空間データ・モデルは、要素、ジオメトリおよびレイヤーで構成される階層型の構造体です。レイヤーはジオメトリで構成され、ジオメトリは要素で構成されます。

許容差は、空間データに精度レベルを関連付けるために使用します。許容差は、2つの点が離れていても(たとえば、丸め誤差の調整のために)同じとみなされる距離を反映します。許容値は0より大きい正の数である必要があります。詳細は、空間データの許容範囲を参照してください。

空間データ分析のパラメータ

「式の追加」を起動し、「式の追加」ウィザードから「空間式」を選択する場合は、パラメータを使用してモデルを構成する必要があります。

表3-4空間データ分析のパラメータ

パラメータ 説明
式タイプ
「長さ」「面積」など、次のいずれかの空間属性を選択します。
  • 長さ: この属性を選択すると、2次元ポリゴンの境界がGEOMETRY_LENGTH型のターゲット列とともにマッピング表に返され、格納されます。
  • 領域: この属性を選択すると、2次元ポリゴンの領域が、GEOMETRY_AREA型のターゲット列とともにマッピング表に戻され、格納されます。
入力列

空間データについて分析する列を選択してください:

デフォルトでは、SDO_GEOMETRY列値にマップされたソースのGEOMETRY列が表示されます。これは、表が空間的に有効になっていることも意味します。

ターゲット列
これは、空間式の結果を格納するターゲット表で定義された新しく作成された式列であり、選択した式タイプ値によって異なります:
  • GEOMETRY_LENGTH: 式タイプとして「長さ」を選択した場合は、ジオメトリの長さの値を表示するGEOMETRY_LENGTH型のターゲット列を表示できます。
  • GEOMETRY_AREA: 「式」タイプとして「領域」を選択した場合は、ジオメトリの領域値を表示するGEOMETRY_AREAタイプのターゲット列を表示できます。

空間分析の実行

ローカル・ファイルまたはクラウド・ストレージからデータ・ロード・ツールを使用して空間データをロードできます。

GeoJSONデータに対して空間分析を実行するには:
  1. ローカル・ファイルまたはクラウド・ストレージからデータ・ロード・カートにデータをロードした後、カート内のファイルを表示できます。「設定」アイコンをクリックします。
    settings-spatial.bmpの説明が続きます

  2. ウィザードの「設定」タブで、「ジオメトリの修正」を選択して無効なジオメトリを修正します。このアイコンは、重複点、ポリゴン方向エラー、ポリゴン構成エラーなどの最も一般的なエラーを修正します。修正不可能なエラーが検出されると、ORA-13199: the given geometry cannot be rectified例外で失敗します。
    add-spatial-expression.bmpの説明が続きます

    ノート

    方向が間違っているジオメトリは修正できません。「ジオメトリの修正」アイコン。
  3. 「許容範囲」の値を指定します。前述の例では、許容値として0.005 (5mm)を指定します。
  4. 「マッピング」セクションで「式の追加」をクリックし、「空間式」を選択します。
    add-spatial-expression-wizard.bmpの説明が続きます

    「式の追加」ダイアログで、次のフィールドを指定します:
    • 式タイプ: 「式タイプ」ドロップダウンから、「面積」を選択して2次元ポリゴンの領域を表示します。「長さ」を選択して、2次元ポリゴンの境界を表示することもできます。
    • 入力列: デフォルトでは、GEOMETRY列が表示されます。このソース列には、ジオメトリの領域が格納されます。式タイプとして「長さ」を選択した場合、このソース列にはジオメトリの長さが格納されます。
    • ターゲット列: 新しく作成された特別な式列の名前を指定します。たとえば、Area型式パラメータの場合はGEOMETRY_AREALength型式パラメータの場合はGEOMETRY_LENGTHです。
    「拡張オプション」セクションで、次のフィールド値を指定します。
    • 許容差: 許容差値を入力します。例: 0.005
    • 単位: 許容範囲の単位をドロップダウンから選択します。たとえば、Square meterです。
    ノート

    ロードするファイルに空間データが含まれていない場合は、式の追加ウィザードのNo input columns have the SDO_GEOMETRY data type for the currently selected expression type of Areaで次のエラーが表示されます。

    詳細は、「空間データ分析のパラメータ」を参照してください。

  5. 「OK」をクリックしますマッピング・グリッドに新しい行が追加されます。この行は、OCI Languageサービスによって生成される出力空間式列を決定します。この例では、表のロード後にターゲット表に作成される新しいGEOMETRY_AREAを表示できます。
    new-mapping-spatial.bmpの説明が続きます

Oracle Spatialの詳細は、『Oracle Spatial開発者ガイド』を参照してください。

データ・ロード・ジョブが完了すると、「データ・ロード」ページの「表およびビュー・ロード」に、ツールにロードされるソース表の詳細が表示されます。行と列の数とアップロードが完了した日時が表示されます。

空間分析から生成された出力データ

Spatial式を使用して列を分析すると、Data Studioによって新しい式列が生成され、更新された表に結果が保存されます。

生成された式列を検索するには、「データベース・アクション起動パッド」から「データ・ロード」にナビゲートします。「表およびビュー・ロード」セクションでロードする表を選択します。

ロード名の横にある3つの垂直ドットをクリックし、「表」をクリックして、「詳細の表示」を選択します。
table-spatial-job.bmpの説明が続きます

これにより、更新されたソース・ファイルを表示するデータ・ロードの「プレビュー」タブが開きます。たとえば、COUNTRIESGEO.GeoJSONファイルの空間分析からの出力データセットを次に示します。ここで、GEOMETRY_AREAは入力列の空間分析です。この列には、2次元ポリゴンの領域が表示されます。
Spatial-output.bmpの説明が続きます

Apache Iceberg表のロード

Data Studioでは、オブジェクト・ストアからのIceberg表のロードおよびリンクがサポートされています。

このツールは、同じファイルの複数のバージョンをロードできます。

  1. アイスバーグ表が定義されているクラウド・ストアの場所を選択します。この例では、OCIに格納されているICEBERGBUCKETを選択します。


    iceberg-bucket.pngの説明が続きます

    Icebergファイルを検出するには、その名前の横にIcebergシンボル
    symbol.pngの説明が続きます

    を使用します。

  2. フォルダを左側のファイル・ナビゲータにドラッグし、右側のカートにドロップします。また、このフォルダは、表のスナップショット、パーティション化スキームおよびスキーマ情報を追跡するメタデータJSONファイルで構成されます。

    カートにフォルダを追加すると、Personal Identifiable Information (PII)プロンプトで構成されるファイルの数に関する警告が表示されます。


    drag-drop-bucket.pngの説明が続きます

    ノート

    : フォルダのかわりに複数のファイルをロードする場合、ツールは、複数のソース・ファイルから単一のターゲット表にすべてのオブジェクトをロードするかどうかを尋ねます。「OK」をクリックして続行するか、エスケープして取り消します。
  3. Click Start in the data link cart menu bar.クラウド・ストアからのロードを開始するかどうかを示す通知が表示されます。「実行」を選択して続行します。


    run1.pngの説明が続きます

  4. ロードの進行状況は、「表」および「ロードの表示」の下に表示されます。ロード後、表ロードの「レポート」および「再ロード」アイコンが表示されます。


    table-view-loads.pngの説明が続きます

  5. Autonomous DatabaseにロードしたIceberg表を問い合せます:
    • ブレッドクラムで「データベース・アクション」をクリックします。
    • 「開発」「SQL」の順に選択します。
    • オブジェクト・ドロップダウンから、左側のナビゲータで「表」を選択します。使用可能なビューのリストから、CALL_CENTER_PARQUET表をワークシートにドラッグ・アンド・ドロップします。


      drop-sql.pngの説明が続きます

    • 使用可能な挿入のタイプを示すダイアログが表示されます。


      select.pngの説明が続きます

      「選択」をクリックして、「適用」をクリックします。

    • 「実行」(ワークシートの上部にある矢印アイコン)をクリックします。このツールでは、「問合せ結果」の下に氷山データが表示されます。


      iceberg-result.pngの説明が続きます

AIソースからのデータのロード

Data Studioツールを使用して、AIソースからデータをロードできます。

「データ・ロード」ダッシュボードで、「データのロード」カードをクリックし、「AIソース」を選択します。


load-ai.pngの説明が続きます

この機能を使用する前に、AIプロファイルの設定の前提条件を実行する必要があります。この機能の設定の詳細は、DBMS_CLOUD_AIパッケージの構成を参照してください。

AIプロファイルを設定するには、次のものが必要です。
  • OpenAIアカウント、CohereアカウントまたはAzure OpenAIサービス
  • DBMS_CLOUD_AIパッケージへのアクセス。

「DBMS_CLOUD_AIを使用したAIプロファイルの構成」セクションのステップに従って、AIプロファイルを作成および構成し、この機能を利用します。

ファイル・システムからのデータのロード

ファイル・システム・ディレクトリからAutonomous Databaseにファイルをロードできます。

表のデータにフィルタを設定して、指定したデータのみをロードすることができます。たとえば、CSVファイルのみにファイルを制限するには、ファイル拡張子フィルタに*.CSVと入力します。

「クラウド・オブジェクトのロード」ページからのデータ・ロード・ジョブの構成および実行。このページを開くには:
  1. 「Data Studio」タブで、「Data Load」を選択します。「データ・ロード」ダッシュボードを表示します。
  2. 「LOAD DATA」をクリックし、「ファイル・システム」オプションを選択します。

ページの上部で、ファイルのロード元となるディレクトリを選択する必要があります。ページの左側にはナビゲータ・ペインがあり、そこでデータを含むディレクトリ内のファイルを選択します。ページの右側には、データ・ロード・ジョブ用のファイルおよびフォルダをステージングするデータ・ロード・カートがあります。データ・ロード・ジョブを実行する前に、そのオプションを設定できます。Autonomous Databaseには、様々なコンシューマ・グループに割り当てられた事前定義済CPU/IOシェアが付属しています。ワークロードに応じて、データ・ロード・ジョブの実行中にコンシューマ・グループを低、中または高に設定できます。ディレクトリからデータベースにファイルをロードするには、次を実行します:

  1. データ・ロード・ジョブの準備: 詳細は、「データ・ロード・ジョブの準備」セクションを参照してください。
  2. データ・ロード・ジョブのファイルまたはフォルダの追加: 詳細は、「データ・ロード・ジョブのファイルまたはフォルダの追加」セクションを参照してください。
  3. データ・ロード・ジョブの詳細の入力: 詳細は、「データ・ロード・ジョブの詳細の入力」を参照してください。
  4. データ・ロード・ジョブの実行: 詳細は、「データ・ロード・ジョブの実行」セクションを参照してください。
  5. 実行後のデータ・ロード・ジョブに関する詳細の表示: 詳細は、「実行後のデータ・ロード・ジョブに関する詳細の表示」セクションを参照してください。
  6. データ・ロード・ジョブから生成された表の表示: 詳細は、「データ・ロード・ジョブから生成された表の表示」セクションを参照してください。

データベース・アクションでのディレクトリの作成

Autonomous Databaseには、ファイルを格納できる事前構成済のdata_pump_dirがあります。ディレクトリの作成、ディレクトリの削除、およびネットワーク・ファイル・システムのアタッチを行うこともできます。

たとえば、CREATE DIRECTORYコマンドを使用して、追加のディレクトリを作成できます。データベースのDROP DIRECTORYコマンドを使用してディレクトリを削除し、DBMS_CLOUD.LIST_FILESを使用してディレクトリの内容をリストします。

ディレクトリの作成

ディレクトリを追加するには、CREATE ANY DIRECTORYシステム権限が必要です。CREATE ANY DIRECTORYシステム権限は、ADMINユーザーに付与されます。CREATE ANY DIRECTORYシステム権限は、ADMINユーザーが他のユーザーに付与できます。

詳細は、CREATE DIRECTORYを参照してください。

ノート

  • CREATE DIRECTORYを指定すると、データベースにデータベース・ディレクトリ・オブジェクトが作成され、ファイル・システム・ディレクトリも作成されます。たとえば、ディレクトリ・パスは次のようになります:
    /u03/dbfs/7C149E35BB1000A45FD/data/stage
  • 次のコマンドを使用すると、ルート・ファイル・システムにディレクトリを作成して、すべてのファイルを表示できます:

    CREATE OR REPLACE DIRECTORY ROOT_DIR AS '';

    ROOT_DIRディレクトリを作成した後、次のコマンドを使用すると、すべてのファイルがリストされます:

    SELECT * FROM DBMS_CLOUD.list_files('ROOT_DIR');
  • ADMIN以外のユーザーでDBMS_CLOUD.LIST_FILESを実行するには、そのユーザーにそのディレクトリに対する読取り権限を付与する必要があります。

ディレクトリを作成し、Data Studioからアクセスする方法を示します。

  • データベース・アクションでディレクトリを作成します。

    データベース・アクション・インスタンスにログインし、「開発」の下のSQLカードを選択します。SQLワークシートを表示できます。ここで、ディレクトリを作成し、作成したディレクトリに選択したファイル・システム名を添付します。次の例で、FSS_DIRはディレクトリの名前です。

    create-directory.pngの説明が続きます

    前述のコマンドを実行します。前述のコマンドは、次の出力を提供します。

    PL/SQLプロシージャが正常に終了しました

  • ファイル・システムの添付
    DBMS_CLOUD_ADMIN.ATTACH_FILE_SYSTEMプロシージャを使用して、選択した名前のファイル・システムをFSS_DIRディレクトリにアタッチします。
    
    BEGIN
      DBMS_CLOUD_ADMIN.ATTACH_FILE_SYSTEM(
        file_system_name => '********',
        file_system_location => '*******.sub1********1.********.oraclevcn.com:/********',
        directory_name => 'FSS_DIR',
        description => 'attach OCI file system'
      );
    END;
    /
    
    

    前述のコマンドを実行して、次の出力を表示します。

    PL/SQL procedure successfully completed.

  • アタッチされたファイル・システムを表示するには、次のコマンドを実行します。

    SELECT file_system_name, file_system_location, directory_path FROM dba_cloud_file_systems;

    ファイル・システム名、ファイル・システムの場所およびディレクトリ・パスを表示します。

  • データ・スタジオ・ツールの「データ・ロード」メニューの「クラウド・オブジェクトのロード」にナビゲートすると、新しいディレクトリを添付ファイルとともに表示できます。クラウド・ストアの場所の選択ドロップダウンをクリックします。new-dir.pngの説明が続きます

新規に作成されたディレクトリFSS_DIRを表示できます。データ・ロード・ツールを使用して、ファイル・システム・ディレクトリから自律型データベースにデータをロードできます。「ファイル・システムからのデータのロード」を参照してください。

共有からデータをロードしています

共有から表を選択できます。提供されたデータ共有をサブスクライブしてアクセスする必要があります。

シェアから表をロードするには、データ・ロード・ダッシュボードで「データのロード」をクリックします。データのロード・ページで「共有」をクリックします。「+共有プロバイダのサブスクライブ」をクリックして、共有プロバイダにサブスクライブします。

データ共有プロバイダへのサブスクライブ

サブスクライブするには、共有プロバイダから受信したアップロード済JSONプロファイルに含まれる情報を使用する必要があります。
  1. 「データ共有プロバイダのサブスクライブ」で、「プロバイダ名」を入力します。subscribe_1.pngの説明が続きます
  2. 「新規プロバイダJSONの追加」を選択し、「デルタ共有プロファイルJSON」をクリックしてJSONプロファイルをドラッグ・アンド・ドロップします。
  3. 「次」をクリックして、「共有の追加」タブをクリックします。
  4. 共有RESTエンドポイントでデータベースからホストへのネットワーク・アクセスを許可するレベルを選択し、「実行」をクリックします。この例では、「ホストへのアクセスのみを許可」が選択されています。network_acl_script.pngの説明が続きます
  5. 使用可能なシェアを登録するには、Available Sharesから Selected Sharesにシェアを移動し、Subscribeをクリックします。

    次のスクリーンショットは、「サブスクライブ」をクリックする前に「使用可能な共有」から「選択した共有」に移動された「REVIEWS」共有を示しています。

    subscribe_2.pngの説明が続きます
  6. データ共有から選択された表から導出された外部表を作成します。
    1. 選択した共有から表をドラッグ・アンド・ドロップします。オプションで、「設定」をクリックして表の詳細を表示できます。

      この例では、選択された表はHOTEL_REVIEWSのみです。

      sel_tbls.pngの説明が続きます
    2. オプションで、表の名前を変更し、「閉じる」をクリックできます。

      この例では、名前がHOTEL_REVIEWSからHOTEL_REVIEWS_SHAREに変更されています。

      name_change.pngの説明が続きます
    3. 「共有の選択」ページで「開始」をクリックし、「データ・ロード・ジョブの実行」ダイアログで「実行」をクリックして、外部表を作成します。 start_run.pngの説明が続きます
    4. 外部表が作成されると、「完了」メッセージが表示されます。xt_complete.pngの説明が続きます
    5. 表の詳細を表示するには、外部表名をクリックします。xt_details.pngの説明が続きます
  7. データベース・アクションから作成された表を表示します。
    1. ブレッドクラムの「データベース・アクション」をクリックして、「データベース・アクション」起動パッドに戻ります。
    2. 「SQL」タイルをクリックします。
    3. 外部表を選択し、ワークシートにドラッグ・アンド・ドロップします。

      表のSQL Select文が表示されます。このSQL文は、共有データを消費するために実行できます。

      xt_sql.pngの説明が続きます
  8. 選択した共有から表をドラッグ・アンド・ドロップします

データ・ロードからのライブ・フィードの作成

データ・ロード・ツールは、クラウド・オブジェクト・ストア内のフォルダからデータをロードし、データ・ロードの繰返しをリアルタイムにスケジュールできるようにします。これは、データ・ロード・ジョブからのライブ・フィードの作成です。

データ・ロードが完了したら、「表の作成」または「表の削除」および「新規表の作成」オプションを使用して、オブジェクト・ストア・フォルダをロードしたカート項目からライブ・フィードを作成できます。

データ・ロードからライブ・フィードを作成するには:
  1. セレクタをクリックして、ナビゲーション・メニューを表示します。「Data Studio」で、「データ・ロード」を選択します。
  2. 「データのロード」タイルを選択して、ローカル・ファイル、データベース、クラウド・ストア、ディレクトリ、シェアなどの様々なソースからデータをロードします。
  3. 「クラウド・ストア」をクリックして、URLまたはクラウド・ストア・リンクからオブジェクトをロードします。
  4. ドロップダウンからクラウド・ストアの場所を選択します。クラウド・ストアの場所を表示できない場合は、「クラウド・ストアの場所の作成」を選択して、新しいクラウド・ストアの場所を作成します。使用可能なクラウドの場所がない場合は、「Oracle Cloud Infrastructureネイティブ資格証明の作成」で説明されているステップに従います。
  5. クラウド・ストアの場所を選択すると、クラウド・ストレージに存在するフォルダおよびファイルのリストを表示できます。クラウド・ストアからのファイルをデータ・ロード・カートに追加し、そこでロード・ジョブの詳細を編集できます。
    ノート

    データ・ロード・ツールは、CSV、XLS、XLSX、TSV、TXT、XML、JSONおよびAVRO形式の単一ファイル、またはXLSX形式のファイルを含むフォルダで構成されるロード済カート項目からのライブ・フィードの作成をサポートしていません。
  6. フォルダを追加するには、左側のファイル・ナビゲータからフォルダをドラッグし、右側のカートにドロップします。フォルダをカートに追加すると、複数のソース・ファイルから単一のターゲット表にすべてのオブジェクトをロードするかどうかを尋ねるプロンプトが表示されます。「はい」をクリックして続行するか、「いいえ」をクリックして取り消します。複数のフォルダをカートに追加できます。各カードで表されるデータが個別の表にロードされますが、カート内のすべてのアイテムが同じデータ・ロード・ジョブの一部として処理されます。
  7. データ・ロード・カートから「設定」(鉛筆アイコン)を選択して、データ・ロード・ジョブの詳細を入力します。
  8. クラウド・ストアの場所からデータをロードする「設定」タブで、「表の作成」または「表の削除および新規表の作成」「オプション」ドロップダウンから選択できます。
    ノート

    ライブ・フィード・ツールは、表を作成してデータを新しい表に挿入するか、既存の表を削除してデータを新しい表に挿入する場合にのみ、データ・ロード・ジョブと連携します。
  9. データ・ロード・ジョブのその他の詳細を入力します。詳細の入力の詳細は、「データ・ロード・ジョブの詳細の入力」トピックを参照してください。
  10. データ・ロード・カートに追加し、データ・ロード・ジョブに関する詳細を入力したら、「開始」を選択してジョブを実行します。
  11. データ・ロード・ジョブの実行後、データ・ロード・カートに緑色のチェック・マークが表示されます
    green-tick.pngの説明が続きます

    データ・ロード・ジョブが完了したことを示します。
  12. データ・ロード・カートの「ライブ表フィードの作成」をクリックして、データ・ロード・ジョブからライブ表フィードを作成します。ライブ表フィードの作成が成功し、ライブ表フィードを編集する必要があることを示す正常なメッセージが表示されます。続行する場合は「はい」を、取り消す場合は「いいえ」をクリックします。「はい」を選択すると、ライブ表フィードの編集ウィザードが開きます。
  13. ライブ表フィードの編集ウィザードでは、ソース・フォルダのクラウド・ストアの場所と、データに適用されたオブジェクト・フィルタを表示できます。

    「データ・ソース」タブの「プレビュー」ドロップダウンから、データをプレビューする任意のファイルを選択します: このフィールドには、ロードしたクラウド・ストア・フォルダに存在するファイルの合計数が表示されます。データのプレビューが表示されます。


    editlive-datasource.pngの説明が続きます

  14. 「次」をクリックして、「表の設定」タブに進みます。
    editlive-tablesettings.pngの説明が続きます

    「表の設定」タブで、データ・ロード・ジョブのプロパティとマッピングの詳細を表示できます。
    ノート

    このタブの詳細を選択または編集することはできません。
  15. 「次」をクリックして、ウィザードの「プレビュー」タブに進みます。

    「プレビュー」ドロップダウンから任意のファイルを選択して、ファイルを表示します。「表プレビュー」には、ドロップダウンから選択したファイルのプレビューが表示されます。


    previewtab.pngの説明が続きます

  16. 「次」をクリックして、ウィザードの「ライブ・フィード設定」タブを表示します。「ライブ・フィード設定」タブで、フィールドに次の値を指定します。
    livefeed-settings.pngの説明が続きます

    • 通知に対して有効: Oracle Cloud Infrastructureの通知に基づいてデータ・ソース内の新規または変更済のデータがロードされるようにするには、このオプションを選択します。このオプションを選択すると、スケジュールに従ってポーリングが開始される場合(つまり、ライブ表フィードの「スケジュール済」オプションを選択した場合)に発生する可能性のある遅延を回避できます。

      「通知に対して有効」オプションを選択した場合、通知を発行するようにオブジェクト・ストア・バケットも構成する必要があります

    • スケジューリングに対して有効化: データ・フィードのスケジュールを設定するには、このオプションを選択します。時間間隔フィールドに数値を入力し、バケットで新規または変更済ファイルを投票する時間タイプおよび日程を選択します。For example, to poll every two hours on Monday, Wednesday, and Friday, enter 2, select Hours, and then select Monday, Wednesday, and Friday in the appropriate fields.「Week Days」ドロップダウンから「All Days」「Monday to Friday」「Sunday to Thursday」または「Custom」を選択できます。「カスタム」フィールドを使用すると、「月曜日」「火曜日」「水曜日」「木曜日」および「金曜日」を選択できます。

    開始日と終了日を選択します。開始日を選択しない場合、現在の日時が開始日として使用されます。終了日はオプションです。ただし、終了日がないと、フィードはポーリングを継続します。

    「ライブ表フィード名」「ターゲット表名」「コンシューマ・グループ」など、ウィザードに表示される残りのフィールドはグレー表示され、選択または編集できません。

「保存」をクリックして、データ・ロード・カートからライブ表フィードを保存および作成します。