データをロードしています
ローカル・デバイスのファイル、リモート・データベース、またはディレクトリや共有プロバイダからのクラウド・ストレージ・バケットからデータをロードできます。ロードできるファイル形式は、CSV、XLSX、TSV、TXT、XML、JSON、GEOJSON、AVRO、PARQUET、GZ、GZIP、ZIP、PDF、PNG、JPG、JPEGおよびTIFFです。
データ・ロード・ツールでは、ブール形式のソース・ファイルのロードがサポートされています。ブール・データ型の真理値はTRUE
およびFALSE
です。NOT NULL
制約がない場合、ブール・データ型では真理値UNKNOWN
もNULL値としてサポートされます。ブール・データ型は、Oracle SQL構文でデータ型が出現するたびに使用できます。
また、Oracle Database表内にベクトル埋込みを直接格納できるVECTOR
データ型もサポートされています。
次のトピックでは、これらのアクションのインタフェースについて説明します。
- Data StudioでのOCI言語サービス機能の使用
センチメント分析、キーフレーズ抽出、言語検出などのOCI言語サービス機能を利用して、機械学習(ML)や人工知能(AI)の専門知識がなくてもデータを分析できます。 - OCI Document Understandingを使用したイメージからの表の抽出
Oracle Cloud Infrastructure(OCI) Document Understandingの機能(表抽出など)を利用して、ロードしたデータから表を検出できます。 - データ・ロードでのGeoJSONの使用
GeoJSONオブジェクトは、特定のジオメトリに関する情報(ポイント、線、ポリゴンなど)とオプションのメタデータ(IDなど)を格納します。 - ローカル・ファイルからのデータのロード
ローカル・ファイルからOracle Autonomous Databaseにデータをロードするには、「データ・ロード」ページで「データのロード」および「ローカル・ファイル」を選択します。 - 他のデータベースからのデータのロード
別のデータベース内の表からOracle Autonomous Databaseにデータをロードするには、「データ・ロード」ページで「データのロード」および「データベース」を選択します。ドロップダウン・リストからデータベース・リンクをクリックします。データベース表のリストから1つ以上の表をドラッグし、「データ・ロード・カート」にドロップします。 - クラウド・ストレージからのデータのロード
クラウド・ストアからAutonomous Database内の表にデータをロードできます。 - Apache Iceberg表のロード
Data Studioでは、オブジェクト・ストアからのIceberg表のロードおよびリンクがサポートされています。 - AIソースからのデータのロード
Data Studioツールを使用して、AIソースからデータをロードできます。 - ファイル・システムからのデータのロード
ファイル・システム・ディレクトリからAutonomous Databaseにファイルをロードできます。 - 共有からのデータのロード
共有から表を選択できます。提供されたデータ共有をサブスクライブしてアクセスする必要があります。 - データ・ロードからのライブ・フィードの作成
データ・ロード・ツールは、クラウド・オブジェクト・ストアのフォルダからデータをロードし、データ・ロードの繰返しをリアルタイムでスケジュールできるようにします。これは、データ・ロード・ジョブからのライブ・フィードの作成です。
親トピック: 「データ・ロード」ページ
Data StudioでのOCI言語サービス機能の使用
センチメント分析、キー・フレーズ抽出、言語検出などのOCI言語サービス機能を利用して、機械学習(ML)や人工知能(AI)の専門知識がなくてもデータを分析できます。
たとえば、製品のフィードバックに使用できます。電話メーカーは、新しい電話モデルを立ち上げ、顧客のセンチメントが製品に何であるかを知りたいと考えています。センチメントの大部分が負の場合、Quality Control(QC)で検出されなかったカメラの潜在的な障害を示す可能性があります。
- センチメント分析、キー・フレーズの抽出および言語検出の概要
センチメント分析、キー・フレーズ抽出および言語検出は、現在、ローカル・ファイルからのデータのロードおよびクラウド・ストレージからのデータのロードでサポートされています。 - データを分析するパラメータ
「設定」タブから「式の追加」を起動する場合は、パラメータを使用してモデルを構成する必要があります。 - センチメント分析の実行
入力データのセンチメントを決定するには: - キー・フレーズ抽出の実行
入力データからキー・フレーズ情報を抽出するには: - 言語検出の実行
Data Studioでは、複数言語の検出がサポートされています。
親トピック: データのロード
センチメント分析、キー・フレーズ抽出および言語検出の概要
センチメント分析、キー・フレーズ抽出および言語検出は、現在、ローカル・ファイルからのデータのロードおよびクラウド・ストレージからのデータのロードでサポートされています。
感情分析
センチメント分析では、テキストを分析して、トピックまたは製品に関するセンチメントを定義します。言語サービスのセンチメント分析では、自然言語処理(NLP)を使用します。Data Studioツールは、Oracle Cloud Infrastructure (OCI) Languageサービスを使用して、入力データを分析および理解します。Data Studioツールは、OCI Languageサービスの出力を含む新しい列をデータ・ロードに動的に追加します。ソース・データの任意の列のセンチメントを検出できます。たとえば、アプリケーションのレビューを含む列を検索する場合は、アプリケーションに関する一般的な意見が必要であると想定します。Data Studioツールは、入力データに対してセンチメント分析を実行し、センチメントで構成されるターゲット表に定義された新しい式列を作成します。
詳細は、OCIでのセンチメント分析を参照してください。
キー・フレーズの抽出
キー・フレーズ抽出は、テキストの主な概念を識別します。キーワード抽出は、入力テキストから、最も関連性の高い単語および表現を抽出する自動プロセスです。これは、コンテンツを要約して、主要トピックを認識するのに役立ちます。ワード・クラウドは、主要なフレーズを使用して生成でき、主要な概念をテキスト・コメントまたはフィードバックで視覚化するのに役立ちます。たとえば、ムービー・レビューでは、コメントで識別されたキー・フレーズに基づいてワード・クラウドを生成し、方向性、演技および撮影スタッフについて最も頻繁にコメントしていることがわかります。
詳細は、OCIでのキー・フレーズ抽出を参照してください。
言語の検出
言語検出などのOCI言語サービス機能を使用して、入力テキストの言語を検出できます。テキストがどの自然言語にあるかを返します。それを使用して言語の障壁を克服し、他の国の人々とのコミュニケーションを改善することができます。入力テキストの言語を決定し、コンテンツを異なる言語に翻訳できます。詳細は、OCIでの言語抽出を参照してください。
- ローカル・ファイルまたはクラウド・ストレージからのデータのロード:分析するデータを、ローカル・ファイルまたはクラウド・ストレージからOracle Autonomous Databaseにロードします。データがエラーなしでデータ・ロード・カートにロードされていることを確認します。マッピング・エラーは、「クラウド・ストアの場所からのデータのロード」の「エラー」クイック・フィルタから表示および修正できます。データ・ロード・ツールにデータをロードした後、
- データ・ロード・ジョブ・カートの「設定」アイコンをクリックして、設定を確認します。
- クラウド・ストアの場所からデータをロード・ウィザードの「設定」ペインで、マッピング・エラーがある場合、マッピング・グリッド・セルが赤で強調表示され、修正する必要のある無効な値が示されます。
- 「エラー」クイック・フィルタをクリックすると、エラーのある列のみが表示されます。
- ツールは、データ・ロード・ジョブの設定を指定する際に、センチメント分析、キー・フレーズの抽出および言語検出を実行します。
親トピック: Data StudioでのOCI言語サービス機能の使用
データを分析するためのパラメータ
「設定」タブから「式の追加」を起動する場合は、パラメータを使用してモデルを構成する必要があります。
表3-3センチメント分析、キー・フェーズ抽出および言語検出のパラメータ
パラメータ | 説明 |
---|---|
式タイプ |
入力テキストに対して実行する操作として、「センチメント分析」、「キー・フレーズ抽出」および「言語検出」のいずれかを選択します。 |
入力列 |
分析する列を選択します。 入力列のドロップダウンには、センチメント分析、キー・フレーズ抽出および言語検出がサポートする列のみが含まれます。 センチメント分析の場合、入力ドロップダウンにはVARCHAR2、NVARCHAR2、CLOBまたはNCLOBターゲット列のみが表示されます。 |
ターゲット列 |
|
親トピック: Data StudioでのOCI言語サービス機能の使用
感情分析の実行
入力データのセンチメントを決定するには:
- ローカル・ファイルまたはクラウド・ストレージからデータ・ロード・カートにデータをロードした後、カート内のファイルを表示できます。「設定」アイコンをクリックします。
- 「設定」アイコンをクリックすると、ローカル・ファイルからのデータのロード・ウィザードが開きます。この例では、ローカル・ファイルからデータをロードしています。
- ウィザードの「設定」タブで、「マッピング」セクションの「式の追加」をクリックします。
これにより、「式の追加」ダイアログ・ボックスが開きます。
- 「式の追加」ダイアログで、次のフィールドを指定します:
- 式タイプ:「式タイプ」ドロップダウンから「センチメント分析」を選択します。
- 入力列:分析する列をドロップダウンから選択します。例: CONTENT
- ターゲット列:新しく作成した式列の名前を入力します。たとえば、CONTENT_SENTIMENT。
詳細は、「データを分析するためのパラメータ」を参照してください。
- 「OK」をクリックしますマッピング・グリッドに新しい行が追加されます。この行は、OCI Languageサービスによって生成される出力式列を決定します。
- 「閉じる」をクリックします
- 「データ・ロード」メニュー・カートの「開始」をクリックして、ローカル・ファイルからデータをロードします。ローカル・ファイルからのロードを開始するかどうかを確認する確認メッセージが表示されます。
- 「実行」をクリックして確認します。
データ・ロード・ジョブが完了すると、「データ・ロード」ページの「表およびビュー・ロード」に、ツールにロードされるソース表の詳細が表示されます。行と列の数とアップロードが完了した日時が表示されます。
- OCIセンチメント分析から生成される出力データ
OCI Language Serviceモデルを使用して列を分析すると、Data Studioによって新しい式列が生成され、更新された表に結果が保存されます。
親トピック: Data StudioでのOCI言語サービス機能の使用
OCIセンチメント分析から生成された出力データ
OCI Language Serviceモデルを使用して列を分析すると、Data Studioによって新しい式列が生成され、更新された表に結果が保存されます。
生成された式列を検索するには、「データベース・アクション起動パッド」から「データ・ロード」にナビゲートします。「表およびビュー・ロード」セクションでロードする表を選択します。
ロード名の横にある3つの垂直ドットをクリックし、「表」をクリックして「表示」を選択します。
これにより、データ・ロードの「プレビュー」タブが開き、更新されたソース・ファイルが表示されます。たとえば、Instagramアプリケーションのセンチメント分析からの出力データセットを次に示します。ここで、CONTENT
はターゲット列、CONTENT_SENTIMENT
は入力列のセンチメント分析です。この列には、正、中性、混合、負などの次のいずれかの値が表示されます。ツールでセンチメントを判別できない場合、Nullが表示されます。
親トピック: センチメント分析の実行
キー・フレーズ抽出の実行
入力データからキー・フレーズ情報を抽出するには:
- ローカル・ファイルまたはクラウド・ストレージからデータ・ロード・カートにデータをロードした後、カート内のファイルを表示できます。「設定」アイコンをクリックします。
- 「設定」アイコンをクリックすると、ローカル・ファイルからのデータのロード・ウィザードが開きます。この例では、ローカル・ファイルからデータをロードしています。
- ウィザードの「設定」タブで、「マッピング」セクションの「式の追加」をクリックします。
これにより、「式の追加」ダイアログ・ボックスが開きます。
- 「式の追加」ダイアログで、次のフィールドを指定します。
- 式タイプ:「式タイプ」ドロップダウンから「キー・フレーズ抽出」を選択します。
- 入力列:分析する列をドロップダウンから選択します。例: CONTENT
- ターゲット列:新しく作成した式列の名前を入力します。たとえば、CONTENT_KEY_PHRASE_EXTRACTION。
詳細は、「データを分析するためのパラメータ」を参照してください。
- 「OK」をクリックしますマッピング・グリッドに新しい行が追加されます。この行は、OCI Languageサービスによって生成される出力式列を決定します。
- 「閉じる」をクリックします
- 「データ・ロード」メニュー・カートの「開始」をクリックして、ローカル・ファイルからデータをロードします。ローカル・ファイルからのロードを開始するかどうかを確認する確認メッセージが表示されます。
- 「実行」をクリックして確認します。
データ・ロード・ジョブが完了すると、「データ・ロード」ページの「表およびビュー・ロード」に、ツールにロードされるソース表の詳細が表示されます。行と列の数とアップロードが完了した日時が表示されます。
- OCIキー・フレーズ抽出から生成される出力データ
OCI Language Serviceモデルを使用して列を分析すると、Data Studioによって新しい式列が生成され、更新された表に結果が保存されます。
親トピック: Data StudioでのOCI言語サービス機能の使用
OCIキー・フレーズ抽出から生成された出力データ
OCI Language Serviceモデルを使用して列を分析すると、Data Studioによって新しい式列が生成され、更新された表に結果が保存されます。
生成された式列を検索するには、「データベース・アクション起動パッド」から「データ・ロード」にナビゲートします。「表およびビュー・ロード」セクションでロードする表を選択します。
ロード名の横にある3つの垂直ドットをクリックし、「表」をクリックして、「表示」を選択します。
たとえば、Instagramアプリケーションのセンチメント分析からの出力データセットを次に示します。ここで、CONTENT
はターゲット列で、CONTENT_KEY_PHRASE_EXTRACTION
列には入力列から抽出されたキー・フレーズが表示されます。
親トピック: キー・フレーズ抽出の実行
言語検出の実行
Data Studioでは、複数の言語の検出がサポートされています。
- クラウド・ストレージからデータ・ロード・カートにデータをロードした後、カート内のファイルを表示できます。「設定」アイコンをクリックします。
- 「設定」アイコンをクリックすると、クラウド・ストアの場所からのデータのロード・ウィザードが開きます。
- ウィザードの「設定」タブで、「マッピング」セクションの「式の追加」をクリックします。
これにより、「式の追加」ダイアログ・ボックスが開きます。「AI式」を選択します。
- 「式の追加」ダイアログで、次のフィールドを指定します。
- 式タイプ:「式タイプ」ドロップダウンから「言語検出」を選択します。
- 入力列:分析する列をドロップダウンから選択します。この場合、「レビュー」列の言語を検出する必要があります。例: REVIEW
- ターゲット列:新しく作成した式列の名前を入力します。たとえば、REVIEW_LANGUAGE_DETECTION。
詳細は、「データを分析するためのパラメータ」を参照してください。
- 「OK」をクリックしますマッピング・グリッドに新しい行が追加されます。この行は、OCI Languageサービスによって生成される出力式列を決定します。
- 「閉じる」をクリックします
- 「データ・ロード」メニュー・カートの「開始」をクリックして、ローカル・ファイルからデータをロードします。ローカル・ファイルからのロードを開始するかどうかを確認する確認メッセージが表示されます。
- 「実行」をクリックして確認します。
データ・ロード・ジョブが完了すると、「データ・ロード」ページの「表およびビュー・ロード」に、ツールにロードされるソース表の詳細が表示されます。行と列の数とアップロードが完了した日時が表示されます。
- OCI言語検出から生成される出力データ
OCI Language Serviceモデルを使用して列を分析すると、Data Studioによって新しい式列が生成され、更新された表に結果が保存されます。
親トピック: Data StudioでのOCI言語サービス機能の使用
OCI言語検出から生成された出力データ
OCI Language Serviceモデルを使用して列を分析すると、Data Studioによって新しい式列が生成され、更新された表に結果が保存されます。
生成された式列を検索するには、「データベース・アクション起動パッド」から「データ・ロード」にナビゲートします。「表およびビュー・ロード」セクションでロードする表を選択します。
ロード名の横にある3つの垂直ドットをクリックし、「表」をクリックして、「詳細の表示」を選択します。
![view-details-language.bmpの説明が続きます view-details-language.bmpの説明が続きます](img/view-details-language.bmp)
たとえば、「レビュー」列の言語検出からの出力データセットを次に示します。ここで、REVIEW
はターゲット列で、REVIEW_LANGUAGE_DETECTION
列には入力列から検出された言語が表示されます。
親トピック: 言語検出の実行
OCI Document Understandingを使用したイメージからの表の抽出
表抽出などのOracle Cloud Infrastructure(OCI) Document Understandingの機能を使用すると、ロードしたデータから表を検出できます。
この機能を使用するためにサポートされているファイル形式は、PDF、JPEG、JPG、PNGおよびタグ・イメージ・ファイル形式(TIFF)です。
たとえば、PDF文書が採用日や給与を含むすべての従業員詳細で構成されている場合、文書の理解によって表が識別され、表構造が抽出されます。セルの行と列の関係を維持しながら、表のコンテンツを抽出します。
- 表抽出の概要
「データのロード」ツールでは、ローカル・ファイルからのデータのロードおよびクラウド・ストレージからのデータのロードにおける表抽出がサポートされます。 - イメージからの表抽出の実行
サンプルPDFを使用して表抽出を実行します。
親トピック: データのロード
表抽出の概要
データのロード・ツールは、ローカル・ファイルからデータをロードし、クラウド・ストレージからデータをロードする際に、表抽出をサポートします。
表抽出
OCI Document Understandingサービスにより、お客様はディープ・ラーニング・モデルを活用した非構造化ドキュメントのインサイトを発見できます。テキスト、表を抽出し、他の優れた機能の中でドキュメント・タイプを識別できます。表抽出では、ドキュメント内のすべての表が識別され、行/列の関係を維持した状態でコンテンツが表形式で抽出されます。
このサービスは、ソース・データの英語でのみ使用できます。
詳細は、表抽出を参照してください。
イメージからの表抽出の実行
サンプルPDFでテーブル抽出を実行します。
次のPDFに表が表示されます。
![image1-pdf.pngの説明が続きます image1-pdf.pngの説明が続きます](img/image1-pdf.png)
- PDFファイルをクラウド・ストレージから「データ・ロード」カートにロードします。ファイルをナビゲータからカートにドラッグ・アンド・ドロップできます。
- 「開始」をクリックしてデータをロードします。データのロードを開始するかどうかを確認する通知を受信します。「実行」をクリックして続行します。
- ロードが完了したら、「データ・ロード」ダッシュボードの「表」および「ロードの表示」でロードされたファイルを表示できます。
- 自律型データベースにロードしたPDFから表を抽出します。
- ブレッドクラムで「データベース・アクション」をクリックします。
- 「開発」、「SQL」の順に選択します。
- オブジェクト・ドロップダウンから、左側のナビゲータで「表」を選択します。使用可能な表のリストから、
EMP_ALL
表をワークシートにドラッグ・アンド・ドロップします。使用可能な挿入のタイプを示すダイアログが表示されます。
「選択」をクリックして、「適用」をクリックします。
- 「実行」(ワークシートの上部にある矢印アイコン)をクリックします。抽出された表が「問合せ結果」タブに表示されます。
データ・ロードでのGeoJSONの使用
GeoJSONオブジェクトは、特定のジオメトリに関する情報(ポイント、線、ポリゴンなど)とオプションのメタデータ(IDなど)を格納します。
GeoJSONファイルの拡張子は*.geojson
です。GeoJSONデータは、Data Studioのデータ・ロードを使用してAutonomous Databaseにロードできます。表にGeoJSONデータが含まれている場合、データは、SQLデータ型SDO_GEOMETRY
のドキュメント・セットからGeoJSONデータを投影する列にロードされます。
GeoJSONデータを含む表のロード
GeoJSONデータを使用してData Studioで表をロードし、その設定を確認すると、GeoJSONデータの列geometry
を持つ表Brazil_Geo
が作成されることがわかります。
![settings-geo.pngの説明が続きます settings-geo.pngの説明が続きます](img/settings-geo.png)
BRAZIL_GEO
をロードすると、ツールによってGeoJSONオブジェクトがデータ型SDO_GEOMETRY
の新しい列geometry
にロードされることがわかります。
表ロードの実行後に表ロードの「詳細の表示」を実行するときに、「データ定義」タブで同じものを表示することもできます。
- GeoJSON列の空間式の追加
Oracle Spatialは、ロケーション対応アプリケーションおよび地理情報システム(GIS)アプリケーションのユーザーが、空間データを簡単かつ自然に管理できるように設計されています。 - 空間データ分析のパラメータ
「式の追加」を起動し、「式の追加」ウィザードから「空間式」を選択する場合は、パラメータを使用してモデルを構成する必要があります。 - 空間分析の実行
ローカル・ファイルまたはクラウド・ストレージからデータ・ロード・ツールを使用して空間データをロードできます。 - 空間分析から生成される出力データ
空間式を使用して列を分析すると、Data Studioによって新しい式列が生成され、更新された表に結果が保存されます。
親トピック: データのロード
GeoJSON列の空間式の追加
Oracle Spatialは、ロケーション対応アプリケーションおよび地理情報システム(GIS)・アプリケーションのユーザーが、空間データを簡単かつ自然に管理できるように設計されています。
空間データがOracleデータベースに格納されると、データベースに格納されている他のすべてのデータと容易に操作、取得および関連付けることができます。
Oracle Spatialの空間データ・モデルは、要素、ジオメトリおよびレイヤーで構成される階層型の構造体です。レイヤーはジオメトリで構成され、ジオメトリは要素で構成されます。
許容差は、空間データに精度レベルを関連付けるために使用します。許容差は、2つの点が離れていても(たとえば、丸め誤差の調整のために)同じとみなされる距離を反映します。許容値は0より大きい正の数である必要があります。詳細は、空間データの許容範囲を参照してください。
親トピック: データ・ロードでのGeoJSONの使用
空間データ分析のパラメータ
「式の追加」を起動し、「式の追加」ウィザードから「空間式」を選択する場合は、パラメータを使用してモデルを構成する必要があります。
表3-4空間データ分析のパラメータ
パラメータ | 説明 |
---|---|
式タイプ |
「長さ」や「面積」など、次のいずれかの空間属性を選択します。
|
入力列 |
空間データについて分析する列を選択してください: デフォルトでは、 |
ターゲット列 |
これは、空間式の結果を格納するターゲット表で定義された新しく作成された式列であり、選択した式タイプ値によって異なります:
|
親トピック: データ・ロードでのGeoJSONの使用
空間分析の実行
ローカル・ファイルまたはクラウド・ストレージからデータ・ロード・ツールを使用して空間データをロードできます。
- ローカル・ファイルまたはクラウド・ストレージからデータ・ロード・カートにデータをロードした後、カート内のファイルを表示できます。「設定」アイコンをクリックします。
- ウィザードの「設定」タブで、「ジオメトリの修正」を選択して無効なジオメトリを修正します。このアイコンは、重複点、ポリゴン方向エラー、ポリゴン構成エラーなどの最も一般的なエラーを修正します。修正不可能なエラーが検出されると、
ORA-13199: the given geometry cannot be rectified
例外で失敗します。ノート
方向が間違っているジオメトリは修正できません。「ジオメトリの修正」アイコン。 - 「許容範囲」の値を指定します。前述の例では、許容値として0.005 (5mm)を指定します。
- 「マッピング」セクションで「式の追加」をクリックし、「空間式」を選択します。「式の追加」ダイアログで、次のフィールドを指定します:
- 式タイプ: 「式タイプ」ドロップダウンから、「面積」を選択して2次元ポリゴンの領域を表示します。「長さ」を選択して、2次元ポリゴンの境界を表示することもできます。
- 入力列: デフォルトでは、
GEOMETRY
列が表示されます。このソース列には、ジオメトリの領域が格納されます。式タイプとして「長さ」を選択した場合、このソース列にはジオメトリの長さが格納されます。 - ターゲット列: 新しく作成された特別な式列の名前を指定します。たとえば、Area型式パラメータの場合は
GEOMETRY_AREA
、Length型式パラメータの場合はGEOMETRY_LENGTH
です。
「拡張オプション」セクションで、次のフィールド値を指定します。- 許容差: 許容差値を入力します。例:
0.005
- 単位: 許容範囲の単位をドロップダウンから選択します。たとえば、
Square meter
です。
ノート
ロードするファイルに空間データが含まれていない場合は、式の追加ウィザードのNo input columns have the SDO_GEOMETRY data type for the currently selected expression type of Area
で次のエラーが表示されます。詳細は、「空間データ分析のパラメータ」を参照してください。
- 「OK」をクリックしますマッピング・グリッドに新しい行が追加されます。この行は、OCI Languageサービスによって生成される出力空間式列を決定します。この例では、表のロード後にターゲット表に作成される新しい
GEOMETRY_AREA
を表示できます。
Oracle Spatialの詳細は、『Oracle Spatial開発者ガイド』を参照してください。
データ・ロード・ジョブが完了すると、「データ・ロード」ページの「表およびビュー・ロード」に、ツールにロードされるソース表の詳細が表示されます。行と列の数とアップロードが完了した日時が表示されます。
親トピック: データ・ロードでのGeoJSONの使用
空間分析から生成された出力データ
Spatial式を使用して列を分析すると、Data Studioによって新しい式列が生成され、更新された表に結果が保存されます。
生成された式列を検索するには、「データベース・アクション起動パッド」から「データ・ロード」にナビゲートします。「表およびビュー・ロード」セクションでロードする表を選択します。
ロード名の横にある3つの垂直ドットをクリックし、「表」をクリックして、「詳細の表示」を選択します。
これにより、更新されたソース・ファイルを表示するデータ・ロードの「プレビュー」タブが開きます。たとえば、COUNTRIESGEO.GeoJSON
ファイルの空間分析からの出力データセットを次に示します。ここで、GEOMETRY_AREA
は入力列の空間分析です。この列には、2次元ポリゴンの領域が表示されます。
親トピック: データ・ロードでのGeoJSONの使用
Apache Iceberg表のロード
Data Studioでは、オブジェクト・ストアからのIceberg表のロードおよびリンクがサポートされています。
このツールは、同じファイルの複数のバージョンをロードできます。
- アイスバーグ表が定義されているクラウド・ストアの場所を選択します。この例では、OCIに格納されている
ICEBERGBUCKET
を選択します。Icebergファイルを検出するには、その名前の横にIcebergシンボル
を使用します。 - フォルダを左側のファイル・ナビゲータにドラッグし、右側のカートにドロップします。また、このフォルダは、表のスナップショット、パーティション化スキームおよびスキーマ情報を追跡するメタデータJSONファイルで構成されます。
カートにフォルダを追加すると、Personal Identifiable Information (PII)プロンプトで構成されるファイルの数に関する警告が表示されます。
ノート
: フォルダのかわりに複数のファイルをロードする場合、ツールは、複数のソース・ファイルから単一のターゲット表にすべてのオブジェクトをロードするかどうかを尋ねます。「OK」をクリックして続行するか、エスケープして取り消します。 - Click Start in the data link cart menu bar.クラウド・ストアからのロードを開始するかどうかを示す通知が表示されます。「実行」を選択して続行します。
- ロードの進行状況は、「表」および「ロードの表示」の下に表示されます。ロード後、表ロードの「レポート」および「再ロード」アイコンが表示されます。
- Autonomous DatabaseにロードしたIceberg表を問い合せます:
- ブレッドクラムで「データベース・アクション」をクリックします。
- 「開発」、「SQL」の順に選択します。
- オブジェクト・ドロップダウンから、左側のナビゲータで「表」を選択します。使用可能なビューのリストから、CALL_CENTER_PARQUET表をワークシートにドラッグ・アンド・ドロップします。
- 使用可能な挿入のタイプを示すダイアログが表示されます。
「選択」をクリックして、「適用」をクリックします。
- 「実行」(ワークシートの上部にある矢印アイコン)をクリックします。このツールでは、「問合せ結果」の下に氷山データが表示されます。
親トピック: データのロード
AIソースからのデータのロード
Data Studioツールを使用して、AIソースからデータをロードできます。
「データ・ロード」ダッシュボードで、「データのロード」カードをクリックし、「AIソース」を選択します。
![load-ai.pngの説明が続きます load-ai.pngの説明が続きます](img/load-ai.png)
この機能を使用する前に、AIプロファイルの設定の前提条件を実行する必要があります。この機能の設定の詳細は、DBMS_CLOUD_AIパッケージの構成を参照してください。
- OpenAIアカウント、CohereアカウントまたはAzure OpenAIサービス
DBMS_CLOUD_AI
パッケージへのアクセス。
「DBMS_CLOUD_AIを使用したAIプロファイルの構成」セクションのステップに従って、AIプロファイルを作成および構成し、この機能を利用します。
親トピック: データのロード
ファイル・システムからのデータのロード
ファイル・システム・ディレクトリからAutonomous Databaseにファイルをロードできます。
表のデータにフィルタを設定して、指定したデータのみをロードすることができます。たとえば、CSVファイルのみにファイルを制限するには、ファイル拡張子フィルタに*.CSVと入力します。
- 「Data Studio」タブで、「Data Load」を選択します。「データ・ロード」ダッシュボードを表示します。
- 「LOAD DATA」をクリックし、「ファイル・システム」オプションを選択します。
ページの上部で、ファイルのロード元となるディレクトリを選択する必要があります。ページの左側にはナビゲータ・ペインがあり、そこでデータを含むディレクトリ内のファイルを選択します。ページの右側には、データ・ロード・ジョブ用のファイルおよびフォルダをステージングするデータ・ロード・カートがあります。データ・ロード・ジョブを実行する前に、そのオプションを設定できます。Autonomous Databaseには、様々なコンシューマ・グループに割り当てられた事前定義済CPU/IOシェアが付属しています。ワークロードに応じて、データ・ロード・ジョブの実行中にコンシューマ・グループを低、中または高に設定できます。ディレクトリからデータベースにファイルをロードするには、次を実行します:
- データ・ロード・ジョブの準備: 詳細は、「データ・ロード・ジョブの準備」セクションを参照してください。
- データ・ロード・ジョブのファイルまたはフォルダの追加: 詳細は、「データ・ロード・ジョブのファイルまたはフォルダの追加」セクションを参照してください。
- データ・ロード・ジョブの詳細の入力: 詳細は、「データ・ロード・ジョブの詳細の入力」を参照してください。
- データ・ロード・ジョブの実行: 詳細は、「データ・ロード・ジョブの実行」セクションを参照してください。
- 実行後のデータ・ロード・ジョブに関する詳細の表示: 詳細は、「実行後のデータ・ロード・ジョブに関する詳細の表示」セクションを参照してください。
- データ・ロード・ジョブから生成された表の表示: 詳細は、「データ・ロード・ジョブから生成された表の表示」セクションを参照してください。
- データベース・アクションでのディレクトリの作成
Autonomous Databaseには、ファイルを格納できる事前構成済のdata_pump_dir
があります。ディレクトリの作成、ディレクトリの削除、およびネットワーク・ファイル・システムのアタッチを行うこともできます。
親トピック: データのロード
データベース・アクションでのディレクトリの作成
Autonomous Databaseには、ファイルを格納できる事前構成済のdata_pump_dir
があります。ディレクトリの作成、ディレクトリの削除、およびネットワーク・ファイル・システムのアタッチを行うこともできます。
たとえば、CREATE DIRECTORY
コマンドを使用して、追加のディレクトリを作成できます。データベースのDROP DIRECTORY
コマンドを使用してディレクトリを削除し、DBMS_CLOUD.LIST_FILES
を使用してディレクトリの内容をリストします。
ディレクトリの作成
ディレクトリを追加するには、CREATE ANY DIRECTORY
システム権限が必要です。CREATE ANY DIRECTORY
システム権限は、ADMINユーザーに付与されます。CREATE ANY DIRECTORY
システム権限は、ADMINユーザーが他のユーザーに付与できます。
詳細は、CREATE DIRECTORYを参照してください。
CREATE DIRECTORY
を指定すると、データベースにデータベース・ディレクトリ・オブジェクトが作成され、ファイル・システム・ディレクトリも作成されます。たとえば、ディレクトリ・パスは次のようになります:/u03/dbfs/7C149E35BB1000A45FD/data/stage
-
次のコマンドを使用すると、ルート・ファイル・システムにディレクトリを作成して、すべてのファイルを表示できます:
CREATE OR REPLACE DIRECTORY ROOT_DIR AS '';
ROOT_DIR
ディレクトリを作成した後、次のコマンドを使用すると、すべてのファイルがリストされます:SELECT * FROM DBMS_CLOUD.list_files('ROOT_DIR');
-
ADMIN以外のユーザーで
DBMS_CLOUD.LIST_FILES
を実行するには、そのユーザーにそのディレクトリに対する読取り権限を付与する必要があります。
ディレクトリを作成し、Data Studioからアクセスする方法を示します。
- データベース・アクションでディレクトリを作成します。
データベース・アクション・インスタンスにログインし、「開発」の下のSQLカードを選択します。SQLワークシートを表示できます。ここで、ディレクトリを作成し、作成したディレクトリに選択したファイル・システム名を添付します。次の例で、
FSS_DIR
はディレクトリの名前です。前述のコマンドを実行します。前述のコマンドは、次の出力を提供します。
PL/SQLプロシージャが正常に終了しました。
- ファイル・システムの添付DBMS_CLOUD_ADMIN.ATTACH_FILE_SYSTEMプロシージャを使用して、選択した名前のファイル・システムを
FSS_DIR
ディレクトリにアタッチします。BEGIN DBMS_CLOUD_ADMIN.ATTACH_FILE_SYSTEM( file_system_name => '********', file_system_location => '*******.sub1********1.********.oraclevcn.com:/********', directory_name => 'FSS_DIR', description => 'attach OCI file system' ); END; /
前述のコマンドを実行して、次の出力を表示します。
PL/SQL procedure successfully completed.
- アタッチされたファイル・システムを表示するには、次のコマンドを実行します。
SELECT file_system_name, file_system_location, directory_path FROM dba_cloud_file_systems;
ファイル・システム名、ファイル・システムの場所およびディレクトリ・パスを表示します。
- データ・スタジオ・ツールの「データ・ロード」メニューの「クラウド・オブジェクトのロード」にナビゲートすると、新しいディレクトリを添付ファイルとともに表示できます。クラウド・ストアの場所の選択ドロップダウンをクリックします。
新規に作成されたディレクトリFSS_DIR
を表示できます。データ・ロード・ツールを使用して、ファイル・システム・ディレクトリから自律型データベースにデータをロードできます。「ファイル・システムからのデータのロード」を参照してください。
親トピック: ファイル・システムからのデータのロード
共有からデータをロードしています
共有から表を選択できます。提供されたデータ共有をサブスクライブしてアクセスする必要があります。
シェアから表をロードするには、データ・ロード・ダッシュボードで「データのロード」をクリックします。データのロード・ページで「共有」をクリックします。「+共有プロバイダのサブスクライブ」をクリックして、共有プロバイダにサブスクライブします。
データ共有プロバイダへのサブスクライブ
- 「データ共有プロバイダのサブスクライブ」で、「プロバイダ名」を入力します。
- 「新規プロバイダJSONの追加」を選択し、「デルタ共有プロファイルJSON」をクリックしてJSONプロファイルをドラッグ・アンド・ドロップします。
- 「次」をクリックして、「共有の追加」タブをクリックします。
- 共有RESTエンドポイントでデータベースからホストへのネットワーク・アクセスを許可するレベルを選択し、「実行」をクリックします。この例では、「ホストへのアクセスのみを許可」が選択されています。
- 使用可能なシェアを登録するには、Available Sharesから Selected Sharesにシェアを移動し、Subscribeをクリックします。
次のスクリーンショットは、「サブスクライブ」をクリックする前に「使用可能な共有」から「選択した共有」に移動された「REVIEWS」共有を示しています。
- データ共有から選択された表から導出された外部表を作成します。
- 選択した共有から表をドラッグ・アンド・ドロップします。オプションで、「設定」をクリックして表の詳細を表示できます。
この例では、選択された表はHOTEL_REVIEWSのみです。
- オプションで、表の名前を変更し、「閉じる」をクリックできます。
この例では、名前がHOTEL_REVIEWSからHOTEL_REVIEWS_SHAREに変更されています。
- 「共有の選択」ページで「開始」をクリックし、「データ・ロード・ジョブの実行」ダイアログで「実行」をクリックして、外部表を作成します。
- 外部表が作成されると、「完了」メッセージが表示されます。
- 表の詳細を表示するには、外部表名をクリックします。
- 選択した共有から表をドラッグ・アンド・ドロップします。オプションで、「設定」をクリックして表の詳細を表示できます。
- データベース・アクションから作成された表を表示します。
- ブレッドクラムの「データベース・アクション」をクリックして、「データベース・アクション」起動パッドに戻ります。
- 「SQL」タイルをクリックします。
- 外部表を選択し、ワークシートにドラッグ・アンド・ドロップします。
表のSQL Select文が表示されます。このSQL文は、共有データを消費するために実行できます。
- 選択した共有から表をドラッグ・アンド・ドロップします
親トピック: データのロード
データ・ロードからのライブ・フィードの作成
データ・ロード・ツールは、クラウド・オブジェクト・ストア内のフォルダからデータをロードし、データ・ロードの繰返しをリアルタイムにスケジュールできるようにします。これは、データ・ロード・ジョブからのライブ・フィードの作成です。
データ・ロードが完了したら、「表の作成」または「表の削除」および「新規表の作成」オプションを使用して、オブジェクト・ストア・フォルダをロードしたカート項目からライブ・フィードを作成できます。
- セレクタをクリックして、ナビゲーション・メニューを表示します。「Data Studio」で、「データ・ロード」を選択します。
- 「データのロード」タイルを選択して、ローカル・ファイル、データベース、クラウド・ストア、ディレクトリ、シェアなどの様々なソースからデータをロードします。
- 「クラウド・ストア」をクリックして、URLまたはクラウド・ストア・リンクからオブジェクトをロードします。
- ドロップダウンからクラウド・ストアの場所を選択します。クラウド・ストアの場所を表示できない場合は、「クラウド・ストアの場所の作成」を選択して、新しいクラウド・ストアの場所を作成します。使用可能なクラウドの場所がない場合は、「Oracle Cloud Infrastructureネイティブ資格証明の作成」で説明されているステップに従います。
- クラウド・ストアの場所を選択すると、クラウド・ストレージに存在するフォルダおよびファイルのリストを表示できます。クラウド・ストアからのファイルをデータ・ロード・カートに追加し、そこでロード・ジョブの詳細を編集できます。
ノート
データ・ロード・ツールは、CSV、XLS、XLSX、TSV、TXT、XML、JSONおよびAVRO形式の単一ファイル、またはXLSX形式のファイルを含むフォルダで構成されるロード済カート項目からのライブ・フィードの作成をサポートしていません。 - フォルダを追加するには、左側のファイル・ナビゲータからフォルダをドラッグし、右側のカートにドロップします。フォルダをカートに追加すると、複数のソース・ファイルから単一のターゲット表にすべてのオブジェクトをロードするかどうかを尋ねるプロンプトが表示されます。「はい」をクリックして続行するか、「いいえ」をクリックして取り消します。複数のフォルダをカートに追加できます。各カードで表されるデータが個別の表にロードされますが、カート内のすべてのアイテムが同じデータ・ロード・ジョブの一部として処理されます。
- データ・ロード・カートから「設定」(鉛筆アイコン)を選択して、データ・ロード・ジョブの詳細を入力します。
- クラウド・ストアの場所からデータをロードする「設定」タブで、「表の作成」または「表の削除および新規表の作成」を「オプション」ドロップダウンから選択できます。
ノート
ライブ・フィード・ツールは、表を作成してデータを新しい表に挿入するか、既存の表を削除してデータを新しい表に挿入する場合にのみ、データ・ロード・ジョブと連携します。 - データ・ロード・ジョブのその他の詳細を入力します。詳細の入力の詳細は、「データ・ロード・ジョブの詳細の入力」トピックを参照してください。
- データ・ロード・カートに追加し、データ・ロード・ジョブに関する詳細を入力したら、「開始」を選択してジョブを実行します。
- データ・ロード・ジョブの実行後、データ・ロード・カートに緑色のチェック・マークが表示されます
データ・ロード・ジョブが完了したことを示します。 - データ・ロード・カートの「ライブ表フィードの作成」をクリックして、データ・ロード・ジョブからライブ表フィードを作成します。ライブ表フィードの作成が成功し、ライブ表フィードを編集する必要があることを示す正常なメッセージが表示されます。続行する場合は「はい」を、取り消す場合は「いいえ」をクリックします。「はい」を選択すると、ライブ表フィードの編集ウィザードが開きます。
- ライブ表フィードの編集ウィザードでは、ソース・フォルダのクラウド・ストアの場所と、データに適用されたオブジェクト・フィルタを表示できます。
「データ・ソース」タブの「プレビュー」ドロップダウンから、データをプレビューする任意のファイルを選択します: このフィールドには、ロードしたクラウド・ストア・フォルダに存在するファイルの合計数が表示されます。データのプレビューが表示されます。
- 「次」をクリックして、「表の設定」タブに進みます。「表の設定」タブで、データ・ロード・ジョブのプロパティとマッピングの詳細を表示できます。ノート
このタブの詳細を選択または編集することはできません。 - 「次」をクリックして、ウィザードの「プレビュー」タブに進みます。
「プレビュー」ドロップダウンから任意のファイルを選択して、ファイルを表示します。「表プレビュー」には、ドロップダウンから選択したファイルのプレビューが表示されます。
- 「次」をクリックして、ウィザードの「ライブ・フィード設定」タブを表示します。「ライブ・フィード設定」タブで、フィールドに次の値を指定します。
-
通知に対して有効: Oracle Cloud Infrastructureの通知に基づいてデータ・ソース内の新規または変更済のデータがロードされるようにするには、このオプションを選択します。このオプションを選択すると、スケジュールに従ってポーリングが開始される場合(つまり、ライブ表フィードの「スケジュール済」オプションを選択した場合)に発生する可能性のある遅延を回避できます。
「通知に対して有効」オプションを選択した場合、通知を発行するようにオブジェクト・ストア・バケットも構成する必要があります
- スケジューリングに対して有効化: データ・フィードのスケジュールを設定するには、このオプションを選択します。時間間隔フィールドに数値を入力し、バケットで新規または変更済ファイルを投票する時間タイプおよび日程を選択します。For example, to poll every two hours on Monday, Wednesday, and Friday, enter 2, select Hours, and then select Monday, Wednesday, and Friday in the appropriate fields.「Week Days」ドロップダウンから「All Days」、「Monday to Friday」、「Sunday to Thursday」または「Custom」を選択できます。「カスタム」フィールドを使用すると、「月曜日」、「火曜日」、「水曜日」、「木曜日」および「金曜日」を選択できます。
開始日と終了日を選択します。開始日を選択しない場合、現在の日時が開始日として使用されます。終了日はオプションです。ただし、終了日がないと、フィードはポーリングを継続します。
「ライブ表フィード名」、「ターゲット表名」、「コンシューマ・グループ」など、ウィザードに表示される残りのフィールドはグレー表示され、選択または編集できません。
-
「保存」をクリックして、データ・ロード・カートからライブ表フィードを保存および作成します。
親トピック: データのロード