表は、データの構造を定義します。

新しいデータを表にロードしたり、既存の場所にある参照データをロードできます。表に対するファイングレイン・アクセス制御権限を定義するには、表権限を作成します。

表は外部または管理が可能です。

外部表

外部表は、Oracle AI Data Platform Workbenchで管理されない場所に格納されるデータの構造を定義します。AIデータ・プラットフォーム・ワークベンチで外部表を作成すると、メタデータ・ライフサイクルはAIデータ・プラットフォーム・ワークベンチによって管理されます。外部表を削除すると、表定義のみが削除されます。外部表によって参照されるデータは削除されません。

ユーザーに、外部表の作成に必要な次のIAMポリシーがあることを確認します:

allow group <GroupName> to read buckets in compartment id <external-data-CompartmentId>
allow group <GroupName> to inspect objects in compartment id <external-data-CompartmentId>

外部表には追加のIAMポリシーが必要です。詳細は、Oracle AI Data Platform WorkbenchのIAMポリシーを参照してください。

管理対象テーブル

管理対象表は、AIデータ・プラットフォーム内に格納され、AIデータ・プラットフォーム・ワークベンチ・ユーザーのみがアクセスできるデータの構造を定義します。

管理対象表を削除すると、表定義および表データが削除されます。

サポートされている表形式

書式 説明 使用状況
カンマ区切りの値(CSV) データは、データを構造化するために、指定された行ベースのファイル形式のテキスト・ファイルとして格納されます。通常、ファイルの最初の行は、データの列名を含むヘッダー行です。 システム間で表形式データを交換するために使用します。ファイル内の各行は、表内の行です。
JavaScript Object Notation (JSON) データは、JavaScriptオブジェクト構文に基づいて構造化データを表すための標準テキストベースの形式で格納されます。JSONでは、オブジェクトのリストまたは階層構造がサポートされています。 ストリーム・アプリケーションで使用されます。JSONは、複雑な関係を持つ関連データの単一のドキュメントへの格納を簡素化し、リレーショナル・データ・モデルへの混沌としたリスト変換を回避します。JSONは分割できないことに注意してください。
Avro データは行ベースのバイナリ形式で格納され、スキーマはファイル・サイズを最小限に抑え、効率を最大化するためにJSON形式で格納されます。Avroは、追加フィールド、欠落フィールドおよび変更されたフィールドを管理することで、スキーマの進化を確実にサポートしています。これにより、古いソフトウェアは新しいデータを読み取ることができ、新しいソフトウェアは古いデータを読み込むことができます。データ・シリアライズ・システムとも呼ばれます。 avroファイルが分割可能かつ圧縮可能であるため、データ・ストレージに使用されます。シリアル化された行ベースのストレージは、AI Data Platformへのデータの挿入など、大量の書込みトランザクションに最適です。Avroは、高速書込み中にスキーマの進化が重要な場合にも適しています。
Parquet データは列形式のデータ形式で格納され、非常に圧縮可能で分割可能です。Parquetは、Write Once Read Many (WORM)パラダイム用に最適化されています。書き込み速度は遅くなりますが、特にカラムのサブセットにのみアクセスする場合、読み取り速度は非常に速くなります。 圧縮アルゴリズムが列データ・フォーマットでより適切に機能するため、ビッグ・データの問題を解決するために使用されます。ビッグ・データは、イメージ、ビデオ、ドキュメント、構造化データ表などの様々な形式で格納できます。Parquetは、データの一部を読み取るときにワークロードが多い場合に適しています。たとえば、データセットに多数の列があるが、列のサブセットにのみアクセスする場合です。Sparkに依存している場合、または複数のサービスがオブジェクト・ストレージに格納されている同じデータにアクセスする場合に理想的です。
Optimized Row Columnar(ORC) データは、行のコレクションに列形式で単一のファイルに格納されます。 クラスタ全体での行コレクションのパラレル処理に使用されます。読取りトランザクションが書込みトランザクションよりも多い場合、または圧縮が優先される場合に最適です。
デルタ データは、ACIDトランザクションおよびスケーラブルなメタデータ処理のためのJSONファイルベースのトランザクション・ログを使用してParquetデータファイルを拡張する列形式で格納されます。 トランザクションのサポートに使用されます。

制限事項

Oracle AI Data Platformの表には、次の制限が適用されます。

  • ボリューム内またはボリューム上のデータファイルまたはディレクトリに外部表を定義することはできません。
  • 別の外部表または外部ボリュームにすでに使用されているバケットおよびそのディレクトリ(あるいはその両方)に外部表を定義することはできません
  • マスター・カタログでビューを表示またはリストすることはできません。

管理対象表の作成

管理するスキーマの表を作成できます。

  1. 表を作成するスキーマにナビゲートします。
  2. 「表」タブを選択します。
  3. 「表の作成」アイコン 「表の作成」をクリックします。

    表タイプ「管理対象」が選択された表トレイの作成

  4. 「表タイプ」「管理対象」を選択します。
  5. 「管理対象表形式」から表の形式を選択します。
  6. 表データを含むファイルをドラッグ・アンド・ドロップするか、クリックしてファイルの場所を参照します。
  7. 表の名前と説明を指定します。
  8. オプション: パーティションを追加するには、「パーティション・キー(オプション)」を展開します。「パーティションの追加」をクリックし、データ列を選択します。
  9. オプション: 表プロパティをデータ・カタログのメタデータに追加するには、「表プロパティ(オプション)」を展開します。「プロパティの追加」をクリックし、プロパティとその値を指定します。
  10. 「作成」をクリックします。

外部表の作成

OCIオブジェクト・ストレージにデータを含む外部表を作成できます。

  1. 表を作成するスキーマにナビゲートします。
  2. 「表」タブを選択します。
  3. 「表の作成」アイコン 「表の作成」をクリックします。

    表タイプ「外部」が選択された状態で開いた表の作成ページ

  4. 「表タイプ」「外部」を選択します。
  5. データが格納されているOCIオブジェクト・ストレージから、コンパートメント、バケットおよびフォルダを選択します。選択できるオブジェクトは、ログイン・ユーザーのIAM権限に基づきます。
  6. 表の名前と説明を指定します。
  7. オプション: 表プロパティをデータ・カタログのメタデータに追加するには、「表プロパティ(オプション)」を展開します。「プロパティの追加」をクリックし、プロパティとその値を指定します。
  8. 「作成」をクリックします。

表を編集

管理する表の詳細を変更できます。

  1. スキーマにナビゲートします。
  2. 「表」タブを選択します。
  3. 編集する表の横にあるアクションの3つのドット・アイコン 「アクション」をクリックします。
    • 「名前変更」をクリックして表の名前を変更します。新しい名前を入力し、[Enter]を押します。
    • 表の説明を変更するには、「説明の編集」をクリックします。新しい説明を入力し、「保存」をクリックします。

表の詳細を表示

スキーマ内の表の詳細を表示できます。

  1. スキーマに移動します。「表」タブをクリックします。
  2. 詳細を表示するボリュームの名前をクリックします。ボリュームの横にあるアクションの3つのドット・アイコン 「アクション」をクリックし、「表示」をクリックすることもできます。
  3. 「詳細」タブをクリックします。

表の削除

管理するスキーマから表を削除できます。

  1. 表を削除するスキーマにナビゲートします。
  2. 「表」タブをクリックします。
  3. 削除する表の横にあるアクションの3つのドット・アイコン 「アクション」をクリックし、「削除」をクリックします。
  4. 「削除」をクリックします