機械翻訳について

データ・フローについて

データ・フローでは、データを整理および統合して、ユーザーがビジュアル化できるキュレートされたデータセットを作成できます。

データ・フローを使用すると、手動コーディングのスキルがなくてもデータを視覚的に操作できます。

たとえば、データ・フローを使用して、次のことを実行できます:

  • データセットの作成。
  • ソースが異なるデータの結合。
  • データの集計。
  • 機械学習モデルのトレーニングまたはデータへの予測機械学習モデルの適用。
  • OCI Visionサービスによる人工知能を使用した、オブジェクト検出、イメージ分類またはテキスト検出の実行。

データ・フローは、データ・フロー設計ペインに作成します。
data-flow-designer-new.pngの説明は以下のとおりです
図data-flow-designer-new.pngの説明

データ・フローをビルドするには、ステップを追加します。 各ステップでは、データの追加、表の結合、列のマージ、データの変換など、特定の機能を実行します。 データ・フロー・エディタを使用して、ステップを追加および構成します。 各ステップは、追加または変更時に検証されます。 データ・フローを構成したら、それを実行してデータセットを作成または更新します。

独自の列を追加したりデータを変換する場合、SQL演算子の幅広い(BETWEEN、LIKE、INなど)、条件式(CASEなど)、および関数(Avg、Median、Percentileなど)を使用できます。

データ・フローによって生成されたデータセットの更新

データ・フローを再実行して、データセットを最新の状態に保つことができます。

ノート:

データ・フローを再実行すると、データ・フローの外部の出力データセットに直接適用された変換はすべて失われます。 データセットは最初から再作成されます。

データ・フローの制限

大量のデータを処理する場合は、データ・フローの制限があることに注意してください。 データ・フローの制限を参照してください。

データ・フローのデータベース・サポート

データ・フローを使用すると、データセットおよびサブジェクト領域からデータをキュレートできます。

データ・フローは、個別またはシーケンスで実行できます。 データ・フローには複数のデータ・ソースを含めることができ、それらをどのように結合するかを指定できます。

「データの追加」ステップを使用してデータ・フローにデータを追加し、「データの保存」ステップを使用してデータ・フローからの出力データを保存します。

データ・フローからの出力データは、データセットまたはサポートされるデータベース・タイプのいずれかで保存できます。 データをデータベースに保存する場合、データ・ソースをデータ・フローのデータで上書きすることにより、データ・ソースを変換できます。 データ・ソースとデータ・フローの各表は同じデータベース内に存在し、同じ名前である必要があります。 開始する前に、サポートされているデータベース・タイプの1つへの接続を作成します。

ノート:

データ・ゲートウェイに接続されたリモート・データベースからデータを追加できます。 ただし、データ・ゲートウェイに接続されたリモート・データベースにデータを保存することはできません。

データ出力

データ・フローから次のデータベース・タイプに出力データを保存できます:
  • Oracle Autonomous AI Lakehouse
  • Oracle Autonomous AI Transaction Processing
  • Oracle Database/Oracle AI Database
  • Apache Hive
  • Hortonworks Hive
  • MapR Hive
  • スパーク

データベース・バージョン情報については、「サポートされるデータソース」を参照してください。

データ入力

データ・フローでは、データセットおよびサブジェクト領域からのデータを処理できます。 データベースから直接データをプルすることはできません。最初にデータベース表からデータセットを作成する必要があります。

データ・フロー・デザイナでの作業

データ・フロー・デザイナを使用すると、グラフィカルな設計環境でデータをキュレートおよび変換できます。

データ・フロー・デザイナでの作業:

データ・フロー・デザイナを使用して、データを変換するデータ・フロー・ステップを編成および構成します。



データ・フロー・デザイナの次の機能を使用します。

機能 アイコン 説明
コンパクト・レイアウト コンパクト・レイアウト・アイコン ステップを小さい表示領域にグループ化して、スクロールを減らします。
拡張レイアウト 拡張レイアウト・アイコン 入力データ・ソースのステップを左揃えにして、読みやすくします。
不完全なJOINまたはUNION

完全なJOINまたはUNIONアイコン

JOINまたはUNIONが行われていないデータ・ソースを示します。 青いリンク・アイコン完全なJOINまたはUNIONアイコンにマウス・ポインタを重ねると、推奨される結合ターゲット(点線)が表示され、再度クリックして結合または結合(実線)を完了します。

接続を削除するには、結合ステップ「JOINステップ」アイコンまたは結合ステップ「UNIONステップ」アイコンを右クリックし、「削除」を選択します。

ズームの機能強化 「ズーム」アイコン ズーム・インおよびズーム・アウトします。