データベース内アルゴリズムの機能
Oracle Machine Learningでは、データ・サイエンティスト、開発者、データ・エンジニアの生産性を高めるツールのスイートが提供されます。このスイートにより、機械学習モデルの開発、評価およびデプロイメントが合理化されます。これは、この分野の専門家にも専門家以外にも対応しています。
データベース内アルゴリズムの機能の概要を次に示します。
-
データベース内機械学習:
- 別のMLエンジンにデータをエクスポートすることなく、Oracle Database内でML操作を直接実行できます。この手法によって、データ移動が不要になり、効率性とデータ・セキュリティが確保されます。
- Oracleでは、並列化され分散されたアルゴリズムが使用され、処理の高速化のために、複数のクラスタ・ノードにわたりシームレスにスケーリングされます。
- メモリー使用量が最適化され、高速スコアリングのためにExadataのストレージ層機能プッシュダウンが利用されます。
-
スケーラビリティとデプロイメント:
- OMLのスケーラブルなアーキテクチャを使用して、バッチおよびリアルタイムで予測を実行できます。
- SQL問合せで予測演算子を使用するか、PythonやRなどのプログラミング言語とともに直接それらを使用できます。
- Autonomous Database Serverless上のOMLでは、RESTインタフェースを介したノーコード・デプロイメントがサポートされており、様々な技術スキルを持つユーザーがデプロイメントにアクセスできるようになっています。
-
第一級のデータベース・オブジェクトとしての機械学習モデル:
- データベース・レベルのアクセス制御によってモデルを管理して、安全な処理を実現できます。
- 監査を通じてユーザー・アクションを追跡し、使用状況と変更点に関するインサイトを提供できます。
- 効率的な共有および再利用のために、データベース間でモデルをエクスポートおよびインポートできます。
- MLモデルのバックアップ、リカバリ、セキュアな保管のためにデータベース・ツールを活用できます。
-
データ準備:
クレンジング、フィルタリング、正規化、サンプリングなどの主要なステップを自動化できます。ほとんどのデータは、マイニング前に様々な方法での整備、フィルタリング、正規化、サンプリング、変換を必要とします。機械学習プロジェクトの取組みのうち、その80%までがデータの準備に費やされることもよくあります。
-
テキスト処理:
- 非構造化テキストから有用な情報を抽出し、機械学習手法を使用してそれを構造化データに変換できます。
- テキスト・トークンまたは特徴を使用すると、テキスト・データからインサイトを問合せて導出して、ビジネス上の課題に効果的に対処できます。
-
パーティション化モデル:
- 特性に基づいてデータを複数のサブセットに分割し、複数のモデルを効率的に編成できます。
- パーティション化を使用して様々なデータセットを管理しながら、明瞭性を維持し、モデル管理を改善します。
-
ソリューションの市場投入までの時間の短縮:
- SQL予測演算子とRESTインタフェースを使用してMLモデルを瞬時にデプロイできます。
- 他のツールなしで、R環境やPython環境から直接予測を実行できます。
- Autonomous Database Serverlessでのデプロイメントを簡略化して実用的なインサイトを迅速に提供でき、専門家と専門家以外の両方のためのワークフローを合理化できます。
トピック:
- 自動データ準備
機械学習モデルは、多くの場合、トレーニング前にデータ変換が必要になります。Oracle Machine Learning (OML)では、自動データ準備(ADP)を使用してこのプロセスが自動化されます。ADPは、OML4SQL、OML4PyおよびOML4Rのデータベース内モデルに適用され、それにより、データ変換が容易になります。 - 統合テキスト・マイニング
OMLでの統合テキスト・マイニングでは、SQLとPL/SQLを使用して、Oracle Database内でテキスト分析を直接実行できます。この統合により、データベース環境の外部にデータを移動する必要なく、非構造化テキスト・データから有意義なインサイトを抽出できるようになります。 - パーティション化モデルについて
パーティション化モデルでは、特定の属性に基づいてデータセットを複数のパーティションに分割し、パーティションごとにモデルを作成できます。システムによってこれらのモデルの作成と管理が自動化されるため、手作業が減ります。
親トピック: データベース内機械学習とは