機械学習の概要

機械学習は、人工知能(AI)のサブセットであり、自らが使用したデータに基づいて学習したりパフォーマンスを向上させるシステムを構築することが主な目的となっています。

機械学習とは

機械学習とは、データ内の未知の関係性を見つける手法です。

機械学習とAIという用語は、よく同義的に使用されます。重要な違いとして、すべての機械学習はAIですが、すべてのAIが機械学習であるわけではありません。機械学習は、大量に保管されている可能性があるデータを自動的に検索して、単純な統計分析では得られないパターンや傾向を発見します。機械学習は、モデルを作成するデータのパターンを識別する高度なアルゴリズムを使用します。これらのモデルを使用して、予測と予想を作成し、データを分類できます。

機械学習の主な特徴は次のとおりです。

  • パターンの自動検出

  • 発生確率の高い結果の予測

  • 実用的な情報の作成

  • 大量になる可能性があるデータを分析する機能

機械学習は、従来の演繹的な問合せ手法やレポート手法では対処できない問題について、答えを得ることができます。

機械学習の利点

機械学習は、データ内のパターンや関係性の検出に役立つ強力なテクノロジです。

傾向とパターンの検出 - 機械学習では、データに隠された情報を発見します。ユーザーは、長期にわたってデータを処理してきた結果、重要なパターンについてはすでに認識している可能性があります。機械学習では、そうした経験的観測の追認や適切性の確認ができ、その上で、簡単な観測ではすぐには見分けられない新たなパターンを発見できます。機械学習では、因果関係以外の予測的な関係性を発見できます。たとえば、機械学習によって、収入が$50,000から$65,000で特定の雑誌を購読する男性は特定の製品を購入する傾向にある、と判断されたとします。ユーザーは、この情報をマーケティング戦略の開発に利用できます。機械学習では大量のデータを処理でき、機械学習を財務分析に使用できます。利点として、株価予測(アルゴリズム取引)やポートフォリオ管理などがあります。

データ駆動型の意思決定 - 多くの企業がビッグ・データを保有し、そのデータから意味のある情報を抽出することは、データ駆動型のビジネス上の意思決定を行う上で重要です。機械学習アルゴリズムを利用することで、組織はデータを知識や実用的な情報に変換できます。変化する要求により、企業は機械学習手法を使用することで、より適切な意思決定をより迅速に行うことができます。

おすすめ製品 - 機械学習の結果を使用して、オンラインでの顧客の行動パターンやマーケティング・キャンペーンに対する顧客の反応に基づいて、関連性の高い有益な製品を販促したり推奨することによって、顧客の意思決定に影響を与えることもできます。

不正、異常およびセキュリティ・リスクの検出 - 金融サービス部門は、異常パターンや不正を発見し、新たな不正行為にさらにもっと迅速に対応することで、機械学習アルゴリズムや手法の恩恵を受けてきました。今日、企業や政府は、ビジネスおよび情報共有をオンラインで行っています。このような場合、ネットワーク・セキュリティが問題となります。機械学習は、異常な動作を検出し、自動的に是正処置を講じるのに役立ちます。

小売分析 - 機械学習は、顧客の購入パターンを分析して、ターゲット顧客にプロモーション・オファーを提供するの役立ちます。このサービスは、優れたカスタマ・エクスペリエンスを保証し、顧客ロイヤルティを向上させます。

健康管理 - 医療用途での機械学習が普及しつつあり、患者や医師を支援しています。レントゲン写真、CT、MRI、PET画像、放射線科レポートなどの画像を綿密に調べて知的意思決定を行うために、高度な機械学習手法が放射線医学で使用されています。機械学習ベースの自動検出および診断は実際の放射線科医の診断と同等以上であると報告されています。機械学習アプリケーションには、乳癌を検出するようトレーニングされているものもあります。医療分野における機械学習のもう1つの一般的な用途は、自動請求処理です。機械学習を利用するアプリケーションのいくつかは、脳卒中、糖尿病、冠動脈疾患、腎不全などの様々な条件における患者のリスクを指摘したり、必要となる可能性がある薬物療法または処置を勧めることもできます。

まとめると、機械学習では次のことが可能です。

  • 傾向とパターンを容易に識別する
  • 製品マーケティングと販売の予測を簡素化する
  • 早期の異常検出を促進する
  • "学習"により手作業を最小化する
  • 多次元データを処理する

ビジネス上の問題の定義

企業は、ドキュメントの分類、財務成果の予測、隠れたパターンや異常の検出などの問題に直面しています。機械学習は、十分なデータによってビジネス上の問題を明確に理解し、意味のある結果を得るために適切な質問をする方法を習得していれば、このような問題の解決を支援できます。

データの準備、ML手法の適用および結果の評価にはスキルが必要です。機械学習を通じて発見されるパターンは、問題をどのように定式化するかによって大きく異なることがあります。たとえば、"ダイレクト・メール・キャンペーンへの反応を向上させる"方法を知ろうとするのではなく、過去にキャンペーンに対して反応した顧客の特性を見つけようとする場合があります。その場合、見込み客の特定のプロファイルがダイレクト電子メール・キャンペーンに反応するかどうかを分類できます。

機械学習の形式の多くは予測です。たとえば、あるモデルでは、教育やその他の人口統計学的要素に基づいて収入レベルを予測できます。予測には、確率(この予測が正しいことの確からしさ)が関連しています。予測確率は信頼度(この予測を信頼できる程度)とも呼ばれます。一部の予測機械学習では、特定の結果を示す条件である、ルールが生成されます。たとえば、あるルールは、学士号を持っていて特定の地域に住んでいる人は、収入が地域の平均収入よりも高いことが多い、ということを表します。ルールには、支持度(母集団のうちこのルールに適合する個体の割合)が関連しています。

機械学習のその他の形式として、データ内のグループを識別するというものがあります。たとえば、モデルによって、母集団のうち、収入が特定の範囲内にある集団、良好な運転歴を持つ集団、年単位で新車をリースする集団を識別するような場合です。

実行する処理

複数の機械学習手法("マイニング機能"とも呼ばれる)は、Oracle DatabaseとOracle Autonomous Databaseを介して使用できます。ビジネス上の問題に応じて、適切なマイニング機能またはマイニング機能の組合せを特定し、ソリューションを最も効果的にサポートする1つ以上のアルゴリズムを選択できます。

一部のマイニング機能では、複数のアルゴリズムから選択することも可能です。特定の問題については、ある手法またはアルゴリズムが他のものより適していたり、複数のアルゴリズムを使用して問題を解決できることもあります。

次の図は、Oracle DatabaseおよびOracle Autonomous Databaseで利用できる機械学習手法の選択方法についての基本的な考え方を示しています。

OMLは、分類、回帰、クラスタリング、特徴抽出、異常検出、相関(マーケット・バスケット分析)、時系列などの様々な機械学習手法を実行するために一連の幅広いインデータベース・アルゴリズムを提供することで、Oracle Database内で機械学習機能を提供します。その他に、属性重要度、行重要度、ランキングなどの手法もあります。OMLでは、Oracle Databaseの組込み機能を使用して、スケーラビリティ、改良済メモリーおよびパフォーマンスを最大化します。また、OMLはPython、Rなどのオープン・ソース言語と統合されています。RとPythonのオープン・ソース・パッケージを使用すると、OML4PyとOML4Rからの埋込み実行と組み合せて、この一連の手法およびアルゴリズムを拡張できます。

インタフェースを介した詳細の検出

Oracleでは、SQL、RおよびPython用のプログラミング言語インタフェースと、OML AutoML UIやOracle Data Minerなどのコーディング不要のユーザー・インタフェース、およびOMLサービスによるRESTモデルの管理とデプロイメントをサポートしています。

Oracle Machine Learning Notebooks (OML Notebooks)は、Apache Zeppelinテクノロジに基づいており、Oracle Autonomous Database (Autonomous Data Warehouse (ADW)、Autonomous Transactional Database (ATP)およびAutonomous JSON Database (AJD))で機械学習を実行できるようにします。OMLノートブックを使用すると、データの探索、視覚化および準備を行い、分析手法を開発してドキュメント化できます。

AutoMLユーザー・インタフェース(AutoML UI)は、コーディングを必要としない自動化された機械学習を提供するOracle Machine Learningインタフェースです。AutoML UIで実験を作成して実行すると、アルゴリズムと特徴の選択、およびモデルのチューニングと選択が自動的に実行されるため、生産性が向上し、モデルの精度とパフォーマンスが向上します。広範なデータ・サイエンス・バックグラウンドを持たないビジネス・ユーザーは、AutoML UIを使用して機械学習モデルを作成およびデプロイできます。

Oracle Machine Learning Services (OML Services)では、OML機能を拡張して、REST APIを介してインデータベースOMLモデルとサードパーティのOpen Neural Networks Exchange (ONNX)形式の機械学習モデルの両方のモデル・デプロイメントおよびモデル・ライフサイクル管理をサポートします。Oracle Machine Learning ServicesのREST APIは、Oracle Autonomous DatabaseでホストされるREST APIエンドポイントを提供します。これらのエンドポイントを使用して、機械学習モデルをそのメタデータとともに格納し、モデルのスコアリング・エンドポイントを作成できます。

Oracle Machine Learning for Python (OML4Py)では、Oracle Autonomous Databaseサービスに格納されているデータまたはPython APIを使用してOracle Autonomous Databaseサービスを介してアクセス可能なデータに対して、データ変換や統計分析、機械学習分析、グラフィカル分析のためのPythonコマンドおよびスクリプトを実行できます。OML4Pyは、PythonユーザーがPython構文を使用してデータベース表およびビューのデータを操作できるようにするPythonモジュールです。OML4Pyの関数およびメソッドは、データベース内で実行できるように、選択したPython関数のセットをSQLに透過的に変換します。OML4Pyユーザーは自動機械学習(AutoML)を使用して、自動化されたアルゴリズム選択と特徴選択、およびモデルのチューニングと選択により、ユーザーの生産性と機械学習の結果を向上させることができます。Embedded Python Executionを使用すると、Autonomous Database環境によって生成されたPythonエンジンでユーザー定義Python関数を実行できます。

Oracle Machine Learning for R (OML4R)は、ユーザー定義R関数を本番環境に即時デプロイできる、Rでのエンドツーエンド分析プロセス用のデータベース中心の環境を提供します。OML4Rは、RパッケージとOracle Database機能のセットで、これを使用するとRユーザーは、SQLを使用しなくてもデータベース常駐データを操作したり、1つ以上のデータベースが制御するRエンジンでユーザー定義R関数("スクリプト"とも呼ばれる)を実行できます。OML4Rは、Oracle DatabaseおよびOracle Database Cloud Serviceに同梱されています。

Oracle Machine Learning for SQL (OML4SQL)では、強力なインデータベース機械学習アルゴリズムへのSQLアクセスが可能です。OML4SQLを使用して、アプリケーションおよびダッシュボードにインテリジェント機能を追加できる予測的かつ記述的な機械学習モデルを構築してデプロイできます。OML4SQLは、Oracle Database、Oracle Database Cloud ServiceおよびOracle Autonomous Databaseに同梱されています。

Oracle Data Miner (ODMr)は、Oracle SQL Developerの拡張です。Oracle Data Minerは、データ内の隠れたパターン、関係性およびインサイトを発見するためのグラフィカル・ユーザー・インタフェースです。ODMrには、データの探索と準備、機械学習テクノロジの適用に使用するステップを定義および取得するためのドラッグ・アンド・ドロップ・ワークフロー・エディタがあります。