機械翻訳について

1.1.3 ビジネス上の問題の定義

企業は、ドキュメントの分類、財務成果の予測、隠れたパターンや異常の検出などの問題に直面しています。 機械学習は、十分なデータによってビジネス上の問題を明確に理解し、意味のある結果を得るために適切な質問をする方法を習得していれば、このような問題の解決を支援できます。

データの準備、ML手法の適用および結果の評価にはスキルが必要です。 機械学習を通じて発見されるパターンは、問題をどのように定式化するかによって大きく異なることがあります。 たとえば、"ダイレクト・メール・キャンペーンへの反応を向上させる"方法を知ろうとするのではなく、過去にキャンペーンに対して反応した顧客の特性を見つけようとする場合があります。 その場合、見込み客の特定のプロファイルがダイレクト電子メール・キャンペーンに反応するかどうかを分類できます。

機械学習の形式の多くは予測です。 たとえば、あるモデルでは、教育やその他の人口統計学的要素に基づいて収入レベルを予測できます。 予測には、確率(この予測が正しいことの確からしさ)が関連しています。 予測確率は信頼度(この予測を信頼できる程度)とも呼ばれます。 一部の予測機械学習では、特定の結果を示す条件である、ルールが生成されます。 たとえば、あるルールは、学士号を持っていて特定の地域に住んでいる人は、収入が地域の平均収入よりも高いことが多い、ということを表します。 ルールには、支持度(母集団のうちこのルールに適合する個体の割合)が関連しています。

機械学習のその他の形式として、データ内のグループを識別するというものがあります。 たとえば、モデルによって、母集団のうち、収入が特定の範囲内にある集団、良好な運転歴を持つ集団、年単位で新車をリースする集団を識別するような場合です。