ビジュアライゼーションには、どのような統計分析を追加できますか。

次に示す統計分析をビジュアライゼーションに追加することで、データに対するより優れたインサイトを得られます。
stat_analytics-png.pngの説明が続きます
図stat_analytics-png.pngの説明

予測

予測関数は線形回帰を使用して、線形トレンドに沿った既存の値に基づいて将来の値を予測します。

将来の期間を設定して、データの時系列に基づいて値を予測できます。「ビジュアライゼーションへの予測の追加」を参照してください。

Oracleでは、次の予測モデル・タイプをサポートしています。

  • 自己回帰和分移動平均(ARIMA) - 過去の時系列データが非季節性であるが、将来を説明し予測するために十分な観測値(少なくとも50、できれば100を超える観測値)を提供する場合、このタイプが適しています。
  • 季節性ARIMA - データに一定期間にわたって繰り返される定期的な変化のパターンがある場合に適しています。たとえば、月次データの季節性は、夏季の月に高い値が出現し、冬季の月に低い値が出現する場合などです。
  • 三重指数平滑化(ETS) - 明確なパターンを持たない反復時系列データを分析する場合に適しています。このモデル・タイプは、データが時間の経過とともに一定の間隔で繰り返される傾向を考慮した指数移動平均を生成します。
  • Prophet - このタイプは、データセットが長期間にわたる場合、複数の強い季節性がある場合、以前に知られていた不規則なイベントが含まれている場合、データ・ポイントが欠落している場合、または大きな外れ値がある場合に適しています。

設定をより細かく制御する場合や、他のビジュアライゼーションで予測を使用する場合は、FORECAST関数を使用してカスタム計算を作成することもできます。「分析関数」を参照してください。

クラスタ

クラスタ関数は、同じグループのオブジェクトが、他のグループのオブジェクトよりも多くのコヒーレンスと近接性を示すように、一連のオブジェクトをグループ化します。たとえば、散布図に色を使用して、異なるグループのクラスタを表示できます。「ビジュアライゼーションでのクラスタまたは外れ値の作成」を参照してください。

  • K平均クラスタリング - "n"観察を"k"クラスタにパーティション化し、各観察が最も近い平均を持つクラスタに属して、クラスタのプロトタイプとして機能するようにします。
  • 階層的クラスタリング - 集約的(ボトムアップ)アプローチまたは分割的(トップダウン)アプローチのいずれかを使用して構築されたクラスタの階層を作成するために使用します。
設定をより細かく制御する場合や、他のビジュアライゼーションでクラスタを使用する場合は、CLUSTER関数を使用してカスタム計算を作成することもできます。「分析関数」を参照してください。

外れ値

外れ値関数は、個々の値の平均期待値から最も遠い場所にあるデータ・レコードを表示します。たとえば、他の観察から最も離れている極端な値は、このカテゴリに分類されます。外れ値は、測定、実験的エラーまたは希少さの変動を示すことができます。すでにクラスタがあるチャートに外れ値を追加すると、その外れ値は別の形状として表示されます。

外れ値では、K平均法クラスタリングまたは階層クラスタリングを使用できます。「ビジュアライゼーションでのクラスタまたは外れ値の作成」を参照してください。

設定をより細かく制御する場合や、他のビジュアライゼーションで外れ値を使用する場合は、OUTLIER関数を使用してカスタム計算を作成することもできます。「分析関数」を参照してください。

基準線

参照線関数は、X軸またはY軸の値に対応するチャート内の水平線または垂直線を定義します。「ビジュアライゼーションへの基準線の追加」を参照してください。

  • 折れ線 - 平均、最小または最大の間の折れ線を計算するように選択できます。たとえば、航空会社業界では、時間に対する旅客の数が想定されている場合、参照線は特定の月の旅客の数が平均を上回っているか下回っているかを示すことができます。
  • 範囲 - 範囲は、データポイントの上下範囲を表します。カスタム・オプションまたは標準偏差関数を選択し、平均、最大および最小を指定できます。たとえば、月別売上を分析し、平均から最大までのカスタム参照範囲を使用する場合は、売上が平均を上回り、最大値を下回っている月を特定できます。

トレンド線

トレンド線関数は、問題のメトリックの一般的なコースを示します。トレンド線は、グラフ上の多数のポイントを結ぶ直線です。トレンド線は、ビジュアライゼーションでの値セットのグループの特定の方向を分析するのに役立ちます。ビジュアライゼーションへの統計分析の追加を参照してください。

  • 線形 - 線形データで使用します。データ・ポイント内のパターンが線に似ている場合、データは線形です。線形トレンド線は、メトリックが一定の速度で増減していることを示します。
  • 多項式 - データの変動時はこの曲線を使用します。これは、大量のデータセットでの損益を分析する場合などに役立ちます。
  • 指数 - この曲線は、データ値が急速に増減する場合に使用します。データにゼロまたはマイナスの値が含まれている場合は、指数トレンド線を作成できません。

設定をより細かく制御する場合や、他のビジュアライゼーションでトレンド線を使用する場合は、TRENDLINE関数を使用してカスタム計算を作成することもできます。「分析関数」を参照してください。