oraclesai.clustering.LISAHotspotClustering

class LISAHotspotClustering(column=None, spatial_weights_definition=None, max_p_value=None, supported_quadrants=None, seed=None, n_jobs=1)

ホット・スポット・クラスタ化の実装。 高値または低値を持つフィーチャの空間クラスタ、および空間外れ値を識別します。 サンプルごとに、ローカルのMoranのI、p値、およびクラスタ・タイプを表すラベルが計算されます。 p値はMoranのIの統計的意義を表します。 4つの異なるラベルがあります。

  • 1 (高-高) 高い値で囲まれた高い値(ホット・スポットとも呼ばれます)。

  • 2 (低-高) 高い値で囲まれた低い値。

  • 3 (低-低) 低い値で囲まれた低い値(コールド・スポットとも呼ばれます)。

  • 4 (高-低) 低い値で囲まれた高い値。

パラメータ:
  • column - int, default=None。 ローカル相関のコンピュートに使用される列。 Noneの場合、Xの1つの列がモデルに収まることが予想されます。

  • spatial_weights_definition - SpatialWeightsDefinition, default=None。 空間関係の指定。 ネイバーの識別に使用される基準を定義します(KNNWeightsDefinition、DistanceBandWeightsDefinitionなど)。

  • max_p_value - float, default=None。 特定の値を下回るp値を持つリージョンのみをラベル付けするために使用されます

  • supported_quadrants - 整数のリスト。default=None。 これらの四分位数からの観測だけにラベルが付けられます。 値は、ロケーション、1 (高)、2 (低)、3 (低)、4 (高)を示します。

  • seed - int, default=None。 条件付きランダム化の再現性を確保するためにシードされます。

  • n_jobs - int, default=None。 同時に実行されているジョブの最大数。 Noneは、n_jobs=1と解釈される'unset'のマーカーです。

メソッド

__init__([column, ...])

fit(X[, y, geometries, spatial_weights, ...])

指定された列に基づいてローカル自動相関索引を計算します。

fit_predict(X[, y, geometries, ...])

クラスタリング・モデルをトレーニングし、各観測に割り当てられたラベルを返します。

get_params([deep])

このエスティメータのパラメータを取得します。

set_params(**params)

このエスティメータのパラメータを設定します。

属性

Is

各サンプルのローカルMoranのI配列。

labels_

各サンプルの四角形のロケーションを示す整数の配列。

ps

各サンプルのp値を持つ配列。

regions_

クアドラントをキーとして、および対応するクアドラントのサンプルによって形成されるすべての連続リージョンを値として含むディクショナリ。