oraclesai.regression
- class GWRRegressor(spatial_weights_definition=None, bandwidth=None, fixed=True)
GWRモデルは、近傍内の観測からターゲット変数と説明変数を組み込むことで、データセット内のすべての観測の局所回帰モデルをトレーニングし、独立変数と従属変数の間の関係を局所性によって変えることができます。
- パラメータ:
spatial_weights_definition - SpatialWeightsDefinition, default=None。 ネイバー間の空間関係を指定します。
bandwidth - scalar, default=None。 距離または近接Kのいずれかで構成される帯域幅の値。 None以外の場合、
spatial_weights_definition
パラメータを無視し、fixed
に従って空間ウェイトを定義します。fixed
がTrueの場合、DistanceBandWeightsDefinition
を使用します。それ以外の場合、KNNWeightsDefinition
を使用します。fixed - boolean, default=True。 基準距離ベースのカーネル関数ではTrue、適応近傍関数ではFalse。
- property betas
- 返り値:
トレーニング済GWRモデルの推定パラメータ(n x k)を含む2D配列
- property diagnostics
- 返り値:
トレーニング済モデルの統計を含むSpatialDiagnosticsインスタンス。 モデルが定義されていない場合、Noneが返されます
- fit(X, y, geometries=None, crs=None)
データセット上のすべてのサンプルに対して局所的な線形回帰を実行し、指定された帯域幅内にあるロケーションの従属変数および非依存変数を組み込みます。
spatial_weights_definition
が定義されている場合、パラメータbandwidth
は無視され、空間重みから帯域幅が取得されます。spatial_weights_definition
が定義されていない場合は、座標を使用して帯域幅を推定します。- パラメータ:
X - シェイプ(n_samples、n_features)の{numpy array, geopandas dataframe, vector dataframe}。 独立変数
y - {pandas.DataFrame, numpy 1D array or string}. 文字列として指定した場合、XはDataFrameである必要があります。
geometries - shapely array, default=None。
X
の各サンプルのジオメトリ・データ。crs - pyproj.crs.CRS, default=None。 座標参照系。
X
がnumpy配列の場合にのみ使用されます。 CRS情報がX
で使用可能な場合(つまり、SpatialDataFrameまたはGeoDataFrame)は無視されます
- 返り値:
self Fitted estimator。
- property k
- 返り値:
係数を推定する変数の数(ラムダを除く定数を含む)
- property model_type
- 返り値:
定義された回帰モデル
- predict(X, geometries=None)
指定されたデータを使用してGWRモデルを評価します。 モデルが定義されていない場合、Noneが返されます。 予測セットの各行に対してローカル・モデルを構築します。 各ローカル・モデルの予測を含む1D numpy配列を返します。
- パラメータ:
X - シェイプ(n_samples、n_features)の{numpy array, geopandas dataframe, vector dataframe}。 独立変数
y - {pandas.DataFrame, numpy 1D array or string}. 文字列として指定した場合、XはDataFrameである必要があります。
geometries - shapely array, default=None。 Xの各サンプルのジオメトリ・データ。
crs - pyproj.crs.CRS, default=None。 座標参照系。 Xがnumpy配列の場合にのみ使用されます。 XでCRS情報が使用可能な場合(XがSpatialDataFrameまたはGeoDataFrameの場合)は無視されます
- 返り値:
指定されたデータのターゲット変数の予測。
- property predy
- 返り値:
トレーニング・データの予測を含む配列
- score(X, y, sample_weight=None, geometries=None)
回帰スコア関数またはR-Squaredの値を返します。 独立変数から予測可能な従属変数の変動の割合を表します。 最適なスコアは1.0であり、モデルは任意に悪くなる可能性があるため、負の値になる可能性があります。 入力を無視して常にyの予想値を予測する定数モデルでは、R-Squaredスコアは0になります。
- パラメータ:
X - シェイプ(n_samples、n_features)の{numpy array, geopandas dataframe, vector dataframe}。 独立変数
y - {pandas.DataFrame, numpy 1D array or string}. 文字列として指定した場合、XはDataFrameである必要があります。
sample_weight - 各サンプルのスコアに対する加重コントリビューション。
geometries - shapely array, default=None。
X
の各サンプルのジオメトリ・データ。
- 返り値:
回帰スコア関数またはR-Squaredの値を返します。 独立変数から予測可能な従属変数の変動の割合を表します。
- property summary
- 返り値:
トレーニング済モデルのサマリー
- property u
- 返り値:
トレーニング済モデルの残余を含む配列
- class GeographicalRegressor(global_model=None, model_cls=None, spatial_weights_definition=None, bandwidth=None, fixed=True, local_weight=0.25, **kwargs)
地理的回帰交渉。 グローバル・モデルと複数のローカル・モデルを使用して回帰を実行します。
- パラメータ:
global_model - scikit-learnエスティメータ・インスタンス(default=None)。 グローバル・モデルとして使用されるトレーニング済モデル。 ローカル・モデルは、このモデルと同じタイプになります。
model_cls
がNoneの場合は必須です。model_cls - scikit-learnエスティメータのクラス。default=None。 グローバル・モデルおよびローカル・モデルのタイプ。 (
global_model
ではなく)model_cls
を指定すると、グローバル・モデルがトレーニングされます。global_model=None
の場合に必要です。model_cls
作成パラメータはkwargs
として指定されます。spatial_weights_definition - SpatialWeightsDefinition, default=None。 空間関係の指定。 この基準は、データを近所にグループ化し、ローカル・モデルをトレーニングするために使用されます。
bandwidth - intまたはfloat、default=None。 距離(fixed=True)または最も近い近傍の数(fixed=False)。bandwidth + fixedは、空間関係の指定を設定する別の方法です。
spatial_weights_definition
が設定されている場合は無視されます。fixed - bool, default=True。 帯域幅が距離を表す場合は真。 Falseは、最も近い隣人の数です。
local_weight - float (0.0から1.0)、default=0.25。 ローカル・モデルの予測に関連付けられた重み。
kwargs - パラメータ
model_cls.
を使用して作成された内部モデルの追加パラメータ
- fit(X, y, geometries=None, crs=None, spatial_weights=None, spatial_weights_definition=None, fit_global_model=True, n_jobs=1, backend=None, batch_size=None)
地理的回帰モデルをトレーニングします。 内部的には、グローバル・モデル(
fit_global_model=True
の場合)と複数のローカル・モデルがトレーニングされます。 ローカル・モデルが各地域に対して作成されます。 近傍は、空間的に関連するX
からの複数のサンプルを含む空間リージョンです。 近隣は、モデルの作成時間(spatial_weights_definition
、bandwidth
)で指定された空間関係を使用するか、トレーニングのパラメータとして渡された空間重みマトリックス・オブジェクトを使用して構築されます。- パラメータ:
X - SpatialDataFrame、DataFrame、GeoDataFrameまたは2D numpy配列。 期待されるシェイプは(n_samples、n_features)です。 データの予測。 SpatialDataFrameまたはGeoDataFrameの場合、ジオメトリは列として
X
にあります。X
に列yが含まれている場合、パラメータy
はその列の名前を指定する必要があります。y - 1D配列または文字列。 ターゲット値
X
にターゲット値を含む列が含まれている場合、このパラメータはかわりにその列の名前を指定します。geometries - Shapelyジオメトリのリスト。文字列(列名)またはNone、default=None。
X
に関連付けられたジオメトリ。X
がSpatialDataFrameまたはGeoDataFrameで、X
にジオメトリがその列の1つとして含まれている場合、このパラメータにはその列の名前を含めることも、Noneにすることもできます(X
に'geometry'という列がある場合)。crs - pyproj.crs.CRSまたは文字列(default=None)。 ジオメトリの空間参照システム。
X
がnumpy配列の場合にのみ使用されます。 CRS情報がX
で使用可能な場合(つまり、SpatialDataFrameまたはGeoDataFrame)は無視されますspatial_weights - SpatialWeightsDefinitionまたはpysal重みオブジェクト。default=None。 トレーニング・データの事前計算済空間加重マトリックス。 None以外の場合、モデルの作成時に空間関係指定は無視されます。
fit_global_model - bool, default=True。 Falseの場合、グローバル・モデルはトレーニングされません。
n_jobs - int、default=1。 ローカル・モデルのトレーニングを並列化するために使用されるプロセッサ・コアの数。 使用可能なすべてのコアを使用するには -1を設定します。
backend - string, default=None。
n_jobs != 1
の時に使用するJoblibバックエンド。 Noneの場合、Joblibのデフォルトのバックエンドが使用されます(通常はloki)batch_size - 'auto'またはint、default='auto'。 パラレル・ジョブ当たりのバッチ・タスクの数。
- 返り値:
self Fitted estimator。
- predict(X, y=None, geometries=None, crs=None)
グローバル・モデルとジオメトリに近いローカル・モデルを使用して、Xのターゲット値を予測します。 返される予測は次のように計算されます: local_model_prediction * local_weight + global_model.prediction * (1.0 - local_weight)
- パラメータ:
X - SpatialDataFrame、DataFrame、GeoDataFrameまたは2D numpy配列。 期待されるシェイプは(n_samples、n_features)です。 データの予測。 SpatialDataFrameまたはGeoDataFrameの場合、ジオメトリは列としてXにあります。 Xに列y (例:トレーニングまたはテストに使用されるプロキシまたはDataFrame)が含まれている場合、パラメータyはその列の名前を指定し、除外できるようにする必要があります。
y - 文字列またはNone(default=None)。 Xにターゲット値を含む列が含まれている場合、このパラメータではその列の名前を指定するため、予測に対して除外できます。それ以外の場合、このパラメータは使用されません。
geometries - Shapelyジオメトリのリスト。文字列(列名)またはNone、default=None。 Xサンプルに関連付けられたジオメトリ。 XがSpatialDataFrameまたはGeoDataFrameで、Xにその列の1つとしてジオメトリが含まれている場合、このパラメータにその列の名前を含めるか、省略できます(Xにgeometryという列がある場合)。
- 返り値:
指定されたデータのターゲット変数の予測を含む、シェイプn_samplesの配列。
- score(X, y, geometries=None, sample_weight=None, crs=None)
回帰スコア関数またはR-Squaredの値を返します。 独立変数から予測可能な従属変数の変動の割合を表します。 最適なスコアは1.0であり、モデルは任意に悪くなる可能性があるため、負の値になる可能性があります。 入力を無視して常にyの予想値を予測する定数モデルでは、R-Squaredスコアは0になります。
- パラメータ:
X - SpatialDataFrame、DataFrame、GeoDataFrameまたは2D numpy配列。 期待されるシェイプは(n_samples、n_features)です。 データの予測。 SpatialDataFrameまたはGeoDataFrameの場合、ジオメトリは列としてXにあります。 Xに列y (例:トレーニングまたはテストに使用されるプロキシまたはDataFrame)が含まれている場合、パラメータyはその列の名前を指定し、除外できるようにする必要があります。
y - 文字列またはNone(default=None)。 Xにターゲット値を含む列が含まれている場合、このパラメータではその列の名前を指定するため、予測に対して除外できます。それ以外の場合、このパラメータは使用されません。
geometries - Shapelyジオメトリのリスト。文字列(列名)またはNone、default=None。 Xサンプルに関連付けられたジオメトリ。 XがSpatialDataFrameまたはGeoDataFrameで、Xにその列の1つとしてジオメトリが含まれている場合、このパラメータにその列の名前を含めるか、省略できます(Xにgeometryという列がある場合)。
crs - pyproj.crs.CRS, default=None。 座標参照系。
- 返り値:
指定されたデータのR平方メトリック。
- class OLSRegressor(spatial_weights_definition=None)
Ordinary Least Square (OLS)アルゴリズムは、トレーニング・セットからMean Squared Error (MSE)を最小限にして新しい値を予測する行に適合します。 パラメータ
spatial_weights_definition
を定義すると、モデルのトレーニング後に空間統計を取得できます。これらの統計は、空間依存または空間異種性の存在を識別するのに役立ちます- パラメータ:
spatial_weights_definition - SpatialWeightsDefinition, default=None。 ネイバー間の空間関係を指定します。 定義されている場合は、Lagrange MultiplierテストやMoranのIなどのSpatial診断が含まれます。
- property betas
- 返り値:
トレーニング済モデルの推定パラメータを持つ配列
- property diagnostics
空間重みを指定してOLSモデルをトレーニングした場合、空間診断を取得できます。
- 返り値:
トレーニング済モデルの統計を含むSpatialDiagnosticsインスタンス。 モデルが定義されていない場合、Noneが返されます
- 「フィット」 ( X, y, 「幾何学 = なし」, 「crs = なし」, 「spatial_weights = なし」, 「spatial_weights_definition = なし」 )
トレーニング・データセットを使用してモデルをトレーニングします。
- パラメータ:
X - シェイプ(n_samples、n_features)の{numpy array, geopandas dataframe, vector dataframe}。 独立変数
y - {pandas.DataFrame, numpy 1D array or string}. 文字列として指定した場合、XはDataFrameである必要があります。
geometries - shapely array, default=None。
X
の各サンプルのジオメトリ・データ。crs - pyproj.crs.CRS, default=None。 座標参照系。
X
がnumpy配列の場合にのみ使用されます。X
でCRS情報が使用可能な場合(つまり、SpatialDataFrameまたはGeoDataFrame)は無視されます。spatial_weights - SpatialWeights, default=None。 空間加重マトリックス。
- 返り値:
self Fitted estimator。
- property k
- 返り値:
係数を推定する変数の数(ラムダを除く定数を含む)
- property model_type
- 返り値:
定義された回帰モデル
- predict(X, geometries=None)
指定されたデータのターゲット変数を推定します。 モデルが定義されていない場合、Noneが返されます。
- パラメータ:
X - シェイプ(n_samples、n_features)の{numpy array, geopandas dataframe, vector dataframe}。 独立変数
geometries - shapely array, default=None。
X
の各サンプルのジオメトリ・データ。
- 返り値:
指定されたデータのターゲット変数の予測。
- property predy
- 返り値:
トレーニング・データの予測を含む配列
- score(X, y, sample_weight=None, geometries=None)
回帰スコア関数またはR-Squaredの値を返します。 独立変数から予測可能な従属変数の変動の割合を表します。 最適なスコアは1.0であり、モデルは任意に悪くなる可能性があるため、負の値になる可能性があります。 入力を無視して常にyの予想値を予測する定数モデルでは、R-Squaredスコアは0になります。
- パラメータ:
X - シェイプ(n_samples、n_features)の{numpy array, geopandas dataframe, vector dataframe}。 独立変数
y - {pandas.DataFrame, numpy 1D array or string}. 文字列として指定した場合、XはDataFrameである必要があります。
sample_weight - 各サンプルのスコアに対する加重コントリビューション。
geometries - shapely array, default=None。
X
の各サンプルのジオメトリ・データ。
- 返り値:
回帰スコア関数またはR-Squaredの値を返します。 独立変数から予測可能な従属変数の変動の割合を表します。
- property summary
- 返り値:
トレーニング済モデルのサマリー
- property u
- 返り値:
トレーニング済モデルの残余を含む配列
- class SLXRegressor(spatial_weights_definition=None)
SLX回帰モデルは、フィーチャ・エンジニアリング・ステップを含む通常のライナー回帰を実行して、データに空間コンテキストを提供するフィーチャを追加します。これは、トブラーの法則によれば、遠くのものよりも近いものが関係しているためです。 このアルゴリズムは、隣接する観測からの平均を表す、特定の特徴の空間ラグを持つ1つ以上の列を追加します。
- パラメータ:
spatial_weights_definition - SpatialWeightsDefinition, default=None。 ネイバー間の空間関係を指定します。
- property betas
- 返り値:
トレーニング済モデルの推定パラメータを持つ配列
- property diagnostics
- 返り値:
トレーニング済モデルの統計を含むSpatialDiagnosticsインスタンス。 モデルが定義されていない場合、Noneが返されます
- fit(X, y, geometries=None, crs=None, spatial_weights=None, column_ids=None)
X
の独立変数とcolumn_ids
で指定された列の空間ラグの組合せを使用してOLSモデルをトレーニング- パラメータ:
X - シェイプ(n_samples、n_features)の{numpy array, geopandas dataframe, vector dataframe}。 独立変数
y - {pandas.DataFrame, numpy 1D array or string}. 文字列として指定した場合、XはDataFrameである必要があります。
geometries - shapely array, default=None。 Xの各サンプルのジオメトリ・データ。
crs - pyproj.crs.CRS, default=None。 座標参照系。
X
がnumpy配列の場合にのみ使用されます。 CRS情報がX
で使用可能な場合(つまり、SpatialDataFrameまたはGeoDataFrame)は無視されますspatial_weights - SpatialWeights, default=None。 空間加重マトリックス。
column_ids - 文字列のリストまたは整数のリスト。default=None。 列名または列索引のリスト。空間ラグのコンピュートに使用される列を示します。
- 返り値:
self Fitted estimator。
- property k
- 返り値:
係数を推定する変数の数(ラムダを除く定数を含む)
- property model_type
- 返り値:
定義された回帰モデル
- predict(X, geometries=None, spatial_weights=None, use_fit_lag=False)
指定されたデータのターゲット変数を推定します。
use_fit_lag=False
の場合、予測データから空間ラグがコンピュートされ、それ以外の場合、トレーニング・データから空間ラグがコンピュートされます。- パラメータ:
X - シェイプ(n_samples、n_features)の{numpy array, geopandas dataframe, vector dataframe}。 独立変数
geometries - shapely array, default=None。
X
の各サンプルのジオメトリ・データ。spatial_weights - SpatialWeights, default=None。 空間加重マトリックス。
use_fit_lag - boolean, default=False。 falseの場合、tre予測データからの空間ラグを使用します。それ以外の場合、トレーニング・データを使用して空間ラグを計算します。
- 返り値:
指定されたデータのターゲット変数の予測。
- property predy
- 返り値:
トレーニング・データの予測を含む配列
- score(X, y, sample_weight=None, geometries=None, use_fit_lag=False)
R-Squaredメトリックを返します。 独立変数から予測可能な従属変数の変動の割合を表します。
use_fit_lag=False
の場合、指定されたデータから空間ラグがコンピュートされ、それ以外の場合、トレーニング・データから空間ラグがコンピュートされます。- パラメータ:
X - シェイプ(n_samples、n_features)の{numpy array, geopandas dataframe, vector dataframe}。 独立変数
y - {pandas.DataFrame, numpy 1D array or string}. 文字列として指定した場合、XはDataFrameである必要があります
sample_weight - 各サンプルのスコアに対する加重貢献度
geometries - shapely array, default=None。 Xの各サンプルのジオメトリ・データ。
use_fit_lag - boolean, default=False。 falseの場合、予測データからの空間ラグを使用します。それ以外の場合、トレーニング・データを使用して空間ラグを計算します。
- 返り値:
指定されたデータのR平方メトリック。
- property summary
- 返り値:
トレーニング済モデルのサマリー
- property u
- 返り値:
トレーニング済モデルの残余を含む配列
- class SpatialAdaptiveRegressor(spatial_weights_definition=None)
データに適合する回帰アルゴリズムを検出する自動化されたアプローチで構成されます。 空間診断から、アルゴリズムはMoranのIを取得します。 Moran's Iの正の値は、空間依存性または空間クラスタリングの存在を示し、この空間依存性を含むアルゴリズムが優先されます。 Moran'sが負の場合は、リージョンの分散または空間異方性の存在を示し、局所的なメソッドはより適しています。 パラメータ
spatial_weights_definition
が指定されていない場合、OLSモデルが提案されます。- パラメータ:
spatial_weights_definition - SpatialWeightsDefinition, default=None。 ネイバー間の空間関係を指定します。
- property betas
- 返り値:
トレーニング済モデルの推定パラメータを持つ配列
- property diagnostics
- 返り値:
トレーニング済モデルの統計を含むSpatialDiagnosticsインスタンス。 モデルが定義されていない場合、Noneが返されます
- fit(X, y, geometries=None, crs=None, spatial_weights=None)
データに適合する回帰モデルを選択し、指定されたトレーニング・データでトレーニングします。
- パラメータ:
X - シェイプ(n_samples、n_features)の{numpy array, geopandas dataframe, vector dataframe}。 独立変数
y - {pandas.DataFrame, numpy 1D array or string}. 文字列として指定した場合、XはDataFrameである必要があります。
geometries - shapely array, default=None。
X
の各サンプルのジオメトリ・データ。crs - pyproj.crs.CRS, default=None。 座標参照系。
X
がnumpy配列の場合にのみ使用されます。X
でCRS情報が使用可能な場合(つまり、SpatialDataFrameまたはGeoDataFrame)は無視されます。spatial_weights - SpatialWeights, default=None。 空間加重マトリックス。
- 返り値:
self Fitted estimator。
- property k
- 返り値:
係数を推定する変数の数(ラムダを除く定数を含む)
- property model_type
- 返り値:
定義された回帰モデル
- predict(X, geometries=None)
指定されたデータのターゲット変数を推定します。 モデルが定義されていない場合、Noneが返されます。
- パラメータ:
X - シェイプ(n_samples、n_features)の{numpy array, geopandas dataframe, vector dataframe}。 独立変数
geometries - shapely array, default=None。
X
の各サンプルのジオメトリ・データ。
- 返り値:
指定されたデータのターゲット変数の予測。
- property predy
- 返り値:
トレーニング・データの予測を含む配列
- score(X, y, sample_weight=None, geometries=None)
回帰スコア関数またはR-Squaredの値を返します。 独立変数から予測可能な従属変数の変動の割合を表します。 最適なスコアは1.0であり、モデルは任意に悪くなる可能性があるため、負の値になる可能性があります。 入力を無視して常にyの予想値を予測する定数モデルでは、R-Squaredスコアは0になります。
- パラメータ:
X - シェイプ(n_samples、n_features)の{numpy array, geopandas dataframe, vector dataframe}。 独立変数
y - {pandas.DataFrame, numpy 1D array or string}. 文字列として指定した場合、XはDataFrameである必要があります。
sample_weight - 各サンプルのスコアに対する加重コントリビューション。
geometries - shapely array, default=None。
X
の各サンプルのジオメトリ・データ。
- 返り値:
回帰スコア関数またはR-Squaredの値を返します。 独立変数から予測可能な従属変数の変動の割合を表します。
- property summary
- 返り値:
トレーニング済モデルのサマリー
- property u
- 返り値:
トレーニング済モデルの残余を含む配列
- class SpatialErrorRegressor(spatial_weights_definition=None)
空間誤差モデルでは、線形方程式の誤差項に空間ラグが導入されています。 残差に空間ラグを追加すると、ネイバーのエラーが観察エラーに影響します。これにより、エラー用語の空間ラグに関連付けられた余分なパラメータが生成されます
- パラメータ:
spatial_weights_definition - SpatialWeightsDefinition, default=None。 ネイバー間の空間関係を指定します。
- property betas
- 返り値:
トレーニング済モデルの推定パラメータを持つ配列
- property diagnostics
- 返り値:
トレーニング済モデルの統計を含むSpatialDiagnosticsインスタンス。 モデルが定義されていない場合、Noneが返されます
- fit(X, y, geometries=None, crs=None, spatial_weights=None)
トレーニング・データセットを使用してモデルをトレーニングします。
- パラメータ:
X - シェイプ(n_samples、n_features)の{numpy array, geopandas dataframe, vector dataframe}。 独立変数
y - {pandas.DataFrame, numpy 1D array or string}. 文字列として指定した場合、XはDataFrameである必要があります。
geometries - shapely array, default=None。
X
の各サンプルのジオメトリ・データ。crs - pyproj.crs.CRS, default=None。 座標参照系。
X
がnumpy配列の場合にのみ使用されます。X
でCRS情報が使用可能な場合(つまり、SpatialDataFrameまたはGeoDataFrame)は無視されます。spatial_weights - SpatialWeights, default=None。 空間加重マトリックス。
- 返り値:
self Fitted estimator。
- property k
- 返り値:
係数を推定する変数の数(ラムダを除く定数を含む)
- property model_type
- 返り値:
定義された回帰モデル
- predict(X, geometries=None)
指定されたデータのターゲット変数を推定します。 モデルが定義されていない場合、Noneが返されます。
- パラメータ:
X - シェイプ(n_samples、n_features)の{numpy array, geopandas dataframe, vector dataframe}。 独立変数
geometries - shapely array, default=None。
X
の各サンプルのジオメトリ・データ。
- 返り値:
指定されたデータのターゲット変数の予測。
- property predy
- 返り値:
トレーニング・データの予測を含む配列
- score(X, y, sample_weight=None, geometries=None)
回帰スコア関数またはR-Squaredの値を返します。 独立変数から予測可能な従属変数の変動の割合を表します。 最適なスコアは1.0であり、モデルは任意に悪くなる可能性があるため、負の値になる可能性があります。 入力を無視して常にyの予想値を予測する定数モデルでは、R-Squaredスコアは0になります。
- パラメータ:
X - シェイプ(n_samples、n_features)の{numpy array, geopandas dataframe, vector dataframe}。 独立変数
y - {pandas.DataFrame, numpy 1D array or string}. 文字列として指定した場合、XはDataFrameである必要があります。
sample_weight - 各サンプルのスコアに対する加重コントリビューション。
geometries - shapely array, default=None。
X
の各サンプルのジオメトリ・データ。
- 返り値:
回帰スコア関数またはR-Squaredの値を返します。 独立変数から予測可能な従属変数の変動の割合を表します。
- property summary
- 返り値:
トレーニング済モデルのサマリー
- property u
- 返り値:
トレーニング済モデルの残余を含む配列
- class SpatialFixedEffectsRegressor(spatial_weights_definition=None)
空間固定効果アルゴリズムは、空間制度の簡易バージョンであり、各制度のインターセプト・パラメータまたは定数パラメータを計算しますが、他のモデル・パラメータは一定です。
- パラメータ:
spatial_weights_definition - SpatialWeightsDefinition, default=None。 ネイバー間の空間関係を指定します。
- property betas
- 返り値:
トレーニング済モデルの推定パラメータを持つ配列
- property diagnostics
- 返り値:
トレーニング済モデルの統計を含むSpatialDiagnosticsインスタンス。 モデルが定義されていない場合、Noneが返されます
- fit(X, y, geometries=None, crs=None, spatial_weights=None, regimes=None)
OLSモデルをトレーニングします。このモデルでは、インターセプト・パラメータが制度に応じて変わり、残りのパラメータは一定のままです。
- パラメータ:
X - シェイプ(n_samples、n_features)の{numpy array, geopandas dataframe, vector dataframe}。 独立変数
y - {pandas.DataFrame, numpy 1D array or string}. 文字列として指定した場合、XはDataFrameである必要があります。
geometries - shapely array, default=None。
X
の各サンプルのジオメトリ・データ。crs - pyproj.crs.CRS, default=None。 座標参照系。
X
がnumpy配列の場合にのみ使用されます。 CRS情報がX
で使用可能な場合(つまり、SpatialDataFrameまたはGeoDataFrame)は無視されますspatial_weights - SpatialWeights, default=None。 空間加重マトリックス。
regimes - List, default=None。 regimeへの各観察のマッピングを含むn値のリスト。 nの値は、
X
の行数と同じである必要があります。
- 返り値:
self Fitted estimator。
- property k
- 返り値:
係数を推定する変数の数(ラムダを除く定数を含む)
- property model_type
- 返り値:
定義された回帰モデル
- predict(X, regimes=None, geometries=None, spatial_weights=None)
指定されたデータおよび制度を使用してモデルを評価します。 モデルが定義されていない場合、Noneが返されます。 体制に従ってモデルの対応するインターセプトを取得し、予測データを使用してモデルを評価
- パラメータ:
X - シェイプ(n_samples、n_features)の{numpy array, geopandas dataframe, vector dataframe}。 独立変数
regimes - List, default=None。 regimeへの各観察のマッピングを含むn値のリスト。 nの値は、
X
の行数と同じである必要があります。geometries - shapely array, default=None。
X
の各サンプルのジオメトリ・データ。spatial_weights - SpatialWeights, default=None。 空間加重マトリックス。
- 返り値:
指定されたデータのターゲット変数の予測。
- property predy
- 返り値:
トレーニング・データの予測を含む配列
- score(X, y, sample_weight=None, regimes=None, geometries=None, spatial_weights=None)
R-平方メトリックを返します。 制度に従ってモデルの対応するインターセプトを取得し、指定されたデータでターゲット変数を推定します。
- パラメータ:
X - シェイプ(n_samples、n_features)の{numpy array, geopandas dataframe, vector dataframe}。 独立変数。
sample_weight - 各サンプルのスコアに対する加重コントリビューション。
regimes - List, default=None。 regimeへの各観察のマッピングを含むn値のリスト。 nの値は、
X
の行数と同じである必要があります。geometries - shapely array, default=None。
X
の各サンプルのジオメトリ・データ。spatial_weights - SpatialWeights, default=None。 空間加重マトリックス。
- 返り値:
指定されたデータのR平方メトリック。
- property summary
- 返り値:
トレーニング済モデルのサマリー
- property u
- 返り値:
トレーニング済モデルの残余を含む配列
- class SpatialLagRegressor(spatial_weights_definition=None)
空間ラグ回帰モデルでは、ターゲット変数に対する空間依存性が考慮されます。つまり、リージョンのターゲット変数の値は、そのネイバーのターゲット変数に関連付けられます。 空間ラグ・モデルには、従属変数の空間ラグが線形方程式に含まれます。これにより、従属変数の空間ラグに関連付けられた余分なパラメータが生成されます
- パラメータ:
spatial_weights_definition - SpatialWeightsDefinition, default=None。 ネイバー間の空間関係を指定します。
- property betas
- 返り値:
トレーニング済モデルの推定パラメータを持つ配列
- property diagnostics
- 返り値:
トレーニング済モデルの統計を含むSpatialDiagnosticsインスタンス。 モデルが定義されていない場合、Noneが返されます
- fit(X, y, geometries=None, crs=None, spatial_weights=None)
トレーニング・データセットを使用してモデルをトレーニングします。
- パラメータ:
X - シェイプ(n_samples、n_features)の{numpy array, geopandas dataframe, vector dataframe}。 独立変数
y - {pandas.DataFrame, numpy 1D array or string}. 文字列として指定した場合、XはDataFrameである必要があります。
geometries - shapely array, default=None。
X
の各サンプルのジオメトリ・データ。crs - pyproj.crs.CRS, default=None。 座標参照系。
X
がnumpy配列の場合にのみ使用されます。X
でCRS情報が使用可能な場合(つまり、SpatialDataFrameまたはGeoDataFrame)は無視されます。spatial_weights - SpatialWeights, default=None。 空間加重マトリックス。
- 返り値:
self Fitted estimator。
- property k
- 返り値:
係数を推定する変数の数(定数およびrhoを含む)
- property model_type
- 返り値:
定義された回帰モデル
- predict(X, geometries=None)
指定されたデータのターゲット変数を推定します。 モデルが定義されていない場合、Noneが返されます。
- パラメータ:
X - シェイプ(n_samples、n_features)の{numpy array, geopandas dataframe, vector dataframe}。 独立変数
geometries - shapely array, default=None。
X
の各サンプルのジオメトリ・データ。
- 返り値:
指定されたデータのターゲット変数の予測。
- property predy
- 返り値:
トレーニング・データの予測を含む配列
- score(X, y, sample_weight=None, geometries=None)
回帰スコア関数またはR-Squaredの値を返します。 独立変数から予測可能な従属変数の変動の割合を表します。 最適なスコアは1.0であり、モデルは任意に悪くなる可能性があるため、負の値になる可能性があります。 入力を無視して常にyの予想値を予測する定数モデルでは、R-Squaredスコアは0になります。
- パラメータ:
X - シェイプ(n_samples、n_features)の{numpy array, geopandas dataframe, vector dataframe}。 独立変数
y - {pandas.DataFrame, numpy 1D array or string}. 文字列として指定した場合、XはDataFrameである必要があります。
sample_weight - 各サンプルのスコアに対する加重コントリビューション。
geometries - shapely array, default=None。
X
の各サンプルのジオメトリ・データ。
- 返り値:
回帰スコア関数またはR-Squaredの値を返します。 独立変数から予測可能な従属変数の変動の割合を表します。
- property summary
- 返り値:
トレーニング済モデルのサマリー
- property u
- 返り値:
トレーニング済モデルの残余を含む配列
- class SpatialRegimesRegressor(spatial_weights_definition=None)
回帰方程式パラメータは、regimeと呼ばれるカテゴリ変数に従って推定されます。このカテゴリ変数は、空間コンテキスト内のリージョンなど、様々なものを表すことができます。 地区名やブロック名などの近隣を使用して、制度を定義できます。 モデルは線形回帰モデルで構成され、線形方程式の項は体制によって異なります。
- パラメータ:
spatial_weights_definition - SpatialWeightsDefinition, default=None。 ネイバー間の空間関係を指定します。
- property betas
- 返り値:
トレーニング済モデルの推定パラメータを持つ配列
- property diagnostics
- 返り値:
トレーニング済モデルの統計を含むSpatialDiagnosticsインスタンス。 モデルが定義されていない場合、Noneが返されます
- fit(X, y, geometries=None, crs=None, spatial_weights=None, regimes=None)
パラメータ
regimes
は、制度として使用されるカテゴリ変数を示します。 OLSモデルは、各制度に対してトレーニングされ、それぞれに異なるパラメータ・セットを取得します。- パラメータ:
X - シェイプ(n_samples、n_features)の{numpy array, geopandas dataframe, vector dataframe}。 独立変数
y - {pandas.DataFrame, numpy 1D array or string}. 文字列として指定した場合、XはDataFrameである必要があります。
geometries - shapely array, default=None。
X
の各サンプルのジオメトリ・データ。crs - pyproj.crs.CRS, default=None。 座標参照系。 Xがnumpy配列の場合にのみ使用されます。 CRS情報が
X
で使用可能な場合(つまり、SpatialDataFrameまたはGeoDataFrame)は無視されますspatial_weights - SpatialWeights, default=None。 空間加重マトリックス。
regimes - List, default=None。 regimeへの各観察のマッピングを含むn値のリスト。 nの値は、Xの行数と同じである必要があります。
- 返り値:
self Fitted estimator。
- property k
- 返り値:
係数を推定する変数の数(ラムダを除く定数を含む)
- property model_type
- 返り値:
定義された回帰モデル
- predict(X, regimes=None, geometries=None, spatial_weights=None)
指定されたデータおよび制度を使用してモデルを評価します。 モデルが定義されていない場合、Noneが返されます。 体制に従ってモデルの対応するパラメータ・セットを取得し、予測データを使用してモデルを評価
- パラメータ:
X - シェイプ(n_samples、n_features)の{numpy array, geopandas dataframe, vector dataframe}。 独立変数
regimes - List, default=None。 regimeへの各観察のマッピングを含むn値のリスト。 nの値は、
X
の行数と同じである必要があります。geometries - shapely array, default=None。
X
の各サンプルのジオメトリ・データ。spatial_weights - SpatialWeights, default=None。 空間加重マトリックス。
- 返り値:
指定されたデータのターゲット変数の予測。
- property predy
- 返り値:
トレーニング・データの予測を含む配列
- score(X, y, sample_weight=None, regimes=None, geometries=None, spatial_weights=None)
R-平方メトリックを返します。 制度に従ってモデルの対応するパラメータ・セットを取得し、指定されたデータでターゲット変数を推定します。
- パラメータ:
X - シェイプ(n_samples、n_features)の{numpy array, geopandas dataframe, vector dataframe}。 独立変数。
sample_weight - 各サンプルのスコアに対する加重コントリビューション。
regimes - List, default=None。 regimeへの各観察のマッピングを含むn値のリスト。 nの値は、
X
の行数と同じである必要があります。geometries - shapely array, default=None。
X
の各サンプルのジオメトリ・データ。spatial_weights - SpatialWeights, default=None。 空間加重マトリックス。
- 返り値:
指定されたデータのR平方メトリック。
- property summary
- 返り値:
トレーニング済モデルのサマリー
- property u
- 返り値:
トレーニング済モデルの残余を含む配列