O-Clusterについて
O-Clusterは、大規模な高次元データセットの分析に適した、高速でスケーラブルなグリッドベースのクラスタリング・アルゴリズムです。このアルゴリズムでは、ユーザー定義のパラメータに依存せずに高品質なクラスタを生成できます。
O-Clusterの目的は、データ内で高密度の領域を特定し、それらの領域をクラスタに分割することです。それは、軸平行な1次元の(直行の)データ投影を使用して、高密度な領域を特定します。このアルゴリズムでは、重複がなく、サイズのバランスがとれた個別のクラスタに分割するための分割ポイントが検索されます。
O-Clusterは、2分木階層を作成して再帰的に動作します。リーフ・クラスタの数は、自動的に決定されます。アルゴリズムは、クラスタの最大数を制限するように構成できます。