プライマリ・コンテンツに移動
Oracle® Data Mining概要
12
c
リリース1 (12.1)
B72966-03
索引
次へ
目次
タイトルおよび著作権情報
はじめに
対象読者
関連ドキュメント
Oracle Technology Network上のOracle Data Miningリソース
アプリケーション開発およびデータベース管理ドキュメント
ドキュメントのアクセシビリティについて
表記規則
Oracle Data Mining概要ガイドのこのリリースでの変更点
Oracle Data Mining 12
c
リリース1 (12.1)での変更点
新機能
サポート対象外機能
その他の変更
第I部 概要
1
データ・マイニングとは
データ・マイニングとは
自動検出
予測
グループ化
実用的な情報
データ・マイニングと統計
データ・マイニングとOLAP
データ・マイニングとデータ・ウェアハウス
データ・マイニングで可能なこと、不可能なこと
適切な問題の設定
データの理解
データ・マイニングのプロセス
問題の定義
データの収集、準備および特徴エンジニアリング
モデルの作成と評価
知識の配置
2
Oracle Data Miningの紹介
Oracle Data Miningとは
データベース・カーネル内でのデータ・マイニング
Oracle Exadataでのデータ・マイニング
Oracle Data Miningのインタフェース
PL/SQL API
SQL関数
Oracle Data Miner
予測分析
データベース分析の概要
3
Oracle Data Miningの基礎
マイニング機能
監視ありデータ・マイニング
監視あり学習: テスト
監視あり学習: スコアリング
監視なしデータ・マイニング
監視なし学習: スコアリング
アルゴリズム
Oracle Data Miningの監視ありアルゴリズム
Oracle Data Miningの監視なしアルゴリズム
データ準備
Oracle Data Miningによるデータ準備の簡略化
ケース・データ
ネストしたデータ
テキスト・データ
データベース内スコアリング
パラレル実行と管理の簡易化
モデル適用と動的スコアリングのためのSQL関数
第II部 マイニング機能
4
回帰
回帰とは
回帰の仕組み
線形回帰
多変量線形回帰
回帰係数
非線形回帰
多変量非線形回帰
信頼限界
回帰モデルのテスト
回帰統計量
2乗平均平方根誤差
平均絶対誤差
回帰のアルゴリズム
5
分類
分類とは
分類モデルのテスト
混同マトリックス
リフト
リフト統計量
受信者操作特性(ROC)
ROC曲線
曲線下面積
ROCとモデルのバイアス
ROC統計量
分類モデルのバイアス
コスト
コストと精度
ポジティブ・クラスとネガティブ・クラス
コストと利益の割当て
事前確率およびクラスの重み
分類のアルゴリズム
6
異常検出
異常検出とは
1クラス分類
1クラス・データの異常検出
外れ値検出用の異常検出
異常検出アルゴリズム
7
クラスタリング
クラスタリングとは
クラスタの計算方法
新しいデータのスコアリング
階層クラスタリング
ルール
支持度と信頼度
クラスタリング・モデルの評価
クラスタリングのアルゴリズム
8
相関
相関とは
相関ルール
マーケット・バスケット分析
相関ルールとE-Commerce
トランザクショナル・データ
相関のアルゴリズム
9
特徴の選択と抽出
最適な属性の検出
特徴選択および属性評価とは
属性評価およびスコアリング
特徴抽出とは
特徴抽出とスコアリング
属性評価および特徴抽出のアルゴリズム
第III部 アルゴリズム
10
Apriori
Aprioriとは
相関ルールと高頻度項目セット
前件と後件
信頼度
Apriori用のデータ準備
ネイティブ・トランザクショナル・データとスター・スキーマ
項目と集合
スパース・データ
相関ルールの計算
項目セット
高頻度項目セット
例: 高頻度項目セットからのルールの計算
相関ルールの評価
支持度
信頼度
リフト
11
ディシジョン・ツリー
ディシジョン・ツリーとは
ディシジョン・ツリーのルール
信頼度と支持度
ディシジョン・ツリーの利点
ディシジョン・ツリー・モデルのXML
ディシジョン・ツリーの拡大
分岐
コスト・マトリックス
オーバーフィットの回避
ディシジョン・ツリー・アルゴリズムのチューニング
ディシジョン・ツリー用のデータ準備
12
期待値最大化
期待値最大化とは
期待値ステップと最大化ステップ
確率密度推定
アルゴリズムの拡張
スケーラビリティ
高いディメンション性
成分数
パラメータ初期化
成分からクラスタへ
アルゴリズムの構成
期待値最大化用のデータ準備
13
一般化線形モデル
一般化線形モデルとは
Oracle Data MiningのGLM
解釈性と透明性
ワイド・データ
信頼限界
リッジ回帰
リッジ回帰の構成
リッジと信頼限界
リッジと分散拡大係数(線形回帰用)
リッジとデータ準備
スケーラブルな特徴選択
特徴選択
特徴選択の構成
特徴選択とリッジ回帰
特徴生成
特徴生成の構成
GLM用のチューニングと診断
構築設定
診断
係数統計情報
グローバルなモデルの統計情報
行の診断情報
GLM用のデータ準備
線形回帰用のデータ準備
ロジスティック回帰用のデータ準備
欠損値
線形回帰
線形回帰の係数統計情報
線形回帰のグローバルなモデルの統計情報
線形回帰の行の診断情報
ロジスティック回帰
参照クラス
クラスの重み
ロジスティック回帰の係数統計情報
ロジスティック回帰のグローバルなモデルの統計情報
ロジスティック回帰の行の診断情報
14
k
-Means
k
-Meansとは
Oracle Data Miningの拡張
k
-Means
重心
スコアリング
k
-Meansアルゴリズム構成
k
-Means用のデータ準備
15
最小記述長
MDLとは
圧縮とエントロピ
確率変数の値: 統計的分布
確率変数の値: 重要な予測子
合計エントロピ
モデル・サイズ
モデル選択
MDLメトリック
MDL用のデータ準備
16
Naive Bayes
Naive Bayesとは
Naive Bayesの利点
Naive Bayesモデルのチューニング
Naive Bayes用のデータ準備
17
Non-Negative Matrix Factorization
NMFとは
行列因数分解
NMFでのスコアリング
NMFでのテキスト・マイニング
テキスト・マイニング用のNMF
NMFアルゴリズムのチューニング
NMF用のデータ準備
18
O-Cluster
O-Clusterとは
パーティショニング方針
量的属性のパーティショニング
質的属性のパーティショニング
アクティブなサンプリング
プロセス・フロー
スコアリング
O-Clusterアルゴリズムのチューニング
O-Cluster用のデータ準備
O-Cluster用のユーザー定義のデータ準備
19
特異値分解
特異値分解とは
行列操作
低ランクの分解
スケーラビリティ
アルゴリズムの構成
モデル・サイズ
パフォーマンス
PCAスコアリング
SVD用のデータ準備
20
サポート・ベクター・マシン
サポート・ベクター・マシンとは
SVMの利点
Oracle Data MiningのSVMの利点
利用性
スケーラビリティ
カーネルベースの学習
能動学習
SVMモデルのチューニング
SVM用のデータ準備
正規化
SVMと自動データ準備
SVM分類
クラスの重み
1クラスSVM
SVM回帰
用語集
索引