ヘッダーをスキップ
Oracle Data Mining概要
11
g
リリース2(11.2)
E48231-01
索引
次
目次
例一覧
図一覧
表一覧
タイトルおよび著作権情報
はじめに
対象読者
ドキュメントのアクセシビリティについて
関連ドキュメント
表記規則
Oracle Data Miningの新機能
Oracle Database 11
g
リリース 2 (11.2.0.3) Oracle Data Mining
Oracle Database 11
g
リリース 2 (11.2.0.2) Oracle Data Mining
Oracle Database 11
g
リリース 1 (11.1) Oracle Data Mining
第I部 概要
1
データ・マイニングとは
データ・マイニングとは
自動検出
予測
グループ化
実用的な情報
データ・マイニングと統計
データ・マイニングとOLAP
データ・マイニングとデータ・ウェアハウス
データ・マイニングで可能なこと、不可能なこと
適切な問題の設定
データの理解
データ・マイニングのプロセス
問題の定義
データの収集と準備
モデルの作成と評価
知識の配置
2
Oracle Data Miningの紹介
データベース・カーネル内でのデータ・マイニング
Oracle Exadataでのデータ・マイニング
データ・マイニング機能
監視ありデータ・マイニング
監視あり学習: テスト
監視あり学習: スコアリング
監視なしデータ・マイニング
監視なし学習: スコアリング
Oracle Data Miningの機能
データ・マイニングのアルゴリズム
Oracle Data Miningの監視ありアルゴリズム
Oracle Data Miningの監視なしアルゴリズム
データ準備
自動データ準備
モデルの透明性
Oracle Data Miningの使用方法
Oracle Data Miner
PL/SQLパッケージ
SQLスコアリング関数
R-ODM
PMMLのインポート
Oracle Spreadsheet Add-In for Predictive Analytics
Java API
Oracle Data Miningに関する情報源
Oracle Technology Network上のOracle Data Miningリソース
Oracle Data MiningおよびOracle Databaseの分析機能
3
Oracle Predictive Analyticsの紹介
予測分析とは
予測分析とデータ・マイニング
仕組み
予測分析の操作
Oracle Spreadsheet Add-In for Predictive Analytics
DBMS_PREDICTIVE_ANALYTICS
例: PREDICT
背景情報
EXPLAIN
PREDICT
精度
PROFILE
第II部 マイニング機能
4
回帰
回帰とは
回帰の仕組み
線形回帰
多変量線形回帰
回帰係数
非線形回帰
多変量非線形回帰
信頼限界
回帰モデルのテスト
回帰統計量
2乗平均平方根誤差
平均絶対誤差
回帰のアルゴリズム
5
分類
分類とは
分類モデルのテスト
混同マトリックス
リフト
リフト統計量
受信者操作特性(ROC)
ROC曲線
ROC曲線下面積
ROCとモデルのバイアス
ROC統計量
分類モデルのバイアス
コスト
コストと精度
ポジティブ・クラスとネガティブ・クラス
コストと利益の割当て
事前確率
分類のアルゴリズム
6
異常検出
異常検出とは
1クラス分類
1クラス・データの異常検出
外れ値検出用の異常検出
異常検出アルゴリズム
7
クラスタリング
クラスタリングとは
クラスタの計算方法
新しいデータのスコアリング
階層クラスタリング
ルール
支持度と信頼度
クラスタリング・モデルの評価
クラスタリングのアルゴリズム
8
相関
相関とは
相関ルール
マーケット・バスケット分析
相関ルールとE-Commerce
トランザクショナル・データ
相関のアルゴリズム
9
特徴の選択と抽出
最適な属性の検出
特徴選択および属性評価とは
属性評価およびスコアリング
特徴抽出とは
特徴抽出とスコアリング
属性評価および特徴抽出のアルゴリズム
第III部 アルゴリズム
10
Apriori
Aprioriとは
相関ルールと高頻度項目セット
前件と後件
信頼度
Apriori用のデータ準備
ネイティブ・トランザクショナル・データとスター・スキーマ
項目と集合
スパース・データ
相関ルールの計算
項目セット
高頻度項目セット
例: 高頻度項目セットからのルールの計算
相関ルールの評価
支持度
信頼度
リフト
11
ディシジョン・ツリー
ディシジョン・ツリーとは
ディシジョン・ツリーのルール
信頼度と支持度
ディシジョン・ツリーの利点
ディシジョン・ツリー・モデルのXML
ディシジョン・ツリーの拡大
分岐
コスト・マトリックス
オーバーフィットの回避
ディシジョン・ツリー・アルゴリズムのチューニング
ディシジョン・ツリー用のデータ準備
12
一般化線形モデル
一般化線形モデルとは
Oracle Data MiningのGLM
解釈性と透明性
ワイド・データ
信頼限界
リッジ回帰
リッジ回帰用の構築設定
リッジと信頼限界
リッジと分散拡大係数(線形回帰用)
リッジとデータ準備
GLM用のチューニングと診断
構築設定
診断
係数統計情報
グローバルなモデルの統計情報
行の診断情報
GLM用のデータ準備
線形回帰用のデータ準備
ロジスティック回帰用のデータ準備
欠損値
線形回帰
線形回帰の係数統計情報
線形回帰のグローバルなモデルの統計情報
線形回帰の行の診断情報
ロジスティック回帰
参照クラス
クラスの重み
ロジスティック回帰の係数統計情報
ロジスティック回帰のグローバルなモデルの統計情報
ロジスティック回帰の行の診断情報
13
k
-Means
k
-Meansとは
Oracle Data Miningの拡張
k
-Means
重心
スコアリング
k
-Meansアルゴリズムのチューニング
k
-Means用のデータ準備
14
最小記述長
MDLとは
圧縮とエントロピ
確率変数の値: 統計的分布
確率変数の値: 重要な予測子
合計エントロピ
モデル・サイズ
モデル選択
MDLメトリック
MDL用のデータ準備
15
Naive Bayes
Naive Bayesとは
Naive Bayesの利点
Naive Bayesモデルのチューニング
Naive Bayes用のデータ準備
16
Non-Negative Matrix Factorization
NMFとは
行列因数分解
NMFでのスコアリング
NMFでのテキスト・マイニング
NMFアルゴリズムのチューニング
NMF用のデータ準備
17
O-Cluster
O-Clusterとは
パーティショニング方針
量的属性のパーティショニング
質的属性のパーティショニング
アクティブなサンプリング
プロセス・フロー
スコアリング
O-Clusterアルゴリズムのチューニング
O-Cluster用のデータ準備
O-Cluster用のユーザー定義のデータ準備
18
サポート・ベクター・マシン
サポート・ベクター・マシンとは
SVMの利点
Oracle Data MiningのSVMの利点
利用性
スケーラビリティ
カーネルベースの学習
能動学習
SVMモデルのチューニング
SVM用のデータ準備
正規化
SVMと自動データ準備
SVM分類
クラスの重み
1クラスSVM
SVM回帰
第IV部 データ準備
19
自動データ準備と組込みのデータ準備
概要
ケース表
データ型の変換
日付データ
テキスト変換
ビジネスおよび領域に関する変換
自動データ準備
ビニング
正規化
外れ値の処理
自動データ準備での変換
組込みのデータ準備
変換リストおよび自動データ準備
Oracle Data Miningの変換ルーチン
ビニング・ルーチン
正規化ルーチン
外れ値の処理のルーチン
透明性
内部変換
第V部 非構造化データのマイニング
20
テキスト・マイニング
非構造化データとは
Oracle Data Miningでの非構造化データのサポート方法
混合データ
テキスト・データ型
テキスト・マイニング・アルゴリズム
テキスト分類
多クラスのドキュメント分類
多ターゲットのドキュメント分類
ドキュメント分類のアルゴリズム
テキスト・クラスタリング
テキストの特徴抽出
テキストの相関
テキストの属性評価
マイニング用のテキストの準備
Oracle Data MiningとOracle Text
用語集
索引