ヘッダーをスキップ
Oracle Data Mining概要
11
g
リリース1(11.1)
E05704-02
索引
次へ
目次
例一覧
図一覧
表一覧
タイトルおよび著作権の情報
はじめに
対象読者
ドキュメントのアクセシビリティについて
関連ドキュメント
表記規則
サポートおよびサービス
Oracle Data Miningの新機能
Oracle Data Mining 11
g
リリース1(11.1)の新機能
Oracle Data Mining 10
g
リリース2(10.2)の新機能
第I部 概要
1
データ・マイニングとは
データ・マイニングとは
自動検出
予測
グループ化
実用的な情報
データ・マイニングと統計
データ・マイニングとOLAP
データ・マイニングとデータ・ウェアハウス
データ・マイニングで可能なこと、不可能なこと
適切な問題の設定
データの理解
データ・マイニングのプロセス
問題の定義
データの収集と準備
モデルの作成と評価
知識の配置
2
Oracle Data Miningの紹介
データベース・カーネル内でのデータ・マイニング
データ・マイニング機能
監視ありデータ・マイニング
監視あり学習: テスト
監視あり学習: スコアリング
監視なしデータ・マイニング
監視なし学習: スコアリング
Oracle Data Miningの機能
データ・マイニングのアルゴリズム
Oracle Data Miningの監視ありアルゴリズム
Oracle Data Miningの監視なしアルゴリズム
データ準備
スーパーモデル
Oracle Data Miningの使用方法
Oracle Data Miner
PL/SQLパッケージ
SQL関数
Java API
Oracle Spreadsheet Add-In for Predictive Analytics
Oracle Data Miningに関する情報源
Oracle Technology Network上のOracle Data Miningリソース
Oracle Data Miningに関する出版物
Oracle Data MiningおよびOracle Databaseの分析機能
3
Oracle Predictive Analyticsの紹介
予測分析とは
予測分析とデータ・マイニング
仕組み
予測分析の操作
Oracle Spreadsheet Add-In for Predictive Analytics
予測分析のAPI
PL/SQL APIでの予測分析
Java APIでの予測分析
例: OraProfileTaskを使用したプロファイル結果の作成
例: PREDICT
背景情報
EXPLAIN
PREDICT
精度
PROFILE
第II部 マイニング機能
4
回帰
回帰とは
回帰の仕組み
線形回帰
多変量線形回帰
回帰係数
非線形回帰
多変量非線形回帰
信頼限界
回帰問題の例
回帰モデルのテスト
残差プロット
回帰統計量
2乗平均平方根誤差
平均絶対誤差
Oracle Data Minerでのテスト・メトリック
回帰のアルゴリズム
5
分類
分類とは
分類問題の例
分類モデルのテスト
精度
混同マトリックス
リフト
リフト統計量
受信者操作特性(ROC)
ROC曲線
ROC曲線下面積
ROCとモデルのバイアス
ROC統計量
分類モデルのバイアス
コスト
コストと精度
ポジティブ・クラスとネガティブ・クラス
コストと利益の割当て
事前確率
分類のアルゴリズム
6
異常検出
異常検出とは
1クラス分類
1クラス・データの異常検出
外れ値検出用の異常検出
異常検出問題の例
例: 外れ値の検出
例: 新しいデータのスコアリング
異常検出のアルゴリズム
7
クラスタリング
クラスタリングとは
クラスタの解釈
クラスタの計算方法
クラスタ・ルール
支持度と信頼度
クラスタの数
属性ヒストグラム
クラスタの重心
新しいデータのスコアリング
クラスタリング問題の例
例: クラスタの特定
例: 新しいデータのスコアリング
クラスタリングのアルゴリズム
8
相関
相関とは
トランザクション
項目と集合
スパース・データ
項目セット
高頻度項目セット
相関問題の例
相関ルール用のアルゴリズム
9
特徴の選択と抽出
最適な属性の検出
特徴選択
属性評価用のデータ
例: 属性評価
例: 予測分析のEXPLAIN
特徴抽出
特徴抽出用のデータ
例: 作成データから作成した特徴
例: スコアリングされた特徴
特徴選択と特徴抽出のアルゴリズム
第III部 アルゴリズム
10
Apriori
Aprioriとは
相関ルール
前件と後件
信頼度
例: 高頻度項目セットからのルールの計算
相関ルール用のメトリック
支持度
信頼度
リフト
相関ルール用のデータ
11
ディシジョン・ツリー
ディシジョン・ツリーとは
ディシジョン・ツリーのルール
信頼度と支持度
ディシジョン・ツリーの利点
ディシジョン・ツリーの拡大
分岐
コスト・マトリックス
オーバーフィットの回避
ディシジョン・ツリー・モデルのXML
ディシジョン・ツリー・アルゴリズムのチューニング
ディシジョン・ツリー用のデータ準備
12
一般化線形モデル
一般化線形モデルとは
Oracle Data MiningのGLM
解釈性と透明性
ワイド・データ
信頼限界
リッジ回帰
リッジ回帰用の構築設定
リッジと信頼限界
リッジと分散拡大係数(線形回帰用)
リッジとデータ準備
GLM用のチューニングと診断
構築設定
診断
係数統計情報
グローバルなモデルの統計情報
行の診断情報
GLM用のデータ準備
線形回帰用のデータ準備
ロジスティック回帰用のデータ準備
欠損値
線形回帰
線形回帰の係数統計情報
線形回帰のグローバルなモデルの統計情報
線形回帰の行の診断情報
ロジスティック回帰
参照クラス
クラスの重み
ロジスティック回帰の係数統計情報
ロジスティック回帰のグローバルなモデルの統計情報
ロジスティック回帰の行の診断情報
13
k
-Means
k-Meansとは
k-Means用のデータ準備
14
最小記述長
MDLとは
MDL用のデータ準備
15
Naive Bayes
Naive Bayesとは
Naive Bayesの利点
Naive Bayesモデルのチューニング
Naive Bayes用のデータ準備
16
Non-Negative Matrix Factorization
NMFとは
仕組み
NMF用のデータ準備
17
O-Cluster
O-Clusterとは
O-Cluster用のデータ準備
O-Cluster用のユーザー定義のデータ準備
18
サポート・ベクター・マシン
サポート・ベクター・マシンとは
SVMの利点
Oracle Data MiningのSVMの利点
利用性
スケーラビリティ
カーネルベースの学習
能動学習
SVMモデルのチューニング
SVM用のデータ準備
正規化
SVMと自動データ準備
SVM分類
クラスの重み
1クラスSVM
SVM回帰
第IV部 データ準備
19
自動データ準備と組込みのデータ準備
概要
ケース表
データ型の変換
日付データ
テキスト変換
ビジネスおよび領域に関する変換
自動データ準備
自動データ準備の有効化
アルゴリズム固有の変換の概要
ビニング
正規化
外れ値の処理
アルゴリズムとADP
組込みのデータ準備
変換リストとADP
変換リストの作成
ネストした属性の変換
Oracle Data Miningの変換ルーチン
ビニング
正規化
外れ値の処理
透明性
モデルの詳細と作成データ
逆変換
逆変換式の変更
第V部 非構造化データのマイニング
20
テキスト・マイニング
非構造化データとは
Oracle Data Miningでの非構造化データのサポート方法
混合データ
テキスト・データ型
テキスト・マイニング・アルゴリズム
テキスト分類
多クラスのドキュメント分類
多ターゲットのドキュメント分類
ドキュメント分類のアルゴリズム
テキスト・クラスタリング
テキストの特徴抽出
テキストの相関
テキストの属性評価
マイニング用のテキストの準備
テキスト・マイニング問題の例
Oracle Data MiningとOracle Text
用語集
索引