ヘッダーをスキップ

Oracle Content Management SDKインストレーションおよび構成ガイド
10g (9.0.4.2) for UNIX Systems

B15639-04
目次
目次
索引
索引

戻る 次へ

A Oracle CM SDK配置の計画

この付録は、Oracle CM SDKの構成および配置を決定するときの計画に役立つ情報を提供します。

この付録の項目は次のとおりです。

Oracle CM SDKのアーキテクチャおよび主要なOracleテクノロジーとの統合の詳細は、『Oracle Content Management SDK管理者ガイド』の第1章「概要」を参照してください。

Oracle CM SDK最小ハードウェア要件

表A-1「単一コンピュータの配置の最小ハードウェア要件」および表A-2「複数コンピュータの配置の場合(本番環境)の最小ハードウェア要件」に示す要件は、Oracle CM SDK中間層のインストールを使用することを基準にしています。

表A-1の情報は、Oracle CM SDKを専用の中間層コンピュータにインストールし、Oracle Ultra SearchおよびOracle Emailも配置する場合には、それらを別のコンピュータで実行することを前提にしています。

表A-1および表A-2には、Oracle Internet Directoryのための要件は含まれていません。Oracle Internet Directoryは、別のコンピュータにおいてインストール、構成および実行することをお薦めします。

表A-1    単一コンピュータの配置の最小ハードウェア要件 
摘要  要件 

コンピュータの数 

サポートされるOracle CM SDKユーザー 

同時接続で2ユーザー1 

CPUの数 

1(Oracle Textを索引付けに使用する場合はさらに1つ) 

最小プロセッサ・タイプ 

AIX CPU: すべてのAIX互換プロセッサ

HP CPU: HP-UX 11.0(64-bit)用HP 9000シリーズHP-UXプロセッサ

HP-UX Itanium CPU: HP-UX Itanium 64-bitプロセッサ

Linux CPU: 1GHzのPentium III

Tru64 CPU: Alphaプロセッサ

Solaris: Ultra 60 

RAM 

1GB 

ハードディスク・ドライブ領域およびスワップ領域 

最小8.5GBのハードディスク・ドライブ領域が必要。そのうちの6GBはOracle DatabaseおよびOracle Collaboration Suite中間層のインストール、2GBはスワップ領域に使用。 

1 同時接続ユーザーは、ある特定の時間内に操作を実行するユーザーです。

表A-2    複数コンピュータの配置の場合(本番環境)の最小ハードウェア要件 
摘要  要件 

コンピュータの数 

サポートされるOracle CM SDKユーザー 

同時接続で50ユーザー 

コンピュータ1: 中間層 

 

CPUの数 

最小プロセッサ・タイプ 

AIX CPU: すべてのAIX互換プロセッサ

HP CPU: HP-UX 11.0(64-bit)用HP 9000シリーズHP-UXプロセッサ

HP-UX Itanium CPU: HP-UX Itanium 64-bitプロセッサ

Linux CPU: 1GHzのPentium III

Tru64 CPU: Alphaプロセッサ

Solaris: Ultra 60 

RAM 

1.5GB 

ハードディスク・ドライブ領域およびスワップ領域 

最小4GBのハードディスク・ドライブ領域が必要。そのうちの2GBはOracle Collaboration Suite中間層のインストール、2GBはスワップ領域に使用。 

コンピュータ2: データベース 

 

CPUの数 

2(このうち1つはOracle Textによる索引付け用) 

RAM、ハードディスクおよびスワップ領域 

データベース・コンピュータの要件については、Oracle Databaseのインストレーション・ガイドおよびリリース・ノートを参照してください。 

表A-1のハードウェア要件は、過度なアクセスがなく2つのプロトコルを使用する2人程度のOracle CM SDK同時接続ユーザーに対応します。

表A-2のハードウェア要件は、約50人のOracle CM SDK同時接続ユーザーがすべてのプロトコルを適度に使用してアクセスするという環境をサポートします。

配置構成オプションと要件

本番環境では、次のガイドラインに従ってOracle CM SDKおよびOracle Application Serverを配置することをお薦めします。

詳細は、Oracle Application Serverのインストレーション・ガイドを参照してください。

Oracle Application Server InfrastructureおよびOracle Internet Directoryの使用

資格証明管理にOracle Internet Directoryを使用しない場合、Oracle CM SDKはOracle Application Server Infrastructureを必要としません。Oracle CM SDKでOracle Internet Directoryを使用する場合は、次のガイドラインに従います。

Oracle Application Serverのインストレーション・ガイドおよび『Oracle Internet Directory管理者ガイド』で、追加の推奨事項および要件を参照してください。

複数コンピュータの配置

Oracle CM SDKは、Oracle Application Serverによってサポートされる中間層アプリケーション・サーバー・ソフトウェアとして動作するように設計されています。最高のパフォーマンスを得るため、および管理を容易にするために、階層は別の物理コンピュータに配置する必要があります。すなわち、データベースを1台のコンピュータで実行し、Oracle Application ServerおよびOracle CM SDKソフトウェアを別のコンピュータで実行します。

Oracle Internet Directoryを使用してOracle CM SDKのユーザー資格証明を管理するには、Oracle Internet DirectoryおよびOracle Application Server Infrastructureを実行するための要件を満たす3台目のコンピュータにOracle Application Server Infrastructureをインストールおよび構成する必要があります。詳細は、『Oracle Application Server管理者ガイド』を参照してください。

配置の作業の概要は、次のとおりです。

データベース層(コンピュータ1)

データベース層には、Oracle9i Database Serverリリース2(9.2.0.4)以上またはOracle Database 10g を使用する必要があります。データベース・インスタンスは、「Oracle Database要件および推奨事項」に示す要件を満たしている必要があります。

Oracle Enterprise Manager 10g Grid Controlコンソールに対してOracle Internet DirectoryではなくOracle Management Agentの使用を計画している場合、そのコンピュータにGrid Controlコンソールをインストールします。オプションとして、Oracle Databaseを使用するようにこれを構成することもできます。

新規データベースを作成する場合の情報の設定については、付録B「Oracle Databaseの作成」を参照してください。

Oracle Application Server Infrastructure層(コンピュータ2)

  1. Oracle Application Server Infrastructureをインストールおよび構成します。

  2. Oracle CM SDKユーザー(および他のOracleアプリケーション)の認証に使用する場合にOracle Internet Directoryを構成します。

  3. Grid Controlコンソールを使用する場合、そのコンピュータでOracle Application Server Infrastructureが構成されているOracleホームにそれをインストールします。

    オプションとして、Oracle Application Server Infrastructureデータベースを使用するようにGrid Controlコンソールを構成することもできます。

アプリケーション・サーバー層(コンピュータ3)

  1. Oracle Application Server 10g リリース2(10.1.2)をインストールおよび構成します。Oracle Application Serverの「J2EE and Web Cache」インストール・オプションを使用することをお薦めします。

  2. Oracle Application Serverが構成されているOracleホームにOracle CM SDKをインストールおよび構成します。構成時に、データベース層のデータベース・インスタンスを使用して「新規Oracle CM SDKドメインの作成」を選択します。


    注意:

    Oracle Application Serverの構成時に「Oracle Application Server Infrastructureの使用」を選択し、Oracle Internet Directoryインスタンスを指定した場合は、ifscaツールを使用するときにOracle Internet Directoryが実行されている必要があります。 


  3. アップグレードする場合、すべてのカスタム・クラスを以前のOracle 9i FSまたはOracle CM SDKのインストールから次のディレクトリにコピーします。

    $ORACLE_HOME/ifs/cmsdk/custom_classes
    
    
  4. Oracle Management Agentを使用する場合、そのコンピュータで別のOracleホームにそれをインストールします。


    注意:

    LINKという名前のカスタム・クラスがある場合、Oracle CM SDKをインストールする前にそのクラス名を変更してください。 


単一コンピュータの配置

コンピュータがハードウェアおよびソフトウェアの要件を満たしている場合、Oracle CM SDKを単一のコンピュータにインストールできます。推奨する要件を満たさないコンピュータで構成すると、期待するパフォーマンスを得られません。

単一コンピュータの配置のハードウェア要件は、2つのプロトコルで同時にアクセスする2人までのOracle CM SDKユーザーに対応します。資格証明管理にOracle Internet Directoryを使用する場合、コンピュータにはOracleホーム・インスタンスが3つ必要です。このため、開発用または評価のみが目的の場合は、単一コンピュータの配置を使用することをお薦めします。

  1. Oracle9i Database Serverリリース2(9.2.0.4)以上またはOracle Database 10g を1つのOracleホームにインストールおよび構成します。

  2. Oracle Application Serverの「J2EE and Web Cache」インストール・タイプを、すべてデフォルト値のまま別の新規Oracleホームにインストールおよび構成します。

  3. Oracle Application Serverが含まれる同じOracleホームにOracle CM SDKをインストールします。

  4. アップグレードする場合、すべてのカスタム・クラスを以前のOracle 9i FSまたはOracle CM SDKのインストールから次のディレクトリにコピーします。

    $ORACLE_HOME/ifs/cmsdk/custom_classes
    


    注意:

    LINKという名前のカスタム・クラスがある場合、Oracle CM SDKをインストールする前にそのクラス名を変更してください。 


  5. Oracle CM SDK Configuration Assistantを使用して、第3章「インストールと構成」の指示に従ってOracle CM SDKを構成します。

プロトコルの選択

パフォーマンスおよびスケーラビリティに関して最も重要なのは、Oracle CM SDKへのアクセスに使用するプロトコルの選択です。

Oracle CM SDKへのアクセスには、可能なかぎりWide Area Network(WAN)のプロトコルを第1のメカニズムとして使用することをお薦めします。Local Area Network(LAN)のプロトコルは、2次的に使用するか、WANプロトコルを使用できないユーザーの場合にのみ使用します。

WANには次のプロトコルがあります。

LANには次のプロトコルがあります。

WANプロトコルは、一般にネットワーク・ラウンドトリップの点で効率がよく、エンド・ユーザーのリクエストを完了するのに少ないサーバー操作の実行で済みます。このため、エンド・ユーザーに対するパフォーマンスが向上します。

たとえば、Windowsコンピュータでドキュメントを表示または編集するには、SMBではなく、Microsoft Office 2000/XPでWebフォルダを使用することをお薦めします。


注意:

Webフォルダは、使用が推奨されていないWindows XPのWebDAVリダイレクタと異なります。

Webフォルダは、構文http://server/contentを使用してネットワーク・ドライブをマップすると作成され、「ネットワーク プレース」の下にドライブ文字なしで表示されます。

Webフォルダは、すべてのWindowsオペレーティング・システムで構成できます。

Windows XP WebDAVリダイレクタは、構文¥¥server¥targetを使用してネットワーク・ドライブをマップすると作成され、マウントされたドライブ(たとえば、E:)として表示されます。 


SMB、AFPまたはNFSと比較したWebフォルダのメリットは、次のとおりです(例としてSMBを挙げています)。

Webフォルダを使用する場合のデメリットは、次のとおりです。

サイジング・ガイドライン

この項では、Oracle CM SDKのサンプル配置に対するハードウェア要件、および実際の組織にOracle CM SDKを配置するのに必要なハードウェア構成を決定するための計算式について説明します。

この項には次の項目があります。

Oracle CM SDKのハードウェア要件は、主に表A-3に示す要素によって決定します。

表A-3    Oracle CM SDKのハードウェア要件を決定する主な要素 
ハードウェア資源  中間層コンピュータの要件の決定要素  データベース・コンピュータの要件の決定要素 

CPU 

  • 1秒当たりに実行される操作のピーク時の数

 
  • 1秒当たりに実行される操作のピーク時の数

  • Oracle Text索引付けを使用するかどうか

 

メモリー 

  • 1秒当たりに実行される操作のピーク時の数

  • 同時接続ユーザーのピーク時の数

  • 同時接続ユーザーごとに使用されるプロトコルの平均数

  • 同時接続ユーザーごとに使用されるセッションの平均数

  • SMB/AFP/NFSプロトコルのユーザーの数

  • フォルダごとのドキュメントの数

 
  • 1秒当たりに実行される操作のピーク時の数

  • ドキュメントの数

 

ディスク・サイズ 

該当なし 

  • ドキュメントの数

  • ドキュメントの平均コンテンツ・サイズ

 

ディスク・スループット

(このマニュアルでは触れていません) 

該当なし 

  • 1秒当たりに読取りおよび書込みされるドキュメントのピーク時の数

  • ドキュメントの平均コンテンツ・サイズ

 

ハードウェア要件を決定するためには、ユーザーが実行する作業の種類を想定する必要があります。次に示す数値は、ユーザー40,000人以上のオラクル社におけるOracle Files(Oracle CM SDKを使用して構築されたアプリケーション)の配置から補外される平均であり、Oracle CM SDKの使用計画の基準として使用できます。

表A-4    ユーザー・プロファイル 
ユーザー・タスク  接続ユーザーの操作の数(1時間当たり) 

フォルダを開く 

ドキュメントの読取りおよび書込み 

10 

問合せ 

0.1 


注意:

目的のユーザー・プロファイルが表A-4に示す平均値と比べて著しく大きい場合、またはOracle CM SDKアプリケーションが一般的なファイル・サーバーの代替として使用されない場合、このサイジング・ガイドラインは適切でない可能性があります。 


このサイジング・ガイドラインは、Sun Microsystemsハードウェアの同時接続ユーザー10,000人のベンチマークに基づいています。従業員数40,000人、ドキュメント数1,700万、コンテンツ量4TBに及ぶオラクル社におけるOracle Filesの本番環境での使用から得られた数値に対しても、このガイドラインを検証しています。そのシステムには、中間層コンピュータにIntel Linuxハードウェア、データベースにSun社製ハードウェアが使用されています。

各中間層コンピュータのサイジング計算式

この項目では、各中間層コンピュータの特定ハードウェアのサイジングを決定するために使用する計算式を示します。

次の表は、サイジング計算式の概要を示します。

表A-5    各中間層コンピュータに関するOracle CM SDKの一般的なサイジング推奨事項 
構成要素  サイジング推奨事項 

CPUの数 

切上げ(ピーク時の同時接続ユーザー数/250 + 33%の余裕) 

必要な使用可能ディスク領域 

ソフトウェアに最低500MB 

マシンの合計メモリー 

HTTPがプライマリ・プロトコルの場合、
480MB +3.6 MB * ピーク時の同時接続ユーザー数)

HTTPがプライマリ・プロトコルでない場合、または目的のユーザー・プロファイルが表A-4に示す平均値と異なる場合、
480MB +(1MB * ピーク時の同時接続ユーザー数 * 各同時接続ユーザーが使用する平均セッション数)+(3KB * Javaオブジェクト・キャッシュに想定するオブジェクト数)+(8MB * データベースへの接続数) 

CPUの数

必要なCPUの数を決定するための計算式は、次のとおりです。

roundup(peak concurrent connected users / 250 + 33% headroom)

最高の効率にするためには、CPUの75%のみを割り当てます。

この計算式は次の想定に基づきます。

必要な使用可能ディスク領域

ソフトウェアに最低500MBを割り当てます。これには次の点は考慮されていません。

コンピュータの合計メモリー(HTTPがプライマリ・プロトコルである場合)

HTTPがプライマリ・プロトコルである場合、コンピュータに必要な合計メモリーを決定するための計算式は、次のとおりです。

480MB + (3.6MB * peak concurrent connected users)

480MBは最初のOracle CM SDK中間層コンピュータ用です。3.6MBという値は次のように想定して計算されています。

コンピュータの合計メモリー(HTTP以外のプロトコルの場合)

HTTPがプライマリ・プロトコルではない場合、または目的のユーザー・プロファイルが表A-4に示す平均値と異なる場合、次の計算式を使用してコンピュータに必要な合計メモリーを決定します。

480MB + (1MB * peak concurrent connected users * average number of sessions in use by 
each concurrent connected user) + (3KB * number of objects desired in the Java object 
cache) + (8MB * number of connections to the database)

480MBは最初のOracle CM SDK中間層コンピュータ用です。他の値は次のように想定して計算されています。

データベース・コンピュータのサイジング計算式

この項目では、各データベース・コンピュータの特定ハードウェアのサイジングを決定するために使用する計算式を示します。

次の表は、サイジング計算式の概要を示します。

表A-6    データベース・コンピュータに関するOracle CM SDKの一般的な推奨事項 
構成要素  サイジング推奨事項 

CPUの数 

切上げ(ピーク時の同時接続ユーザー数/250 + 33%の余裕) 

必要な使用可能ディスク領域 

4.5GB +生ファイルの合計サイズ+(生ファイルの合計サイズ* 20%) 

マシンの合計メモリー 

64MB + 128MB +データベース・バッファ・キャッシュ+(1MB *データベースへの接続数)+(500バイト*ドキュメントの数)+(100KB *ピーク時の同時接続ユーザー数 

CPUの数

必要なCPUの数を決定するための計算式は、次のとおりです。

roundup(peak concurrent connected users / 250 + 33% headroom)

最高の効率にするためには、CPUの75%のみを割り当てます。Oracle Text索引付けを使用する場合、1つの追加CPUが新規ドキュメント・コンテンツのバックグラウンドOracle Text索引付け用に使用されます。

この計算式は次の想定に基づきます。

必要な使用可能ディスク領域

必要な使用可能ディスク領域を決定するための計算式は、次のとおりです。

4.5GB + total raw file size + (total raw file size * 20%)

4.5GBは、Oracleソフトウェアおよび初期データベース構成に必要な領域です。コンテンツの索引付けにOracle Textを使用しない場合、生ファイルの合計サイズに20%ではなく15%を乗じます。

コンピュータの合計メモリー

必要なコンピュータの合計メモリーを決定するための計算式は、次のとおりです。

64MB + 128MB + database buffer cache + (1MB * number of connections to the database) + 
(500 bytes * number of documents) + (100KB * peak concurrent connected users)

この計算式は次の想定に基づきます。

メモリーの要件: サンプル配置

各構成要素の中間層コンピュータのおおよその最小メモリー・オーバーヘッドは、表A-7に示すとおりです。

表A-7    構成要素別のメモリー・オーバーヘッド 
摘要  通常ノードおよびHTTPノードを実行する中間層コンピュータのおおよその最小メモリー量(MB)  追加のHTTPノードを実行する中間層コンピュータのおおよその最小メモリー量(MB)  追加の通常ノードを実行する中間層コンピュータのおおよその最小メモリー量(MB) 

コンピュータのブート時にオペレーティング・システムが使用するメモリー。 

60 

60 

60 

最初のJava仮想コンピュータ(JVM)のオーバーヘッド。 

30 

30 

30 

ドメイン・コントローラJVM。Oracle CM SDKプロトコルを実行している中間層コンピュータの数にかかわらず、単一のOracle CM SDKスキーマに対して1回のみこれを実行する必要があります。 

20 

Oracle Enterprise Manager Webサイト。Oracle Enterprise Managerによってノードを管理できるように、各ノードでこれを実行する必要があります。 

150 

150 

150 

通常Oracle CM SDKノードJVM。デフォルトで、FTP、NTFSなどのすべてのプロトコルおよびOracle CM SDKエージェントがこれにより実行されます。 

50 

50 

Oracle CM SDKノード・ガーディアンJVM。Oracle CM SDK通常ノードを監視し、ノード障害からリカバリします。 

10 

10 

デフォルトHTTPデーモンを含むOracle HTTP Server。HTTPアクセスが必要な場合のみ、これを実行する必要があります。 

30 

30 

Oracle CM SDK OC4Jプロセス。Oracle CM SDK HTTP/WebDAV/Oracle FileSyncアクセスが必要な場合のみ、これを実行する必要があります。Oracle HTTP Serverと対になります。 

130 

130 

合計 

480 

400 

300 

表領域

表A-8は、Oracle CM SDKに格納される様々なデータのタイプ、および各表領域の目的を示します。カスタム表領域の作成については、付録B「Oracle Databaseの作成」を参照してください。

表A-8    表領域の定義 
表領域タイプ  名前(Oracle CM SDK Configuration Assistantにおける)  表領域名の例  説明 

ドキュメント・ストレージ 

索引付けされたメディア 

IFS_LOB_I 

テキスト・ファイルやワード・プロセッシング・ファイルなど、Oracle Textによって索引付けされたドキュメントのラージ・オブジェクト(LOB)データを格納します。 

ドキュメント・ストレージ 

索引付けされていないメディア 

IFS_LOB_N 

zipファイルなど、Oracle Textによって索引付けされていないドキュメントのLOBデータを格納します。 

ドキュメント・ストレージ 

interMediaメディア 

IFS_LOB_M 

イメージ、オーディオ、ビデオのファイルなど、Oracle interMediaによって索引付けされたドキュメントのLOBデータを格納します。 

Oracle Text 

Oracle Textデータ 

IFS_CTX_I 

Oracle CM SDKドキュメントからOracle Textによって抽出された単語(トークン)を格納します(Oracle表DR$IFS_TEXT$I)。 

Oracle Text 

Oracle Text索引 

IFS_CTX_X 

Oracle TextトークンのOracle B*ツリー索引を格納します(Oracle索引DR$IFS_TEXT$X)。 

Oracle Text 

Oracle Textキーマップ 

IFS_CTX_K 

各種Oracle Text表を格納します(Oracle表DR$IFS_TEXT$KDR$IFS_TEXT$NDR$IFS_TEXT$R)。 

メタデータ 

プライマリ 

IFS_MAIN 

ドキュメントのメタデータ、ユーザーやグループに関する情報およびその他のOracle CM SDKオブジェクト・データを格納します。 

一般Oracleストレージ 

該当なし 

その他 

Oracleデータ・ディクショナリ、トランザクション中の一時ファイルなどを格納する

SYSTEMROLLBACKTEMPおよびその他の表領域。 

代表的な表領域の記憶域およびディスクI/Oを、表A-9に示します。

表A-9    表領域の記憶域の要件およびディスクI/O 
表領域  I/Oスループット要件の合計に対する割合  ディスク領域の要件に対する割合 

IFS_MAIN 

50% 

2% 

IFS_CTX_X 

20% 

1% 

IFS_CTX_I 

10% 

1% 

IFS_LOB_I 

8% 

35% 

IFS_LOB_N 

5% 

55% 

その他 

5% 

1% 

IFS_LOB_M 

1% 

4% 

IFS_CTX_K 

1% 

1% 

合計 

100% 

100 

表A-9に関して次の点に注意してください。

ドキュメントのOracle Databaseへの格納

ディスク領域の最も大きな消費は、Oracle CM SDK内にあるドキュメント(索引付けされたメディアの表領域、索引付けされていないメディアの表領域およびinterMediaの表領域)を実際に収めているディスクにおいて発生します。この項では、ドキュメントの格納方法およびそのドキュメントが必要とする領域の算出方法について説明します。

前述のとおり、Oracle CM SDKに格納されるドキュメントは、実際にはデータベース表領域に格納されます。Oracle CM SDKは、Oracleデータベースのラージ・オブジェクト(LOB)機能を使用しています。データベースが提供するLOBの1タイプであるバイナリ・ラージ・オブジェクト(BLOB)として、すべてのドキュメントが格納されます。LOBは、データベースに格納される通常データと同様にトランザクション・セマンティクスを規定します。セマンティクスを規定するために、それぞれで変更およびリカバリできる小さな部分にLOBを分割する必要があります。この小さな部分はチャンクと呼ばれます。チャンクは、LOB列を含む表領域のうちの、1つ以上の連続したデータベース・ブロックからなるグループです。

ブロック内のデータベース・ブロック情報およびチャンク情報の両方(BlockOverhead)が、格納されるデータのオーバーヘッドになります。現在のBlockOverheadは、ブロック当たり60バイトで、ブロック・ヘッダー、LOBヘッダーおよびブロック・チェックサムで構成されています。Oracle CM SDKは、LOBを32KBのチャンク・サイズに構成しています。

たとえば、データベースのDB_BLOCK_SIZEパラメータを8192(8KB)に設定すると想定します。1つのチャンクには、4つの連続したブロックが必要で、オーバーヘッドは240バイトです。このチャンクで使用可能な領域は、32768-240=32528バイトです。

Oracle CM SDKに格納される各ドキュメントは、整数値のチャンクで構成されます。たとえば前の例の場合、500KBのドキュメントは512000/32528=15.74=16のチャンクを使用します。16のチャンクは16*32K = 524288バイトです。このドキュメントを格納するチャンク・オーバーヘッドは524288-512000=12288バイトであり、元のドキュメント・サイズの2.4%に相当します。

Oracle CM SDKが使用するチャンク・サイズは、ドキュメントに対して最適のアクセス時間になるように設定されています。1つのチャンクより小さなドキュメントの場合、少なくても1つのチャンクが使用されるので、オーバーヘッドがディスク領域の多くの部分を占めることになります。

LOBのトランザクション・セマンティクスに必要なもう1つの構造は、LOB索引です。LOB索引の各エントリは、特定LOBオブジェクトのうちの8つのチャンクを指すことができます(NumLobPerIndexEntry = 8)。前述の例である16のチャンクを使用する500KBのドキュメントの場合、そのオブジェクトに対して2つの索引エントリが必要です。各エントリは、46バイト(LobIndexEntryOverhead)でOracle B*ツリー索引に格納されます。この索引にも、どのように断片化されるかによってそれ自体のオーバーヘッドがあります。

LOB領域の使用に影響する最後の要素は、LOB列の作成時に使用されるPCTVERSIONパラメータです。PCTVERSIONの機能については、『Oracle9i SQLリファレンス』を参照してください。

Oracle CM SDKは、作成するLOB列に対してデフォルトで10%のPCTVERSIONを使用します。これにより、読込み一貫性ビューでの「ORA-22924スナップショットが古すぎる」というエラーの発生の可能性が低減します。このようにデフォルトで、最小のチャンク領域の10%増加を所定のディスク使用量に加えて、永続的なPCTVERSIONチャンクを可能にする必要があります。

ディスク領域が問題となる大規模システムでは、ディスク記憶域の要件を減らすために、PCTVERSIONを1に減らすことをお薦めします。これは、次のSQLコマンドを使用して、実行中のシステムでいつでも変更できます。

alter table odmm_contentstore modify lob (globalindexedblob) (pctversion 1);
alter table odmm_contentstore modify lob (emailindexedblob) (pctversion 1);
alter table odmm_contentstore modify lob (emailindexedblob_t) (pctversion 1);
alter table odmm_contentstore modify lob (intermediablob) (pctversion 1);
alter table odmm_contentstore modify lob (intermediablob_t) (pctversion 1);
alter table odmm_nonindexedstore modify lob (nonindexedblob2) (pctversion 1);

LOB表領域の使用量を計算するには、次の手順に従います。

  1. チャンク当たりのブロック数を計算し、チャンク・サイズからBlockOverhead(60バイト)を引いてチャンク当たりの使用可能領域を計算し、ファイルが使用するチャンク数を算出します。

  2. ファイル・サイズをチャンク当たりの使用可能領域で割ってチャンク数を計算します。式は次のとおりです。

    chunks = roundup(FileSize/(ChunkSize-((ChunkSize/BlockSize)*BlockOverhead)))
    
    

    たとえば、FileSize = 100,000、ChunkSize = 32768、Blocksize = 8192、BlockOverhead = 60の場合、次のとおりです。

    chunks = roundup (100000 /(32768 - ((32768 / 8192) * 60)))= 4 Chunks
    
    
  3. チャンク数とチャンク・サイズを乗じた結果にPCTVERSION係数を乗じ、NumLobPerIndexEntry(8バイト)およびLobIndexEntryOverhead(46バイト)の領域を加えてファイルのディスク領域を計算します。式は次のとおりです。

    FileDiskSpaceInBytes = roundup(chunks*ChunkSize*PctversionFactor) + 
    roundup(chunks/NumLobPerIndexEntry*LobIndexEntryOverhead)
    
    

    たとえば、chunks = 4、ChunkSize = 32768、PctversionFactor = 1.1、NumLobPerIndexEntry = 8、LobIndexEntryOverhead = 46の場合、次のとおりです。

    FileDiskSpaceInBytes = roundup (4 * 32768 * 1.1) + (roundup(4/8) * 46) = 144226 
    FileDiskSpaceInBytes
    
    
  4. LOBに格納する各ファイルの前述の式で計算した結果を合計し、ファイル格納に使用する合計ディスク領域を計算します。式は次のとおりです。

    TableSpaceUsage = sum(FileDiskSpaceInBytes) for all files stored 
    
    

Oracle CM SDKは、複数のLOB列を作成します。領域計算は、表領域への格納に適したコンテンツの容量に基づいて表領域ごとに行う必要があります。

Oracle CM SDKのメタデータおよびインフラストラクチャ

Oracle CM SDKサーバーは、ファイル・システムとそのファイル・システムのコンテンツに関する永続的な情報をデータベース表に保持します。その表とそれに関連する構造は、Oracle CM SDKプライマリ表領域に格納されます。この表領域には、およそ300の表および500の索引が含まれています。ファイル・システムとそのファイル・システムを使用する様々なプロトコルおよびユーザー・インタフェースをサポートするために、このような構造が必要になっています。

この領域の管理および計画の作業は、通常のOracle Databaseのインストールでの操作に類似しています。システムの管理者は、表領域から使用するドキュメントごとに約6KBのオーバーヘッドまたはコンテンツ全体の約2%を考慮しておく必要があります。カテゴリなどの大量のカスタム・メタデータがある場合は、このオーバーヘッドはさらに大きくなります。

表領域に割り当てられる初期ディスク領域は、デフォルト・インストールで約50MBです。50MBのうちの16MBが、インストールの完了で実際に使用されます。その中には、すべての必要な表と索引、およびインストールの一部としてOracle CM SDKにロードされる約700のファイルに必要なメタデータが含まれます。それぞれのインストールで使用されるOracle CM SDKの機能によって、この表領域内の様々な表および索引が様々な割合で増大します。

Oracle Text

Oracle CM SDKがOracle Textとともに動作する場合、ユーザーはOracle CM SDKに格納されたドキュメントを対象とした強力な検索機能へアクセスできます。この機能のためのディスク領域は、最高のパフォーマンスを得るために、3つの異なる表領域に分割されます。

Oracle Textデータ表領域には、索引付けされた様々なドキュメントにあるテキスト・トークン(個々の単語)を保持する表が含まれます。このテキスト・トークンの記憶域は、ドキュメントのASCIIコンテンツにほぼ比例します。

ASCIIコンテンツの割合は、元のドキュメントの形式によって異なります。テキスト・ファイルのみにASCII以外のコンテンツとして空白があるので、テキスト・ファイルはドキュメント当たりの割合のオーバーヘッドが大きくなります。Microsoft WordまたはPowerPointなどのドキュメント・タイプには、テキスト・トークンに相当しないフォーマットに必要な大量のデータが含まれます。そのため、このタイプのドキュメントに関するドキュメント当たりの割合は小さくなります。様々なコンテンツ・タイプがあるシステムにおけるオーバーヘッドの予測値は、索引付けされたドキュメントの元のサイズの合計の約8%です。

表A-10は、一般的なファイル形式のドキュメントにおけるASCIIテキストの容量のガイドラインです。

表A-10    ドキュメント・タイプ別の平均ASCIIコンテンツ 
形式  プレーンASCIIコンテンツ(ファイル・サイズの割合)  すべてのドキュメント・コンテンツに対する一般的な割合1 

Microsoft Excel2 

250% 

4% 

ASCII 

100% 

2% 

HTML 

90% 

10% 

リッチ・テキスト形式 

80% 

Microsoft Word 

70% 

13% 

Acrobat PDF 

10% 

18% 

Microsoft PowerPoint 

1% 

3% 

イメージ(JPEG、BMP)、圧縮ファイル(Zip、TAR)、バイナリ・ファイルなど 

0% 

50% 

合計 

  

100% 

1 オラクル社におけるOracle CM SDKの内部利用の統計より。

2 デフォルトで、Oracle Textは、Excelドキュメントの各数値を別個の単語として索引付けします。ExcelはASCIIの場合より効率的に数値を格納するので、ファイル・サイズの割合から見たASCIIコンテンツは100%を超えます。

Oracle Textキーマップ表領域には、ドキュメントのOracle CM SDKロケータ(Oracle CM SDK DocID)から同じドキュメントのOracle Textロケータ(Oracle Text DocID)に変換するために必要な表および索引が含まれます。この表領域の領域使用の予測値は、索引付けされたドキュメントごとに約70バイトです。

Oracle Text索引表領域には、Oracle Textデータ表領域に格納されたテキスト・トークン情報と照合して使用されるB*ツリー・データベース索引が含まれます。この表領域は、Oracle Textデータ表領域の場合と同様にASCIIコンテンツに比例して増えます。様々なコンテンツ・タイプがあるシステムにおけるオーバーヘッドの期待値は、ドキュメントのASCIIコンテンツの合計の約4%、または索引付けされたドキュメントの合計サイズの合計の約1%です。

ディスク領域の要件: サンプル配置

この項目では、ディスク領域の要件を示し、サーバーにドキュメントが追加されると必要なディスク領域が増大することを明らかにします。

オラクル社の社内利用のためにOracle CM SDKを実行した実績に基づく、大規模システム(数百GBのファイル・コンテンツ)のOracle CM SDKのディスク・オーバーヘッドは、表A-11に示すとおりです。

表A-11    ディスク領域の要件の概要 
表領域オーバーヘッド・タイプ  生ファイル・コンテンツの合計に対するオーバーヘッド1  主な決定要素 

ドキュメント・ストレージ 

12% 

チャンク・サイズ(デフォルト32KB)を基準とするドキュメントのサイズ 

Oracle Text 

5% 

すべてのドキュメントのASCIIコンテンツの量 

メタデータ 

2% 

フォルダ、ドキュメントなどの数 

一般Oracleストレージ 

1% 

TEMPUNDOおよびその他の表領域に関する固定された構成不可のデータベース設定 

合計 

20% 

  

1 これには次の領域は含まれていません。バックアップおよび信頼性のためのミラー化。挿入されるドキュメント数およびドキュメントのサイズによって決まるREDOログ・サイズ、各データベース・ファイルの最後のエクステントの未使用部分(事前作成されたデータベースの未使用部分はこれに該当します。また、エクステント拡大率が大きく設定されている場合にはこのサイズが大きくなる場合があります)。

ラージ・オブジェクト(LOB)、表領域、チャンク・サイズおよびエクステントの用語の説明は、『Oracle9i データベース概要』を参照してください。

オーバーヘッドのうちの多くの割合をLOBのオーバーヘッドが占める場合、Oracle CM SDKインスタンスのオーバーヘッドは、ドキュメント・サイズの平均値および中央値によって異なります。


戻る 次へ
Oracle
Copyright © 2007 Oracle Corporation.

All Rights Reserved.
目次
目次
索引
索引