54 ドキュメント・ローダー

Coherence RAGは、幅広いドキュメント・ソースからの取込みをサポートし、ファイル・システムおよびHTTPプロトコルの組込みサポートと、OCI Object Storage、AWS S3、Azure Blob StorageおよびGoogle Cloud Storageの統合を提供します。

さらに、OpenText、Documentum、SharePoint、Alfresco、およびその他のエンタープライズ・コンテンツ管理システムなどの独自のドキュメント・リポジトリへのサポートを拡張できる柔軟なフレームワークも提供します。

組込みドキュメント・ローダー

Coherence RAGには、`file`および`http`/`https`プロトコルに対する組込みの実装が含まれており、ローカル・ファイル・システムまたはWebから任意のドキュメントをロードできます。

前者は開発中にのみ実際に有用ですが、`http(s)`のサポートは、インターネット上で利用可能な任意のWebページまたはドキュメントを取り込むことができます。

クラウド・ドキュメント・ローダー

Coherence RAGでは、クラウド・ストレージ・ソリューション用の追加のドキュメント・ローダーもサポートされます。

組込みドキュメント・ローダーとは異なり、クラウド・ドキュメント・ローダーは、クラウド・プロバイダのSDKへの追加の依存関係を導入し、通常は追加の構成要件があるため、個別のモジュールにパッケージ化されます。

OCI ObjectStorage

Oracle Cloud Infrastructure (OCI) Object Storageは、`oci-object-storage-loader`モジュールによって実装されます。使用するには、次の依存関係をプロジェクトに追加する必要があります:

xml
<dependency>
  <groupId>${coherence.groupId}</groupId>
  <artifactId>coherence-rag-oci-object-storage-loader</artifactId>
  <version>${coherence.version}</version>
</dependency>

これにより、カスタムの`oci.os` URIプロトコルのドキュメント・ローダーが構成され、次のURI構文を使用してOCI ObjectStorageからドキュメントをロードできるようになります:


oci.os://<namespace>/<bucket>/<object>

たとえば、`axaxnpcrorw5`ネームスペースの`docs`バケットからドキュメント`coherence/coherence-rag.pdf`をロードするには、次のとおり参照します:


oci.os://axaxnpcrorw5/docs/coherence/coherence-rag.pdf

詳細は、[OCI Object Storageドキュメント](https://docs.oracle.com/en-us/iaas/Content/Object/home.htm)を参照してください。

構成

プライベートOCI ObjectStorageバケットからドキュメントをロードするには、OCIインスタンス認証用にクラスタ・メンバーを構成しないかぎり、認証に必要な詳細を指定する必要があります。

これには、次の構成オプションが必要です:


| Property             | Env Variable         | Description                              | Required  |
|----------------------|----------------------|------------------------------------------|-----------|
| oci.region           | OCI_REGION           | The OCI region to connect to             | Yes       |
| oci.tenant.id        | OCI_TENANT_ID        | The OCI tenant identifier                | Yes       |
| oci.user.id          | OCI_USER_ID          | The OCI user identifier                  | Yes       |
| oci.auth.key         | OCI_AUTH_KEY         | The path to a private authentication key | Yes       |
| oci.auth.fingerprint | OCI_AUTH_FINGERPRINT | The authentication fingerprint           | Yes       |

OCI Java SDK認証の詳細は、[ドキュメント](https://docs.oracle.com/en-us/iaas/Content/API/Concepts/devtoolslanding.htm)を参照してください。

AWS S3

Amazon Web Services (AWS) S3ローダーは、`aws-s3-loader`モジュールによって実装されます。使用するには、次の依存関係をプロジェクトに追加する必要があります:

xml
<dependency>
  <groupId>${coherence.groupId}</groupId>
  <artifactId>coherence-rag-aws-s3-loader</artifactId>
  <version>${coherence.version}</version>
</dependency>

これにより、カスタムの`s3` URIプロトコルのドキュメント・ローダーが構成され、次のURI構文を使用してAWS S3からドキュメントをロードできるようになります:

s3://<bucket>/<object>

たとえば、`coherence-rag-docs`バケットからドキュメント`coherence/coherence-rag.pdf`をロードするには、次のとおり参照します:

s3://coherence-rag-docs/coherence/coherence-rag.pdf

詳細は、[Amazon S3ドキュメント](https://docs.aws.amazon.com/s3)を参照してください。

構成

プライベートAmazon S3バケットからドキュメントをロードするには、認証に必要な詳細を指定する必要があります。これには、次の構成オプションが必要です:


| Property             | Env Variable           | Description                  | Required  |
|----------------------|------------------------|------------------------------|-----------|
| aws.region           | AWS_REGION             | The AWS region to connect to | Yes       |
| aws.accessKeyId      | AWS_ACCESS_KEY_ID      | The authentication key ID    | Yes       |
| aws.secretAccessKey  | AWS_SECRET_ACCESS_KEY  | The secret access key        | Yes       |

Amazon S3認証の詳細は、[ドキュメント](https://docs.aws.amazon.com/AmazonS3/latest/API/MakingRequests.html)を参照してください。

Azure Blob Storage

Azure Blob Storageローダーは、`azure-blob-storage-loader`モジュールによって実装されます。使用するには、次の依存関係をプロジェクトに追加する必要があります:

xml
<dependency>
  <groupId>${coherence.groupId}</groupId>
  <artifactId>coherence-rag-azure-blob-storage-loader</artifactId>
  <version>${coherence.version}</version>
</dependency>

これにより、カスタムの`azure.blob` URIプロトコルのドキュメント・ローダーが構成され、次のURI構文を使用してAzure Blob Storageからドキュメントをロードできるようになります:

azure.blob://<bucket>/<object>

たとえば、`coherence-rag-docs`バケットからドキュメント`coherence/coherence-rag.pdf`をロードするには、次のとおり参照します:

azure.blob://coherence-rag-docs/coherence/coherence-rag.pdf

詳細は、[Azure Blob Storageドキュメント](https://learn.microsoft.com/en-us/azure/storage/blobs/)を参照してください。