54 ドキュメント・ローダー
Coherence RAGは、幅広いドキュメント・ソースからの取込みをサポートし、ファイル・システムおよびHTTPプロトコルの組込みサポートと、OCI Object Storage、AWS S3、Azure Blob StorageおよびGoogle Cloud Storageの統合を提供します。
さらに、OpenText、Documentum、SharePoint、Alfresco、およびその他のエンタープライズ・コンテンツ管理システムなどの独自のドキュメント・リポジトリへのサポートを拡張できる柔軟なフレームワークも提供します。
組込みドキュメント・ローダー
Coherence RAGには、`file`および`http`/`https`プロトコルに対する組込みの実装が含まれており、ローカル・ファイル・システムまたはWebから任意のドキュメントをロードできます。
前者は開発中にのみ実際に有用ですが、`http(s)`のサポートは、インターネット上で利用可能な任意のWebページまたはドキュメントを取り込むことができます。
クラウド・ドキュメント・ローダー
Coherence RAGでは、クラウド・ストレージ・ソリューション用の追加のドキュメント・ローダーもサポートされます。
組込みドキュメント・ローダーとは異なり、クラウド・ドキュメント・ローダーは、クラウド・プロバイダのSDKへの追加の依存関係を導入し、通常は追加の構成要件があるため、個別のモジュールにパッケージ化されます。
OCI ObjectStorage
Oracle Cloud Infrastructure (OCI) Object Storageは、`oci-object-storage-loader`モジュールによって実装されます。使用するには、次の依存関係をプロジェクトに追加する必要があります:
xml
<dependency>
<groupId>${coherence.groupId}</groupId>
<artifactId>coherence-rag-oci-object-storage-loader</artifactId>
<version>${coherence.version}</version>
</dependency>
これにより、カスタムの`oci.os` URIプロトコルのドキュメント・ローダーが構成され、次のURI構文を使用してOCI ObjectStorageからドキュメントをロードできるようになります:
oci.os://<namespace>/<bucket>/<object>
たとえば、`axaxnpcrorw5`ネームスペースの`docs`バケットからドキュメント`coherence/coherence-rag.pdf`をロードするには、次のとおり参照します:
oci.os://axaxnpcrorw5/docs/coherence/coherence-rag.pdf
詳細は、[OCI Object Storageドキュメント](https://docs.oracle.com/en-us/iaas/Content/Object/home.htm)を参照してください。
構成
プライベートOCI ObjectStorageバケットからドキュメントをロードするには、OCIインスタンス認証用にクラスタ・メンバーを構成しないかぎり、認証に必要な詳細を指定する必要があります。
これには、次の構成オプションが必要です:
| Property | Env Variable | Description | Required |
|----------------------|----------------------|------------------------------------------|-----------|
| oci.region | OCI_REGION | The OCI region to connect to | Yes |
| oci.tenant.id | OCI_TENANT_ID | The OCI tenant identifier | Yes |
| oci.user.id | OCI_USER_ID | The OCI user identifier | Yes |
| oci.auth.key | OCI_AUTH_KEY | The path to a private authentication key | Yes |
| oci.auth.fingerprint | OCI_AUTH_FINGERPRINT | The authentication fingerprint | Yes |
OCI Java SDK認証の詳細は、[ドキュメント](https://docs.oracle.com/en-us/iaas/Content/API/Concepts/devtoolslanding.htm)を参照してください。
AWS S3
Amazon Web Services (AWS) S3ローダーは、`aws-s3-loader`モジュールによって実装されます。使用するには、次の依存関係をプロジェクトに追加する必要があります:
xml
<dependency>
<groupId>${coherence.groupId}</groupId>
<artifactId>coherence-rag-aws-s3-loader</artifactId>
<version>${coherence.version}</version>
</dependency>これにより、カスタムの`s3` URIプロトコルのドキュメント・ローダーが構成され、次のURI構文を使用してAWS S3からドキュメントをロードできるようになります:
s3://<bucket>/<object>たとえば、`coherence-rag-docs`バケットからドキュメント`coherence/coherence-rag.pdf`をロードするには、次のとおり参照します:
s3://coherence-rag-docs/coherence/coherence-rag.pdf
詳細は、[Amazon S3ドキュメント](https://docs.aws.amazon.com/s3)を参照してください。
構成
プライベートAmazon S3バケットからドキュメントをロードするには、認証に必要な詳細を指定する必要があります。これには、次の構成オプションが必要です:
| Property | Env Variable | Description | Required |
|----------------------|------------------------|------------------------------|-----------|
| aws.region | AWS_REGION | The AWS region to connect to | Yes |
| aws.accessKeyId | AWS_ACCESS_KEY_ID | The authentication key ID | Yes |
| aws.secretAccessKey | AWS_SECRET_ACCESS_KEY | The secret access key | Yes |
Amazon S3認証の詳細は、[ドキュメント](https://docs.aws.amazon.com/AmazonS3/latest/API/MakingRequests.html)を参照してください。
Azure Blob Storage
Azure Blob Storageローダーは、`azure-blob-storage-loader`モジュールによって実装されます。使用するには、次の依存関係をプロジェクトに追加する必要があります:
xml
<dependency>
<groupId>${coherence.groupId}</groupId>
<artifactId>coherence-rag-azure-blob-storage-loader</artifactId>
<version>${coherence.version}</version>
</dependency>これにより、カスタムの`azure.blob` URIプロトコルのドキュメント・ローダーが構成され、次のURI構文を使用してAzure Blob Storageからドキュメントをロードできるようになります:
azure.blob://<bucket>/<object>
たとえば、`coherence-rag-docs`バケットからドキュメント`coherence/coherence-rag.pdf`をロードするには、次のとおり参照します:
azure.blob://coherence-rag-docs/coherence/coherence-rag.pdf
詳細は、[Azure Blob Storageドキュメント](https://learn.microsoft.com/en-us/azure/storage/blobs/)を参照してください。