Recherche de fichier

Utilisez la recherche de fichier pour permettre au modèle d'extraire le contenu pertinent des fichiers stockés dans une banque de vecteurs lors de la génération de la réponse. Cela est utile lorsque vous voulez que les réponses reflètent les documents que vous fournissez plutôt que de compter uniquement sur les connaissances intégrées du modèle.

En créant des banques de vecteurs et en y ajoutant des fichiers, vous activez la recherche sémantique et basée sur des mots-clés dans vos données. Cela étend les connaissances intégrées du modèle avec votre contenu personnalisé et aide à produire des réponses plus précises et contextuelles.

Etant donné que la recherche de fichier est gérée par le service, votre application n'a pas besoin d'implémenter son propre pipeline d'extraction.

Préparer un magasin de vecteurs

Avant d'utiliser la recherche de fichiers, créez une banque de vecteurs et ajoutez les fichiers que le modèle doit référencer. OCI Generative AI prend en charge les API suivantes pour la gestion des fichiers et des banques de vecteurs :

Ensemble d'API Description
Fichiers Charger et gérer des fichiers.
Fichiers de banque de vecteurs Gérer les fichiers joints à une banque de vecteurs.
Lots de fichiers du magasin de vecteurs Ajoutez et gérez plusieurs fichiers dans un lot de stockage vectoriel.
Fichiers de conteneur Gérer les fichiers dans un conteneur.

Exemple

Pour utiliser la recherche de fichier dans une demande, ajoutez une définition d'outil dans la propriété tools avec type: "file_search" et fournissez l'ID de banque de vecteurs.

response = client.responses.create(
    model="openai.gpt-oss-120b",
    input="Summarize the main ideas covered in the documents in this vector store.",
    tools=[
        {
            "type": "file_search",
            "vector_store_ids": ["<vector_store_id>"]
        }
    ]
)

print(response)

Dans cet exemple :

  • Le modèle peut utiliser le contenu de stockage vectoriel lors de la génération de la réponse.
  • L'extraction de fichiers est gérée par la plate-forme.
  • Les paramètres de recherche hybride ne sont pas pris en charge avec l'outil de recherche de fichier.