Modèles préentraînés

La recherche OCI avec OpenSearch héberge divers modèles préentraînés OpenSearch. La prise en charge intégrée de ces modèles signifie que vous n'avez pas besoin d'importer le modèle. Il vous suffit d'enregistrer et de déployer le modèle pour la grappe.

OpenSearch fournit plusieurs modèles préentraînés à source ouverte pour une gamme de cas d'utilisation de recherche et d'analyse par apprentissage automatique. La recherche OCI avec OpenSearch héberge les modèles préentraînés OpenSearch répertoriés dans cette section.

Transformateurs de phrase

Les modèles de transformateur de phrase mappent des phrases et des paragraphes sur un espace vectoriel dense dimensionnel. Le nombre de vecteurs dépend du type de modèle. Vous pouvez utiliser ces modèles pour la mise en grappe ou la recherche sémantique.

Nom de modèle Version Dimensions vectorielles Troncation automatique Format de script
huggingface/sentence-transformers/all-distilroberta-v1 1 Espace vectoriel dense à 768 dimensions. Oui

TORCH_SCRIPT

ONNX

huggingface/sentence-transformers/all-MiniLM-L6-v2 1 Espace vectoriel dense à 384 dimensions. Oui

TORCH_SCRIPT

ONNX

huggingface/sentence-transformers/all-MiniLM-L12-v2 1 Espace vectoriel dense à 384 dimensions. Oui

TORCH_SCRIPT

ONNX

huggingface/sentence-transformers/all-mpnet-base-v2 1 Espace vectoriel dense à 768 dimensions. Oui

TORCH_SCRIPT

ONNX

huggingface/sentence-transformers/msmarco-distilbert-base-tas-b 1 Espace vectoriel dense à 768 dimensions. Optimisé pour la recherche sémantique. Oui

TORCH_SCRIPT

ONNX

huggingface/sentence-transformers/multi-qa-MiniLM-L6-cos-v1 1 Espace vectoriel dense à 384 dimensions. Conçu pour la recherche sémantique et formé sur 215 millions de paires question/réponse. Oui

TORCH_SCRIPT

ONNX

huggingface/sentence-transformers/multi-qa-mpnet-base-dot-v1 1 Espace vectoriel dense à 384 dimensions. Oui

TORCH_SCRIPT

ONNX

huggingface/sentence-transformers/paraphrase-MiniLM-L3-v2 1 Espace vectoriel dense à 384 dimensions. Oui

TORCH_SCRIPT

ONNX

huggingface/sentence-transformers/paraphrase-multilingual-MiniLM-L12-v2 1 Espace vectoriel dense à 384 dimensions. Oui

TORCH_SCRIPT

ONNX