Modèles préentraînés

OCI Search avec OpenSearch héberge divers modèles préentraînés OpenSearch. La prise en charge intégrée de ces modèles signifie que vous n'avez pas besoin d'importer le modèle, vous devez uniquement enregistrer et déployer le modèle pour le cluster.

OpenSearch fournit plusieurs modèles préentraînés open source pour une gamme de cas d'utilisation de recherche et d'analyse de machine learning (ML). OCI Search avec OpenSearch héberge les modèles préentraînés OpenSearch répertoriés dans cette section.

Transformateurs de phrases

Les modèles de transformateur de mentence mettent en correspondance des phrases et des paragraphes dans un espace vectoriel dense dimensionnel. Le nombre de vecteurs dépend du type de modèle. Vous pouvez utiliser ces modèles pour le clustering ou la recherche sémantique.

Nom de modèle Version Dimensions vectorielles Troncation automatique Format de script
huggingface/sentence-transformers/all-distilroberta-v1 1 Espace vectoriel dense en 768 dimensions. Oui

TORCH_SCRIPT

ONNX

huggingface/sentence-transformers/all-MiniLM-L6-v2 1 Espace vectoriel dense en 384 dimensions. Oui

TORCH_SCRIPT

ONNX

huggingface/sentence-transformers/all-MiniLM-L12-v2 1 Espace vectoriel dense en 384 dimensions. Oui

TORCH_SCRIPT

ONNX

huggingface/sentence-transformers/all-mpnet-base-v2 1 Espace vectoriel dense en 768 dimensions. Oui

TORCH_SCRIPT

ONNX

huggingface/sentence-transformers/msmarco-distilbert-base-tas-b 1 Espace vectoriel dense en 768 dimensions. Optimisé pour la recherche sémantique. Oui

TORCH_SCRIPT

ONNX

huggingface/sentence-transformers/multi-qa-MiniLM-L6-cos-v1 1 Espace vectoriel dense en 384 dimensions. Conçu pour la recherche sémantique et formé sur 215 millions de paires question/réponse. Oui

TORCH_SCRIPT

ONNX

huggingface/sentence-transformers/multi-qa-mpnet-base-dot-v1 1 Espace vectoriel dense en 384 dimensions. Oui

TORCH_SCRIPT

ONNX

huggingface/sentence-transformers/paraphrase-MiniLM-L3-v2 1 Espace vectoriel dense en 384 dimensions. Oui

TORCH_SCRIPT

ONNX

huggingface/sentence-transformers/paraphrase-multilingual-MiniLM-L12-v2 1 Espace vectoriel dense en 384 dimensions. Oui

TORCH_SCRIPT

ONNX