Extraction d'expression clé

L'extraction d'expressions clés désigne le processus automatisé d'extraction des mots les plus pertinents et des expressions du texte d'entrée. Cette opération permet de résumer le contenu et d'identifier les principaux sujets.

Le modèle d'extraction de phrases clés utilise le traitement du langage naturel et l'apprentissage automatique pour rechercher des données clés relatives aux points principaux du texte. Il comprend le texte d'entrée non structuré et retourne des mots clés et des phrases clés.

Les phrases clés se composent de sujets et d'objets évoqués dans le document. Les modificateurs, tels que les adjectifs associés à ces sujets et objets, sont également inclus dans la sortie. Des notes de confiance sont incluses pour chaque phrase clé. Les notes de confiance sont des valeurs comprises entre 0 et 1.

Cas d'utilisation

Voici certains cas d'utilisation dans un contexte professionnel :

  • Surveillance de marque

  • Suivi des études de marché

  • Analyse concurrentielle

  • Tickets de soutien à la clientèle

  • Analyse de la rétroaction des employés

  • Commentaires des clients

  • Analyse de courriels

Fonctions prises en charge

  • Phrases clés

  • Notes de confiance

  • Les demandes prennent en charge les lots d'enregistrements uniques et d'enregistrements multiples.

Langues prises en charge pour le texte d'entrée

  • Anglais
  • Espagnol

Exemples

Texte entré Phrases clés
Red Bull Racing Honda, the four-time Formula-1 World 
Champion team, has chosen Oracle Cloud Infrastructure 
(OCI) as their infrastructure partner. 
Red Bull Racing Honda 0.9997
Oracle Cloud Infrastructure 0.9583
infrastructure partner 0.9583
oci 0.9979
OCI recently added new services to the existing 
compliance program including SOC, HIPAA, and ISO, to enable our customers 
to solve their use cases. We also released new technical papers and 
guidance documents related to Object Storage, the Australian Prudential 
Regulation Authority (APRA), and the Central Bank of Brazil. These 
resources help regulated customers better understand how OCI 
supports their regional and industry-specific compliance requirements. 
Not only are we expanding our number of compliance offerings and 
regulatory alignments, we continue to add regions and services at 
a faster rate.
OCI 0.9999
new services 0.9998
existing compliance program 0.9998
including SOC 0.9998
use cases 0.9998
new white papers 0.9998
guidance documents 0.9998
Object Storage 0.9998
Australian Prudential Regulation Authority 0.9998
Central Bank of Brazil 0.9998
regulated customers 0.9998
industry-specific compliance requirements 0.9998
number of compliance offerings 0.9998
regulatory alignments 0.9998
faster rate 0.9998
ISO 0.9992
customers 0.9992
apra 0.9992
resources 0.9992
services 0.8186
HIPPA 0.9979
regions 0.9147

Les données JSON du premier exemple sont les suivantes :

Exemple de demande
POST https://<region-url>/20210101/actions/batchDetectLanguageKeyPhrases
Format de demande d'API :
{
  "documents": [
    {
      "key": "doc1",
      "text": "Red Bull Racing Honda, the four-time Formula-1 World Champion team, has chosen Oracle Cloud Infrastructure (OCI) as their infrastructure partner."
    }
  ]
}
Réponse JSON :
{
    "documents": [
        {
            "key": "1",
            "keyPhrases": [
                {
                    "text": "red bull racing honda",
                    "score": 0.9997546563973576
                },
                {
                    "text": "oracle cloud infrastructure",
                    "score": 0.9997546563973576
                },
                {
                    "text": "infrastructure partner",
                    "score": 0.9997546563973576
                },
                {
                    "text": "oci",
                    "score": 0.9979336625058923
                }
            ],
            "languageCode": "en"
        }
    ],
    "errors": []
}

Limites

  • Les phrases clés qui sont des phrases nominales avec des adjectifs modificateurs sont identifiées de sorte que les mots qui ne respectent pas ces critères soient ignorés.

  • Ce modèle n'est pas sensible à la casse.

  • Un texte qui contient plusieurs signes de ponctuation entre les mots peut être marqué en tant que phrase clé.

  • Les URL dont le format est correct (commençant par http, https ou www) sont identifiées.