Extraction d'expressions clés

L'extraction de mots-clés est le processus automatisé d'extraction des mots les plus pertinents et des expressions du texte saisi. Ce processus permet de récapituler le contenu et de reconnaître les principaux sujets.

Le modèle d'extraction d'expressions clés utilise le traitement du langage naturel et l'apprentissage automatique pour rechercher des informations relatives aux principaux points du texte. Il comprend le texte saisi non structuré, et renvoie les mots-clés et les expressions clés.

Les expressions clés se composent de sujets et d'objets qui sont abordés dans le document. Tous les modificateurs, tels que les adjectifs associés à ces sujets et objets, sont également inclus dans le résultat. Les scores de confiance sont inclus pour chaque expression clé qui indique la confiance à l'égard de l'expression clé. Les scores de confiance sont une valeur comprise entre 0 et 1.

Cas d'emploi

Voici quelques cas d'emploi relatifs aux entreprises :

  • Surveillance de la marque

  • Surveillance des études de marché

  • Analyse de la concurrence sur le marché

  • Tickets de support technique

  • Analyse des commentaires des employés

  • Avis des clients

  • Analyse de courriel

Fonctionnalités prises en charge

  • Expressions clés

  • Scores de confiance

  • Les demandes prennent en charge les batches d'enregistrements uniques et de plusieurs enregistrements.

Langues prises en charge pour le texte d'entrée

  • Anglais
  • Espagnol

Exemples

Texte saisi Expressions clés
Red Bull Racing Honda, the four-time Formula-1 World 
Champion team, has chosen Oracle Cloud Infrastructure 
(OCI) as their infrastructure partner. 
Red Bull Racing Honda 0.9997
Oracle Cloud Infrastructure 0.9583
infrastructure partner 0.9583
oci 0.9979
OCI recently added new services to the existing 
compliance program including SOC, HIPAA, and ISO, to enable our customers 
to solve their use cases. We also released new technical papers and 
guidance documents related to Object Storage, the Australian Prudential 
Regulation Authority (APRA), and the Central Bank of Brazil. These 
resources help regulated customers better understand how OCI 
supports their regional and industry-specific compliance requirements. 
Not only are we expanding our number of compliance offerings and 
regulatory alignments, we continue to add regions and services at 
a faster rate.
OCI 0.9999
new services 0.9998
existing compliance program 0.9998
including SOC 0.9998
use cases 0.9998
new white papers 0.9998
guidance documents 0.9998
Object Storage 0.9998
Australian Prudential Regulation Authority 0.9998
Central Bank of Brazil 0.9998
regulated customers 0.9998
industry-specific compliance requirements 0.9998
number of compliance offerings 0.9998
regulatory alignments 0.9998
faster rate 0.9998
ISO 0.9992
customers 0.9992
apra 0.9992
resources 0.9992
services 0.8186
HIPPA 0.9979
regions 0.9147

Le contenu JSON pour le premier exemple est le suivant :

Exemple de demande
POST https://<region-url>/20210101/actions/batchDetectLanguageKeyPhrases
Format de demande d'API :
{
  "documents": [
    {
      "key": "doc1",
      "text": "Red Bull Racing Honda, the four-time Formula-1 World Champion team, has chosen Oracle Cloud Infrastructure (OCI) as their infrastructure partner."
    }
  ]
}
Contenu JSON de la réponse :
{
    "documents": [
        {
            "key": "1",
            "keyPhrases": [
                {
                    "text": "red bull racing honda",
                    "score": 0.9997546563973576
                },
                {
                    "text": "oracle cloud infrastructure",
                    "score": 0.9997546563973576
                },
                {
                    "text": "infrastructure partner",
                    "score": 0.9997546563973576
                },
                {
                    "text": "oci",
                    "score": 0.9979336625058923
                }
            ],
            "languageCode": "en"
        }
    ],
    "errors": []
}

Limites

  • Les expressions clés qui sont des noms associés à des adjectifs qui agissent comme modificateurs sont identifiées afin que les mots qui ne suivent pas ces critères puissent être ignorés.

  • Ce modèle ne distingue pas les majuscules des minuscules.

  • Un texte qui contient plusieurs signes de ponctuation entre les mots peut être désigné comme une expression clé.

  • Les URL dont le format est correct (commençant par http, https ou www) sont identifiées.