Estrazione frase chiave

L'estrazione delle parole chiave è il processo automatico di estrazione delle parole più rilevanti e delle espressioni dal testo di input. Aiuta a riassumere il contenuto e riconosce gli argomenti principali.

Il modello di estrazione delle frasi chiave utilizza NLP e ML per trovare approfondimenti relativi ai punti principali del testo. Comprende il testo di input non strutturato e restituisce parole chiave e frasi chiave (KP).

I KP sono costituiti da soggetti e oggetti di cui si parla nel documento. Nell'output vengono inclusi anche tutti i modificatori, ad esempio gli aggettivi associati a questi oggetti e argomenti. I punteggi di confidenza per ogni frase chiave che indicano la fiducia sul KP sono inclusi. I punteggi di affidabilità sono un valore compreso tra 0 e 1.

Casi d'uso

Alcuni casi d'uso aziendali sono:

  • Monitoraggio del marchio

  • Monitoraggio delle ricerche di mercato

  • Analisi di mercato competitiva

  • Ticket di assistenza clienti

  • Analisi feedback dipendente

  • Recensioni dei clienti

  • Analisi e-mail

Funzioni supportate

  • Parole chiave

  • Punteggi affidabilità

  • Le richieste supportano batch a record singolo e a più record.

Lingue supportate per testo di input

  • Inglese
  • spagnolo

Esempi

Testo di input Frasi chiave
Racing Cars, the four-time  World 
Champion team, has chosen Oracle Cloud Infrastructure 
(OCI) as their infrastructure partner. 
Racing Cars 0.9997
Oracle Cloud Infrastructure 0.9583
infrastructure partner 0.9583
oci 0.9979
OCI recently added new services to the existing 
compliance program including SOC, HIPAA, and ISO, to enable our customers 
to solve their use cases. We also released new technical papers and 
guidance documents related to Object Storage, the Asteroid Prudential 
Regulation Authority (APRA), and the Central Bank of Bankland. These 
resources help regulated customers better understand how OCI 
supports their regional and industry-specific compliance requirements. 
Not only are we expanding our number of compliance offerings and 
regulatory alignments, we continue to add regions and services at 
a faster rate.
OCI 0.9999
new services 0.9998
existing compliance program 0.9998
including SOC 0.9998
use cases 0.9998
new white papers 0.9998
guidance documents 0.9998
Object Storage 0.9998
Asteroid Prudential Regulation Authority 0.9998
Central Bank of Bankland 0.9998
regulated customers 0.9998
industry-specific compliance requirements 0.9998
number of compliance offerings 0.9998
regulatory alignments 0.9998
faster rate 0.9998
ISO 0.9992
customers 0.9992
apra 0.9992
resources 0.9992
services 0.8186
HIPPA 0.9979
regions 0.9147

Il JSON per il primo esempio è:

Richiesta campione
POST https://<region-url>/20210101/actions/batchDetectLanguageKeyPhrases
Formato richiesta API:
{
  "documents": [
    {
      "key": "doc1",
      "text": "Racing Cars, the four-time  World Champion team, has chosen Oracle Cloud Infrastructure (OCI) as their infrastructure partner."
    }
  ]
}
JSON risposta:
{
    "documents": [
        {
            "key": "1",
            "keyPhrases": [
                {
                    "text": "red bull racing honda",
                    "score": 0.9997546563973576
                },
                {
                    "text": "oracle cloud infrastructure",
                    "score": 0.9997546563973576
                },
                {
                    "text": "infrastructure partner",
                    "score": 0.9997546563973576
                },
                {
                    "text": "oci",
                    "score": 0.9979336625058923
                }
            ],
            "languageCode": "en"
        }
    ],
    "errors": []
}

Limitazioni

  • Le frasi chiave che sono frasi sostantive con modificatori aggettivi vengono identificate in modo che le parole che non seguono questi criteri possano essere ignorate.

  • Questo modello non fa distinzione tra maiuscole e minuscole.

  • Il testo che contiene più punteggiatura tra le parole potrebbe essere contrassegnato come frase chiave.

  • Vengono identificati gli URL che sono ben formati (a partire da http, https o www).