Extração de Frase-chave

A extração de palavras-chave é o processo automatizado de extração das palavras com mais relevância e expressões do texto de entrada. Ela ajuda a resumir o conteúdo e reconhece os principais tópicos.

O modelo de extração de frases-chave usa o NLP e o ML para encontrar insights relacionados aos pontos principais do texto. Ele entende o texto de entrada não estruturado e retorna palavras-chave e frases-chave (KPs).

As KPs consistem em assuntos e objetos que estão sendo falados no documento. Quaisquer modificadores, como adjetivos associados a esses sujeitos e objetos, também são incluídos na saída. Pontuações de confiança para cada frase-chave que significam a confiança sobre o KP são incluídas. As pontuações de confiança são um valor de 0 a 1.

Casos de Uso

Alguns casos de uso comercial são:

  • Monitoramento de marca

  • Monitoramento da pesquisa de mercado

  • Análise competitiva de mercado

  • Tíquetes de suporte ao cliente

  • Análise de feedback do funcionário

  • Avaliações de clientes

  • Análise por e-mail

Recursos com Suporte

  • Frases-chave

  • Pontuações de confiança

  • As solicitações suportam registros únicos e batches de vários registros.

Idiomas Suportados para Texto de Entrada

  • Inglês
  • Espanhol

Exemplos

Texto de Entrada Frases-Chave
Racing Cars, the four-time  World 
Champion team, has chosen Oracle Cloud Infrastructure 
(OCI) as their infrastructure partner. 
Racing Cars 0.9997
Oracle Cloud Infrastructure 0.9583
infrastructure partner 0.9583
oci 0.9979
OCI recently added new services to the existing 
compliance program including SOC, HIPAA, and ISO, to enable our customers 
to solve their use cases. We also released new technical papers and 
guidance documents related to Object Storage, the Asteroid Prudential 
Regulation Authority (APRA), and the Central Bank of Bankland. These 
resources help regulated customers better understand how OCI 
supports their regional and industry-specific compliance requirements. 
Not only are we expanding our number of compliance offerings and 
regulatory alignments, we continue to add regions and services at 
a faster rate.
OCI 0.9999
new services 0.9998
existing compliance program 0.9998
including SOC 0.9998
use cases 0.9998
new white papers 0.9998
guidance documents 0.9998
Object Storage 0.9998
Asteroid Prudential Regulation Authority 0.9998
Central Bank of Bankland 0.9998
regulated customers 0.9998
industry-specific compliance requirements 0.9998
number of compliance offerings 0.9998
regulatory alignments 0.9998
faster rate 0.9998
ISO 0.9992
customers 0.9992
apra 0.9992
resources 0.9992
services 0.8186
HIPPA 0.9979
regions 0.9147

O JSON para o primeiro exemplo é:

Amostra de Solicitação
POST https://<region-url>/20210101/actions/batchDetectLanguageKeyPhrases
Formato da Solicitação de API:
{
  "documents": [
    {
      "key": "doc1",
      "text": "Racing Cars, the four-time  World Champion team, has chosen Oracle Cloud Infrastructure (OCI) as their infrastructure partner."
    }
  ]
}
JSON de resposta:
{
    "documents": [
        {
            "key": "1",
            "keyPhrases": [
                {
                    "text": "red bull racing honda",
                    "score": 0.9997546563973576
                },
                {
                    "text": "oracle cloud infrastructure",
                    "score": 0.9997546563973576
                },
                {
                    "text": "infrastructure partner",
                    "score": 0.9997546563973576
                },
                {
                    "text": "oci",
                    "score": 0.9979336625058923
                }
            ],
            "languageCode": "en"
        }
    ],
    "errors": []
}

Limitações

  • Frases-chave que são frases nominais com modificadores adjetivais são identificadas para que as palavras que não seguem esses critérios possam ser ignoradas.

  • Este modelo faz distinção entre maiúsculas e minúsculas.

  • Texto que contém diversas pontuações entre palavras pode ser sinalizado como uma frase-chave.

  • URLs bem formados (início com http, https ou www) são identificados.