Extracción de frases clave

La extracción de palabras clave es el proceso automatizado de extracción de palabras con mayor relevancia y expresiones del texto introducido. Ayuda a resumir el contenido y reconoce los temas principales.

El modelo de extracción de frases clave utiliza NLP y AA para encontrar información relacionada con los puntos principales del texto. Comprende el texto introducido no estructurado y devuelve palabras clave y frases clave (KP).

Las KP están formadas por sujetos y objetos sobre los que se habla en el documento. Cualquier modificador, como adjetivos asociados a estos sujetos y objetos, también se incluyen en la salida. Se incluyen puntuaciones de confianza para cada frase clave que indican la confianza sobre el KP. Las puntuaciones de confianza son un valor que va de 0 a 1.

Casos de Uso

Algunos casos de uso de negocio son:

  • Supervisión de la marca

  • Supervisión de la investigación de mercado

  • Análisis de mercado sobre la competencia

  • Tickets de soporte al cliente

  • Análisis de comentarios de los empleados

  • Revisiones de cliente

  • Análisis de correo electrónico

Funciones soportadas

  • Frases clave

  • Puntuaciones de confianza

  • Las solicitudes soportan lotes de registro único y de varios registros.

Idiomas admitidos para texto de entrada

  • Inglés
  • español

Ejemplos

Texto de Entrada Frases clave
Racing Cars, the four-time  World 
Champion team, has chosen Oracle Cloud Infrastructure 
(OCI) as their infrastructure partner. 
Racing Cars 0.9997
Oracle Cloud Infrastructure 0.9583
infrastructure partner 0.9583
oci 0.9979
OCI recently added new services to the existing 
compliance program including SOC, HIPAA, and ISO, to enable our customers 
to solve their use cases. We also released new technical papers and 
guidance documents related to Object Storage, the Asteroid Prudential 
Regulation Authority (APRA), and the Central Bank of Bankland. These 
resources help regulated customers better understand how OCI 
supports their regional and industry-specific compliance requirements. 
Not only are we expanding our number of compliance offerings and 
regulatory alignments, we continue to add regions and services at 
a faster rate.
OCI 0.9999
new services 0.9998
existing compliance program 0.9998
including SOC 0.9998
use cases 0.9998
new white papers 0.9998
guidance documents 0.9998
Object Storage 0.9998
Asteroid Prudential Regulation Authority 0.9998
Central Bank of Bankland 0.9998
regulated customers 0.9998
industry-specific compliance requirements 0.9998
number of compliance offerings 0.9998
regulatory alignments 0.9998
faster rate 0.9998
ISO 0.9992
customers 0.9992
apra 0.9992
resources 0.9992
services 0.8186
HIPPA 0.9979
regions 0.9147

El JSON del primer ejemplo es:

Solicitud de ejemplo
POST https://<region-url>/20210101/actions/batchDetectLanguageKeyPhrases
Formato de solicitud de API:
{
  "documents": [
    {
      "key": "doc1",
      "text": "Racing Cars, the four-time  World Champion team, has chosen Oracle Cloud Infrastructure (OCI) as their infrastructure partner."
    }
  ]
}
JSON de respuesta:
{
    "documents": [
        {
            "key": "1",
            "keyPhrases": [
                {
                    "text": "red bull racing honda",
                    "score": 0.9997546563973576
                },
                {
                    "text": "oracle cloud infrastructure",
                    "score": 0.9997546563973576
                },
                {
                    "text": "infrastructure partner",
                    "score": 0.9997546563973576
                },
                {
                    "text": "oci",
                    "score": 0.9979336625058923
                }
            ],
            "languageCode": "en"
        }
    ],
    "errors": []
}

Limitaciones

  • Se identifican las frases clave que sean frases sustantivas con modificadores adjetivos de modo que las palabras que no sigan estos criterios se podrían ignorar.

  • Este modelo no es sensible a mayúsculas/minúsculas.

  • El texto que contiene varias señales de puntuación entre palabras se podrían marcar como frase clave.

  • Las URL con un formato correcto (comienza por http, https o www) se identifican.