Usar lenguaje de OCI para análisis de comentarios de clientes
Los datos de texto, como publicaciones en redes sociales, noticias y encuestas, proporcionan valiosas estadísticas de negocio y de clientes. Con frecuencia, se tarda demasiado tiempo en analizar manualmente grandes cantidades de datos textuales, por lo que las empresas pasan al procesamiento de lenguaje natural (NLP) para obtener estadísticas de forma eficaz y a escala. Para utilizar estas capacidades del NLP, debe confiar en que los científicos de datos creen y entrenen modelos de aprendizaje automático personalizados y, a continuación, desplegar estos modelos en las aplicaciones. Este proceso suele llevar mucho tiempo y es caro.
El lenguaje de Oracle Cloud Infrastructure (OCI) reduce este tiempo y esfuerzo al proporcionar capacidades clave de procesamiento de lenguajes como modelos entrenados preparados para la producción para obtener estadísticas sobre texto no estructurado y elimina la necesidad de experiencia en aprendizaje automático. Puede utilizar el lenguaje de OCI para automatizar el análisis de texto a escala y comprender el texto no estructurado en documentos, las interacciones de comentarios de los clientes o los tickets de soporte relacionados con cualquier problema o revisión. Esto le permitirá extraer información para mejorar la experiencia del cliente y aumentar la eficiencia.
El lenguaje de OCI permite a los desarrolladores aplicar capacidades como análisis de emociones, extracción de frases de clave, clasificación de texto, reconocimiento de entidades con nombre y mucho más en sus aplicaciones. Los desarrolladores pueden integrar capacidades de NLP preentrenadas en aplicaciones sin necesidad de científicos de datos para crear modelos personalizados. Se puede acceder al lenguaje de OCI a través de la consola de OCI, SDK de OCI en Python, Java, Go, Typescript, .Redes, API de REST u OCI-CLI.
- Mejore la experiencia de cliente: explore cómo utilizan los clientes los productos, extraiga sentimientos sobre ciertas áreas de interés e identifique las frustraciones clave para abordarlos en el momento oportuno.
- Identificar datos importantes: extraiga entidades con nombre de los comentarios del cliente para identificar personas, productos y organizaciones mencionadas.
- Garantizar la seguridad y la privacidad: el lenguaje de OCI mantiene la privacidad del cliente con modelos de idioma que no almacenan datos para formación, depuración u otros fines. Además, el lenguaje de OCI se puede utilizar para identificar cualquier información de identificación personal (PII) potencial para proteger la privacidad del cliente.
Arquitectura
Esta arquitectura demuestra la relación entre los diversos componentes de un sistema típico que tiene el lenguaje OCI en su núcleo.
Aproximadamente el 80% de los datos del mundo están en formatos no estructurados, la mayor parte del tiempo, escritos en lenguaje natural. Esta arquitectura de referencia ilustra cualquier sistema que reciba comentarios de los clientes. En este ejemplo específico, vamos a utilizar una aplicación de reservas para la industria de la hostelería que incluye alojamiento, servicio de comida y bebida, planificación de eventos, parques temáticos, hoteles, agencias de viajes, restaurantes o bares. En el siguiente diagrama se describe cómo puede utilizar las capacidades de inteligencia artificial incorporadas para analizar, explorar y visualizar los comentarios de los clientes con el fin de extraer información para mejorar la experiencia de cliente.
Una cadena de hotel pide a los clientes que hagan comentarios después de que se hayan desprotegido. Hay un flujo continuo de comentarios que se debe analizar. El hotel utiliza una hoja de cálculo para capturar miles de reseñas, con cada fila que consiste en una revisión del cliente: feliz o no contento con el servicio, la ubicación o la comida. Esta información se puede utilizar para mejorar productos, servicios vendidos o todo el negocio. Dado que hay mucha información no estructurada, los datos deben ingerirse, las estadísticas deben extraerse de esa información y, a continuación, analizarse y visualizarse. El servicio de integración de datos se utiliza para organizar el flujo de datos en esta arquitectura de referencia.
El siguiente diagrama ilustra esta arquitectura de referencia.

Descripción de la ilustración oci-ai-language-arch.png
oci-ai-language-arch-oracle.zip
- Agregue los datos de revisión del cliente en un origen de datos, como una base de datos o un archivo. Para este ejemplo, se supone que los datos están en un archivo .csv en Object Storage.
- La integración de datos puede leer los datos del origen de datos y, para cada revisión del cliente, enviar llamadas al lenguaje de OCI a través de una función sin servidor.
- OCI Language extrae una lista de aspectos y sus sentimientos relacionados (positivos, negativos, neutros) de cada registro. Además, OCI Language extrae la lista de entidades mencionadas en el registro que se le ha enviado, como los nombres de personas u organizaciones mencionadas en cada revisión.
Por ejemplo: Una de las opiniones menciona: "Hey el hotel era hermoso, el personal era muy amable para mí, pero la comida para el desayuno no era tan grande". El lenguaje de OCI extraerá aspectos como "hotel", "breakfast" y "staff" y nos dirá que "hotel" y "staff" tienen sentimientos positivos y que "breakfast" tiene sentimientos negativos.
También es posible extraer entidades, como nombres de personas, ubicaciones, organizaciones y eventos mediante el lenguaje de OCI.
- Una vez que la integración de datos recibe los aspectos y las entidades, esta información se proyecta como un juego de tablas en Autonomous Data Warehouse. Se proyectan tres tablas diferentes: una tabla para los datos de revisión sin procesar, una tabla para cada uno de los aspectos detectados y su sentimiento, y una tabla con las entidades identificadas.
La base de datos de destino también puede ser un tipo diferente de base de datos, como MySQL.
- A continuación, puede utilizar Oracle Analytics Cloud para visualizar las estadísticas extraídas. Oracle Analytics Cloud permite crear gráficos a partir de las tablas extraídas y filtrar los datos. Por ejemplo, puede trazar el sentimiento a lo largo del tiempo en un gráfico, o visualizar los aspectos que tienen más probabilidades de causar sentimientos positivos o negativos en una nube de palabras.
El proceso de transformación del archivo de OCI Language y visualización de las estadísticas de Oracle Analytics Cloud es el siguiente: Object Storage → Data Integration Service → Oracle Functions → OCI Language → Oracle Functions → Data Integration Service → Autonomous Data Warehouse → Oracle Analytics Cloud.
La arquitectura tiene los siguientes componentes:
- Región
Una región de Oracle Cloud Infrastructure es un área geográfica localizada que contiene uno o más centros de datos, denominados dominios de disponibilidad. Las regiones son independientes de otras regiones y las grandes distancias pueden separarlas (entre países e, incluso, continentes).
- Dominios de disponibilidad
Los dominios de disponibilidad son centros de datos independientes dentro de una región. Los recursos físicos de cada dominio de disponibilidad están aislados de los recursos de los otros dominios de disponibilidad, que ofrecen tolerancia a los fallos. Los dominios de disponibilidad no comparten una infraestructura como la alimentación o la refrigeración, ni la red interna del dominio de disponibilidad. Por lo tanto, es poco probable que un fallo en un dominio de disponibilidad afecte a los otros dominios de disponibilidad de la región.
- Red virtual en la nube (VCN) y subredes
Una VCN es una red personalizada y definida por software que se configura en una región de Oracle Cloud Infrastructure. Al igual que las redes del centro de datos tradicionales, las VCN le proporcionan un control completo sobre su entorno de red. Una VCN puede tener varios bloques CIDR no superpuestos que puede cambiar después de crear la VCN. Puede segmentar una VCN en subredes, que se pueden acotar a una región o a un dominio de disponibilidad. Cada subred está formada por un rango contiguo de direcciones que no se solapan con las demás subredes de la VCN. Puede cambiar el tamaño de una subred después de la creación. Una subred puede ser pública o privada.
- equilibrador de carga
El servicio Oracle Cloud Infrastructure Load Balancing proporciona una distribución automatizada de tráfico desde un punto de entrada a varios servidores a los que se puede acceder desde la red virtual en la nube (VCN). El servicio ofrece un equilibrador de carga con una dirección IP pública o privada, y ancho de banda aprovisionado. Un equilibrador de carga mejora el uso de los recursos, facilita la escalabilidad y ayuda a garantizar una alta disponibilidad.
Puede configurar varias políticas de equilibrio de carga y comprobaciones del sistema específicas de la aplicación para garantizar que el equilibrador de carga solo dirige el tráfico a instancias en buen estado. El equilibrador de carga puede reducir su ventana de mantenimiento vaciando el tráfico de un servidor de aplicaciones que no está en buen estado antes de eliminarlo del servicio para su mantenimiento.
El servicio de equilibrio de carga permite crear un equilibrador de carga público o privado dentro de su VCN. Un equilibrador de carga público tiene una dirección IP pública accesible desde Internet. Un equilibrador de carga privado tiene una dirección IP de la subred de host, que solo es visible dentro de su VCN. Se crearán subredes dedicadas para equilibradores de carga privados o públicos para requisitos futuros. El equilibrador de carga público de OCI con Oracle Cloud Infrastructure WAF se considerará para cualquier aplicación web orientada a Internet o API basada en HTTP.
- Listas de seguridad
Para cada subred, puede crear reglas de seguridad que especifiquen el origen, el destino y el tipo de tráfico que se deben permitir dentro y fuera de la subred.
- Tablas de rutas
Las tablas de rutas virtuales contienen reglas para enrutar el tráfico desde subredes hasta destinos fuera de una VCN, normalmente a través de gateways.
- Gateway de internet
El gateway de Internet permite el tráfico entre las subredes públicas de una VCN y la red pública de Internet.
- Conexión a VPN
VPN Connect proporciona conectividad VPN IPSec de sitio a sitio entre la red local y los VCN en Oracle Cloud Infrastructure. El conjunto de protocolos IPSec cifra el tráfico IP antes de transferir los paquetes del origen al destino y desciende el tráfico cuando llega.
- Gestión de identidad y acceso (IAM)
Oracle Cloud Infrastructure Identity and Access Management (IAM) le permite controlar quién puede acceder a sus recursos en Oracle Cloud Infrastructure y las operaciones que pueden realizar en esos recursos.
- Object Storage
El almacenamiento de objetos proporciona acceso rápido a grandes cantidades de datos estructurados y no estructurados de cualquier tipo de contenido, incluidas copias de seguridad de bases de datos, datos analíticos y contenido enriquecido, como imágenes y vídeos. Puede almacenar datos de forma segura y, a continuación, recuperarlos directamente desde Internet o desde la plataforma en la nube. Puede escalar el almacenamiento sin problemas sin experimentar una degradación del rendimiento o de la fiabilidad del servicio. Utilice el almacenamiento estándar para el almacenamiento "activo" al que debe acceder de forma rápida, inmediata y frecuente. Utilice el almacenamiento de archivos para el almacenamiento "en frío" que conserva durante largos períodos de tiempo y rara vez acceso.
- Data Integration Service
La integración de datos de Oracle Cloud Infrastructure es un servicio en la nube, sin servidor y totalmente gestionado que extrae, carga, transforma, limpia y vuelve a asignar datos de una variedad de orígenes de datos a servicios de destino de Oracle Cloud Infrastructure, como Autonomous Data Warehouse y Oracle Cloud Infrastructure Object Storage. ETL (carga de transformación de extracción) aprovecha el procesamiento de ampliación totalmente gestionado en Spark, y ELT (transformación de carga de extracción) aprovecha las capacidades de reducción de SQL completas de Autonomous Data Warehouse para minimizar el movimiento de datos y mejorar el tiempo de obtención de resultados de los datos recién ingeridos. Los usuarios diseñan procesos de integración de datos mediante una interfaz de usuario intuitiva y sin código que optimiza los flujos de integración para generar el motor y la orquestación más eficientes, asignando y ampliando automáticamente el entorno de ejecución. La integración de datos de Oracle Cloud Infrastructure proporciona exploración interactiva y preparación de datos, y ayuda a los ingenieros de datos a proteger frente al cambio de esquema mediante la definición de reglas para manejar los cambios de esquema.
Para el ejemplo de las reseñas del hotel, puede crear un flujo de datos para leer los datos no estructurados, llamar al lenguaje de OCI para extraer información del texto y, a continuación, proyectar las estadísticas extraídas en tablas estructuradas en una base de datos. Para obtener más información, consulte la publicación de blog enlazada: Extracción de información de datos no estructurados mediante servicios AI en la sección "Más información".
- Funciones
Oracle Functions es una plataforma de funciones como servicio (FaaS) totalmente gestionada, multi-inquilino, altamente escalable y bajo demanda. Se basa en el motor de origen abierto Fn Project. Las funciones permiten desplegar el código y llamarlo directamente o dispararlo en respuesta a eventos. Oracle Functions utiliza los contenedores de Docker alojados en Oracle Cloud Infrastructure Registry.
- Idioma de OCI
El lenguaje de OCI es un servicio sin servidor y multi-inquilino al que se puede acceder mediante llamadas de API de REST. Proporciona modelos predefinidos que se suelen volver a entrenar y controlar para obtener los mejores resultados. El lenguaje proporciona capacidades de inteligencia artificial y aprendizaje automático para detectar el idioma en su texto no estructurado. Además, proporciona otras herramientas para ayudarle a obtener más información sobre el texto.
- Autonomous Data Warehouse
Oracle Autonomous Data Warehouse es un servicio de base de datos autogestionado, autoprotegido y autorreparable optimizado para cargas de trabajo de almacenamiento de datos. No es necesario configurar ni gestionar ningún hardware, ni instalar ningún software. Oracle Cloud Infrastructure gestiona la creación de la base de datos, así como la realización de copias de seguridad, la aplicación de parches, la actualización y el ajuste de la base de datos.
- Oracle Analytics Cloud
Oracle Analytics Cloud es un servicio en la nube pública escalable y seguro que ofrece a los analistas empresariales funciones de análisis de autoservicio modernas y que funcionan con IA para la preparación de datos, la visualización, la generación de informes empresariales, los análisis aumentados y el procesamiento y generación de lenguaje natural. Con Oracle Analytics Cloud, también obtiene capacidades de gestión de servicios flexibles, lo que incluye una configuración rápida, posibilidades de ampliación y aplicación de parches sencillas y gestión automatizada del ciclo de vida.
La transformación de miles de revisiones no estructuradas en formatos estructurados, como la tabla de aspectos, permite utilizar los datos para escenarios, como el análisis de datos, la formación de modelos de aprendizaje automático y la búsqueda. En el ejemplo de las revisiones de hoteles, puede cargar los datos en Oracle Analytics Cloud para visualizar las estadísticas y explorar la información de una forma que le permita identificar tareas accionables. Para obtener más información, consulte la publicación de blog enlazada: Extracción de información de datos no estructurados mediante servicios AI en la sección "Más información".
- Dominios de errores
Un dominio de errores es una agrupación de hardware e infraestructura en un dominio de disponibilidad. Cada dominio de disponibilidad tiene tres dominios de errores con hardware y energía independientes. Al distribuir recursos entre varios dominios de errores, las aplicaciones pueden tolerar fallos físicos del servidor, mantenimiento del sistema y fallos de energía dentro de un dominio de errores.
- Análisis, AA y aplicaciones personalizadas
Servicios de análisis y aplicaciones personalizadas que catalogarán, prepararán, procesarán y analizarán datos.
Recomendaciones
- VCN
Al crear una VCN, determine el número de bloques de CIDR necesarios y el tamaño de cada bloque en función del número de recursos que planea asociar a las subredes de la VCN. Utilice bloques CIDR que se encuentren dentro del espacio de direcciones IP privadas estándar.
Seleccione bloques CIDR que no se superpongan con ninguna otra red (en Oracle Cloud Infrastructure, su centro de datos local u otro proveedor en la nube) a la que desea configurar conexiones privadas.
Después de crear una VCN, puede cambiar, agregar y eliminar sus bloques de CIDR.
Al diseñar las subredes, tenga en cuenta el flujo de tráfico y los requisitos de seguridad. Conecte todos los recursos de un nivel o rol específico a la misma subred, que puede servir como límite de seguridad.
- Seguridad
Utilice políticas para restringir quién puede acceder a los recursos de OCI que tiene su compañía y cómo puede acceder a ellos. Cuando se detecta cualquier configuración incorrecta o actividad no segura, Cloud Guard recomienda acciones correctivas y ayuda con esas acciones en función de las recetas de responsable de respuesta que puede definir.
Para los recursos que requieren la máxima seguridad, Oracle recomienda utilizar zonas de seguridad. Una zona de seguridad es un compartimento asociado a una receta de políticas de seguridad definida por Oracle que se basa en las mejores prácticas. Por ejemplo, no se puede acceder a los recursos de una zona de seguridad desde la red pública de Internet y se deben cifrar con claves gestionadas por el cliente.
Al crear y actualizar recursos en una zona de seguridad, OCI valida las operaciones con respecto a las políticas de la receta de zona de seguridad y deniega las operaciones que violan cualquiera de las políticas.
- Autonomous Data Warehouse
Esta arquitectura utiliza Oracle Autonomous Data Warehouse en una infraestructura compartida. Active la escala automática para proporcionar las cargas de trabajo de la base de datos hasta tres veces la potencia de procesamiento.
Considere el uso de la función de tablas particionadas híbridas de Autonomous Data Warehouse para mover particiones de datos a Oracle Cloud Infrastructure Object Storage y servirlas a usuarios y aplicaciones de forma transparente. Recomendamos utilizar esta función para los datos que no se suelen consumir y para los que no necesita el mismo rendimiento que para los datos almacenados en Autonomous Data Warehouse.
Considere el uso de la función de tablas externas para consumir datos almacenados en Oracle Cloud Infrastructure Object Storage en tiempo real sin necesidad de replicarlos en Autonomous Data Warehouse. Esta función une de forma transparente y perfecta los juegos de datos curados fuera de Autonomous Data Warehouse, independientemente del formato (parquet, avro, orc, json, csv, etc.), con datos que residan en Autonomous Data Warehouse.
Considere la posibilidad de utilizar el acelerador de consultas de ADW cuando consuma datos de almacenamiento de objetos para ofrecer una experiencia mejorada y más rápida a los usuarios.
- Object Storage
Esta arquitectura utiliza la salida procesada del almacén de Oracle Cloud Infrastructure Object Storage estándar para que otros servicios en la nube puedan acceder a la salida para realizar más análisis y mostrarla.
- Ancho de banda del equilibrador de carga
Al crear el equilibrador de carga, puede seleccionar una unidad predefinida que proporcione un ancho de banda fijo o especificar una unidad personalizada (flexible) en la que defina un rango de ancho de banda y permita al servicio ampliar el ancho de banda automáticamente según los patrones de tráfico. Con cualquier enfoque, puede cambiar la unidad en cualquier momento después de crear el equilibrador de carga.
Consideraciones
Tenga en cuenta los siguientes puntos al desplegar esta arquitectura de referencia.
- Límites de Recursos
Tenga en cuenta las mejores prácticas, los límites por servicio y las cuotas de compartimento para su arrendamiento.
- Conectividad
Considere el uso de FastConnect si desea una conexión privada y dedicada entre sus instalaciones locales y OCI; de lo contrario, utilice VCN Connect.
- Supervisión de OCI
El servicio OCI Monitoring le permite supervisar de forma activa y pasiva los recursos en la nube mediante las funciones de métricas y alarmas.
- Costo
Utilice unidades flexibles para seleccionar el número de CPU y la cantidad de memoria que necesita para las cargas de trabajo que se ejecutan en la instancia. Esta flexibilidad le permite crear máquinas virtuales que coincidan con su carga de trabajo, lo que le permite optimizar el rendimiento y minimizar los costos. El servicio OCI Monitoring le permite supervisar de forma activa y pasiva los recursos en la nube mediante las funciones de métricas y alarmas.
- Bots conversacionales con análisis de percepciones en tiempo real
Como proyecto futuro, esta arquitectura se puede adaptar para utilizar bots conversacionales. El análisis de sentimiento ha evolucionado para incluir la asignación de descripciones en tiempo real que permite al bot conversacional mirar las palabras importantes en una oración y asignarles un valor relativo positivo, neutro o negativo, dando al bot una comprensión de toda la vigencia de la conversación.
Más información
Para obtener más información sobre el lenguaje de OCI, revise estos recursos adicionales:
- Publicación en blog: extracción de estadísticas a partir de datos no estructurados mediante servicios de IA
- Idioma de OCI
- Lea la documentación del lenguaje de OCI
- Página del producto Oracle Analytics
- Funciones de Oracle Cloud
- Autonomous Data Warehouse
- Marco de mejores prácticas para Oracle Cloud Infrastructure