Más información sobre el despliegue de un sistema de detección de fraude de IA de varios agentes en OCI

Las instituciones financieras se enfrentan a sofisticados intentos de fraude que requieren un análisis inteligente y automatizado.

Inspirados en las innovaciones de The Guardian Life Insurance Company of America en la prevención del fraude, proponemos un sistema de detección de fraudes multiagente basado exclusivamente en los servicios de Oracle Cloud Infrastructure (OCI). El diseño utiliza múltiples agentes de IA especializados, como el analizador de fraudes y los agentes de recuperación de datos, que son coordinados por un orquestador central o un agente supervisor. En combinación, imitan a un equipo de investigación que muestra ideas, recopila evidencia, recomienda decisiones y genera narrativas.

Este caso de uso de detección de fraudes con varios agentes utiliza una arquitectura moderna basada en IA en Oracle Cloud. Al combinar la base de datos de OCI y otros servicios con un marco de agentes orquestado, creamos un sistema que puede identificar de forma proactiva el fraude y ayudar a los investigadores con información generada por IA.

El diseño es escalable, flexible y permite agregar nuevos agentes o herramientas mediante la actualización de configuraciones o el despliegue de funciones adicionales de OCI a medida que evolucionan los esquemas de fraude. También conecta funciones de IA de vanguardia, como grandes modelos de lenguaje (LLM) y detección de anomalías, con sistemas de datos empresariales, como Oracle Autonomous Database, de forma segura. El orquestador del servidor garantiza que cada agente de IA trabaje en conjunto y se comunique con los sistemas de Oracle en el lenguaje que requieren (SQL, llamadas de API) para que las intenciones de la IA se conviertan en acciones reales mediante el uso de datos reales.

Puede adaptar este diseño para crear una plataforma de demostración que recorra escenarios, como la detección de fraudes de seguros. Puede mostrar cómo el orquestador asigna tareas a los agentes y presenta el resultado final mediante un panel de control o una respuesta de chatbot que explique los hallazgos del agente del analizador de fraude. Las partes interesadas ven la arquitectura modular y entienden claramente las funciones de los servicios de OCI: Autonomous Database gestiona los datos a escala, OCI Functions ejecuta microservicios y OCI Generative AI agrega inteligencia.

Este diseño demuestra cómo Oracle Cloud puede ofrecer un flujo de trabajo de IA ágil para la detección de fraudes en tiempo real a fin de detectar el fraude más rápido con un contexto detallado y, en última instancia, proteger a la empresa y a sus clientes. La arquitectura se presenta en dos fases:

Fase 1: Implementa la capa de orquestación adaptando los conceptos de código abierto de Google Gen AI Toolbox para crear un marco de agente escalable.
Fase 2: integra un razonamiento más profundo del modelo de lenguaje grande (LLM) de OCI para mejorar la inteligencia.

Acerca de Productos y Servicios

Esta solución destaca los siguientes productos y servicios:

Fase 1:

Google Gen AI Toolbox se está ejecutando
- Oracle Cloud Infrastructure Compute
- Oracle Cloud Infrastructure Kubernetes Engine
Oracle Autonomous Transaction Processing
Oracle Cloud Infrastructure Functions (sin servidor)
Detección de anomalías en Oracle Cloud Infrastructure

Fase 2:

Oracle Cloud Infrastructure Generative AI o modelos preentrenados de Oracle
Oracle Cloud Infrastructure Data Science
Oracle Machine Learning
Oracle Cloud Infrastructure Language
Oracle Cloud Infrastructure Streaming
Oracle Cloud Infrastructure GoldenGate

Consulte Productos, soluciones y servicios de Oracle para obtener lo que necesita.

Arquitectura

Esta arquitectura muestra un sistema de detección de fraudes de IA de varios agentes en Oracle Cloud Infrastructure (OCI).

Este diseño utiliza múltiples agentes de IA para proporcionar información clave, recopilar pruebas y producir un análisis exhaustivo del fraude.

En el núcleo se encuentra un servidor de protocolo de contexto de modelo (MCP) que organiza interacciones de agentes. Los agentes especializados gestionan distintas tareas. Por ejemplo, un agente de recuperación de datos consulta los orígenes de datos empresariales y un agente de analizador de fraudes evalúa y explica las anomalías. El flujo comienza cuando un evento, como una alerta de transacción sospechosa o una consulta de un investigador, dispara el orquestador. A continuación, el orquestador delega subtareas a los agentes y consolida sus resultados mediante un patrón de diseño fan-in y fan-out. Cada agente utiliza servicios nativos de OCI para realizar tareas (consultas de base de datos, inferencia de LLM, etc.), y el orquestador se traduce entre los contextos de agente y sistema de Oracle, lo que garantiza que cada agente obtenga la información que necesita en el formato que espera.

En el siguiente diagrama se muestra una descripción general del flujo de proceso:

A continuación se incluye la Descripción de ai-fraud-detection-flow.png

Descripción de la ilustración ai-fraud-detection-flow.png

ai-fraud-detection-flow-oracle.zip

Servidor de orquestación MCP
El servidor de protocolo de contexto de modelo (MCP) es el hub de coordinación que organiza las acciones del agente y mantiene el contexto general o el estado de una investigación. Utiliza MCP para estandarizar la forma en que los agentes invocan herramientas e intercambian datos. Actuando como un "cerebro central", recibe la solicitud inicial (alerta de fraude o consulta de análisis) y llama a los agentes apropiados en secuencia. También traduce intenciones de agente de alto nivel en operaciones de bajo nivel en sistemas Oracle, como convertir la solicitud de información del cliente de un agente en una consulta SQL y convertir los resultados de SQL en una respuesta en lenguaje natural. Este enfoque desacopla a los agentes de las llamadas directas al sistema mediante el uso del orquestador como puente entre la lógica del agente y los datos empresariales, lo que permite actualizaciones flexibles y control centralizado. En la primera fase de esta arquitectura, el servidor es un servidor ligero derivado de Gen AI Toolbox de Google que se ejecuta en Oracle Cloud Infrastructure Compute u OCI Kubernetes Engine.
Agente de recuperación de datos
El agente de recuperación de datos es un agente especializado responsable de recuperar datos relevantes de orígenes empresariales. Por ejemplo, al recibir un ID de cliente o de transacción del orquestador, consulta a Oracle Autonomous Database u otros almacenes de datos de OCI información como transacciones recientes, perfiles de cuenta, historial de reclamaciones, etc. Puede implantar este agente mediante OCI Functions (sin servidor) para llamar a las herramientas alojadas en un servidor MCP para Autonomous Database. El agente contiene toda la lógica de acceso a datos. El servidor de orquestación puede utilizar una herramienta predefinida para este agente, como una herramienta LookupTransaction o GetCustomerProfile configurada por YAML que sabe cómo ejecutar el SQL adecuado en Autonomous Database. Similar a cómo Google Gen AI Toolbox utiliza herramientas definidas por YAML para permitir que los agentes realicen operaciones de base de datos, este diseño define las consultas de base de datos como herramientas basadas en la configuración. En la primera fase, el agente de datos simplemente ejecuta estas consultas sin la participación de la toma de decisiones de IA y devuelve los resultados al orquestador.
Agente de analizador de fraude
El agente analizador de fraude es el agente fundamental que evalúa los datos en busca de signos de fraude y genera información. Este agente ingiere el contexto, como los detalles de la transacción, la información del cliente o los patrones históricos proporcionados por el orquestador, y aplica la lógica de IA/AA para determinar si el escenario es probable que sea fraudulento. En la fase 1, podría ser un motor basado en reglas o un modelo de detección de anomalías de OCI para proporcionar una respuesta rápida y determinista. Por ejemplo, puede marcar anomalías, como una transacción muy fuera del rango normal o varias reclamaciones en un corto período de tiempo. Luego, el agente produce una puntuación o clasificación de fraude y, posiblemente, una explicación.

En la fase 2, el agente del analizador de fraudes se aumenta con capacidades de LLM mediante el uso de OCI Generative AI u modelos preentrenados de Oracle para generar narrativas de investigación legibles para humanos. De esta manera, la IA generativa crea automáticamente un informe conciso de los hallazgos, resumiendo por qué una transacción fue marcada y haciendo referencia a los datos directamente, como la forma en que las transacciones recientes de un cliente muestran compras inusuales de alto valor en el extranjero, que se desvía de su patrón normal en 5σ (5 sigma), lo que indica una alta probabilidad de fraude. La propia división de servicios financieros de Oracle ha destacado el valor de estas narrativas generativas en la aceleración de las investigaciones. En la fase 2, el agente del analizador de fraudes puede utilizar un LLM de OCI para analizar los datos y explicar los resultados. Por ejemplo, podría utilizar una petición de datos que incorpore los datos y le pida al modelo que analice el riesgo de fraude, o podría realizar un razonamiento asistido por herramientas llamando primero a una herramienta de cálculo y luego haciendo que el LLM profundice en los resultados.
Agentes adicionales (según sea necesario)
La arquitectura admite la capacidad de conectar otros agentes para enriquecer el análisis. Por ejemplo, un agente de cheques externo podría llamar a servicios de terceros, como listas de sanciones o agencias de crédito, para recopilar más pruebas sobre la entidad involucrada. Otro podría ser un agente de notificación y gestión de casos que, después de que se confirma el fraude, registra el caso en un sistema o dispara una alerta a un investigador humano. La capacidad del orquestador para gestionar varios agentes y coordinar flujos de trabajo complejos permite agregar nuevos agentes sin molestar a los existentes. Esta modularidad hace que el sistema sea ampliable para presentaciones de demostración que pueden comenzar con dos agentes y, posteriormente, adjuntar más para otros escenarios de demostración, como comprobaciones de conformidad, mensajes de clientes, etc.