Visión general del servicio de IA generativa

La IA generativa es un servicio de Oracle Cloud Infrastructure totalmente gestionado que proporciona un conjunto de modelos de lenguaje grandes (LLM) personalizables y de última generación que cubren una amplia gama de casos de uso, incluidos chat, generación de texto, resumen y creación de incrustaciones de texto.

Utilice el campo de juego, la API o la CLI para probar los modelos preentrenados listos para usar o crear y alojar sus propios modelos personalizados ajustados basados en sus propios datos en clusters de IA dedicados.

El servicio OCI Generative AI incluye los siguientes modelos fundamentales para incrustaciones de chat, rerank y texto.

Chat
Haga preguntas y obtenga respuestas conversacionales a través de un chatbot de IA.
Rerank
Introduzca una consulta y una lista de textos y obtenga una matriz ordenada con cada texto asignado una puntuación de relevancia. La puntuación de relevancia es cómo el modelo clasifica los documentos, es decir, qué tan bien cada texto coincide con la consulta.
Incrustación
Convertir texto en elementos embebidos de vectores para su uso en aplicaciones de búsquedas semánticas, sistemas de recomendación, clasificación de textos o agrupación de textos.

Uso de modelos básicos previamente entrenados

Para comenzar, use el patio de recreo para probar los modelos fundacionales preentrenados. Ejecute las peticiones de datos, ajuste los parámetros, actualice las peticiones de datos y vuelva a ejecutar los modelos hasta que esté satisfecho con los resultados. A continuación, obtenga el código de la consola y cópielo en las aplicaciones.

Opciones de flujo de trabajo de usuario para utilizar los modelos preentrenados listos para usar del servicio de IA generativa.

Ajuste de los Modelos Preentrenados

Puede crear una copia de un modelo básico previamente entrenado, agregar su propio juego de datos de entrenamiento y permitir que el servicio OCI Generative AI ajuste el modelo por usted. OCI Generative AI utiliza clusters de IA dedicados especialmente dimensionados para el ajuste. Estos clusters pertenecen solo a su arrendamiento. Después de ajustar el modelo, cree un punto final para el modelo personalizado y el host que modela en un cluster de IA dedicado diseñado para el alojamiento. Al crear el cluster de alojamiento, seleccione el modelo preentrenado correcto del que se deriva el modelo ajustado.

Opciones de flujo de trabajo de usuario para utilizar el servicio de IA generativa para ajustar un modelo previamente entrenado y alojar el modelo ajustado a través de un punto final.

Casos de uso

Utilice el servicio OCI Generative AI para los siguientes tipos de casos de uso.

Generación de texto

Utilice modelos de chat previamente entrenados o modelos de generación de texto para crear texto para cualquier propósito, por ejemplo:

  • Pitch para un nuevo producto
  • Lema para una campaña de marketing
  • Correo electrónico de ventas a un cliente
  • Publicación en medios sociales
  • Descripción del Trabajo
  • Título de un artículo
Conversaciones

Puede hacer preguntas en lenguaje natural y, opcionalmente, enviar texto, como documentos, correos electrónicos y revisiones de productos al LLM y las razones del LLM sobre el texto y proporciona respuestas inteligentes.

Extracción de datos

Extraer fragmentos de datos específicos del texto, por ejemplo:

  • Extracción de información de solicitante de una solicitud escrita en texto de formato libre.
  • Extraer fechas o sumas de un contrato.
  • Permite extraer estadísticas o tendencias de las tablas de datos.
Resumen

Generar resúmenes ejecutivos para documentos que son demasiado largos para leer o resumir cualquier tipo de texto, por ejemplo:

  • Documentos
  • Contratos
  • Emails
  • Artículos
  • Publicaciones de blogs
  • Reseñas de productos
  • Publicaciones en redes sociales
Clasificación

Clasifique el texto en categorías predefinidas, por ejemplo:

  • Dada una lista de tickets de soporte, clasifíquelos por el departamento que los debe gestionar.
  • Dada una lista de sectores y nombres de empresas, clasifique las empresas por sus respectivos sectores.
Transferencia de estilo

Cambiar el estilo o el tono del texto, por ejemplo:

  • Reescribe cualquier texto en un estilo, formato (lista o párrafos) o tono diferente.
  • Vuelva a redactar el texto.
  • Sugerir mejoras gramaticales.
Similitud semántica

Evalúe varias entradas en función de la similitud de su significado, por ejemplo:

  • Evalúe una lista de preguntas enviadas a un sistema de soporte para extraer la respuesta más relevante dada a preguntas similares en el pasado cuando aparece una nueva pregunta.
  • Sustituya las búsquedas basadas en palabras clave por búsquedas semánticas para mejorar la relevancia de los resultados de búsqueda.

Regiones con IA generativa

Oracle aloja sus servicios de OCI en regiones y dominios de disponibilidad. Una región es un área geográfica localizada, mientras que un dominio de disponibilidad es uno o más centros de datos de esa región. OCI Generative AI se aloja en las siguientes regiones:

Importante

Algunas regiones no ofrecen todos los modelos. Consulte la región de cada modelo previamente entrenado para averiguar qué modelos están disponibles en una región cercana a usted.
Nombre de región Ubicación Identificador de región Clave de la región
Este de Brasil (São Paulo) Sao Paulo sa-saopaulo-1 GRU
Alemania Central (Frankfurt) Frankfurt eu-frankfurt-1 FRA
Centro de Japón (Osaka) Osaka ap-osaka-1 KIX
Emiratos Árabes Unidos oriental (Dubái) Dubai me-dubai-1 DXB
Sur del Reino Unido (Londres) Londres uk-london-1 LHR
Noroeste de Estados Unidos (Chicago) Chicago us-chicago-1 ORD

Consulte About Regions and Availability Domains para obtener una lista completa de regiones de OCI disponibles, junto con las ubicaciones, identificadores de región, claves de región y dominios de disponibilidad asociados.

Modelos previamente entrenados con llamadas entre regiones

Consulte la siguiente columna, titulada "Región de destino" para la región comercial de OCI que ofrece modelos entrenados previamente para el servicio de IA generativa donde se realiza una llamada entre regiones entre la "Región de alojamiento" y la "Región de destino".

Por ejemplo, cuando un usuario introduce una solicitud de inferencia para utilizar el modelo xAI Grok 3 en Chicago, el servicio de IA generativa en Chicago realiza una solicitud a este modelo alojado en Salt Lake City y devuelve la respuesta del modelo a Chicago de donde proviene la solicitud de inferencia del usuario. Para obtener una lista de los modelos preentrenados en OCI Generative AI y sus regiones, consulte Modelos básicos preentrenados en IA generativa.

Áreas

Región de alojamiento:

El servicio OCI Generative AI llama a esta región para acceder al modelo alojado y devuelve la respuesta del modelo a la región de destino

Región de Destino:

Región de OCI que ofrece OCI Generative AI Service donde el usuario envía solicitudes a un modelo previamente entrenado

Modelos previamente entrenados:

Modelos en OCI Generative AI Service con llamadas entre regiones

EE. UU. SLC (Salt Lake City) ORD (Chicago)

Servicios que llaman al servicio de IA generativa

Actualmente, el servicio de IA generativa de Oracle Cloud Infrastructure (OCI) no se ofrece en todas las regiones comerciales de OCI. Consulte la siguiente columna titulada "Región de destino:" para obtener una lista de las regiones comerciales de OCI que ofrecen el servicio OCI Generative AI.

Hay servicios de OCI que documentan (en las "Descripciones de Servicio de Créditos Universales de Oracle PaaS y IaaS") que realizan llamadas al servicio OCI Generative AI. Para una llamada determinada al servicio OCI Generative AI, si la región de llamada y la región de destino no son iguales, se realizará una llamada entre regiones.

Área

Llamada a regiones:

Regiones de OCI desde las que se pueden realizar llamadas (entre regiones) al servicio OCI Generative AI

Región de Destino:

Región de OCI que ofrece OCI Generative AI Service

Brasil GRU, VCP GRU
EU AMS, MRS, LIN, ARN, CDG, MAD, ZRH, FRA FRA
Japón KIX, NRT KIX
Emiratos Árabes Unidos DXB DXB
UK CWL, LHR LHR
Estados Unidos PHX, IAD, SJC, ORD ORD

Acceso a IA generativa en la consola

  1. Inicie sesión en la consola mediante un explorador soportado.
  2. En la barra de navegación de la consola, seleccione una región con IA generativa, por ejemplo, Medio oeste de EE. UU. (Chicago) o Sur de Reino Unido (Londres). Consulte qué modelos se ofrecen en su región.
  3. Abra el menú de navegación y seleccione Análisis e IA. En Servicios de IA, seleccione IA generativa.