À propos de l'utilisation d'Oracle AI Database 26ai pour l'IA d'entreprise

Permettez à votre entreprise de transformer les données d'affaires gérées dans Oracle AI Database 26ai en connaissances gérées de haute qualité qui alimentent les applications d'IA sans ajouter de magasins vectoriels distincts. À l'aide du pipeline de connaissances d'Dify Enterprise Edition, vous pouvez orchestrer l'ingestion, l'enrichissement et l'indexation de données multimodales (texte, images, audio) directement dans Oracle AI Database 26ai. Vous pouvez ensuite exploiter une extraction rapide et fiable pour des cas d'utilisation tels que les copilotes du soutien à la clientèle, la recherche de connaissances et les flux de travail assistés par agent, avec les avantages suivants :
  • Accélérez le délai de rentabilisation de l'IA en activant les données existantes résidentes d'Oracle
  • Améliorez la qualité et la cohérence des réponses grâce à un contexte organisé et aligné sur les politiques
  • Bénéficiez d'une évolutivité en toute confiance avec les performances, la disponibilité et la sécurité de niveau entreprise d'Oracle
  • Réduire la complexité architecturale en unifiant le stockage des données et la gestion des vecteurs
Dans ce livre de jeu de solution, vous apprendrez à intégrer Dify à Oracle AI Database afin de fournir une référence reproductible pour la création d'une génération augmentée de récupération (RAG) et d'applications de connaissances qui s'exécutent à l'échelle de la production.

Architecture

Dify s'exécute sur Oracle Cloud Infrastructure Kubernetes Engine (OKE) dans plusieurs domaines de disponibilité au sein d'un seul réseau en nuage virtuel (VCN) après une conception de réseau à trois niveaux.

L'architecture suivante présente un déploiement à trois niveaux typique de Dify sur OCI dans une région OCI et un seul VCN qui couvre trois domaines de disponibilité pour une haute disponibilité :



oracle-adb-dify-arch-oracle.zip

La liste suivante résume le déploiement et la connectivité :

  • Un utilisateur sur place se connecte à l'application par Internet.
  • Les demandes s'arrêtent sur un équilibreur de charge public fourni par l'équilibreur de charge OCI (LB) dans un VCN.
  • Présentez la plate-forme avec un contrôleur de trafic entrant et un équilibreur de charge OCI pour un accès externe à la console et aux services Dify.
  • Les équilibreurs de charge publics nécessitent deux sous-réseaux publics dans différents domaines de disponibilité pour assurer la haute disponibilité.
  • Déployez Dify Enterprise Edition sur OKE dans un réseau VCN qui couvre plusieurs domaines de disponibilité.
  • La grappe expose un point d'extrémité d'API (interface de programmation d'application) kubernetes et exécute plusieurs noeuds de travail.
  • Chaque noeud héberge des pods d'application. Utilisez un sous-réseau de pod privé dédié avec des passerelles NAT afin que les pods se connectent à Internet sans être exposés publiquement.
  • Les images de conteneur sont extraites du registre de conteneurs d'OCI sur Oracle Services Network (OSN) à l'aide d'une passerelle de service.
  • Utilisez Oracle AI Database 26ai comme base de données vectorielle, tirant parti de son stockage/extraction vectoriel natif et des fonctions d'entreprise (partitionnement, RAC, partitionnement horizontal, optimisation Exadata) pour l'évolutivité et la fiabilité.

L'architecture comporte les composants suivants :

  • Région OCI

    Une région OCI est une zone géographique localisée qui contient un ou plusieurs centres de données, des domaines de disponibilité d'hébergement. Les régions sont indépendantes les unes des autres, et de grandes distances peuvent les séparer (à travers les pays ou même les continents).

  • Domaine de disponibilité

    Les domaines de disponibilité sont des centres de données indépendants et autonomes dans une région. Les ressources physiques de chaque domaine de disponibilité sont isolées des ressources des autres domaines de disponibilité, ce qui garantit la tolérance aux pannes. Les domaines de disponibilité ne partagent pas les éléments d'infrastructure (alimentation ou refroidissement, par exemple) ni le réseau de domaines de disponibilité interne. Ainsi, une défaillance d'un domaine de disponibilité ne doit pas avoir d'incidence sur les autres domaines de disponibilité de la région.

  • Réseau en nuage virtuel et sous-réseau OCI

    Un réseau en nuage virtuel (VCN) est un réseau défini par logiciel personnalisable, configuré dans une région OCI. Comme les réseaux de centre de données traditionnels, les réseaux en nuage virtuels vous permettent de contrôler votre environnement de réseau. Un VCN peut disposer de plusieurs blocs de routage inter-domaine (CIDR) sans chevauchement que vous pouvez modifier après avoir créé le VCN. Vous pouvez segmenter un VCN en sous-réseaux, dont la portée peut concerner une région ou un domaine de disponibilité. Un sous-réseau est constitué d'un intervalle contigu d'adresses qui ne chevauchent pas les autres sous-réseaux dans le réseau en nuage virtuel. Vous pouvez modifier la taille d'un sous-réseau après sa création. Un sous-réseau peut être public ou privé.

  • Équilibreur de charge

    Oracle Cloud Infrastructure Load Balancer assure la répartition automatisée du trafic d'un point d'entrée unique vers plusieurs serveurs.

  • Moteur Kubernetes pour OCI

    Oracle Cloud Infrastructure Kubernetes Engine (OCI Kubernetes Engine ou OKE) est un service entièrement géré, évolutif et hautement disponible que vous pouvez utiliser pour déployer vos applications conteneurisées dans le nuage. Vous spécifiez les ressources de calcul dont vos applications ont besoin et OKE les provisionne sur OCI dans une location existante. OKE utilise Kubernetes pour automatiser le déploiement, l'ajustement et la gestion des applications conteneurisées sur des grappes d'hôtes.

  • Oracle AI Database 26ai

    Oracle AI Database 26ai avec la recherche vectorielle d'IA vous permet d'interroger les données par signification plutôt que par mots clés. Les représentations vectorielles (embeddings) capturent la sémantique du texte, des images, de l'audio, etc. afin que vous puissiez trouver un contenu similaire efficacement. Les fonctions de distance SQL intégrées permettent des recherches de similarité à l'aide de vecteurs. Vous pouvez combiner la similarité sémantique et d'autres critères de recherche avec de grands modèles de langage (RAG) pour obtenir des réponses plus précises et pertinentes.

  • Oracle Autonomous AI Database

    Oracle Autonomous AI Database fournit une base de données entièrement autonome et facile à utiliser qui s'adapte de manière élastique et offre une performance des interrogations rapide. En tant que service, il ne nécessite pas d'administration de base de données. Vous n'avez pas besoin de configurer ou de gérer du matériel, ni d'installer de logiciel. Il gère automatiquement le provisionnement, la sauvegarde, l'application de correctifs et la mise à niveau, ainsi que l'augmentation ou la réduction de la base de données et s'agit d'un service élastique. Développez des applications évolutives alimentées par l'intelligence artificielle avec toutes les données à l'aide des capacités d'IA intégrées. Utilisez le grand modèle de langage (LLM) de votre choix et déployez-le dans le nuage ou dans votre centre de données.

Cas d'utilisation

Alors que les entreprises mettent en œuvre des plans de développement d'IA basés sur de grands modèles de langage (LLM) et des données privées, Oracle AI Database 26ai, avec ses doubles avantages de la gestion des vecteurs natifs et de fonctionnalités d'entreprise matures, fournit une solution de plate-forme de données stable, efficace et à faible seuil pour le cadre de développement d'agents Dify Oracle AI Database et les applications d'IA créées sur Dify.

  • Réutilisation des ressources et optimisation des coûts : Les entreprises n'ont plus besoin d'acheter de bases de données vectorielles dédiées et peuvent réutiliser entièrement les ressources Oracle AI Database existantes, ce qui réduit considérablement les coûts d'approvisionnement et de maintenance du matériel.
  • Évolutivité des capacités : À mesure que les données multimodales (telles que les images industrielles et les journaux audio) deviennent de plus en plus courantes dans les applications d'IA d'entreprise, Oracle AI Database 26ai peut étendre davantage les capacités d'extraction de vecteurs multimodaux, fournissant une prise en charge plus complète de l'IA pour des scénarios tels que la fabrication intelligente et le diagnostic médical.
  • Garantie de stabilité : Tirez parti des années d'expérience d'Oracle AI Database dans le partitionnement, la RAC et l'optimisation Exadata, Oracle AI Database 26ai peut facilement gérer les volumes de données de niveau pétaoctet et les scénarios de simultanéité d'accès élevé, assurant un fonctionnement stable 24/7 pour les applications d'IA d'entreprise.

Oracle AI Database 26ai est non seulement le principal vecteur de gestion des données d'entreprise, mais aussi la base technique clé pour promouvoir la transformation des entreprises, du stockage de données à l'exploitation de valeur de l'IA, en fournissant un soutien technique solide pour les mises à niveau intelligentes d'entreprise.

Points à considérer

Lors de l'intégration de Dify à OCI, envisagez ces options.

  • Utilisez des sous-réseaux privés pour les niveaux d'application/de données et des groupes de sécurité de réseau sur des listes de sécurité lorsque cela est possible.
  • Utilisez le service Chambre forte OCI pour les clés secrètes (clés d'API, références de base de données), les politiques IAM avec les privilèges les moins élevés et la journalisation OCI, la surveillance et les alarmes pour l'observabilité.
  • Tenez compte de plusieurs groupes de noeuds de domaine de disponibilité et des vérifications d'état de l'équilibreur de charge pour assurer la haute disponibilité et l'ajustement automatique.

À propos des services et des rôles requis

Cette solution nécessite les services et rôles suivants :

  • Oracle Cloud Infrastructure
  • Oracle Autonomous AI Database
  • Moteur Kubernetes pour OCI
  • Dify Enterprise Edition

Il s'agit des rôles nécessaires pour chaque service.

Nom du service : Rôle Requis pour...
Difier : Utilisateur Créez un utilisateur Dify identifié par l'espace-table par défaut du mot de passe avec le quota d'utilisateurs unlimited.
Difier : DB_DEVELOPER_ROLE Permettre aux administrateurs d'affecter rapidement les privilèges dont les développeurs ont besoin pour concevoir, créer et déployer des applications pour Oracle Database.

Voir Produits, solutions et services Oracle pour obtenir ce dont vous avez besoin.