A propos de l'utilisation d'Oracle AI Database 26ai pour l'IA d'entreprise
- Accélérez le délai de rentabilité de l'IA en activant les données résidentes d'Oracle existantes
- Améliorer la qualité et la cohérence des réponses grâce à un contexte organisé et aligné sur les stratégies
- Evoluez en toute confiance sur les performances, la disponibilité et la sécurité de niveau entreprise d'Oracle
- Réduire la complexité architecturale en unifiant le stockage des données et la gestion des vecteurs
Architecture
L'architecture suivante présente un déploiement à trois niveaux typique de Dify sur OCI au sein d'une région OCI et d'un seul VCN qui couvre trois domaines de disponibilité pour la haute disponibilité :
oracle-adb-dify-arch-oracle.zip
La liste suivante récapitule le déploiement et la connectivité :
- Un utilisateur sur site se connecte à l'application via Internet.
- Les demandes prennent fin sur un équilibreur de charge public fourni par l'équilibreur de charge OCI (LB) dans un VCN.
- Placez la plate-forme devant un contrôleur d'entrée et un équilibreur de charge OCI pour un accès externe à la console et aux services Dify.
- Les LB publics nécessitent deux sous-réseaux publics dans différents domaines de disponibilité pour une haute disponibilité.
- Déployez Dify Enterprise Edition sur OKE au sein d'un VCN qui couvre plusieurs domaines de disponibilité.
- Le cluster expose une adresse d'API kubernetes et exécute plusieurs noeuds de processus actif.
- Chaque noeud héberge des pods d'application. Utilisez un sous-réseau de pod privé dédié avec des passerelles NAT afin que les pods se connectent à Internet sans être publiquement exposés.
- Les images de conteneur sont extraites d'OCI Container Registry sur Oracle Services Network (OSN) à l'aide d'une passerelle de service.
- Utilisez Oracle AI Database 26ai comme base de données vectorielle, en tirant parti de ses fonctionnalités natives de stockage/extraction vectorielle et d'entreprise (partitionnement, RAC, sharding, optimisation Exadata) pour l'évolutivité et la fiabilité.
L'architecture comporte les composants suivants :
- Région OCI
Une région OCI est une zone géographique précise qui contient des centres de données, hébergeant des domaines de disponibilité. Les régions sont indépendantes les une des autres et peuvent les séparer d'un pays ou d'un continent à l'autre par de grandes distances.
- Domaine de disponibilité
Les domaines de disponibilité sont des centres de données autonomes indépendants au sein d'une région. Les ressources physiques de chaque domaine de disponibilité sont isolées de celles des autres, ce qui garantit la tolérance aux pannes. Les domaines de disponibilité ne partagent ni infrastructure (par exemple, alimentation, système de refroidissement), ni réseau de domaine de disponibilité interne. Par conséquent, une panne sur un domaine de disponibilité ne doit pas affecter les autres domaines de disponibilité de la région.
- Réseau et sous-réseau cloud virtuel OCI
Un réseau cloud virtuel est un réseau personnalisable défini par logiciel que vous configurez dans une région OCI. Comme les Réseaux de centre de données traditionnels, les Réseaux cloud virtuels vous donnent un contrôle sur l'environnement réseau. Un VCN peut comporter plusieurs blocs de routage interdomaine sans classe (CIDR) qui ne se chevauchent pas et que vous pouvez modifier une fois le VCN créé. Vous pouvez segmenter un réseau cloud virtuel en plusieurs sous-réseaux ciblant une région ou un domaine de disponibilité. Chaque sous-réseau est composé d'une plage contiguë d'adresses qui ne chevauchent pas celles des autres sous-réseaux du réseau cloud virtuel. Vous pouvez modifier la taille d'un sous-réseau après sa création. Un sous-réseau peut être public ou privé.
- Equilibreur de charge
Oracle Cloud Infrastructure Load Balancer fournit une distribution automatisée du trafic d'un point d'entrée unique à plusieurs serveurs.
- OCI Kubernetes Engine
Oracle Cloud Infrastructure Kubernetes Engine (OCI Kubernetes Engine ou OKE) est un service entièrement géré, évolutif et hautement disponible que vous pouvez utiliser pour déployer vos applications en conteneur dans le cloud. Vous indiquez les ressources de calcul dont vos applications ont besoin, et OKE les provisionne sur OCI dans une location existante. OKE utilise Kubernetes pour automatiser le déploiement, la mise à l'échelle et la gestion des applications en conteneur dans les clusters d'hôtes.
- Oracle AI Database 26ai
Oracle AI Database 26ai avec AI Vector Search vous permet d'interroger des données par signification plutôt que par mots-clés. Les représentations vectorielles (embeddings) capturent la sémantique du texte, des images, de l'audio, etc. afin que vous puissiez trouver du contenu similaire efficacement. Les fonctions SQL de distance intégrées permettent des recherches de similarité à l'aide de vecteurs. Vous pouvez combiner la similarité sémantique et d'autres critères de recherche aux grands modèles de langage (RAG) pour obtenir des réponses plus précises et pertinentes.
- Oracle Autonomous AI Database
Oracle Autonomous AI Database fournit une base de données facile à utiliser, entièrement autonome (autogouverne) qui évolue de manière élastique et offre des performances de requête rapides. En tant que service, il ne nécessite pas d'administration de base de données. Vous n'avez besoin de configurer ni de gérer le matériel, ni d'installer un logiciel. Il gère automatiquement le provisionnement, la sauvegarde, l'application de patches et la mise à niveau, ainsi que la croissance ou la réduction de la base de données. Il s'agit d'un service élastique. Développez des applications évolutives alimentées par l'IA avec toutes les données à l'aide de fonctionnalités d'IA intégrées. Utilisez le grand modèle de langage (LLM) de votre choix et déployez-le dans le cloud ou votre centre de données.
Cas d'emploi
Alors que les entreprises mettent en œuvre des plans de développement d'IA basés sur des modèles de langage volumineux (LLM) et des données privées, Oracle AI Database 26ai, avec ses deux avantages de la gestion vectorielle native et de fonctionnalités d'entreprise matures, fournit une solution de plate-forme de données stable, efficace et à faible seuil pour la structure de développement d'agent Dify Oracle AI Database et les applications d'IA basées sur Dify.
- Réutilisation des ressources et optimisation des coûts : les entreprises n'ont plus besoin d'acheter des bases de données vectorielles dédiées et peuvent réutiliser entièrement les ressources Oracle AI Database existantes, ce qui réduit considérablement les coûts d'achat et de maintenance du matériel.
- Evolutivité de la capacité : à mesure que les données multimodales (telles que les images industrielles et les journaux audio) deviennent de plus en plus courantes dans les applications d'IA d'entreprise, Oracle AI Database 26ai peut étendre les capacités de récupération de vecteurs multimodaux, fournissant une prise en charge plus complète de l'IA pour des scénarios tels que la fabrication intelligente et le diagnostic médical.
- Garantie de stabilité : en s'appuyant sur les années d'expérience d'Oracle AI Database en matière de partitionnement, d'optimisation RAC et d'Exadata, Oracle AI Database 26ai peut facilement gérer des volumes de données de niveau pétaoctet et des scénarios à forte simultanéité d'accès, garantissant un fonctionnement stable 24/7 pour les applications d'IA d'entreprise.
Oracle AI Database 26ai est non seulement le principal vecteur de la gestion des données vectorielles de l'entreprise, mais également la base technique clé pour promouvoir la transformation des entreprises du stockage de données à l'exploration de valeur de l'IA, fournissant un support technique solide pour les mises à niveau intelligentes de l'entreprise.
Points à prendre en compte
Lors de l'intégration de Dify à OCI, envisagez ces options.
- Utilisez des sous-réseaux privés pour les niveaux application/données, les groupes de sécurité réseau sur les listes de sécurité lorsque cela est possible.
- Utilisez OCI Vault pour les clés secrètes (clés d'API, créds de base de données), les stratégies IAM ayant le moins de privilèges et OCI Logging, Monitoring et Alarms pour l'observabilité.
- Prenez en compte plusieurs pools de noeuds de domaine de disponibilité et les vérifications de l'état de l'équilibreur de charge pour la haute disponibilité et le redimensionnement automatique.
A propos des services et rôles requis
Cette solution requiert les services et rôles suivants :
- Oracle Cloud Infrastructure
- Oracle Autonomous AI Database
- OCI Kubernetes Engine
- Enterprise Edition Dify
Il s'agit des rôles nécessaires pour chaque service.
| Nom du service : Rôle | Obligatoire pour... |
|---|---|
| Dify : User (Utilisateur) | Créez un utilisateur Dify identifié par le tablespace par défaut du mot de passe avec le quota d'utilisateurs unlimited.
|
Dify (Vérifier) : DB_DEVELOPER_ROLE |
Permettre aux administrateurs d'affecter rapidement les privilèges dont les développeurs ont besoin pour concevoir, créer et déployer des applications pour Oracle Database. |
Reportez-vous à Produits, solutions et services Oracle pour obtenir ce dont vous avez besoin.
