OCI-Sprache für Kundenfeedbackanalysen verwenden
Textdaten wie Posts in sozialen Medien, Nachrichten und Umfragen liefern wertvolle Geschäfts- und Kundeneinblicke. Meistens ist es zu zeitaufwändig, große Mengen an Textdaten manuell zu analysieren, sodass Unternehmen zur Natural Language Processing (NLP) wechseln, um Erkenntnisse effektiv und skalierbar zu gewinnen. Um diese NLP-Funktionen nutzen zu können, müssen Sie sich auf Data Scientists verlassen, um benutzerdefinierte Modelle für maschinelles Lernen zu erstellen und zu trainieren und diese Modelle dann in Anwendungen bereitzustellen. Dieser Prozess ist häufig zeitaufwändig und teuer.
Mit Oracle Cloud Infrastructure (OCI) Language können Sie diese Zeit und diesen Aufwand reduzieren. Dabei werden wichtige Sprachverarbeitungsfunktionen als vorbereitete Produktionsmodelle bereitgestellt, mit denen Sie Erkenntnisse in unstrukturiertem Text ermitteln und maschinellem Lernen nicht mehr benötigen. Mit OCI Language können Sie die Textanalyse skalierbar automatisieren und unstrukturierten Text in Dokumenten, Kundenfeedbackinteraktionen oder Support-Tickets zu Problemen oder Beurteilungen verstehen. So können Sie Einblicke gewinnen, um die Kundenerfahrung zu verbessern und die Effizienz zu steigern.
Mit OCI Language können Entwickler Funktionen wie Sentimentanalyse, Schlüssel-Phrasen-Extraktion, Textklassifizierung, Erkennung benannter Entitys und mehr in ihre Anwendungen anwenden. Entwickler können vordefinierte NLP-Funktionen in Anwendungen integrieren, ohne dass Data Scientists benutzerdefinierte Modelle erstellen müssen. Auf OCI-Sprache kann über die OCI-Konsole, OCI-SDKs in Python, Java, Go, Typescript, zugegriffen werden.Net-, REST-APIs oder die OCI-CLI.
- Kundenerfahrung verbessern: Finden Sie heraus, wie Kunden die Produkte verwenden, Gefühle zu bestimmten Interessenbereichen extrahieren und wichtige Frustrationen identifizieren, um sie zeitnah zu bewältigen.
- Wichtige Daten identifizieren: Extrahieren Sie benannte Entitäten aus dem Kundenfeedback, um die genannten Personen, Produkte und Organisationen zu identifizieren.
- Sicherheit und Datenschutz sicherstellen: OCI Language gewährleistet den Datenschutz mit Sprachmodellen, die keine Daten für Schulungen, Debugging oder andere Zwecke speichern. Darüber hinaus kann OCI Language verwendet werden, um potenzielle persönlich identifizierbare Informationen (PII) zum Schutz der Privatsphäre der Kunden zu identifizieren.
Architektur
Diese Architektur zeigt die Beziehung zwischen den verschiedenen Komponenten in einem typischen System mit OCI-Sprache im Kern.
Etwa 80 % der Weltdaten sind in unstrukturierten Formaten, meist in natürlicher Sprache geschrieben. Diese Referenzarchitektur zeigt jedes System, das Feedback von Kunden erhält. In diesem speziellen Beispiel nutzen wir eine Buchungsanwendung für die Hospitality-Branche mit Unterkünften, Gastronomie, Veranstaltungsplanung, Themenparks, Hotels, Reisebüros, Restaurants oder Bars. Das folgende Diagramm beschreibt, wie Sie mit den vordefinierten KI-Funktionen Kundenfeedback analysieren, untersuchen und visualisieren können, um Einblicke zu gewinnen und die Customer Experience zu verbessern.
Eine Hotelkette fordert Kunden nach dem Auschecken zur Rückmeldung auf. Ein kontinuierliches Feedback, das analysiert werden muss. Das Hotel verwendet eine Kalkulationstabelle, um Tausende von Bewertungen zu erfassen, mit jeder Reihe bestehend aus einer Kundenbewertung: glücklich oder nicht zufrieden über den Service, den Ort oder die Nahrung. Diese Informationen können zur Verbesserung der verkauften Produkte, Dienstleistungen oder des gesamten Unternehmens verwendet werden. Da so viele unstrukturierte Informationen vorliegen, müssen Daten aufgenommen werden, die Erkenntnisse aus diesen Informationen extrahiert und anschließend analysiert und visualisiert werden. Mit dem Datenintegrations-Service wird der Datenfluss in dieser Referenzarchitektur orchestriert.
Das folgende Diagramm veranschaulicht diese Referenzarchitektur.

Beschreibung der Abbildung oci-ai-language-arch.png
oci-ai-language-arch-oracle.zip
- Aggregieren Sie die Kundenprüfungsdaten in einer Datenquelle, z.B. einer Datenbank oder Datei. Im Rahmen dieses Beispiels wird davon ausgegangen, dass sich die Daten in einer CSV-Datei im Objektspeicher befinden.
- Die Datenintegration kann die Daten aus der Datenquelle lesen und für jede Kundenprüfung Aufrufe an OCI Language über eine serverlose Funktion senden.
- OCI Language extrahiert eine Liste mit Aspekten und den zugehörigen Sentiments (positiv, negativ, neutral) aus jedem Datensatz. Darüber hinaus extrahiert OCI Language die Liste der Entitys, die in dem an ihn gesendeten Datensatz aufgeführt sind, wie z.B. die Namen der in jeder Prüfung genannten Personen oder Organisationen.
Beispiel: Eine der Rezensionen erwähnt: "Hey, das Hotel war wunderschön, das Personal war sehr freundlich zu mir, aber das Frühstücksbuffet war nicht so toll." OCI Language extrahiert Aspekte wie "Hotel", "breakfast" und "staff" und sagt uns, dass "hotel" und "staff" ein positives Sentiment aufweisen und das "breakfast" negative Sentiment hat.
Sie können auch Entitys wie Namen von Personen, Standorten, Organisationen und Ereignissen mit OCI-Sprache extrahieren.
- Nachdem die Aspekte und Entitys bei der Datenintegration empfangen wurden, werden diese Informationen als eine Gruppe von Tabellen in Autonomous Data Warehouse prognostiziert. Es werden drei verschiedene Tabellen projiziert: eine Tabelle für die Raw-Prüfdaten, eine Tabelle für jeden erkannten Aspekt und deren Sentiment sowie eine Tabelle mit den identifizierten Entitys.
Die Zieldatenbank kann auch ein anderer Datenbanktyp wie MySQL sein.
- Anschließend können Sie mit Oracle Analytics Cloud die extrahierten Einblicke visualisieren. Mit Oracle Analytics Cloud können Sie Diagramme aus den extrahierten Tabellen erstellen und die Daten filtern. Beispiel: Sie können das Sentiment im Zeitverlauf in einem Diagramm darstellen oder die Aspekte visualisieren, die am ehesten zu positiven oder negativen Sentimenten in einer Wortwolke führen.
Der Prozess zum Transformieren der Datei aus OCI-Sprache und Anzeigen der Insights in Oracle Analytics Cloud lautet wie folgt: Object Storage → Data Integration Service → Oracle Functions → OCI Language → Oracle Functions → Data Integration Service → Autonomous Data Warehouse → Oracle Analytics Cloud.
Die Architektur hat folgende Komponenten:
- Region
Eine Oracle Cloud Infrastructure-Region ist ein lokalisierter geografischer Bereich, der mindestens ein Data Center, die sogenannten Availability-Domains, enthält. Regionen sind unabhängig von anderen Regionen, und große Entfernungen können sie trennen (auf Ländern oder sogar Kontinenten).
- Verfügbarkeitsdomains
Availability-Domains sind eigenständige, unabhängige Data Center innerhalb einer Region. Die physischen Ressourcen in jeder Availability-Domain sind von den Ressourcen in den anderen Availability-Domains isoliert, was Fehlertoleranz bietet. Availability-Domains haben keine gemeinsame Infrastruktur wie Stromversorgung, Kühlung oder das interne Availability-Domainnetzwerk. Daher ist es wahrscheinlich, dass sich ein Fehler in einer Availability-Domain auf die anderen Availability-Domains in der Region auswirkt.
- Virtuelles Cloud-Netzwerk (VCN) und Subnetze
Ein VCN ist ein anpassbares, softwaredefiniertes Netzwerk, das Sie in einer Oracle Cloud Infrastructure-Region einrichten. Wie bei traditionellen Data Center-Netzwerken erhalten Sie mit VCNs die vollständige Kontrolle über Ihre Netzwerkumgebung. Ein VCN kann mehrere sich nicht überschneidende CIDR-Blöcke aufweisen, die Sie nach dem Erstellen des VCN ändern können. Sie können ein VCN in Subnetze segmentieren, die einer Region oder einer Availability-Domain zugeordnet werden können. Jedes Subnetz besteht aus einem fortlaufenden Adressbereich, der sich mit den anderen Subnetzen im VCN nicht überschneidet. Sie können die Größe eines Subnetzes nach der Erstellung ändern. Ein Subnetz kann öffentlich oder privat sein.
- Load Balancer
Der Oracle Cloud Infrastructure Load Balancing-Service ermöglicht automatisierte Trafficverteilung von einem Entry Point zu mehreren Servern, die über das virtuelle Cloud-Netzwerk (VCN) erreichbar sind. Der Service bietet einen Load Balancer mit wahlweise einer öffentlichen oder privaten IP-Adresse und der bereitgestellten Bandbreite. Ein Load Balancer verbessert die Ressourcennutzung, vereinfacht die Skalierung und gewährleistet High Availability.
Sie können mehrere Load Balancing Policys und anwendungsspezifische Integritätsprüfungen konfigurieren, um sicherzustellen, dass der Load Balancer Traffic nur an gesunde Instanzen leitet. Der Load Balancer kann das Wartungsfenster reduzieren, indem er Traffic aus einem fehlerhaften Anwendungsserver umleitet, bevor Sie ihn zur Wartung aus dem Service entfernen.
Mit Load Balancing Service können Sie einen öffentlichen oder privaten Load Balancer in Ihrem VCN erstellen. Ein Public-Load-Balancer verfügt über eine öffentliche IP-Adresse, auf die im Internet zugegriffen werden kann. Ein privater Load Balancer verfügt aus dem Hostsubnetz über eine IP-Adresse, die nur in Ihrem VCN sichtbar ist. Dedizierte Subnetze werden für private oder öffentliche Load Balancer für zukünftige Anforderungen erstellt. Öffentlicher OCI-Load Balancer mit Oracle Cloud Infrastructure WAF wird für internetbasierte Webanwendungen oder HTTP-basierte APIs in Betracht gezogen.
- Sicherheitslisten
Für jedes Subnetz können Sie Sicherheitsregeln erstellen, die Quelle, Ziel und Traffictyp angeben, die im Subnetz und aus dem Subnetz zulässig sein müssen.
- Weiterleitungstabellen
Virtuelle Routentabellen enthalten Regeln, mit denen Traffic von Subnetzen an Ziele außerhalb eines VCN weitergeleitet wird, im Allgemeinen über Gateways.
- Internetgateway
Das Internetgateway ermöglicht den Traffic zwischen den öffentlichen Subnetzen in einem VCN und dem öffentlichen Internet.
- VPN-Connect
VPN Connect bietet Site-to-Site-IPSec-VPN-Konnektivität zwischen Ihrem On-Premise-Netzwerk und VCNs in Oracle Cloud Infrastructure. Die IPSec-Protokollsuite verschlüsselt den IP-Traffic, bevor die Pakete von der Quelle zum Ziel übertragen werden, und entschlüsselt den Traffic, wenn er ankommt.
- Identitäts- und Zugriffsverwaltung (IAM)
Mit Oracle Cloud Infrastructure Identity and Access Management (IAM) können Sie kontrollieren, wer auf Ihre Ressourcen in Oracle Cloud Infrastructure zugreifen kann und welche Vorgänge sie für diese Ressourcen ausführen können.
- Object Storage
Der Objektspeicher bietet schnellen Zugriff auf große Mengen an strukturierten und unstrukturierten Daten mit beliebigen Inhaltstypen, darunter Datenbankbackups, Analysedaten und umfangreiche Inhalte, wie Bilder und Videos. Sie können Daten sicher im Internet oder in der Cloud-Plattform speichern und daraus abrufen. Sie können den Speicher nahtlos skalieren, ohne dass die Performance oder die Servicezuverlässigkeit beeinträchtigt wird. Verwenden Sie Standardspeicher für "Hot"-Speicher, auf den Sie schnell, sofort und häufig zugreifen müssen. Verwenden Sie Archive Storage für "kalten" Speicher, den Sie über lange Zeiträume aufbewahren, selten oder selten.
- Datenintegrations-Service
Oracle Cloud Infrastructure Data Integration ist ein vollständig verwalteter, serverloser, cloud-nativer Service, der Daten aus einer Vielzahl von Datenquellen in Oracle Cloud Infrastructure-Zielservices wie Autonomous Data Warehouse und Oracle Cloud Infrastructure Object Storage extrahiert, lädt, transformiert, bereinigt und neu ausbildet. ETL (Extract Transform Load) nutzt vollständig verwaltete Scale-out-Verarbeitung in Spark, und ELT (Extract Load Transform) nutzt umfassende SQL-Push-down-Funktionen von Autonomous Data Warehouse, um die Datenbewegung zu minimieren und die Time-to-Value für neu erfasste Daten zu verbessern. Benutzer entwickeln Datenintegrationsprozesse mit einer intuitiven, kodlosen Benutzeroberfläche, die Integrationsabläufe optimiert, um die effizienteste Engine und Orchestrierung zu generieren und die Ausführungsumgebung automatisch zuzuweisen und zu skalieren. Oracle Cloud Infrastructure Data Integration bietet interaktive Exploration und Datenvorbereitung. Data Engineers schützen vor Schemadaten. Dabei werden Regeln für Schemaänderungen definiert.
Für das Beispiel für Hotelreviews können Sie einen Datenfluss erstellen, um Ihre unstrukturierten Daten zu lesen, OCI Language aufrufen, um Einblicke aus dem Text zu extrahieren und dann die extrahierten Einblicke in strukturierte Tabellen in einer Datenbank zu projizieren. Weitere Informationen finden Sie im verknüpften Blogpost: Extrahieren von Einblicken aus unstrukturierten Daten mit AI-Services im Abschnitt "Weitere Informationen".
- Funktionen
Oracle Functions ist eine vollständig verwaltete, mehrmandantenfähige, hochskalierbare und On-Demand Functions-as-a-Service-(FaaS-)Plattform. Sie wird von der Open-Source-Engine des Fn-Projekts unterstützt. Mit Funktionen können Sie Ihren Code bereitstellen und entweder direkt aufrufen oder als Reaktion auf Ereignisse auslösen. Oracle Functions verwendet Docker-Container, die in Oracle Cloud Infrastructure Registry gehostet werden.
- OCI-Sprache
OCI Language ist ein serverloser und Multitenant-Service, auf den über REST-API-Aufrufe zugegriffen werden kann. Es enthält vorschulete Modelle, die häufig trainiert und überwacht werden, um Ihnen die besten Ergebnisse zu liefern. Sprache bietet Funktionen für künstliche Intelligenz und maschinelles Lernen, um die Sprache in Ihrem unstrukturierten Text zu erkennen. Außerdem stellt sie andere Tools bereit, mit denen Sie weitere Einblicke in Ihren Text erhalten.
- Autonomous Data Warehouse
Oracle Autonomous Data Warehouse ist ein selbststeuernder, selbstsichernder, selbstreparierender Datenbankservice, der für Data Warehousing-Workloads optimiert ist. Sie müssen keine Hardware konfigurieren oder verwalten und keine Software installieren. Oracle Cloud Infrastructure verarbeitet das Erstellen der Datenbank sowie das Backup, Patching, Upgrade und Tuning der Datenbank.
- Oracle Analytics Cloud
Oracle Analytics Cloud ist ein skalierbarer und sicherer Public-Cloud-Service, mit dem Business Analysts moderne, KI-gesteuerte Selfservice-Analysefunktionen für Datenvorbereitung, Visualisierung, Enterprise-Reporting, erweiterte Analysen und natürliche Sprachverarbeitung und -generierung erhalten. Mit Oracle Analytics Cloud erhalten Sie außerdem flexible Servicemanagementfunktionen, einschließlich schnellem Setup, einfacher Skalierung und Patching sowie automatisiertem Lifecycle Management.
Wenn Sie Tausende unstrukturierter Beurteilungen in strukturierte Formate transformieren, wie z.B. die Tabelle "Aspekte", können Sie die Daten für Szenarios verwenden, wie Datenanalysen, Modelle für maschinelles Lernen von Schulungen und Suchen. Im Beispiel für Hotelreviews können Sie die Daten in Oracle Analytics Cloud laden, um die Einblicke zu visualisieren und die Informationen so zu erkunden, dass Sie verwertbare Aufgaben identifizieren können. Weitere Informationen finden Sie im verknüpften Blogpost: Extrahieren von Einblicken aus unstrukturierten Daten mit AI-Services im Abschnitt "Weitere Informationen".
- Faultdomains
Eine Faultdomain ist eine Gruppierung aus Hardware und Infrastruktur innerhalb einer Availability-Domain. Jede Availability-Domain umfasst drei Faultdomains mit unabhängiger Stromversorgung und Hardware. Wenn Sie Ressourcen auf mehrere Faultdomains verteilen, können Ihre Anwendungen damit den physischen Serverausfall, die Systemwartung und Stromausfälle innerhalb einer Faultdomain tolerieren.
- Analyse-, ML- und benutzerdefinierte Anwendungen
Analyseservices und benutzerdefinierte Anwendungen, mit denen Daten katalogisiert, vorbereitet, verarbeitet und analysiert werden.
Empfehlungen
- VCN
Legen Sie beim Erstellen eines VCN die Anzahl der erforderlichen CIDR-Blöcke und die Größe jedes Blocks basierend auf der Anzahl der Ressourcen fest, die Sie den Subnetzen im VCN zuordnen möchten. Verwenden Sie CIDR-Blöcke, die sich im privaten Standard-IP-Adressraum befinden.
Wählen Sie CIDR-Blöcke aus, die sich nicht mit anderen Netzwerken (in Oracle Cloud Infrastructure, Ihrem On-Premise-Data Center oder einem anderen Cloud-Provider) überschneiden, für die Sie private Verbindungen einrichten möchten.
Nachdem Sie ein VCN erstellt haben, können Sie dessen CIDR-Blöcke ändern, hinzufügen und entfernen.
Berücksichtigen Sie beim Entwerfen der Subnetze den Trafficfluss und die Sicherheitsanforderungen. Hängen Sie alle Ressourcen innerhalb einer bestimmten Tier oder Rolle an dasselbe Subnetz an, das als Sicherheitsgrenze verwendet werden kann.
- Sicherheit
Verwenden Sie Policys, um einzuschränken, wer auf die OCI-Ressourcen Ihres Unternehmens zugreifen kann und wie sie darauf zugreifen können. Wenn falsche Konfiguration oder unsichere Aktivitäten ermittelt werden, empfiehlt Cloud Guard Korrekturmaßnahmen und unterstützt diese Aktionen basierend auf Responder-Rezepten, die Sie definieren können.
Für Ressourcen, die maximale Sicherheit erfordern, empfiehlt Oracle die Verwendung von Sicherheitszonen. Eine Sicherheitszone ist ein Compartment, das mit einem von Oracle definierten Rezept mit Sicherheits-Policys verknüpft ist, die auf Best Practices basieren. Beispiel: Auf die Ressourcen in einer Sicherheitszone kann nicht über das öffentliche Internet zugegriffen werden. Sie müssen dann mit vom Kunden verwalteten Schlüsseln verschlüsselt werden.
Wenn Sie Ressourcen in einer Sicherheitszone erstellen und aktualisieren, validiert OCI die Vorgänge anhand der Policys im Rezept "security-zone" und lehnt Vorgänge ab, die gegen eine der Policys verstoßen.
- Autonomous Data Warehouse
Diese Architektur verwendet Oracle Autonomous Data Warehouse auf einer gemeinsamen Infrastruktur. Aktivieren Sie die automatische Skalierung, um den Datenbank-Workloads bis zu dreifache Verarbeitungsleistung bereitzustellen.
Ziehen Sie in Betracht, das Feature für partitionierte Hybrid-Tabellen von Autonomous Data Warehouse zu verwenden, um Partitionen von Daten in Oracle Cloud Infrastructure Object Storage zu verschieben und diese transparent für Benutzer und Anwendungen zu nutzen. Wir empfehlen, dieses Feature für Daten zu verwenden, die nicht häufig konsumiert werden und für die Sie nicht dieselbe Performance wie für Daten benötigen, die in Autonomous Data Warehouse gespeichert sind.
Sie sollten das Feature für externe Tabellen verwenden, um Daten zu nutzen, die in Oracle Cloud Infrastructure Object Storage gespeichert sind, ohne dass sie auf Autonomous Data Warehouse repliziert werden müssen. Mit diesem Feature werden Datasets, die außerhalb von Autonomous Data Warehouse kuratiert wurden, unabhängig vom Format (Parquet, avro, orc, json, csv usw.) transparent und nahtlos mit Daten im Autonomous Data Warehouse verknüpft.
Ziehen Sie die Verwendung von ADW Query Accelerator in Betracht, wenn Sie Objektspeicherdaten nutzen, um Benutzern eine verbesserte und schnellere Erfahrung zu bieten.
- Objektspeicher
Diese Architektur verwendet die standardmäßige von Oracle Cloud Infrastructure Object Storage verarbeitete Ausgabe, damit andere Cloud-Services zur weiteren Analyse und Anzeige auf die Ausgabe zugreifen können.
- Load-Balancer-Bandbreite
Beim Erstellen des Load Balancers können Sie entweder eine vordefinierte Ausprägung auswählen, die eine feste Bandbreite bereitstellt, oder eine benutzerdefinierte (flexible) Ausprägung angeben, in der Sie einen Bandbreitenbereich festlegen und die Bandbreite basierend auf Trafficmustern automatisch skalieren lassen. Bei beiden Lösungen können Sie die Ausprägungen nach dem Erstellen des Load Balancers jederzeit ändern.
Hinweise
Beachten Sie die folgenden Punkte beim Deployment dieser Referenzarchitektur.
- Ressourcengrenzwerte
Beachten Sie die Best Practices, Limits nach Service und Compartment Quotas für Ihren Mandanten.
- Konnektivität
Ziehen Sie in Betracht, FastConnect zu verwenden, wenn Sie eine dedizierte, private Verbindung zwischen Ihrem Standort und OCI wünschen, oder VCN Connect verwenden.
- OCI-Monitoring
Mit dem OCI Monitoring-Service können Sie Ihre Cloud-Ressourcen mit den Metriken- und Alarmefeatures aktiv und passiv überwachen.
- Kostenfaktor
Wählen Sie mit flexiblen Ausprägungen die Anzahl der CPUs und den Arbeitsspeicher aus, den Sie für die Workloads benötigen, die auf der Instanz ausgeführt werden. Dadurch können Sie VMs erstellen, die Ihrer Workload entsprechen, sodass Sie die Performance optimieren und Kosten minimieren können. Mit dem OCI Monitoring-Service können Sie Ihre Cloud-Ressourcen mit den Metriken- und Alarmefeatures aktiv und passiv überwachen.
- Chatbots mit Sentimentanalyse in Echtzeit
Als zukünftiges Projekt kann diese Architektur an die Verwendung von Chatbots angepasst werden. Sentimentanalyse hat sich zu einer Echtzeit-Erzählungszuordnung entwickelt, mit der der der Chatbot die wichtigen Wörter in einem Satz ansehen und ihnen einen relativen Wert mit positiv, neutral oder negativ zuweisen kann. So erhält der Bot ein Verständnis des gesamten Konversationsmandanten.