Vortrainiertes Modell in der Konsole verwenden

Vision bietet vortrainierte Modelle, um Erkenntnisse aus Bildern zu extrahieren, ohne Data Scientists zu benötigen.

In diesem Tutorial werden folgende Themen behandelt:

Bevor Sie beginnen

Bevor Sie Vision verwenden, muss der Mandantenadministrator die entsprechenden Policys einrichten.

Policys einrichten

Führen Sie die folgenden Schritte aus, um die erforderlichen Policys für die Verwendung von Vision einzurichten.

  1. Wählen Sie im Navigationsmenü der Konsole die Option Identität und Sicherheit aus.
  2. Wählen Sie unter Identität die Option Policys aus.
  3. Wählen Sie Policy erstellen aus.
    Der Bereich Policy erstellen wird angezeigt.
  4. Geben Sie einen Namen ein. Sie dürfen nur alphanumerische Zeichen, Bindestriche, Punkte und Unterstriche verwenden. Leerzeichen sind nicht zulässig. Beispiel: Geben Sie vision-access-policy ein.
  5. Geben Sie eine Beschreibung ein, damit andere Benutzer den Zweck dieser Policys kennen. Beispiel: Geben Sie Policy to access Vision service. ein.
  6. Compartment auswählen.
  7. Wählen Sie in Policy Builder die Option Manuellen Editor anzeigen aus.
  8. Fügen Sie die folgende Anweisung hinzu:
    allow any-user to use ai-service-vision-family in tenancy
  9. (Optional) Um den Zugriff nur auf Ihre Benutzergruppe einzuschränken, fügen Sie stattdessen die folgende Policy hinzu:
    allow group <your-group-name> to use ai-service-vision-family in tenancy
  10. Klicken Sie auf Erstellen.

1. Datenanforderungen nachvollziehen

Vision arbeitet mit vielen Formaten von Bilddaten zusammen, um Objekte zu erkennen, Bildern Labels zuzuweisen, Text zu extrahieren und vieles mehr. Es akzeptiert Daten über Object Storage. Wenn Vision in der Konsole ausgeführt wird, können Sie auch lokal gespeicherte Images bereitstellen.

Vision bietet synchrone und asynchrone APIs zur Analyse von Bildern. Die jeweiligen Datenanforderungen werden in der folgenden Tabelle erläutert:
API-Datenanforderungen
API Beschreibung Unterstütztes Eingabeformat
Synchrone API
  • analyzeImage
  • analyzeDocument
Analysiert einzelne Bilder.
  • JPG, PNG. PDF und TIFF werden auch mit analyzeDocument unterstützt
  • Bis zu 5 MB
  • Einzelne Bildeingabe
Asynchrone API Analysieren Sie mehrere Bilder oder mehrseitige PDFs.
  • JPG, PNG. PDF und TIFF werden auch mit analyzeDocument unterstützt
  • Unterstützt mehrseitiges PDF
  • Bis zu 2.000 Bilder eingegeben

2. Daten in Objektspeicher laden

In diesem Schritt laden Sie die Bilder und Dokumente, die Sie analysieren möchten, in Object Storage.

Füllen Sie 1 aus. Verstehen Sie die Datenanforderungen, bevor Sie diesen Abschnitt ausprobieren.

Erstellen Sie einen Objektspeicher-Bucket

Wenn Sie bereits über einen Bucket in Object Storage verfügen, den Sie verwenden können, gehen Sie direkt zum nächsten Abschnitt zum Laden von Imagedateien.

  1. Wählen Sie im Navigationsmenü der Konsole die Option Speicher.
  2. Wählen Sie unter "Object Storage" die Option Buckets aus.
  3. Wählen Sie auf der Seite "Buckets" unter Listengeltungsbereich das Compartment aus.
  4. Wählen Sie Bucket erstellen aus. Der Bereich Bucket erstellen wird angezeigt.
  5. Geben Sie einen Wert für Gruppenname ein. Geben Sie keine vertraulichen Informationen ein.
  6. Wählen Sie unter Standardspeicherebene die Option Standard aus. Übernehmen Sie für alle anderen Felder die Standardwerte.
  7. Wählen Sie Erstellen.

Imagedateien in den Objektspeicher-Bucket laden

  1. Wählen Sie auf der Seite "Buckets" den Namen des Buckets aus, in den Sie Images laden möchten. Die Detailseite des Buckets wird angezeigt.
  2. Wählen Sie unter Ressourcen die Option Objekte aus, um die Liste der Objekte im Bucket anzuzeigen.
  3. Wählen Sie Hochladen aus. Der Bereich Objekte hochladen wird angezeigt.
  4. Ziehen Sie die Dateien, die Sie laden möchten, in den Fensterbereich, oder wählen Sie Dateien auswählen, um sie aus Ihren lokalen Dateien auszuwählen.

3. KI dokumentieren

Die Schritte zur Verwendung von Document AI-Funktionen in Vision.

Füllen Sie 2 aus. Laden Sie Daten in Object Storage, bevor Sie diesen Abschnitt versuchen.

Vision-Konsole öffnen

  1. Wählen Sie im Navigationsmenü der Konsole die Option Analysen und KI aus.
  2. Klicken Sie unter KI-Services auf Vision. Die Vision-Homepage wird angezeigt.

Dokument-KI verwenden

  1. Wählen Sie unter Vision die Option Dokument-AI aus. Die Seite "Document AI" wird angezeigt.
  2. Wählen Sie unter Imagequelle die Option Objektspeicher aus.
  3. Wählen Sie ein Dokument aus, das Sie in 2 geladen haben. Daten in Object Storage laden. Die analyzeDocument-API wird aufgerufen.
Diese Features werden aufgerufen und ihre Ergebnisse in der Konsole angezeigt:
Ergebnisse der Dokument-KI
Feature Beschreibung Ergebnisse
OCR (Optische Zeichenerkennung) Findet und digitalisiert Textinformationen aus Bildern. Der im Dokument angegebene Text wird unter Raw-Text im Bereich Ergebnisse angezeigt.
Dokumentbildklassifizierung Klassifiziert Dokumente je nach visueller Darstellung, allgemeinen Features und extrahierten Schlüsselwörtern in verschiedene Typen. Die Klassifizierung in einen Dokumenttyp zusammen mit einem Konfidenzscore wird im Bereich Ergebnisse angezeigt.
Sprachklassifizierung Klassifiziert die Sprache des Dokuments basierend auf visuellen Funktionen. Die Klassifizierung in eine Dokumentsprache und ein Konfidenzscore werden im Bereich Ergebnisse angezeigt.
Tabellenextraktion Extrahiert Inhalt in einem tabellarischen Format und verwaltet die Zeilen- und Spaltenbeziehungen der Zellen. Klicken Sie im Bereich Ergebnisse auf die Registerkarte Tabelle, um die Ausgabe anzuzeigen.
Durchsuchbare PDF-Ausgabe Bettet einen transparenten Layer in das Dokumentbild im PDF-Format ein, damit es nach Schlüsselwörtern durchsucht werden kann.

Hinweis: Diese Funktion ist nur verfügbar, wenn ein PDF-Dokument bereitgestellt wird.

Klicken Sie auf Durchsuchbare PDFs. Eine OCR PDF-Datei wird auf Ihren Computer heruntergeladen.

4. Imageanalyse

Die Schritte zur Verwendung von Bildanalysefunktionen in Vision.

Füllen Sie 2 aus. Laden Sie Daten in Object Storage, bevor Sie diesen Abschnitt versuchen.

Vision-Konsole öffnen

  1. Wählen Sie im Navigationsmenü der Konsole die Option Analysen und KI aus.
  2. Wählen Sie unter KI-Services die Option Vision aus. Die Vision-Homepage wird angezeigt.

Bildklassifizierung verwenden

  1. Wählen Sie unter Vision die Option Bildklassifizierung aus. Die Seite "Bildklassifizierung" wird angezeigt.
  2. Wählen Sie Objektspeicher aus.
  3. Wählen Sie ein Bild aus, das Sie in 2 geladen haben. Daten in Object Storage laden. Die analyzeIamge-API wird aufgerufen.

Die Ergebnisse zur Kategorisierung von Objekten im Bild werden im Abschnitt Ergebnisse angezeigt. Es gibt Labels zur Klassifizierung der erkannten Objekte und einen Konfidenzscore für jedes Objekt.

Objekterkennung verwenden

  1. Wählen Sie unter Vision die Option Objekterkennung aus. Die Seite {\b Object Detection} wird angezeigt.
  2. Wählen Sie Objektspeicher aus.
  3. Wählen Sie ein Bild aus, das Sie in 2 geladen haben. Daten in Object Storage laden. Die analyzeIamge-API wird aufgerufen.

Die Ergebnisse werden im Abschnitt Ergebnisse angezeigt. Die erkannten Objekte, ein Konfidenzscore für jedes Objekt und das markierte Begrenzungsfeld um jedes Objekt werden im Ergebnisbereich angezeigt. Wenn Sie auf ein Label klicken, wird auf dem Bild das erkannte Objekt angezeigt.

Weitere Schritte

Jetzt wissen Sie, wie Sie Vision mit vortrainierten Modellen verwenden, versuchen Sie es mit benutzerdefinierten Modellen.