Serviceüberblick
Document Understanding ist ein serverloser, mehrmandantenfähiger Service, mit dem Sie Text, Tabellen und andere Schlüsseldaten aus hochgeladenen Dokumentdateien erkennen und klassifizieren können.
Auf den Service kann über die Konsole, die REST-APIs, das SDK und die CLI zugegriffen werden. Sie können einzelne Dateien oder Batches von Dokumenten mit dem API-Endpunkt ProcessorJob verarbeiten.
Die folgenden vortrainierten Modelle werden unterstützt:
- Optische Zeichenerkennung (Optical Character Recognition, OCR): Erkennt und erkennt Text in einem Dokument.
- Textextraktion: Stellt den Text auf Wort- und Zeilenebene sowie die Koordinaten des Begrenzungsrahmens der Texterfassung bereit.
- Schlüsselwerte extrahieren: Extrahiert eine vordefinierte Liste mit Schlüssel/Wert-Paar-Informationen aus Dokumenten wie Belegen, Ausgangsrechnungen, Reisepässen und Fahrer-IDs.
- Tabellenextraktion: Extrahiert Inhalt im Tabellenformat und verwaltet die Zeilen- und Spaltenbeziehungen von Zellen.
- Dokumentklassifizierung: Klassifiziert Dokumente basierend auf visueller Darstellung, allgemeinen Features und extrahierten Schlüsselwörtern in verschiedene Typen. Beispiele für Dokumentarten sind Rechnung, Wareneingang und Lebenslauf.
- OCR-PDF (Optical Character Recognition): Generiert eine durchsuchbare PDF-Datei im OCI Object Storage-Service.