Serviceüberblick
Document Understanding ist ein serverloser, mehrmandantenfähiger Service, mit dem Sie Text, Tabellen und andere Schlüsseldaten aus hochgeladenen Dokumentdateien erkennen und klassifizieren können.
Auf den Service kann über die Konsole, die REST-APIs, das SDK und die CLI zugegriffen werden. Sie können einzelne Dateien oder Batches von Dokumenten mit dem API-Endpunkt ProcessorJob verarbeiten.
Die folgenden vortrainierten Modelle werden unterstützt:
- Optische Zeichenerkennung (Optical Character Recognition, OCR): Erkennt und erkennt Text in einem Dokument.
- Textextraktion: Stellt den Text auf Wort- und Zeilenebene sowie die Koordinaten des Begrenzungsrahmens der Texterfassung bereit.
- Schlüssel/Wert-Extraktion: Extrahiert eine vordefinierte Liste mit Schlüssel/Wert-Paarinformationen aus Quittungen, Rechnungen, Reisepässen und Treiber-IDs.
- Tabellenextraktion: Extrahiert Inhalt im Tabellenformat und verwaltet die Zeilen- und Spaltenbeziehungen von Zellen.
- Dokumentklassifizierung: Klassifiziert Dokumente basierend auf visueller Darstellung, allgemeinen Features und extrahierten Schlüsselwörtern in verschiedene Typen. Beispiele für Dokumentarten sind Rechnung, Wareneingang und Lebenslauf.
- OCR-PDF (Optical Character Recognition): Generiert eine durchsuchbare PDF-Datei im OCI Object Storage-Service.