Documenten classificeren en sleutelwaarden extraheren

Gebruik vooraf getrainde modellen van OCI Document Understanding om documenten te classificeren en sleutelwaarden te extraheren zonder dat kennis van machine learning (ML) of kunstmatige intelligentie (AI) nodig is. U kunt bijvoorbeeld documentclassificatie gebruiken om paspoorten, rijbewijzen, ontvangstbewijzen en facturen te herkennen.

Opmerking: OCI Document Understanding ondersteunt momenteel alleen Engels. Zie voor meer informatie: Limieten voor Document Understanding.
Als u minder dan 10.000 documenten voor een vooraf getraind model hebt of minder dan 2.000 documenten voor een aangepast model hebt, kunt u deze verwerken in één gegevensstroom. Als u een groter aantal hebt dan deze limieten, maakt u voor de verwerking van elke bucket een afzonderlijke gegevensstroom (dat wil zeggen een afzonderlijke gegevensset per bucket) en stelt u een volgorde in om de gegevensstromen na elkaar te verwerken. Zie voor meer informatie: Gegevens verwerken met behulp van een reeks gegevensstromen.
Vereisten:
  1. Klik op de beginpagina van Oracle Analytics op Maken en vervolgens op Gegevensstroom.
  2. Selecteer de gegevensset die is gekoppeld aan de documenten die u wilt analyseren en klik daarna op Toevoegen.

  3. Klik in de gegevensstroomeditor op Stap toevoegen (+).
  4. Dubbelklik in het deelvenster Stappen gegevensstroom op AI-model toepassen en selecteer vervolgens het menu dat u wilt gebruiken.
    Selecteer bijvoorbeeld 'Vooraf getrainde documentclassificatie' om paspoorten te herkennen.
  5. Ga in AI-model toepassen naar de sectie Invoer en configureer de parameters Invoerkolom en Invoertype.
    • Als u per bucket naar uw brondocumenten verwijst, selecteer dan in Invoerkolom URL en in Invoertype Buckets.

    • Verwijst u afzonderlijk naar uw brondocumenten, selecteer dan in Invoerkolom Bestandslocatie en in Invoertype Documenten.
  6. Klik in de gegevensstroomeditor op Stap toevoegen (+) en selecteer Gegevens opslaan.
  7. In Naam voert u een naam in voor de uitvoergegevensset.
    U kunt de gegevensset bijvoorbeeld de naam 'Analyseresultaten paspoortherkenning' geven.
  8. Geef in het veld Gegevens opslaan in de locatie op van de uitvoergegevensset.
  9. Klik op Opslaan, voer een naam in voor de gegevensstroom en klik op OK.
  10. Klik op Gegevensstroom uitvoeren.
Nadat de analyse door de gegevensstroom is voltooid, opent u de gegevensset die u in stap 7 hebt opgegeven.

Navigeer op de beginpagina van Oracle Analytics naar Gegevens en naar Gegevenssets om de gegenereerde gegevensset te zoeken.
Beschrijving van GUID-D4540502-D2A4-43CB-B023-E9F27C43579E-default.png volgt hierna
.png

Zie Uitvoer gegenereerd voor modellen van OCI Document Understanding voor meer informatie over de gegenereerde resultaten.