riconoscimento ottico dei caratteri (OCR)

Document Understanding è in grado di rilevare e riconoscere il testo in un documento. OCR disegna riquadri intorno al testo stampato o scritto a mano che trova in un documento e digitalizza il testo.

Se si dispone di un PDF con testo, Document Understanding trova il testo in quel documento ed estrae il testo. Vengono quindi fornite caselle di delimitazione per il testo identificato. Il rilevamento del testo può essere utilizzato con i modelli AI documento o Analisi immagine.

Document Understanding fornisce un punteggio di affidabilità per ogni raggruppamento di testo. Il punteggio di affidabilità è un numero decimale. I punteggi più vicini a 1 indicano una maggiore fiducia nel testo estratto, mentre i punteggi più bassi indicano un punteggio di affidabilità più basso. L'intervallo del punteggio di affidabilità per ogni etichetta è compreso tra 0 e 1.

Di seguito sono riportate le funzioni supportate.

Estrazione parola
Estrazione righe di testo
Punteggio affidabilità
Polighi di delimitazione
Richiesta singola
Richiesta batch

Le limitazioni sono:

L'OCR è limitato all'inglese.

Esempio OCR

Esempio di utilizzo di OCR in Document Understanding.

Documento di input

Input OCR

Ricevuta da un bar fittizio, tra cui due voci riga, imposta, totale parziale e importi totali.

{ "analyzeDocumentDetails":
                { "compartmentId": "",
                "document": { "namespaceName": "",
                "bucketName": "",
                "objectName": "",
                "source": "OBJECT_STORAGE" },
                "features":
                [ { "featureType": "TEXT_DETECTION" },
                { "featureType": "LANGUAGE_CLASSIFICATION",
                "maxResults": 5 } ]
                } 
                }

output:

OCR - Output risposta API Ricevuta con tutti i campi identificati

{ "documentMetadata":
              { "pageCount": 1,
              "mimeType": "image/jpeg" },
              "pages":
              [ { "pageNumber": 1,
              "dimensions":
              { "width": 361, 
              "height": 600,
              "unit": "PIXEL" },
              "detectedLanguages":
              [ { "languageCode": "ENG",
              "confidence": 0.9999994 },
              { "languageCode": "ARA", 
              "confidence": 4.7619238e-7 },
              { "languageCode": "NLD",
              "confidence": 7.2325456e-8 },
              { "languageCode": "CHI_SIM",
              "confidence": 3.0645523e-8 },
              { "languageCode": "ITA",
              "confidence": 8.6900076e-10 } ],
              "words":
              [ { "text": "Example",
              "confidence": 0.99908227,
              "boundingPolygon":
              { "normalizedVertices": 
              [ { "x": 0.0664819944598338, 
              "y": 0.011666666666666667 },
              { "x": 0.22160664819944598,
              "y": 0.011666666666666667 },
              { "x": 0.22160664819944598,
              "y": 0.035 },
              { "x": 0.0664819944598338,
              "y": 0.035 } ]
              } ... "detectedLanguages":
              [ { "languageCode": "ENG", 
              "confidence": 0.9999994 } ], ...

Documentazione di Oracle Cloud Infrastructure

riconoscimento ottico dei caratteri (OCR)

Esempio OCR

Esempio di utilizzo di OCR in Document Understanding.