riconoscimento ottico dei caratteri (OCR)

Document Understanding è in grado di rilevare e riconoscere il testo in un documento. OCR disegna riquadri intorno al testo stampato o scritto a mano che trova in un documento e digitalizza il testo.

Se si dispone di un PDF con testo, Document Understanding trova il testo in quel documento ed estrae il testo. Vengono quindi fornite caselle di delimitazione per il testo identificato. Il rilevamento del testo può essere utilizzato con i modelli AI documento o Analisi immagine.

Document Understanding fornisce un punteggio di affidabilità per ogni raggruppamento di testo. Il punteggio di affidabilità è un numero decimale. I punteggi più vicini a 1 indicano una maggiore fiducia nel testo estratto, mentre i punteggi più bassi indicano un punteggio di affidabilità più basso. L'intervallo del punteggio di affidabilità per ogni etichetta è compreso tra 0 e 1.

Di seguito sono riportate le funzioni supportate.
  • Estrazione parola
  • Estrazione righe di testo
  • Punteggio affidabilità
  • Polighi di delimitazione
  • Richiesta singola
  • Richiesta batch
Le limitazioni sono:
  • L'OCR è limitato all'inglese.

Esempio OCR

Esempio di utilizzo di OCR in Document Understanding.

Documento di input
Input OCR Ricevuta da un bar fittizio, tra cui due voci riga, imposta, totale parziale e importi totali.
{ "analyzeDocumentDetails":
                { "compartmentId": "",
                "document": { "namespaceName": "",
                "bucketName": "",
                "objectName": "",
                "source": "OBJECT_STORAGE" },
                "features":
                [ { "featureType": "TEXT_DETECTION" },
                { "featureType": "LANGUAGE_CLASSIFICATION",
                "maxResults": 5 } ]
                } 
                }
.
output:
OCR - Output risposta API Ricevuta con tutti i campi identificati:
{ "documentMetadata":
              { "pageCount": 1,
              "mimeType": "image/jpeg" },
              "pages":
              [ { "pageNumber": 1,
              "dimensions":
              { "width": 361, 
              "height": 600,
              "unit": "PIXEL" },
              "detectedLanguages":
              [ { "languageCode": "ENG",
              "confidence": 0.9999994 },
              { "languageCode": "ARA", 
              "confidence": 4.7619238e-7 },
              { "languageCode": "NLD",
              "confidence": 7.2325456e-8 },
              { "languageCode": "CHI_SIM",
              "confidence": 3.0645523e-8 },
              { "languageCode": "ITA",
              "confidence": 8.6900076e-10 } ],
              "words":
              [ { "text": "Example",
              "confidence": 0.99908227,
              "boundingPolygon":
              { "normalizedVertices": 
              [ { "x": 0.0664819944598338, 
              "y": 0.011666666666666667 },
              { "x": 0.22160664819944598,
              "y": 0.011666666666666667 },
              { "x": 0.22160664819944598,
              "y": 0.035 },
              { "x": 0.0664819944598338,
              "y": 0.035 } ]
              } ... "detectedLanguages":
              [ { "languageCode": "ENG", 
              "confidence": 0.9999994 } ], ...