Προετοιμασία εγγράφων για ανάλυση με μοντέλο OCI Document Understanding

Χρησιμοποιείτε καλάθια στον Χώρο αποθήκευσης αντικειμένων του OCI για την αποθήκευση των εγγράφων που θέλετε να αναλύσετε και, στη συνέχεια, δημιουργείτε ένα σύνολο δεδομένων για πρόσβαση σε αυτά τα έγγραφα στο Oracle Analytics.

Συνήθως αποθηκεύετε έγγραφα εισαγωγής και μοντέλα AI στονίδιο λογαριασμό (μίσθωση) Oracle Cloud, το οποίο διευκολύνει τη διαμόρφωση στο Oracle Analytics.

Αν τα έγγραφα εισαγωγής και μοντέλα AI είναι αποθηκευμένα σε διαφορετικές μισθώσεις:
  • Βεβαιωθείτε ότι η ορατότητα του καλαθιού που περιέχει τα έγγραφα εισαγωγής είναι δημόσια. Δείτε Αλλαγή της ορατότητας ενός καλαθιού.
  • Συμπληρώστε το σύνολο δεδομένων εισαγωγής για τη ροή δεδομένων με τις ξεχωριστές διευθύνσεις τοποθεσίας των εγγράφων αντί για μία μεμονωμένη διεύθυνση τοποθεσίας για το καλάθι του OCI στο οποίο είναι αποθηκευμένα τα έγγραφα.
Σε μια μεμονωμένη εκτέλεση, οι ροές δεδομένων του Oracle Analytics μπορούν να επεξεργαστούν έως 10.000 έγγραφα για προεκπαιδευμένα μοντέλα και 2.000 έγγραφα για προσαρμοσμένα μοντέλα. Αν έχετε περισσότερα έγγραφα από αυτά που μπορούν να υποβληθούν σε επεξεργασία σε μια μεμονωμένη εκτέλεση, στην υπηρεσία Object Storage & Archive Storage του OCI, δημιουργήστε πολλαπλά καλάθια με αριθμό εγγράφων που δεν υπερβαίνει το μέγιστο όριο. Στη συνέχεια, δημιουργήστε ένα ξεχωριστό σύνολο δεδομένων και μια ροή δεδομένων για κάθε καλάθι και χρησιμοποιήστε μια ακολουθία για τη σειριακή επεξεργασία των ροών δεδομένων.

Μπορείτε να χρησιμοποιήσετε ένα ιδιωτικό ή δημόσιο καλάθι, το οποίο να είναι προσβάσιμο από τον χρήστη OCI και συμμορφώνεται με τα γενικά όρια του OCI για τα έγγραφα. Ανατρέξτε στην τεκμηρίωση του OCI.

  1. Στην Κονσόλα OCI, μεταβείτε στο Object Storage & Archive Storage και δημιουργήστε ένα καλάθι για την αποθήκευση των εγγράφων σας.

  2. Στην περιοχή Object Storage & Archive Storage, κάντε κλικ στο όνομα ενός καλαθιού και, στη συνέχεια, στην περιοχή Αντικείμενα της σελίδας, κάντε κλικ στην επιλογή Αποστολή για να αποστείλετε τα έγγραφά σας.
    Βεβαιωθείτε ότι το καλάθι δεν περιέχει περιττά αρχεία που δεν θέλετε να επεξεργαστείτε. Το Oracle Analytics επεξεργάζεται κάθε αρχείο στο καλάθι.
  3. Για κάθε καλάθι, προσθέστε τη διεύθυνση τοποθεσίας καλαθιού σε ένα αρχείο τιμών διαχωρισμένων με κόμματα (CSV).
    1. Στον Χώρο αποθήκευσης αντικειμένων, επιλέξτε το καλάθι για να εμφανιστούν τα έγγραφα στο παράθυρο διαλόγου "Αντικείμενα".
    2. Αντιγράψτε τη διεύθυνση τοποθεσίας από τη γραμμή διευθύνσεων τοποθεσίας του προγράμματος περιήγησης.
    3. Δημιουργήστε ένα αρχείο CSV με πεδία για Αναγνωριστικό, Όνομα καλαθιού και Διεύθυνση καλαθιού.
    4. Επικολλήστε τη διεύθυνση τοποθεσίας του καλαθιού στο αρχείο CSV ως τιμή για τη Διεύθυνση τοποθεσίας καλαθιού.
      Εναλλακτικά, αν τα έγγραφα εισαγωγής και μοντέλα AI είναι αποθηκευμένα σε διαφορετικές μισθώσεις, προσθέστε τα ξεχωριστά στο αρχείο CSV.
      Δημιουργήστε ένα αρχείο CSV με πεδία για Αναγνωριστικό, Όνομα εγγράφου και Διεύθυνση τοποθεσίας εγγράφου. Για κάθε έγγραφο στον Χώρο αποθήκευσης αντικειμένων, κάντε κλικ στο εικονίδιο έλλειψης εικονίδιο έλλειψης, επιλέξτε Προβολή λεπτομερειών αντικειμένου και αντιγράψτε την τιμή του πεδίου Όνομα και του πεδίου Διαδρομή διεύθυνσης τοποθεσίας (URI).

      Επικολλήστε την τιμή του πεδίου "Όνομα" ως το όνομα εγγράφου και επικολλήστε την τιμή του πεδίου "Διαδρομή διεύθυνσης τοποθεσίας (URI)" ως τη διεύθυνση τοποθεσίας εγγράφου.

  4. Στο Oracle Analytics, για κάθε καλάθι που χρησιμοποιείτε για να αποθηκεύσετε τα έγγραφά σας, κάντε κλικ στην επιλογή Δημιουργία και έπειτα Σύνολο δεδομένων.
  5. Αποστείλετε το αρχείο CSV που δημιουργήσατε στο Βήμα 3 και αποθηκεύστε το σύνολο δεδομένων.
    Επαναλάβετε τα βήματα 4 και 5 για κάθε κάθε καλάθι. Εάν έχετε περισσότερα από 10.000 έγγραφα, δημιουργήστε πολλά καλάθια που περιέχουν έως και 10.000 έγγραφα το καθένα, και δημιουργήστε ένα ξεχωριστό σύνολο δεδομένων για κάθε κάθε καλάθι.