จัดเตรียมเอกสารเพื่อวิเคราะห์ด้วยโมเดล OCI Document Understanding

คุณใช้บัคเก็ตใน OCI Object Storage เพื่อจัดเก็บเอกสารที่คุณต้องการวิเคราะห์ จากนั้นสร้างชุดข้อมูลเพื่อเข้าใช้เอกสารเหล่านี้ใน Oracle Analytics

โดยทั่วไป คุณจะจัดเก็บเอกสารอินพุตและโมเดล AI ไว้ในแอคเคาท์ Oracle Cloud (รายการภายใน) เดียวกัน ซึ่งช่วยให้ง่ายต่อการตั้งค่าใน Oracle Analytics

ในกรณีที่คุณจัดเก็บเอกสารอินพุตและโมเดล AI ไว้ในรายการภายในอื่น ให้ทำดังนี้
  • ตรวจสอบว่าการแสดงผลบัคเก็ตพื้นที่เก็บข้อมูลที่มีเอกสารอินพุตของคุณ มีสถานะเป็น สาธารณะ โปรดดู เปลี่ยนการแสดงข้อมูลของบัคเก็ต
  • ป็อปปูเลทชุดข้อมูลอินพุตสำหรับโฟลว์ข้อมูลด้วย URL เอกสารแต่ละรายการ แทน URL เดียวสำหรับบัคเก็ต OCI ที่มีการจัดเก็บเอกสาร
ในการรันครั้งเดียว โฟลว์ข้อมูล Oracle Analytics สามารถประมวลผลเอกสารได้สูงสุด 10,000 รายการสำหรับโมเดลที่ฝึกอบรมล่วงหน้า และเอกสาร 2,000 รายการสำหรับโมเดลที่กำหนดเอง หากคุณมีเอกสารมากกว่าจำนวนสูงสุดที่สามารถประมวลผลในการรันครั้งเดียว ในพื้นที่เก็บข้อมูลออบเจกต์และพื้นที่เก็บชุดข้อมูลของ OCI ให้สร้างบัคเก็ตหลายรายการที่มีเอกสารไม่เกินจำนวนสูงสุดในแต่ละบัคเก็ต จากนั้น สร้างชุดข้อมูลและโฟลว์ข้อมูลแยกกันสำหรับแต่ละบัคเก็ต และใช้ลำดับเพื่อประมวลผลโฟลว์ข้อมูลตามลำดับ

คุณสามารถใช้บัคเก็ตแบบส่วนบุคคลหรือส่วนกลางที่สามารถเข้าใช้ได้โดยผู้ใช้ OCI และเป็นไปตามขีดจำกัดทั่วไปเกี่ยวกับเอกสารของ OCI โปรดดูเอกสาร OCI

  1. ใน OCI Console ให้นาวิเกตไปยัง พื้นที่เก็บข้อมูลออบเจกต์และพื้นที่เก็บข้อมูลชุดข้อมูล และสร้างบัคเก็ตใหม่เพื่อจัดเก็บเอกสารของคุณ

  2. ในพื้นที่ พื้นที่เก็บข้อมูลออบเจกต์และพื้นที่เก็บชุดข้อมูล ให้คลิกชื่อบัคเก็ต จากนั้น ภายใต้พื้นที่ ออบเจกต์ ของเพจ ให้คลิก อัปโหลด แล้วอัปโหลดเอกสารของคุณ
    ตรวจสอบให้แน่ใจว่าบัคเก็ตไม่มีไฟล์ที่ไม่เกี่ยวข้องที่คุณไม่ต้องการประมวลผล Oracle Analytics ประมวลผลทุกไฟล์ในบัคเก็ต
  3. สำหรับแต่ละบัคเก็ต ให้เพิ่ม URL ของบัคเก็ตในไฟล์ค่าที่คั่นด้วยเครื่องหมายคอมมา (CSV)
    1. ใน Object Storage ให้เลือกบัคเก็ตเพื่อแสดงเอกสารในไดอะล็อกออบเจกต์
    2. คัดลอก URL จากแถบ URL ของเบราว์เซอร์
    3. สร้างไฟล์ CSV ที่มีฟิลด์สำหรับ ID, ชื่อบัคเก็ต และ URL บัคเก็ต
    4. วาง URL บัคเก็ตในไฟล์ CSV เป็นค่า URL บัคเก็ต
      หรือในกรณีที่คุณจัดเก็บเอกสารอินพุตและโมเดล AI ไว้ในรายการภายในอื่น ให้เพิ่มในไฟล์ CSV ทีละรายการ
      สร้างไฟล์ CSV ที่มีฟิลด์สำหรับ ID, ชื่อเอกสาร และ URL เอกสาร สำหรับเอกสารแต่ละรายการในพื้นที่เก็บข้อมูลออบเจกต์ ให้คลิกไอคอนจุดไข่ปลา ไอคอนจุดไข่ปลา แล้วเลือก รายละเอียดของวิวออบเจกต์ จากนั้น คัดลอกค่า ชื่อ และค่า พาธ URL (URI)

      วางค่าของชื่อเป็นชื่อเอกสาร และวางค่าของพาธ URL (URI) เป็น URL ของเอกสาร

  4. ใน Oracle Analytics สำหรับบัคเก็ตแต่ละรายการที่คุณใช้จัดเก็บเอกสารของคุณ ให้คลิก สร้าง และคลิก ชุดข้อมูล
  5. อัปโหลดไฟล์ CSV ที่คุณสร้างในขั้นตอนที่ 3 และบันทึกชุดข้อมูล
    ทำตามขั้นตอนที่ 4 และ 5 ซ้ำสำหรับแต่ละบัคเก็ต หากคุณมีเอกสารมากกว่า 10,000 รายการ ให้สร้างหลายบัคเก็ตที่มีเอกสารสูงสุด 10,000 รายการ และสร้างชุดข้อมูลแยกต่างหากสำหรับแต่ละบัคเก็ต