2 ทำความเข้าใจเกี่ยวกับกระบวนการของ Content Capture

ลองมาดูกระบวนการพื้นฐานในการบันทึกเนื้อหาและอัปโหลดไปยัง Oracle Content Management

แสดงวิธีการประมวลผลเอกสารตั้งแต่ขั้นแรกจนถึงขั้นสุดท้าย

ที่มา

ผู้ใช้สามารถบันทึกเนื้อหาได้จากหลายที่มา:

ตัวประมวลผล

ไม่ว่าที่มาจะเป็นอย่างไร เอกสารที่บันทึกแต่ละรายการจะได้รับการกำหนดเส้นทางผ่านตัวประมวลผลจำนวนหนึ่งก่อนที่จะอัปโหลดไปยัง Oracle Content Management เพื่อเก็บไว้ในพื้นที่เก็บข้อมูลและ/หรือประมวลผลเพิ่มเติม:
  • ตัวประมวลผลการอิมปอร์ต จะทำการอิมปอร์ตเป็นกลุ่มโดยอัตโนมัติจากที่มาต่างๆ เช่น โฟลเดอร์ระบบไฟล์ ไฟล์ข้อความลิสต์ที่มีตัวคั่น หรืออินบ็อกซ์/โฟลเดอร์ของบัญชีอีเมล์เซิร์ฟเวอร์ งานอิมปอร์ตจะตรวจสอบที่มาและอิมปอร์ตเนื้อหาตามความถี่ที่ระบุ (เช่น ทุกนาที ชั่วโมง หรือวัน)

  • ตัวประมวลผลการแปลง TIFF จะแปลงเอกสารที่ไม่ใช่รูปภาพและสิ่งที่แนบมาเป็นไฟล์รูปแบบ TIFF หรือ JPEG คุณสามารถเลือกรวมเอกสารและสิ่งที่แนบมาได้หลายรูปแบบระหว่างการแปลง ตัวอย่างเช่น ตัวประมวลผลการแปลงสามารถแปลงไฟล์เอกสารอย่าง PDF หรือเอกสาร Microsoft Office เป็นไฟล์รูปภาพ TIFF สำหรับการประมวลผลบาร์โค้ด เป็นต้น

  • ตัวประมวลผลการแปลง PDF จะแปลงเอกสาร รูปภาพ และสิ่งที่แนบมาเป็น PDF
  • ตัวประมวลผลการรับรู้ จะทำการรับรู้บาร์โค้ด จัดระเบียบเอกสาร และสร้างดัชนีโดยอัตโนมัติ

  • ตัวประมวลผลการคอมมิต จะรันโปรไฟล์การคอมมิตเพื่อสร้างเอาต์พุตและอัปโหลดเอกสารเป็นแบทช์ไปยัง Oracle Content Management โดยอัตโนมัติ จากนั้นจึงย้ายแบทช์ออกจากโปรซีเจอร์

    โปรไฟล์การคอมมิตจะระบุวิธีสร้างเอาต์พุตเอกสารและเมตะดาต้า โดยจะมีทั้งการแมปฟิลด์เมตะดาต้า รูปแบบเอาต์พุต คำแนะนำในการจัดการข้อผิดพลาด และการตั้งค่าปัจจัยการคอมมิต

  • ตัวประมวลผลการค้นหาข้อมูล ช่วยให้ผู้ใช้ไคลเอนต์สามารถค้นหาข้อมูลที่รองรับในพื้นที่เก็บข้อมูล Oracle Content Management

  • ตัวประมวลผลการแปลง XML ช่วยให้ผู้ใช้ไคลเอนต์สามารถแปลงเอกสาร XML เป็นรูปแบบที่ต้องการตามไฟล์ XSLT

ตัวประมวลผลแต่ละรายการจะทำงานร่วมกัน (หากคุณคอนฟิเกอร์ให้ใช้ทั้งหมด) งานหลายงานในโฟลว์ของแบทช์จะเริ่มต้นด้วยตัวประมวลผลการอิมปอร์ต จากนั้นจะส่งต่อไปยังตัวประมวลผลการแปลง PDF หรือ TIFF เพื่อแปลงเอกสารเป็นรูปแบบที่คอนฟิเกอร์ไว้ จากนั้นตัวประมวลผลการรับรู้จะรับหน้าที่ต่อเพื่อทำการรับรู้บาร์โค้ด จัดระเบียบเอกสารตามวิธีที่กำหนด และสร้างดัชนี และสุดท้าย ตัวประมวลผลการคอมมิตจะส่ง (อัปโหลด) เอาต์พุตไปยัง Oracle Content Management

เอกสารทั้งหมดที่บันทึกจะได้รับการอัปโหลดและจัดเก็บไว้ใน Oracle Content Management ในลักษณะของรายการเนื้อหาแยก พร้อมกับเมตะดาต้าที่ระบุไว้ระหว่างกระบวนการบันทึกเนื้อหา คุณสามารถเข้าใช้และจัดการรายการเหล่านี้ได้เหมือนกับรายการอื่นๆ ใน Oracle Content Management

โปรซีเจอร์

โปรซีเจอร์ คือ เวิร์กโฟลว์การบันทึกเนื้อหาที่กำหนดไว้ จากแหล่งที่มาเริ่มต้นไปจนถึงการอัปโหลดขั้นสุดท้ายไปยัง Oracle Content Management แต่ละโปรซีเจอร์จะแสดงถึงระบบการบันทึกเนื้อหาทั้งหมด ซึ่งระบุตำแหน่งส่วนกลางในการคอนฟิเกอร์เมตะดาต้า กฎการประมวลผล โปรไฟล์คอนฟิเกอเรชัน และข้อมูลแบทช์สำหรับสภาพแวดล้อมเฉพาะ ผู้ใช้ไคลเอนต์การบันทึกเนื้อหาจะสร้างและเข้าใช้แบทช์ต่างๆ ภายในโปรซีเจอร์ที่พวกเขาได้รับสิทธิ์เข้าใช้ได้

คุณสามารถสร้างโปรซีเจอร์ได้หลายรายการสำหรับหน่วยงานของคุณ เพื่อให้คุณสามารถจัดการความต้องการในการบันทึกเนื้อหาและการประมวลผลได้อย่างมีประสิทธิภาพ เช่น จัดการตามแผนกหรือที่ตั้ง นอกจากนี้คุณยังสามารถกำหนดให้สามารถใช้องค์ประกอบของคอนฟิเกอเรชันทั่วไปร่วมกันได้ระหว่างโปรซีเจอร์เพื่อให้เกิดการใช้งานซ้ำอย่างเหมาะสมที่สุด นอกจากนี้ คุณยังสามารถคัดลอกโปรซีเจอร์เพื่อนำไปใช้กับสภาพแวดล้อมอื่นได้อย่างง่ายดายอีกด้วย

แบทช์

แบทช์ ประกอบด้วยเอกสารอย่างน้อยหนึ่งรายการ ซึ่งอาจเกี่ยวข้องกัน (ตัวอย่างเช่น เอกสารหลายฉบับสำหรับลูกค้ารายเดียวกัน) หรือไม่เกี่ยวข้องกัน (ตัวอย่างเช่น เอกสารที่คั่นด้วยชีทคั่น)
  • เอกสารอาจประกอบด้วยภาพที่สแกนหรือไฟล์อิเล็กทรอนิกส์ เช่น ไฟล์ Microsoft Word หรือ PDF

  • เอกสารอาจมีหรือไม่มีสิ่งที่แนบมา เช่น รูปภาพหรือไฟล์อิเล็กทรอนิกส์

เมื่อคุณทำงานกับแบทช์ คุณสามารถล็อคแบทช์ไว้ได้ คุณจะเห็นไอคอนรูปกุญแจ เมื่อแบทช์ถูกล็อคโดยคุณหรือผู้ใช้อื่น การรีลีสแบทช์จะเป็นการลบไอคอนล็อคออก และทำให้แบทช์นั้นสามารถใช้งานได้โดยผู้ใช้อื่นหรือตัวประมวลผลของระบบ ทั้งนี้ขึ้นอยู่กับการตั้งค่าโปรไฟล์ไคลเอนต์

โปรไฟล์ไคลเอนต์

คุณ สแกน หรือ อิมปอร์ต กลุ่มเพจในแบทช์ โดยใช้โปรไฟล์ไคลเอนต์ที่ผู้จัดการโปรซีเจอร์กำหนดไว้ให้คุณ โปรไฟล์ไคลเอนต์ เป็นกลุ่มการตั้งค่าที่กำหนดวิธีสแกน อิมปอร์ต หรือสร้างดัชนีเอกสารในแบทช์ โปรไฟล์ไคลเอนต์สามารถทำงานดังนี้:
  • ควบคุมสิ่งต่างๆ เช่น การตั้งค่าสแกนเนอร์ วิธีสร้างและคั่นเอกสารในแบทช์ กำหนดว่ามีฟิลด์เมตะดาต้าหรือไม่ กำหนดว่าจะประมวลผลบาร์โค้ดหรือไม่และทำอย่างไร รวมทั้งจะเกิดอะไรขึ้นต่อไปกับแบทช์หลังจากที่คุณรีลีส

  • กำหนดว่าคุณสามารถบันทึกเอกสารเท่านั้น บันทึกและ สร้างดัชนี เอกสาร หรือสร้างดัชนีเอกสารเท่านั้น

  • กำหนดว่าไฟล์อิเล็กทรอนิกส์ที่ไม่ใช่รูปภาพ (เช่น เอกสาร PDF) ควรอยู่ในรูปแบบต้นฉบับ แปลงรูปแบบเป็นรูปภาพ หรือป้องกันไม่ให้อิมปอร์ต

  • ระบุชุดของฟิลด์เมตะดาต้าที่จะป้อนข้อมูลสำหรับเอกสารที่เลือกไว้

ถ้าโปรไฟล์ไคลเอนต์ระบุการสร้างดัชนีไว้ คุณสามารถระบุค่าเมตะดาต้าให้กับเอกสาร เช่น ID และชื่อของลูกค้า โดยทั่วไป เอกสารต่างประเภทกันในแบทช์จะมีชุดของฟิลด์เมตะดาต้าที่แตกต่างกัน คุณสามารถระบุค่าเมตะดาต้าให้เอกสารในแบทช์การสร้างดัชนีเท่านั้น แต่ไม่สามารถต่อท้าย แทรก หรือแทนที่เพจ

เมื่อคุณทำงานกับเอกสารในแบทช์เสร็จแล้ว คุณจะรีลีสแบทช์ซึ่งเป็นการปลดล็อคแบทช์จากการใช้งานเฉพาะคุณเพียงคนเดียว (หากไม่มีการกำหนดกระบวนการรีลีส) หากคุณรีลีสแบทช์และเลือกกระบวนการรีลีสที่ใช้ได้ไว้ การดำเนินการถัดไปที่ทำกับแบทช์จะขึ้นอยู่กับกระบวนการรีลีสดังกล่าว สิ่งที่เกิดขึ้นถัดไปจะขึ้นอยู่กับการตั้งค่าโปรไฟล์ไคลเอนต์ ดังนี้
  • แบทช์อาจถูกย้ายออกจากลิสต์ของช่องแบทช์และคอมมิตไปยัง Oracle Content Management หรือนำเข้าสู่คิวเพื่อประมวลผลเพิ่มเติม เช่น การแปลงเป็น PDF/TIFF หรือการอ่านบาร์โค้ด

  • แบทช์อาจยังคงอยู่ในลิสต์แต่จะถูกปลดล็อค (ไม่มีไอคอนรูปกุญแจ) ซึ่งจะอนุญาตให้คุณหรือผู้ใช้อื่นล็อคแบทช์และแก้ไขเพิ่มเติมได้