ภาพรวมการวิเคราะห์จุดสิ้นสุดของ OCI Data Flow SQL

คุณใช้ Oracle Analytics Cloud เพื่อวิเคราะห์ข้อมูลจากจุดสิ้นสุดของ OCI Data Flow SQL ในพื้นที่เก็บข้อมูลออบเจกต์, Data Lake และแอปพลิเคชัน

จุดสิ้นสุด SQL ของโฟลว์ข้อมูลได้รับการออกแบบสำหรับผู้พัฒนา, นักวิทยาศาสตร์ข้อมูล และนักวิเคราะห์ระดับสูง เพื่อให้สามารถสืบค้นแบบโต้ตอบได้โดยตรงว่าข้อมูลอยู่ตำแหน่งใดใน Data Lake

ประโยชน์ของการใช้จุดสิ้นสุดของ OCI Data Flow SQL

  • คุณสามารถวิเคราะห์ข้อมูลอีเวนต์และอนุกรมเวลาจำนวนมากใน Data Lake โดยไม่ต้องย้ายและสรุปเพื่อประสิทธิภาพ
  • คุณสามารถรวมข้อมูลจากแอปพลิเคชันและดาต้าสโตร์ต่างๆ (เช่น ใน Enterprise Resource Planning) ลงในพื้นที่เก็บข้อมูลออบเจกต์ และดำเนินการสืบค้นข้อมูลเฉพาะกิจได้ ไม่ว่าข้อมูลจะมาจากที่ใดก็ตาม
  • คุณสามารถแจกจ่ายข้อมูลที่ดึงออกมาและการรวมล่วงหน้า และทำงานกับข้อมูลสดที่ระดับความละเอียดใดก็ได้ ดังนั้น คุณจึงไม่เพียงประหยัดเวลาและความพยายามในการเตรียมข้อมูลเท่านั้น แต่ยังมีความสามารถในการวิเคราะห์ที่มีประสิทธิภาพยิ่งขึ้นอีกด้วย
แนวทางปฏิบัติที่ดีที่สุดเพื่อประสิทธิภาพการทำงาน


  • หากต้องการใช้ประโยชน์จากการสร้างดัชนีและการใช้แคชที่เทียร์ Spark Cluster ให้สร้างชุดข้อมูลตามตารางหรือวิวเดียว รองรับชุดข้อมูลตามการรวมหลายตาราง แต่ไม่แนะนำ
  • เมื่อคุณคอนฟิเกอร์คลัสเตอร์จุดสิ้นสุด OCI Data Flow SQL ให้ตั้งค่า incrementalCollect เป็นจริง เช่น:

    spark.sql.thriftServer.incrementalCollect=true;

การแสดงข้อมูลจากจุดสิ้นสุดของ OCI Data Flow SQL

ในโปรแกรมแก้ไขเวิร์กบุค Oracle Analytics Cloud เพิ่มตารางและลูกบาศก์จุดสิ้นสุดของ OCI Data Flow SQL หลายรายการ เมื่อคุณเลือกตารางหรือลูกบาศก์ คุณสามารถเพิ่มคอลัมน์ไดเมนชันและคอลัมน์การวัดในชุดข้อมูลของคุณเพื่อการวิเคราะห์ได้