โมเดลการคาดการณ์ของ Oracle Analytics ใช้อัลกอริทึม Oracle Machine Learning ที่รวมอยู่จำนวนมาก เพื่อค้นหาชุดข้อมูลของคุณ คาดการณ์ค่าเป้าหมาย หรือระบุคลาสของเรคคอร์ด ใช้โปรแกรมแก้ไขโฟลว์ข้อมูลเพื่อสร้าง ฝึก และใช้โมเดลการคาดการณ์กับข้อมูลของคุณ
โมเดลการคาดการณ์ของ Oracle Analytics จะใช้อัลกอริทึมเฉพาะกับชุดข้อมูลเพื่อคาดการณ์ค่า คาดการณ์คลาส หรือระบุกลุ่มในข้อมูล
คุณยังสามารถใช้โมเดลการเรียนรู้ของเครื่อง Oracle เพื่อคาดการณ์ข้อมูล
Oracle Analytics มีอัลกอริทึมที่จะช่วยคุณฝึกอบรมโมเดลการคาดการณ์เพื่อวัตถุประสงค์ต่างๆ ตัวอย่างของอัลกอริทึมได้แก่โครงสร้างการจัดประเภทและการถดถอย (CART), การถดถอยตามตรรกะ และ k-means
คุณจะใช้โปรแกรมแก้ไขข้อมูลเพื่อฝึกอบรมโมเดลในชุดข้อมูลการฝึกอบรมก่อน หลังจากฝึกอบรมโมเดลการคาดการณ์แล้ว คุณจะใช้โมเดลนั้นกับชุดข้อมูลที่คุณต้องการคาดการณ์
คุณสามารถทำให้โมเดลที่ฝึกอบรมแล้วใช้ได้สำหรับผู้ใช้อื่น ซึ่งจะสามารถใช้โมเดลดังกล่าวกับข้อมูลเพื่อคาดการณ์ค่า ในบางกรณี ผู้ใช้บางรายจะฝึกอบรมโมเดล และผู้ใช้อื่นๆ จะใช้โมเดลเหล่านั้น
หมายเหตุ:
หากคุณไม่แน่ใจว่าจะต้องหาอะไรในข้อมูลของคุณ คุณสามารถเริ่มได้ด้วยการใช้ Explain ซึ่งจะใช้การเรียนรู้ของเครื่องเพื่อระบุแนวโน้มและรูปแบบ จากนั้นคุณสามารถใช้โปรแกรมแก้ไขโฟลว์ข้อมูลเพื่อสร้างและฝึกอบรมโมเดลการคาดการณ์เพื่อดริลล์ไปยังแนวโน้มและรูปแบบที่ Explain พบใช้โมเดลที่เสร็จสิ้นแล้วในการให้คะแนนข้อมูลที่ไม่รู้จักหรืที่ไม่ได้กำหนดป้ายกำกับเพื่อสร้างชุดข้อมูลภายในโฟลว์ข้อมูลหรือเพื่อเพิ่มการแสดงข้อมูลการคาดการณ์ไปยังเวิร์กบุค
ตัวอย่าง
สมมติว่าคุณต้องการสร้างและฝึกอบรมโมเดลการจัดประเภทหลายรายการเพื่อคาดการณ์ว่าผู้ป่วยรายใดมีความเสี่ยงในการเกิดโรคหัวใจสูง
Oracle Analytics มาพร้อมอัลกอริทึมสำหรับความต้องการในการกำหนดโมเดลการเรียนรู้ของเครื่อง: การคาดการณ์ตัวเลข การจัดประเภทหลายรายการ ตัวแบ่งประเภทแบบไบนารี และการคลัสเตอร์
ฟังก์ชันการเรียนรู้ของเครื่องของ Oracle เป็นฟังก์ชันสำหรับนักวิเคราะห์ข้อมูลขั้นสูงที่ทราบแนวคิดว่าต้องการค้นหาอะไรในข้อมูล คุ้นเคยกับแนวทางปฏิบัติสำหรับการวิเคราะห์การคาดการณ์ และเข้าใจความแตกต่างระหว่างอัลกอริทึมต่างๆ
หมายเหตุ:
หากคุณกำลังใช้ข้อมูลที่มาจาก Oracle Autonomous Data Warehouse คุณสามารถใช้ความสามารถ AutoML เพื่อฝึกโมเดลการคาดการณ์ให้คุณได้อย่างรวดเร็วและง่ายดาย โดยไม่ต้องใช้ทักษะการเรียนรู้ของเครื่อง See ฝึกโมเดลการคาดการณ์โดยใช้ AutoML ใน Autonomous Data Warehouseตามปกติแล้ว ผู้ใช้ต้องการสร้างโมเดลการคาดการณ์หลายรายการ เปรียบเทียบ และเลือกโมเดลเป็นไปได้ว่าจะให้ผลลัพธ์ที่ตรงตามเกณฑ์และความต้องการมากที่สุด เกณฑ์เหล่านี้อาจแตกต่างกันไป ตัวอย่างเช่น ในบางครั้งผู้ใช้เลือกโมเดลที่มีความถูกต้องโดยรวมที่ดีขึ้น บางครั้งผู้ใช้ก็เลือกโมเดลที่มีข้อผิดพลาดประเภท I (ผลบวกเท็จ) และประเภท II (ผลลบเท็จ) และบางครั้งผู้ใช้ก็เลือกโมเดลที่แสดงผลลัพธ์เร็วกว่าและที่มีระดับความถูกต้องที่ยอมรับได้ แม้จะไม่ใช่ผลลัพธ์ที่สมบูรณ์แบบก็ตาม
Oracle Analytics ประกอบด้วยอัลกอริทึมการเรียนรู้ของเครื่องหลายรายการสำหรับการคาดการณ์และการจัดประเภทแต่ละชนิด ด้วยอัลกอริทึมเหล่านี้ ผู้ใช้สามารถสร้างมากกว่าหนึ่งโมเดล หรือใช้พารามิเตอร์อื่นที่มีการปรับปรุง หรือใช้ชุดข้อมูลการฝึกอบรมอินพุตอื่น แล้วเลือกโมเดลที่ดีที่สุด ผู้ใช้สามารถเลือกโมเดลที่ดีที่สุดด้วยการเปรียบเทียบและถ่วงน้ำหนักโมเดลกับเกณฑ์ของตนเอง ในการกำหนดโมเดลที่ดีที่สุด ผู้ใช้สามารถใช้โมเดลและแสดงข้อมูลผลลัพธ์ของการคำนวณเพื่อระบุความถูกต้อง หรือสามารถเปิดและสำรวจชุดข้อมูลที่เกี่ยวข้องที่ Oracle Analytics ใช้โมเดลเพื่อทำการเอาต์พุต
ดูตารางนี้เพื่อเรียนรู้เกี่ยวกับอัลกอริทึมที่ระบุ
ชื่อ | ประเภท | ชนิด | ฟังก์ชัน | คำอธิบาย |
---|---|---|---|---|
CART |
การจัดประเภท การถดถอย |
ตัวแบ่งประเภทแบบไบนารี ตัวแบ่งประเภทหลายรายการ ตัวเลข |
- | ใช้โครงสร้างการตัดสินใจเพื่อคาดการณ์ทั้งค่าที่แยกกันและค่าต่อเนื่อง
ใช้กับชุดข้อมูลขนาดใหญ่ |
การถดถอยเชิงเส้นแบบ Elastic Net | การถดถอย | ตัวเลข | ElasticNet | โมเดลการถดถอยขั้นสูง ระบุข้อมูลเพิ่มเติม (การเรกูลาไรซ์), ดำเนินการเลือกตัวแปร และดำเนินการรวมเชิงเส้น ค่าเสียหายของวิธีการถดถอย Lasso และ Ridge
ใช้กับแอททริบิวจำนวนมากเพื่อหลักเลี่ยงภาวะร่วมเส้นตรง (แอททริบิวหลายรายการสัมพันธ์กันพอดี) และภาวะ Overfitting |
ลำดับชั้น | การคลัสเตอร์ | การคลัสเตอร์ | AgglomerativeClustering | สร้างลำดับชั้นของการคลัสเตอร์โดยใช้เมตริคจากล่างขึ้นบน (การสังเกตการณ์แต่ละรายการคือคลัสเตอร์ของตัวเอง จากนั้นจึงรวม) หรือบนลงล่าง และเมตริคระยะห่าง
ใช้เมื่อชุดข้อมูลไม่ได้มีขนาดใหญ่และไม่ทราบจำนวนคลัสเตอร์ล่วงหน้า |
K-Means | การคลัสเตอร์ | การคลัสเตอร์ | k-means | พาร์ติชันเรคคอร์ดแบบวนซ้ำลงในคลัสเตอร์ k ซึ่งการสังเกตการณ์แต่ละรายการเป็นของคลัสเตอร์ที่มีค่าเฉลี่ยที่ใกล้เคียงที่สุด
ใช้สำหรับคอลัมน์เมตริคการคลัสเตอร์และใช้กับชุดการคาดการณ์จำนวนคลัสเตอร์ที่จำเป็น ทำงานได้ดีกับชุดข้อมูลขนาดใหญ่ ผลลัพธ์จะแตกต่างกันในการรันแต่ละครั้ง |
การถดถอยเชิงเส้น | การถดถอย | ตัวเลข | กำลังสองน้อยสุด
Ridge Lasso |
แนวทางเชิงเส้นสำหรับการกำหนดโมเดลความสัมพันธ์ระหว่างตัวแปรเป้าหมายและแอททริบิวอื่นๆ ในชุดข้อมูล
ใช้เพื่อคาดการณ์ค่าตัวเลขเมื่อแอททริบิวไม่สัมพันธ์กันพอดี |
การถดถอยตามตรรกะ | การถดถอย | ตัวแบ่งประเภทแบบไบนารี | LogisticRegressionCV | ใช้เพื่อคาดการณ์ค่าของตัวแปรอ้างอิงตามชนิด ตัวแปรอ้างอิงเป็นตัวแปรไบนารีที่มีข้อมูลที่มีรหัสเป็น 1 หรือ 0 |
Naive Bayes | การจัดประเภท |
ตัวแบ่งประเภทแบบไบนารี ตัวแบ่งประเภทหลายรายการ |
GaussianNB | การจัดประเภทความน่าจะเป็นตามทฤษฎีของ Bayes ที่ถือว่าไม่มีการอ้างอิงระหว่างคุณสมบัติ
ใช้เมื่อมีไดเมนชันอินพุตจำนวนมาก |
Neural Network | การจัดประเภท |
ตัวแบ่งประเภทแบบไบนารี ตัวแบ่งประเภทหลายรายการ |
MLPClassifier | อัลกอริทึมการจัดประเภทแบบวนซ้ำที่เรียนรู้ด้วยการเปรียบเทียบผลการจัดประเภทที่มีค่าตามจริงและส่งกลับไปยังเครือข่ายเพื่อแก้ไขอัลกอริทึมสำหรับการวนซ้ำในอนาคต
ใช้สำหรับการวิเคราะห์ข้อความ |
Random Forest | การจัดประเภท |
ตัวแบ่งประเภทแบบไบนารี ตัวแบ่งประเภทหลายรายการ ตัวเลข |
- | วิธีการเรียนรู้แบบรวมที่สร้างโครงสร้างการตัดสินใจหลายรายการและเอาต์พุตค่าที่แสดงถึงโครงสร้างการตัดสินใจทั้งหมดโดยรวม
ใช้เพื่อคาดการณ์ตัวแปรตัวเลขและตัวแปรตามชนิด |
SVM | การจัดประเภท |
ตัวแบ่งประเภทแบบไบนารี ตัวแบ่งประเภทหลายรายการ |
LinearSVC, SVC | จัดประเภทเรคคอร์ดด้วยการแมปในพื้นที่และสร้างระนาบเกินที่สามารถใช้สำหรับการจัดประเภท เรคคอร์ดใหม่ (ข้อมูลการใหคะแนน) ได้รับการแมปไปยังพื้นที่และได้รับการคาดการณ์ว่าเป็นของชนิด ซึ่งอิงตามด้านข้างของระนาบเกินที่เรคคอร์ดนั้นอยู่ |
เมื่อคุณใช้ข้อมูลจาก Oracle Autonomous Data Warehouse คุณสามารถใช้ความสามารถ AutoML เพื่อแนะนำและฝึกโมเดลการคาดการณ์ AutoML จะวิเคราะห์ข้อมูลของคุณ คำนวณอัลกอริทึมที่เหมาะสมที่สุดที่จะใช้ และรีจีสเตอร์โมเดลการคาดการณ์ใน Oracle Analytics เพื่อให้คุณสามารถคาดการณ์ข้อมูลของคุณได้
OML_Developer
และไม่ใช่ผู้ใช้ขั้นสูง 'admin' มิฉะนั้น โฟลว์ข้อมูลจะล้มเหลวเมื่อคุณพยายามบันทึกหรือรันนักวิเคราะห์ข้อมูลขั้นสูงจะสร้างและฝึกอบรมโมเดลการคาดการณ์ เพื่อให้สามารถใข้งานอัลกอริทึม Oracle Machine Learning ในการค้นหาชุดข้อมูล คาดการณ์ค่าเป้าหมาย หรือระบุคลาสของเรคคอร์ด ใช้โปรแกรมแก้ไขโฟลว์ข้อมูลเพื่อสร้างและฝึกอบรมโมเดลการคาดการณ์ และใช้โมเดลดังกล่าวกับข้อมูลของคุณ
การมาถึงที่โมเดลที่ถูกต้องเป็นกระบวนการแบบวนซ้ำ และนักวิเคราะห์ข้อมูลขั้นสูงสามารถลองใช้โมเดลอื่น เปรียบเทียบผลลัพธ์ และปรับพารามิเตอร์ตามการทดลองใช้และข้อผิดพลาด นักวิเคราะห์ข้อมูลสามารถใช้โมเดลการคาดการณ์ขั้นสุดท้ายที่ถูกต้องเพื่อคาดการณ์แนวโน้มในชุดข้อมูลอื่น หรือเพิ่มโมเดลไปยังเวิร์กบุค
หมายเหตุ:
หากคุณกำลังใช้ข้อมูลที่มาจาก Oracle Autonomous Data Warehouse คุณสามารถใช้ความสามารถ AutoML เพื่อฝึกโมเดลการคาดการณ์ให้คุณได้อย่างรวดเร็วและง่ายดาย โดยไม่ต้องใช้ทักษะการเรียนรู้ของเครื่อง See ฝึกโมเดลการคาดการณ์โดยใช้ AutoML ใน Autonomous Data WarehouseOracle Analytics มาพร้อมอัลกอริทึมสำหรับการคาดการณ์ตัวเลือก การจัดประเภทหลายรายการ การจัดประเภทไบนารี และการคลัสเตอร์
Oracle Analytics จะช่วยให้คุณฝึกอบรมโมเดลการเรียนรู้ของเครื่องโดยใช้ขั้นตอนในโฟลว์ข้อมูล เมื่อคุณได้ฝึกโมเดลการเรียนรู้ของเครื่องแล้ว ให้นำไปใช้กับข้อมูลของคุณด้วยขั้นตอน ใช้โมเดล
ชื่อขั้นตอน | คำอธิบาย |
---|---|
AutoML (ต้องใช้ Oracle Autonomous Data Warehouse) | ใช้ความสามารถ AutoML ของ Oracle Autonomous Data Warehouse เพื่อแนะนำและฝึกโมเดลการคาดการณ์ให้กับคุณ ขั้นตอน AutoML จะวิเคราะห์ข้อมูลของคุณ คำนวณอัลกอริทึมที่เหมาะสมที่สุดที่จะใช้ และรีจีสเตอร์โมเดลการคาดการณ์ใน Oracle Analytics |
ฝึกอบรมตัวจำแนกประเภทไบนารี |
ฝึกอบรมโมเดลการเรียนรู้ของเครื่องเพื่อจัดประเภทข้อมูลออกเป็นหนึ่งในสองชนิดที่กำหนดไว้ล่วงหน้า |
ฝึกอบรมการทำคลัสเตอร์ | ฝึกอบรมโมเดลการเรียนรู้ของเครื่องเพื่อคัดแยกกลุ่มที่มีคุณลักษณะคล้ายกันและระบุกลุ่มเหล่านั้นลงในคลัสเตอร์ |
ฝึกอบรมตัวจำแนกประเภทหลายประเภท | ฝึกอบรมโมเดลการเรียนรู้ของเครื่องเพื่อจัดประเภทข้อมูลออกเป็นชนิดที่กำหนดไว้ล่วงหน้าอย่างน้อยสามชนิด |
ฝึกอบรมการคาดการณ์ตัวเลข | ฝึกอบรมโมเดลการเรียนรู้ของเครื่องเพื่อคาดการณ์ค่าตัวเลขตามค่าข้อมูลที่ทราบ |
หลังจากที่คุณสร้างโมเดลการคาดการณ์และรันโฟลว์ข้อมูล คุณสามารถตรวจสอบข้อมูลเกี่ยวกับโมเดลเพื่อระบุความถูกต้อง ใช้ข้อมูลนี้เพื่อปรับการตั้งค่าโมเดลแบบวนซ้ำเพื่อปรับปรุงความถูกต้องและคาดการณ์ผลลัพธ์ได้ดียิ่งขึ้น
ข้อมูลรายละเอียดของโมเดลการคาดการณ์จะช่วยคุณทำความเข้าใจโมเดล และระบุว่าเหมาะสำหรับการคาดการณ์ข้อมูลของคุณหรือไม่ รายละเอียดโมเดลประกอบด้วยคลาสโมเดล อัลกอริทึม คอลัมน์อินพุต และคอลัมน์เอาต์พุต
ดูข้อมูลที่จะช่วยให้คุณเข้าใจคุณภาพของโมเดลการคาดการณ์ ตัวอย่างเช่น คุณสามารถตรวจสอบเมตริคความถูกต้อง เช่น ความถูกต้องของโมเดล, หลักทศนิยม, การเรียกคืน, ค่า F1 และอัตราผลลัพธ์ที่ผิด
Oracle Analytics จะสร้างชุดข้อมูลที่เกี่ยวข้องชุดหนึ่ง เมื่อคุณรันโฟลว์ข้อมูลเพื่อสร้างโมเดลการฝึกอบรมของโมเดลการคาดการณ์ Oracle Analytics คุณสามารถเปิดและสร้างเวิร์กบุคในชุดข้อมูลเหล่านี้เพื่อเรียนรู้เกี่ยวกับความถูกต้องของโมเดล
ชุดข้อมูลที่เกี่ยวข้องจะมีรายละเอียดเกี่ยวกับโมเดล เช่น กฎการคาดการณ์ เมตริคความถูกต้อง เมตริกซ์ความสับสน และไดรเวอร์หลักสำหรับการคาดการณ์ ทั้งนี้ขึ้นอยู่กับอัลกอริทึมที่คุณเลือกสำหรับโมเดล คุณสามารถใช้ข้อมูลนี้เพื่อปรับปรุงโมเดลให้ได้รับผลลัพธ์ที่ดีขึ้น และคุณสามารถใช้ชุดข้อมูลที่เกี่ยวข้องเพื่อเปรียบเทียบโมเดลต่างๆ และตัดสินใจว่าโมเดลใดถูกต้องมากกว่า
ตัวอย่างเช่น คุณสามารถเปิดชุดข้อมูลไดรเวอร์เพื่อดูว่าคอลัมน์ใดมีอิทธิพลเชิงบวกหรือเชิงลบที่รุนแรงในโมเดล การตรวจสอบคอลัมน์เหล่านั้นจะทำให้คุณพบว่าบางคอลัมน์ไม่ถูกถือว่าเป็นตัวแปรโมเดล เนื่องจากไม่ใช่อินพุตที่สมเหตุสมผลหรือมีความละเอียดมากเกินไปสำหรับการคาดการณ์ คุณสามารถใช้โปรแกรมแก้ไขโฟลว์เพื่อเปิดโมเดล และคุณสามารถย้ายคอลัมน์ที่ไม่เกี่ยวข้องหรือละเอียดเกินไปและสร้างโมเดลข้อมูลใหม่ตามข้อมูลที่คุณค้นพบได้ คุณสามารถตรวจสอบแท็บคุณภาพและผลลัพธ์ และตรวจสอบว่าความถูกต้องของโมเดลได้รับการอนุมัติหรือไม่ คุณสามารถทำกระบวนการนี้ต่อไปจนกว่าคุณจะพอใจกับความถูกต้องของโมเดลและพร้อมที่จะให้คะแนนชุดข้อมูลใหม่
อัลกอริทึมที่แตกต่างกันจะสร้างชุดข้อมูลที่เกี่ยวข้องกันที่คล้ายกัน พารามิเตอร์แต่ละรายการและชื่อคอลัมน์อาจเปลี่ยนแปลงในชุดข้อมูล โดยขึ้นอยู่กับประเภทของอัลกอริทึม แต่ฟังก์ชันของชุดข้อมูลจะยังคงเหมือนเดิม ตัวอย่างเช่น ชื่อคอลัมน์ในข้อมูลสถิติอาจเปลี่ยนแปลงจากการถดถอยเชิงเส้นเป็นการถดถอยตามตรรกะ แต่ชุดข้อมูลสถิติจะมีเมตริคความถูกต้องของโมเดล
ชุดข้อมูลที่เกี่ยวข้องสำหรับโมเดล AutoML
เมื่อคุณฝึกโมเดลเชิงคาดการณ์โดยใช้ AutoML แล้ว Oracle Analytics จะสร้างชุดข้อมูลเพิ่มเติมที่มีข้อมูลที่เป็นประโยชน์เกี่ยวกับโมเดลนั้น จำนวนชุดข้อมูลที่สร้างขึ้นจะขึ้นอยู่กับอัลกอริทึมของโมเดล ตัวอย่างเช่น สำหรับโมเดล Naive Bayes นั้น Oracle Analytics จะสร้างชุดข้อมูลที่ให้ข้อมูลเกี่ยวกับความน่าจะเป็นแบบมีเงื่อนไข สำหรับโมเดลโครงสร้างการตัดสินใจ ชุดข้อมูลจะให้ข้อมูลเกี่ยวกับสถิติโครงสร้างการตัดสินใจ เมื่อคุณตรวจสอบโมเดลที่สร้าง AutoML โดยใช้อัลกอริทึม Generalized Linear Model (GLM) คุณจะเห็นรายการที่ขึ้นต้นด้วย GLM* สำหรับชุดข้อมูลเฉพาะโมเดลที่มีข้อมูลเมตะดาต้าเกี่ยวกับโมเดล
.png
ชุดข้อมูลที่เกี่ยวข้อง
หมายเหตุ:
Oracle Analytics จะเพิ่มชื่อเอาต์พุตของโฟลว์ข้อมูลต่อท้ายประเภทชุดข้อมูลที่เกี่ยวข้อง ตัวอย่างเช่น สำหรับโมเดล CART หากเอาต์พุตของโฟลว์ข้อมูลชื่อ cart_model2 ชุดข้อมูลจะมีชื่อว่า cart_model2_CARTCART
Oracle Analytics จัดทำตารางสำหรับดข้อมูลที่เกี่ยวข้องกับ CART (Classification and Regression Tree) ซึ่งมีคอลัมน์ที่แสดงเงื่อนไขและเกณฑ์ของเงื่อนไขในโครงสร้างการตัดสินใจ การคาดการณ์สำหรับแต่ละกลุ่ม และความเชื่อมั่นของการคาดการณ์ ใช้การแสดงข้อมูลไดอะแกรมโครงสร้างเพื่อแสดงข้อมูลโครงสร้างการตัดสินใจนี้
ชุดข้อมูล CART จะถูกสร้างเมื่อคุณเลือกค่าผสมโมเดลและอัลกอริทึมเหล่านี้
โมเดล | อัลกอริทึม |
---|---|
ตัวเลข | CART สำหรับการคาดการณ์ตัวเลข |
การจัดประเภทไบนารี | CART |
การจัดประเภทหลายรายการ | CART |
รายงานการจัดประเภท
Oracle Analytics สร้างตารางสำหรับชุดข้อมูลที่เกี่ยวข้องของรายงานการจัดประเภท ตัวอย่างเช่น หากคอลัมน์เป้าหมายสามารถมีค่าที่ไม่ซ้ำกันสองค่า "ใช่" หรือ "ไม่" ชุดข้อมูลนี้จะแสดงเมตริคความถูกต้อง เช่น F1 ความแม่นยำ การเรียกคืน และการรองรับ (จำนวนแถวในชุดข้อมูลการฝึกอบรมที่มีค่านี้) สำหรับค่าที่ไม่ซ้ำกันทุกค่าของคอลัมน์เป้าหมาย
ชุดข้อมูลการจัดประเภทจะถูกสร้างเมื่อคุณเลือกค่าผสมโมเดลและอัลกอริทึมเหล่านี้
โมเดล | อัลกอริทึม |
---|---|
การจัดประเภทไบนารี |
Naive Bayes Neural Network Support Vector Machine |
การจัดประเภทหลายรายการ |
Naive Bayes Neural Network Support Vector Machine |
เมตริกซ์ความสับสน
Oracle Analytics จะสร้างตารางเปลี่ยนจุดอ้างอิงสำหรับชุดข้อมูลที่เกี่ยวข้องของเมตริกซ์ความสับสน ซึ่งเรียกอีกอย่างว่าเมตริกซ์ข้อผิดพลาด แต่ละแถวจะแสดงอินสแตนซ์ของคลาสที่มีการคาดการณ์ และแต่ละคอลัมน์จะแสดงอินสแตนซ์ในคลาสตามจริง ตารางนี้รายงานจำนวนผลบวกเท็จ, ผลลบเท็จ, ผลบวกจริง และผลลบจริง ซึ่งถูกใช้เพื่อคำนวณเมตริคความถูกต้องของความแม่นยำ การเรียกคืน และ F1
ชุดข้อมูลเมตริกซ์ความสับสนจะถูกสร้างเมื่อคุณเลือกค่าผสมโมเดลและอัลกอริทึมเหล่านี้
โมเดล | อัลกอริทึม |
---|---|
การจัดประเภทไบนารี |
การถดถอยตามตรรกะ CART (โครงสร้างการตัดสินใจ) Naive Bayes Neural Network Random Forest Support Vector Machine |
การจัดประเภทหลายรายการ |
CART (โครงสร้างการตัดสินใจ) Naive Bayes Neural Network Random Forest Support Vector Machine |
ไดรเวอร์
Oracle Analytics จะสร้างตารางสำหรับชุดข้อมูลที่เกี่ยวข้องของไดรเวอร์ ซึ่งมีข้อมูลเกี่ยวกับคอลัมน์ที่ระบุค่าคอลัมน์เป้าหมาย การถดถอยเชิงเส้นใช้เพื่อระบุคอลัมน์เหล่านี้ แต่ละคอลัมน์ได้รับการระบุค่าสัมประสิทธิ์และสหสัมพันธ์ ค่าสัมประสิทธิ์จะอธิบายน้ำหนัก-อายุของคอลัมน์ที่ใช้เพื่อระบุค่าของคอลัมน์เป้าหมาย ค่าสหสัมพันธ์จะระบุทิศทางความสัมพันธ์ระหว่างคอลัมน์เป้าหมายกับคอลัมน์อ้างอิง ตัวอย่างเช่น หากค่าคอลัมน์เป้าหมายเพิ่มขึ้นหรือลดลงตามคอลัมน์อ้างอิง
ชุดข้อมูลไดรเวอร์จะถูกสร้างเมื่อคุณเลือกค่าผสมโมเดลและอัลกอริทึมเหล่านี้
โมเดล | อัลกอริทึม |
---|---|
ตัวเลข |
การถดถอยเชิงเส้น การถดถอยเชิงเส้นแบบ Elastic Net |
การจัดประเภทไบนารี |
การถดถอยตามตรรกะ Support Vector Machine |
การจัดประเภทหลายรายการ | Support Vector Machine |
Hitmap
Oracle Analytics จะสร้างตารางสำหรับชุดข้อมูลที่เกี่ยวข้องของ Hitmap ซึ่งมีข้อมูลเกี่ยวกับโหนดระดับต่ำสุดของโครงสร้างการตัดสินใจ แต่ละแถวในตารางจะแสดงโหนดระดับต่ำสุดและประกอบด้วยข้อมูลที่อธิบายสิ่งที่โหนดระดับต่ำสุดแสดง เช่น ขนาดเซกเมนต์ ความเชื่อมั่น และจำนวนแถวที่คาด ตัวอย่างเช่น จำนวนการคาดการณ์ที่ถูกต้องที่คาด = ขนาดเซกเมนต์ * ความเชื่อมั่น
ชุดข้อมูล Hitmap จะถูกสร้างเมื่อคุณเลือกค่าผสมโมเดลและอัลกอริทึมเหล่านี้
โมเดล | อัลกอริทึม |
---|---|
ตัวเลข | CART สำหรับการคาดการณ์ตัวเลข |
ค่าความคลาดเคลื่อน
Oracle Analytics จะสร้างตารางสำหรับชุดข้อมูลที่เกี่ยวข้องของค่าความคลาดเคลื่อน ซึ่งมีข้อมูลเกี่ยวกับคุณภาพของการคาดการณ์ค่าความคลาดเคลื่อน ค่าความคลาดเคลื่อนคือความแตกต่างระหว่างค่าที่วัดกับค่าที่คาดการณ์ของโมเดลการถดถอย ชุดข้อมูลนี้ประกอบด้วยค่าผลรวมที่สรุปรวมของส่วนต่างสัมบูรณ์ระหว่างค่าจริงกับค่าที่คาดสำหรับคอลัมน์ทั้งหมดในชุดข้อมูล
ชุดข้อมูลค่าความคลาดเคลื่อนจะถูกสร้างเมื่อคุณเลือกค่าผสมโมเดลและอัลกอริทึมเหล่านี้
โมเดล | อัลกอริทึม |
---|---|
ตัวเลข |
การถดถอยเชิงเส้น การถดถอยเชิงเส้นแบบ Elastic Net CART สำหรับการคาดการณ์ตัวเลข |
การจัดประเภทไบนารี | CART (โครงสร้างการตัดสินใจ) |
การจัดประเภทหลายรายการ | CART (โครงสร้างการตัดสินใจ) |
สถิติ
Oracle Analytics สร้างตารางสำหรับชุดข้อมูลที่เกี่ยวข้องของสถิติ เมตริคของชุดข้อมูลนี้จะขึ้นอยู่กับอัลกอริทึมที่ใช้เพื่อสร้างชุดข้อมูล โปรดสังเกตลิสต์ของเมตริคตามอัลกอริทึมนี้:
ชุดข้อมูลนี้จะถูกสร้างเมื่อคุณเลือกค่าผสมโมเดลและอัลกอริทึมเหล่านี้
โมเดล | อัลกอริทึม |
---|---|
ตัวเลข |
การถดถอยเชิงเส้น การถดถอยเชิงเส้นแบบ Elastic Net CART สำหรับการคาดการณ์ตัวเลข |
การจัดประเภทไบนารี |
การถดถอยตามตรรกะ CART (โครงสร้างการตัดสินใจ) Naive Bayes Neural Network Random Forest Support Vector Machine |
การจัดประเภทหลายรายการ |
Naive Bayes Neural Network Random Forest Support Vector Machine |
สรุป
Oracle Analyticsจะสร้างตารางสำหรับชุดข้อมูลที่เกี่ยวข้องของสรุป ซึ่งมีข้อมูล เช่น ชื่อเป้าหมายและชื่อโมเดล
ชุดข้อมูลสรุปจะถูกสร้างเมื่อคุณเลือกค่าผสมโมเดลและอัลกอริทึมเหล่านี้
โมเดล | อัลกอริทึม |
---|---|
การจัดประเภทไบนารี |
Naive Bayes Neural Network Support Vector Machine |
การจัดประเภทหลายรายการ |
Naive Bayes Neural Network Support Vector Machine |
ระบบจะสร้างชุดข้อมูลที่เกี่ยวข้องเมื่อคุณฝึกอบรมโมเดลการคาดการณ์
เมื่อคุณสร้างสถานการณ์ในเวิร์กบุค คุณจะใช้โมเดลการคาดการณ์กับชุดข้อมูลของเวิร์กบุคเพื่อดูแนวโน้มและรูปแบบที่โมเดลได้รับการออกแบบมาให้ค้นหา
หมายเหตุ:
คุณไม่สามารถใช้โมเดล Machine Learning ของ Oracle กับข้อมูลของเวิร์กบุค