Τα προγνωστικά μοντέλα του Oracle Analytics χρησιμοποιούν διάφορους ενσωματωμένους αλγόριθμους Oracle Machine Learning για να εξορύξουν τα σύνολα δεδομένων σας, να προβλέψουν μια τιμή-στόχο ή να αναγνωρίσουν κλάσεις εγγραφών. Χρησιμοποιήστε το πρόγραμμα επεξεργασίας ροής δεδομένων για να δημιουργήσετε, να εκπαιδεύσετε και να εφαρμόσετε προγνωστικά μοντέλα στα δεδομένα σας.
Ένα προγνωστικό μοντέλο του Oracle Analytics εφαρμόζει έναν συγκεκριμένο αλγόριθμο σε ένα σύνολο δεδομένων την πρόβλεψη τιμών και κλάσεων, ή την αναγνώριση ομάδων στα δεδομένα.
Μπορείτε επίσης να χρησιμοποιήσετε μοντέλα μηχανικής εκμάθησης Oracle για την πρόβλεψη δεδομένων.
Το Oracle Analytics περιλαμβάνει αλγόριθμους που σας βοηθούν να εκπαιδεύετε προγνωστικά μοντέλα για διάφορους σκοπούς. Παραδείγματα αλγόριθμων είναι τα δέντρα ταξινόμησης και παλινδρόμησης (CART), η λογιστική παλινδρόμηση και το k-means.
Χρησιμοποιήστε τη λειτουργία επεξεργασίας της ροής δεδομένων για να εκπαιδεύσετε ένα μοντέλο πρώτα σε ένα σύνολο δεδομένων εκπαίδευσης. Μετά την εκπαίδευση του προγνωστικού μοντέλου, θα το εφαρμόσετε στα σύνολα δεδομένων που θέλετε να προβλέψετε.
Ένα εκπαιδευμένο μοντέλο μπορείτε να το καταστήσετε διαθέσιμο σε άλλους χρήστες, οι οποίοι μπορούν να το εφαρμόσουν στα δεδομένα τους για να προβλέψουν τιμές. Σε ορισμένες περιπτώσεις, είναι άλλοι οι χρήστες που εκπαιδεύουν τα μοντέλα και άλλοι οι χρήστες που τα εφαρμόζουν.
Σημείωση:
Εάν δεν είστε σίγουροι τι πρέπει να αναζητήσετε στα δεδομένα σας, μπορείτε να ξεκινήσετε χρησιμοποιώντας τη λειτουργία "Επεξήγηση", η οποία χρησιμοποιεί την εκμάθηση μηχανής για την αναγνώριση τάσεων και μοτίβων. Στη συνέχεια, μπορείτε να χρησιμοποιήσετε τη λειτουργία επεξεργασίας ροής δεδομένων για να δημιουργήσετε και να εκπαιδεύσετε προγνωστικά μοντέλα που θα αναλύουν τάσεις και μοτίβα που βρήκε η λειτουργία "Επεξήγηση".Χρησιμοποιήστε το οριστικοποιημένο μοντέλο για να βαθμολογήσετε άγνωστα ή χωρίς ετικέτα δεδομένα για τη δημιουργία ενός συνόλου δεδομένων εντός μιας ροής δεδομένων ή για την προσθήκη μιας απεικόνισης πρόβλεψης σε ένα βιβλίο εργασίας.
Παράδειγμα
Ας υποθέσουμε ότι θέλετε να δημιουργήσετε και να εκπαιδεύσετε ένα μοντέλο πολλαπλής ταξινόμησης για να προβλέψετε ποιοι ασθενείς έχουν υψηλό κίνδυνο εμφάνισης καρδιοπάθειας.
Το Oracle Analytics παρέχει αλγόριθμους για οποιαδήποτε ανάγκη δημιουργίας μοντέλων εκμάθησης μηχανής: αριθμητικές προβλέψεις, πολλαπλή ταξινόμηση, δυαδική ταξινόμηση και δημιουργία συμπλεγμάτων.
Η λειτουργικότητα εκμάθησης μηχανής της Oracle προορίζεται για αναλυτές σύνθετων δεδομένων που έχουν εικόνα για το τι αναζητούν στα δεδομένα τους, είναι εξοικειωμένοι με την πρακτική των προγνωστικών αναλύσεων και κατανοούν τις διαφορές μεταξύ αλγόριθμων.
Σημείωση:
Αν χρησιμοποιείτε δεδομένα που προέρχονται από το Oracle Autonomous Data Warehouse, μπορείτε να χρησιμοποιήσετε τη δυνατότητα AutoML για να εκπαιδεύσει γρήγορα και εύκολα ένα προγνωστικό μοντέλο για λογαριασμό σας, χωρίς να απαιτούνται δεξιότητες μηχανικής εκμάθησης. Δείτε την ενότητα Εκπαίδευση προγνωστικού μοντέλου με χρήση AutoML στο Autonomous Data Warehouse.Συνήθως οι χρήστες θέλουν να δημιουργούν πολλαπλά προγνωστικά μοντέλα, να τα συγκρίνουν και να επιλέγουν εκείνο που είναι πιο πιθανό να παρέχει αποτελέσματα που ικανοποιούν τα κριτήρια και τις απαιτήσεις τους. Αυτά τα κριτήρια μπορεί να ποικίλλουν. Για παράδειγμα, ορισμένες φορές οι χρήστες επιλέγουν μοντέλα που έχουν καλύτερη συνολική ακρίβεια ή μοντέλα που έχουν τον ελάχιστο τύπο σφαλμάτων I (ψευδών θετικών) και II (ψευδών αρνητικών), και άλλες φορές επιλέγουν μοντέλα που επιστρέφουν ταχύτερα αποτελέσματα και με αποδεκτό επίπεδο ακρίβειας, ακόμη κι αν τα αποτελέσματα δεν είναι ιδανικά.
Το Oracle Analytics περιέχει πολλαπλούς αλγόριθμους εκμάθησης μηχανής για κάθε είδος πρόβλεψης ή ταξινόμησης. Με αυτούς τους αλγόριθμους, οι χρήστες μπορούν να δημιουργούν περισσότερα από ένα μοντέλα ή να χρησιμοποιούν διαφορετικές βελτιστοποιημένες παραμέτρους ή να χρησιμοποιούν διαφορετικά σύνολα δεδομένα εκπαίδευσης για είσοδο και έπειτα να επιλέγουν το καλύτερο μοντέλο. Ο χρήστης μπορεί να επιλέξει το καλύτερο μοντέλο συγκρίνοντας και ζυγίζοντας μοντέλα με βάση τα δικά του κριτήρια. Για να καθορίσουν το καλύτερο μοντέλο, οι χρήστες μπορούν να εφαρμόσουν το μοντέλο και να απεικονίσουν τα αποτελέσματα των υπολογισμών για να καθοριστεί η ακρίβεια, ή μπορούν να ανοίξουν και να εξερευνήσουν τα σχετικά σύνολα δεδομένων που χρησιμοποίησε το Oracle Analytics στο μοντέλο εξόδου.
Συμβουλευτείτε αυτόν τον πίνακα για να μάθετε σχετικά με τους παρεχόμενους αλγόριθμους:
Όνομα | Τύπος | Κατηγορία | Συνάρτηση | Περιγραφή |
---|---|---|---|---|
CART |
Ταξινόμηση Παλινδρόμηση |
Δυαδική ταξινόμηση Πολλαπλή ταξινόμηση Αριθμητικό |
- | Χρησιμοποιεί δέντρα αποφάσεων για την πρόβλεψη διακριτών αλλά και συνεχών τιμών.
Χρησιμοποιήστε την επιλογή με μεγάλα σύνολα δεδομένων. |
Ελαστική καθαρή γραμμική παλινδρόμηση | Παλινδρόμηση | Αριθμητικό | ElasticNet | Μοντέλο σύνθετης παλινδρόμησης. Παρέχει πρόσθετες πληροφορίες (κανονικοποίηση), εκτελεί επιλογή μεταβλητών και γραμμικούς συνδυασμούς. Κυρώσεις μεθόδων παλινδρόμησης Lasso και Ridge.
Χρησιμοποιείται με μεγάλο αριθμό χαρακτηριστικών για να αποφευχθεί η συγγραμμικότητα (όπου πολλαπλά χαρακτηριστικά είναι απολύτως συσχετισμένα) και η υπερπροσαρμογή. |
Ιεραρχικό | Δημιουργία συμπλεγμάτων | Δημιουργία συμπλεγμάτων | AgglomerativeClustering | Δομεί μια ιεραρχία δημιουργίας συμπλεγμάτων είτε από κάτω προς τα επάνω (κάθε παρατήρηση είναι ένα ξεχωριστό σύμπλεγμα και έπειτα συγχωνεύεται) είτε από επάνω προς τα κάτω (όλες οι παρατηρήσεις ξεκινούν ως ένα σύμπλεγμα) και μετρήσεις απόστασης.
Χρησιμοποιείται όταν το σύνολο δεδομένων δεν είναι μεγάλο και ο αριθμός των συμπλεγμάτων δεν είναι γνωστός εκ των προτέρων. |
K-Means | Δημιουργία συμπλεγμάτων | Δημιουργία συμπλεγμάτων | k-means | Διαμερισματοποιεί μέσω επαναλήψεων τις εγγραφές σε συμπλέγματα k όπου κάθε παρατήρηση ανήκει στο σύμπλεγμα με την πλησιέστερη μέση τιμή.
Χρησιμοποιείται για στήλες μετρήσεων δημιουργίας συμπλεγμάτων και με καθορισμένη προσδοκία αριθμού συμπλεγμάτων που απαιτούνται. Συνεργάζεται καλά με μεγάλα σύνολα δεδομένων. Τα αποτελέσματα είναι διαφορετικά με κάθε εκτέλεση. |
Γραμμική παλινδρόμηση | Παλινδρόμηση | Αριθμητικό | Μέθοδος Ελαχίστων Τετραγώνων
Ridge Lasso |
Γραμμική προσέγγιση για μια σχέση μοντελοποίησης μεταξύ μεταβλητής προορισμού και άλλων χαρακτηριστικών στο σύνολο δεδομένων.
Χρησιμοποιείται για την πρόβλεψη αριθμητικών τιμών όταν τα χαρακτηριστικά δεν είναι απολύτως συσχετισμένα. |
Λογιστική παλινδρόμηση | Παλινδρόμηση | Δυαδική ταξινόμηση | LogisticRegressionCV | Χρησιμοποιείται για την πρόγνωση της τιμής μιας κατηγορικά εξαρτώμενης μεταβλητής. Η εξαρτώμενη μεταβλητή είναι μια δυαδική μεταβλητή που περιέχει δεδομένα κωδικοποιημένα σε 1 ή 0. |
Naive Bayes | Ταξινόμηση |
Δυαδική ταξινόμηση Πολλαπλή ταξινόμηση |
GaussianNB | Πιθανολογική ταξινόμηση βάσει του θεωρήματος Bayes που υποθέτει ότι δεν υπάρχει εξάρτηση μεταξύ λειτουργιών.
Χρησιμοποιείται όταν υπάρχει μεγάλος αριθμός διαστάσεων εισόδου. |
Νευρωνικό δίκτυο | Ταξινόμηση |
Δυαδική ταξινόμηση Πολλαπλή ταξινόμηση |
MLPClassifier | Αλγόριθμος ταξινόμησης μέσω επαναλήψεων που μαθαίνει συγκρίνοντας το αποτέλεσμα ταξινόμησης με την πραγματική τιμή και το επιστρέφει στο δίκτυο ώστε να τροποποιηθεί ο αλγόριθμος για περαιτέρω επαναλήψεις.
Χρησιμοποιείται για ανάλυση κειμένου. |
Τυχαίο δάσος | Ταξινόμηση |
Δυαδική ταξινόμηση Πολλαπλή ταξινόμηση Αριθμητικό |
- | Μια μέθοδος εκμάθησης συνόλου που δομεί πολλαπλά δέντρα αποφάσεων και κάνει έξοδο στην τιμή που συλλογικά αναπαριστά όλα τα δέντρα αποφάσεων.
Χρησιμοποιείται για την πρόβλεψη αριθμητικών και κατηγορικών μεταβλητών. |
SVM | Ταξινόμηση |
Δυαδική ταξινόμηση Πολλαπλή ταξινόμηση |
LinearSVC, SVC | Ταξινομεί εγγραφές αντιστοιχίζοντάς τις στον χώρο και δομώντας υπερεπίπεδα που μπορούν να χρησιμοποιηθούν για ταξινόμηση. Οι νέες εγγραφές (δεδομένα βαθμολόγησης) αντιστοιχίζονται στον χώρο και προβλέπονται ότι ανήκουν σε μια κατηγορία, η οποία βασίζεται στην πλευρά του υπερεπιπέδου όπου εμπίπτουν. |
Όταν χρησιμοποιείτε δεδομένα από το Oracle Autonomous Data Warehouse, μπορείτε να χρησιμοποιήσετε τη δυνατότητα AutoML για να προτείνει και να εκπαιδεύσει ένα προγνωστικό μοντέλο. Το AutoML αναλύει τα δεδομένα σας, υπολογίζει τον καλύτερο αλγόριθμο για χρήση και εγγράφει ένα προγνωστικό μοντέλο στο Oracle Analytics, ώστε να μπορείτε να κάνετε προβλέψεις με βάση τα δεδομένα σας.
OML_Developer
και δεν είναι super user τύπου 'admin'. Διαφορετικά, η ροή δεδομένων θα αποτύχει όταν προσπαθήσετε να την αποθηκεύσετε ή να την εκτελέσετε.Οι αναλυτές σύνθετων δεδομένων δημιουργούν και εκπαιδεύουν προγνωστικά μοντέλα, προκειμένου να τα χρησιμοποιούν για την ανάπτυξη αλγόριθμων του Oracle Machine Learning με σκοπό την εξόρυξη συνόλων δεδομένων, την πρόβλεψη τιμών-στόχων ή την αναγνώριση κλάσεων εγγραφών. Χρησιμοποιήστε το πρόγραμμα επεξεργασίας ροής δεδομένων, για να δημιουργήσετε προγνωστικά μοντέλα, να τα εκπαιδεύσετε και να τα εφαρμόσετε στα δεδομένα σας.
Η επίτευξη ενός μοντέλου ακριβείας είναι μια επαναληπτική διαδικασία και ο αναλυτής σύνθετων δεδομένων μπορεί να δοκιμάσει διαφορετικά μοντέλα, να συγκρίνει τα αποτελέσματά τους και να βελτιστοποιήσει παραμέτρους βάσει πολλαπλών δοκιμών. Ο αναλυτής δεδομένων μπορεί να χρησιμοποιήσει το οριστικοποιημένο, ακριβές προγνωστικό μοντέλο για την πρόγνωση των τάσεων σε άλλα σύνολα δεδομένων ή να το προσθέσει σε βιβλία εργασίας.
Σημείωση:
Αν χρησιμοποιείτε δεδομένα που προέρχονται από το Oracle Autonomous Data Warehouse, μπορείτε να χρησιμοποιήσετε τη δυνατότητα AutoML για να εκπαιδεύσει γρήγορα και εύκολα ένα προγνωστικό μοντέλο για λογαριασμό σας, χωρίς να απαιτούνται δεξιότητες μηχανικής εκμάθησης. Δείτε την ενότητα Εκπαίδευση προγνωστικού μοντέλου με χρήση AutoML στο Autonomous Data Warehouse.Το Oracle Analytics παρέχει αλγόριθμους για αριθμητικές προβλέψεις, πολλαπλή ταξινόμηση, δυαδική ταξινόμηση και δημιουργία συμπλεγμάτων.
Το Oracle Analytics σας επιτρέπει να εκπαιδεύετε μοντέλα μηχανικής εκμάθησης χρησιμοποιώντας βήματα στις ροές δεδομένων. Όταν ολοκληρώσετε την εκπαίδευση ενός μοντέλου μηχανικής εκμάθησης, εφαρμόστε το στα δεδομένα σας χρησιμοποιώντας το βήμα Εφαρμογή μοντέλου.
Όνομα βήματος | Περιγραφή |
---|---|
AutoML (απαιτεί Oracle Autonomous Data Warehouse) | Χρησιμοποιήστε τη δυνατότητα AutoML του Oracle Autonomous Data Warehouse, για να προτείνει και να εκπαιδεύσει ένα προγνωστικό μοντέλο για λογαριασμό σας. Το βήμα AutoML αναλύει τα δεδομένα σας, υπολογίζει τον καλύτερο αλγόριθμο για χρήση και εγγράφει ένα προγνωστικό μοντέλο στο Oracle Analytics. |
Εκπαίδευση δυαδικής ταξινόμησης |
Εκπαιδεύστε ένα μοντέλο εκμάθησης μηχανής για την ταξινόμηση των δεδομένων σας σε μία από δύο προκαθορισμένες κατηγορίες. |
Εκπαίδευση δημιουργίας συμπλεγμάτων | Εκπαιδεύστε ένα μοντέλο εκμάθησης μηχανής για τον διαχωρισμό ομάδων με παρόμοια χαρακτηριστικά και την ανάθεσή τους σε συμπλέγματα. |
Εκπαίδευση πολλαπλής ταξινόμησης | Εκπαιδεύστε ένα μοντέλο εκμάθησης μηχανής για την ταξινόμηση των δεδομένων σας σε τρεις ή περισσότερες προκαθορισμένες κατηγορίες. |
Εκπαίδευση αριθμητικών προβλέψεων | Εκπαιδεύστε ένα μοντέλο εκμάθησης μηχανής για την πρόβλεψη μιας αριθμητικής τιμής με βάση γνωστές τιμές δεδομένων. |
Αφού δημιουργήσετε το προγνωστικό μοντέλο και εκτελέσετε τη ροή δεδομένων, μπορείτε να ελέγξετε τις πληροφορίες σχετικά με το μοντέλο για να προσδιορίσετε πόσο ακριβές είναι. Χρησιμοποιήστε αυτές τις πληροφορίες για να προσαρμόσετε μέσω επαναλήψεων τις ρυθμίσεις του μοντέλου, να βελτιώσετε την ακρίβεια και να προβλέψετε καλύτερα αποτελέσματα.
Οι λεπτομέρειες ενός προγνωστικού μοντέλου σάς βοηθούν να κατανοήσετε το μοντέλο και να εξακριβώσετε αν είναι κατάλληλο για την πρόβλεψη των δεδομένων σας. Οι λεπτομέρειες μοντέλου περιλαμβάνουν την κλάση μοντέλου, τον αλγόριθμο, τις στήλες εισόδου και τις στήλες εξόδου.
Δείτε πληροφορίες που σας βοηθούν να κατανοήσετε την ποιότητα ενός προγνωστικού μοντέλου. Για παράδειγμα, μπορείτε να ελέγξετε μετρήσεις ακρίβειας όπως ακρίβεια μοντέλου, ευστοχία, ανάκληση, τιμή F1 και ποσοστό ψευδών θετικών αποτελεσμάτων.
Όταν εκτελείτε τη ροή δεδομένων για να δημιουργήσετε το μοντέλο εκπαίδευσης του προγνωστικού μοντέλου του Oracle Analytics, το Oracle Analytics δημιουργεί ένα σύνολο σχετιζόμενων συνόλων δεδομένων. Μπορείτε να ανοίξετε και να δημιουργήσετε βιβλία εργασίας με αυτά τα σύνολα δεδομένων για να μάθετε ποια είναι η ακρίβεια του μοντέλου.
Ανάλογα με τον αλγόριθμο που επιλέξατε για το μοντέλο σας, τα σχετικά σύνολα δεδομένων περιέχουν λεπτομέρειες για το μοντέλο, όπως κανόνες προβλέψεων, μετρήσεις ακρίβειας, συνδυαστική μήτρα και βασικούς παράγοντες για προβλέψεις. Μπορείτε να χρησιμοποιήσετε αυτές τις πληροφορίες για να βελτιστοποιήσετε το μοντέλο και να λαμβάνετε καλύτερα αποτελέσματα, και μπορείτε να χρησιμοποιήσετε σχετικά σύνολα δεδομένων να συγκρίνετε μοντέλα και να αποφασίσετε ποιο μοντέλο είναι πιο ακριβές.
Για παράδειγμα, μπορείτε να ανοίξετε το σύνολο δεδομένων "Παράγοντες" για να ανακαλύψετε ποιες στήλες έχουν ισχυρή θετική ή αρνητική επίδραση στο μοντέλο. Εξετάζοντας αυτές τις στήλες, βλέπετε ότι ορισμένες στήλες δεν αντιμετωπίζονται ως μεταβλητές μοντέλου, επειδή δεν είναι ρεαλιστικές είσοδοι ή είναι υπερβολικά λεπτομερείς για την πρόβλεψη. Χρησιμοποιήστε τη λειτουργία επεξεργασίας ροής δεδομένων για να ανοίξετε το μοντέλο και βάσει των πληροφοριών που θα ανακαλύψετε, καταργήστε τις μη σχετικές ή πολύ αναλυτικές στήλες, και αναδημιουργήστε το μοντέλο. Ελέγξτε την καρτέλα "Ποιότητα και αποτελέσματα" και επαληθεύετε εάν η ακρίβεια του μοντέλου έχει βελτιωθεί. Συνεχίστε αυτήν τη διαδικασία μέχρι να μείνετε ικανοποιημένοι με την ακρίβεια του μοντέλου και να είναι έτοιμο να βαθμολογήσει ένα νέο σύνολο δεδομένων.
Διαφορετικοί αλγόριθμοι δημιουργούν παρόμοια σχετικά σύνολα δεδομένων. Οι επιμέρους παράμετροι και τα ονόματα στηλών μπορεί να αλλάξουν στο σύνολο δεδομένων, ανάλογα με τον τύπο του αλγόριθμου, αλλά η λειτουργικότητα του συνόλου δεδομένων παραμένει η ίδια. Για παράδειγμα, τα ονόματα στηλών σε ένα σύνολο στατιστικών δεδομένων μπορεί να αλλάξουν από Γραμμική παλινδρόμηση σε Λογιστική παλινδρόμηση, αλλά το σύνολο στατιστικών δεδομένων περιέχει μετρήσεις ακρίβειας του μοντέλου.
Σχετικά σύνολα δεδομένων για μοντέλα AutoML
Όταν εκπαιδεύετε ένα προγνωστικό μοντέλο χρησιμοποιώντας το AutoML, το Oracle Analytics δημιουργεί πρόσθετα σύνολα δεδομένων που περιέχουν χρήσιμες πληροφορίες σχετικά με το μοντέλο. Ο αριθμός των δημιουργούμενων συνόλων δεδομένων εξαρτάται από τον αλγόριθμο του μοντέλου. Για παράδειγμα, για τα μοντέλα Naive Bayes, το Oracle Analytics δημιουργεί ένα σύνολο δεδομένων που παρέχει πληροφορίες σχετικά με υπό προϋποθέσεις πιθανότητες. Για ένα μοντέλο δέντρου αποφάσεων, το σύνολο δεδομένων παρέχει πληροφορίες σχετικά με στατιστικά στοιχεία δέντρου αποφάσεων. Όταν επιθεωρείτε ένα μοντέλο που έχει δημιουργηθεί με το AutoML χρησιμοποιώντας τον αλγόριθμο γενικού γραμμικού μοντέλου (GLM), βλέπετε καταχωρίσεις με το πρόθημα GLM* για τα σχετικά με το μοντέλο σύνολα δεδομένων που περιέχουν πληροφορίες μεταδεδομένων για το μοντέλο.
.png''
Σχετικά σύνολα δεδομένων
Σημείωση:
Το Oracle Analytics προσαρτά το όνομα εξόδου της ροής δεδομένων στον σχετικό τύπο συνόλου δεδομένων. Για παράδειγμα, για ένα μοντέλο CART, εάν η έξοδος της ροής δεδομένων ονομάζεται cart_model2, το σύνολο δεδομένων θα ονομαστεί cart_model2_CART.CART
Το Oracle Analytics δημιουργεί έναν πίνακα για το σύνολο δεδομένων που σχετίζεται με τη δενδρική δομή CART (Classification and Regression Tree), ο οποίος περιέχει στήλες που αναπαριστούν τις συνθήκες και τα κριτήρια συνθηκών στο δέντρο αποφάσεων, μια πρόβλεψη για κάθε ομάδα και αξιοπιστία πρόβλεψης. Χρησιμοποιήστε την απεικόνιση δενδρικής δομής για να απεικονίσετε αυτήν τη μέθοδο ανάλυσης αποφάσεων.
Το σύνολο δεδομένων CART δημιουργείται όταν επιλέξετε αυτούς τους συνδυασμούς μοντέλων και αλγόριθμων.
Μοντέλο | Αλγόριθμος |
---|---|
Αριθμητικό | CART για αριθμητική πρόβλεψη |
Δυαδική ταξινόμηση | CART |
Πολλαπλή ταξινόμηση | CART |
Αναφορά ταξινόμησης
Το Oracle Analytics δημιουργεί έναν πίνακα για το σύνολο δεδομένων σχετικά με την Αναφορά ταξινόμησης. Για παράδειγμα, εάν η στήλη προορισμού μπορεί να έχει τις δύο ξεχωριστές τιμές "Ναι" ή"Όχι", αυτό το σύνολο δεδομένων εμφανίζει δείκτες μέτρησης ακριβείας όπως F1, Ακρίβεια, Ανάκληση και Υποστήριξη (ο αριθμός των σειρών στο σύνολο δεδομένων εκπαίδευσης με αυτήν την τιμή) για κάθε ξεχωριστή τιμή της στήλης προορισμού.
Το σύνολο δεδομένων Ταξινόμησης δημιουργείται όταν επιλέξετε αυτούς τους συνδυασμούς μοντέλων και αλγόριθμων.
Μοντέλο | Αλγόριθμοι |
---|---|
Δυαδική ταξινόμηση |
Naive Bayes Νευρωνικό δίκτυο Μηχανή διανυσμάτων υποστήριξης |
Πολλαπλή ταξινόμηση |
Naive Bayes Νευρωνικό δίκτυο Μηχανή διανυσμάτων υποστήριξης |
Συνδυαστική μήτρα
Το Oracle Analytics δημιουργεί έναν συγκεντρωτικό πίνακα για το σύνολο δεδομένων σχετικά με τη Μήτρα σύγχυσης, η οποία ονομάζεται επίσης μήτρα σφάλματος. Κάθε σειρά αναπαριστά ένα στιγμιότυπο μιας προβλεπόμενης κλάσης, και κάθε στήλη αναπαριστά ένα στιγμιότυπο σε μια πραγματική κλάση. Αυτός ο πίνακας αναφέρει τον αριθμό των ψευδών θετικών, ψευδών αρνητικών, αληθών θετικών και αληθών αρνητικών αποτελεσμάτων, τα οποία χρησιμοποιούνται για τον υπολογισμό μετρήσεων ευστοχίας, ανάκλησης και ακρίβειας F1.
Το σύνολο δεδομένων Μήτρας σύγχυσης δημιουργείται όταν επιλέξετε αυτούς τους συνδυασμούς μοντέλων και αλγόριθμων.
Μοντέλο | Αλγόριθμοι |
---|---|
Δυαδική ταξινόμηση |
Λογιστική παλινδρόμηση CART (Δέντρο αποφάσεων) Naive Bayes Νευρωνικό δίκτυο Τυχαίο δάσος Μηχανή διανυσμάτων υποστήριξης |
Πολλαπλή ταξινόμηση |
CART (Δέντρο αποφάσεων) Naive Bayes Νευρωνικό δίκτυο Τυχαίο δάσος Μηχανή διανυσμάτων υποστήριξης |
Παράγοντες
Το Oracle Analytics δημιουργεί έναν πίνακα για το σύνολο δεδομένων σχετικά με τους Παράγοντες, ο οποίος περιέχει πληροφορίες σχετικά με τις στήλες που προσδιορίζουν τις τιμές της στήλης προορισμού. Για την αναγνώριση αυτών των στηλών χρησιμοποιούνται οι γραμμικές παλινδρομήσεις. Σε κάθε στήλη αντιστοιχίζονται τιμές συντελεστή και συσχέτισης. Η τιμή συντελεστή περιγράφει το βάρος-ηλικία της στήλης προκειμένου να καθοριστεί η τιμή της στήλης προορισμού. Η τιμή συσχέτισης υποδεικνύει την κατεύθυνση σχέσης μεταξύ της στήλης προορισμού και της εξαρτώμενης στήλης. Για παράδειγμα, εάν η τιμή της στήλης προορισμού αυξάνεται ή μειώνεται βάσει της εξαρτώμενης στήλης.
Το σύνολο δεδομένων "Παράγοντες" δημιουργείται όταν επιλέξετε αυτούς τους συνδυασμούς μοντέλων και αλγόριθμων.
Μοντέλο | Αλγόριθμοι |
---|---|
Αριθμητικό |
Γραμμική παλινδρόμηση Ελαστική καθαρή γραμμική παλινδρόμηση |
Δυαδική ταξινόμηση |
Λογιστική παλινδρόμηση Μηχανή διανυσμάτων υποστήριξης |
Πολλαπλή ταξινόμηση | Μηχανή διανυσμάτων υποστήριξης |
Χάρτης εμφανίσεων
Το Oracle Analytics δημιουργεί έναν πίνακα για το σύνολο δεδομένων σχετικά με τον Χάρτη ευστοχίας, ο οποίος περιέχει πληροφορίες σχετικά με τους κόμβους φύλλου της μεθόδου ανάλυσης αποφάσεων. Κάθε σειρά στον πίνακα αναπαριστά έναν κόμβο φύλλου και περιέχει πληροφορίες που περιγράφουν τι αναπαριστά αυτός ο κόμβος φύλλου, όπως μέγεθος τμήματος, αξιοπιστία και αναμενόμενο αριθμό σειρών. Για παράδειγμα, αναμενόμενος αριθμός σωστών προβλέψεων = Μέγεθος τμήματος * Αξιοπιστία.
Το σύνολο δεδομένων χάρτη εμφανίσεων δημιουργείται όταν επιλέξετε αυτούς τους συνδυασμούς μοντέλων και αλγόριθμων.
Μοντέλο | Αλγόριθμος |
---|---|
Αριθμητικό | CART για αριθμητική πρόβλεψη |
Υπόλοιπα
Το Oracle Analytics δημιουργεί έναν πίνακα για το σύνολο δεδομένων σχετικά με τις Τελικές αξίες, ο οποίος περιέχει πληροφορίες σχετικά με την ποιότητα των προβλέψεων τελικών αξιών. Το υπόλοιπο είναι η διαφορά μεταξύ της μετρημένης τιμής και της προβλεπόμενης τιμής ενός μοντέλου παλινδρόμησης. Αυτό το σύνολο δεδομένων περιέχει μια συγκεντρωτική αθροιστική τιμή της απόλυτης διαφοράς μεταξύ πραγματικών και προβλεπόμενων τιμών για όλες τις στήλες στο σύνολο δεδομένων.
Το σύνολο δεδομένων τελικών αξιών δημιουργείται όταν επιλέξετε αυτούς τους συνδυασμούς μοντέλων και αλγόριθμων.
Μοντέλο | Αλγόριθμοι |
---|---|
Αριθμητικά |
Γραμμική παλινδρόμηση Ελαστική καθαρή γραμμική παλινδρόμηση CART για αριθμητική πρόβλεψη |
Δυαδική ταξινόμηση | CART (Δέντρο αποφάσεων) |
Πολλαπλή ταξινόμηση | CART (Δέντρο αποφάσεων) |
Στατιστικά στοιχεία
Το Oracle Analytics δημιουργεί έναν πίνακα για το σύνολο δεδομένων σχετικά με τα Στατιστικά στοιχεία. Αυτές οι μετρήσεις του συνόλου δεδομένων εξαρτώνται από τον αλγόριθμο που χρησιμοποιείται για τη δημιουργία τους. Σημειώστε αυτήν τη λίστα μετρήσεων βάσει αλγόριθμων:
Αυτό το σύνολο δεδομένων δημιουργείται όταν επιλέξετε αυτούς τους συνδυασμούς μοντέλων και αλγόριθμων.
Μοντέλο | Αλγόριθμος |
---|---|
Αριθμητικό |
Γραμμική παλινδρόμηση Ελαστική καθαρή γραμμική παλινδρόμηση CART για αριθμητική πρόβλεψη |
Δυαδική ταξινόμηση |
Λογιστική παλινδρόμηση CART (Δέντρο αποφάσεων) Naive Bayes Νευρωνικό δίκτυο Τυχαίο δάσος Μηχανή διανυσμάτων υποστήριξης |
Πολλαπλή ταξινόμηση |
Naive Bayes Νευρωνικό δίκτυο Τυχαίο δάσος Μηχανή διανυσμάτων υποστήριξης |
Σύνοψη
Το Oracle Analytics δημιουργεί έναν πίνακα για το σύνολο δεδομένων σχετικά με τη Σύνοψη, ο οποίος περιέχει πληροφορίες, όπως Όνομα προορισμού και Όνομα μοντέλου.
Το σύνολο δεδομένων σύνοψης δημιουργείται όταν επιλέξετε αυτούς τους συνδυασμούς μοντέλων και αλγόριθμων.
Μοντέλο | Αλγόριθμοι |
---|---|
Δυαδική ταξινόμηση |
Naive Bayes Νευρωνικό δίκτυο Μηχανή διανυσμάτων υποστήριξης |
Πολλαπλή ταξινόμηση |
Naive Bayes Νευρωνικό δίκτυο Μηχανή διανυσμάτων υποστήριξης |
Όταν εκπαιδεύετε ένα προγνωστικό μοντέλο, δημιουργούνται σχετιζόμενα σύνολα δεδομένων.
Όταν δημιουργείτε ένα σενάριο σε ένα βιβλίο εργασίας, εφαρμόζετε ένα προγνωστικό μοντέλο στο σύνολο δεδομένων του βιβλίου εργασίας, με σκοπό την αποκάλυψη των τάσεων και των μοτίβων που το μοντέλο έχει σχεδιαστεί να βρίσκει.
Σημείωση:
Δεν μπορείτε να εφαρμόσετε ένα μοντέλο μηχανικής εκμάθησης Oracle στα δεδομένα ενός βιβλίου εργασίας.