Δημιουργία και χρήση προγνωστικών μοντέλων Oracle Analytics

Τα προγνωστικά μοντέλα του Oracle Analytics χρησιμοποιούν διάφορους ενσωματωμένους αλγόριθμους Oracle Machine Learning για να εξορύξουν τα σύνολα δεδομένων σας, να προβλέψουν μια τιμή-στόχο ή να αναγνωρίσουν κλάσεις εγγραφών. Χρησιμοποιήστε το πρόγραμμα επεξεργασίας ροής δεδομένων για να δημιουργήσετε, να εκπαιδεύσετε και να εφαρμόσετε προγνωστικά μοντέλα στα δεδομένα σας.

Τι είναι τα προγνωστικά μοντέλα του Oracle Analytics;

Ένα προγνωστικό μοντέλο του Oracle Analytics εφαρμόζει έναν συγκεκριμένο αλγόριθμο σε ένα σύνολο δεδομένων την πρόβλεψη τιμών και κλάσεων, ή την αναγνώριση ομάδων στα δεδομένα.

Μπορείτε επίσης να χρησιμοποιήσετε μοντέλα μηχανικής εκμάθησης Oracle για την πρόβλεψη δεδομένων.

Το Oracle Analytics περιλαμβάνει αλγόριθμους που σας βοηθούν να εκπαιδεύετε προγνωστικά μοντέλα για διάφορους σκοπούς. Παραδείγματα αλγόριθμων είναι τα δέντρα ταξινόμησης και παλινδρόμησης (CART), η λογιστική παλινδρόμηση και το k-means.

Χρησιμοποιήστε τη λειτουργία επεξεργασίας της ροής δεδομένων για να εκπαιδεύσετε ένα μοντέλο πρώτα σε ένα σύνολο δεδομένων εκπαίδευσης. Μετά την εκπαίδευση του προγνωστικού μοντέλου, θα το εφαρμόσετε στα σύνολα δεδομένων που θέλετε να προβλέψετε.

Ένα εκπαιδευμένο μοντέλο μπορείτε να το καταστήσετε διαθέσιμο σε άλλους χρήστες, οι οποίοι μπορούν να το εφαρμόσουν στα δεδομένα τους για να προβλέψουν τιμές. Σε ορισμένες περιπτώσεις, είναι άλλοι οι χρήστες που εκπαιδεύουν τα μοντέλα και άλλοι οι χρήστες που τα εφαρμόζουν.

Σημείωση:

Εάν δεν είστε σίγουροι τι πρέπει να αναζητήσετε στα δεδομένα σας, μπορείτε να ξεκινήσετε χρησιμοποιώντας τη λειτουργία "Επεξήγηση", η οποία χρησιμοποιεί την εκμάθηση μηχανής για την αναγνώριση τάσεων και μοτίβων. Στη συνέχεια, μπορείτε να χρησιμοποιήσετε τη λειτουργία επεξεργασίας ροής δεδομένων για να δημιουργήσετε και να εκπαιδεύσετε προγνωστικά μοντέλα που θα αναλύουν τάσεις και μοτίβα που βρήκε η λειτουργία "Επεξήγηση".
Χρησιμοποιήστε τη λειτουργία επεξεργασίας της ροής δεδομένων για να εκπαιδεύσετε ένα μοντέλο:
  • Αρχικά, δημιουργήστε μια ροή δεδομένων και προσθέστε το σύνολο δεδομένων που θέλετε να χρησιμοποιήσετε για να εκπαιδεύσετε το μοντέλο. Αυτό το σύνολο δεδομένων εκπαίδευσης περιέχει τα δεδομένα που θέλετε να προβλέψετε (για παράδειγμα, μια τιμή όπως πωλήσεις ή ηλικία, ή μια μεταβλητή όπως μια ομάδα πιστωτικού κινδύνου).
  • Εάν χρειάζεται, μπορείτε να χρησιμοποιήσετε τη λειτουργία επεξεργασίας της ροής δεδομένων για να επεξεργαστείτε το σύνολο δεδομένων προσθέτοντας στήλες, επιλέγοντας στήλες, κάνοντας συνένωση κ.ο.κ.
  • Αφού επιβεβαιώσετε ότι θέλετε να εκπαιδεύσετε το μοντέλο σε αυτά τα δεδομένα, προσθέστε ένα βήμα εκπαίδευσης στη ροή δεδομένων και επιλέξτε έναν αλγόριθμο ταξινόμησης (δυαδικής ή πολλαπλής), παλινδρόμησης ή συμπλέγματος για την εκπαίδευση ενός μοντέλου. Έπειτα ονομάστε το μοντέλο που προκύπτει, αποθηκεύστε τη ροή δεδομένων και εκτελέστε την για την εκπαίδευση και δημιουργία του μοντέλου.
  • Εξετάστε τις ιδιότητες στα αντικείμενα εκμάθησης μηχανής για να διαπιστώσετε την ποιότητα του μοντέλου. Εάν χρειάζεται, μπορείτε να επαναλάβετε τη διαδικασία εκπαίδευσης μέχρι το μοντέλο να φτάσει στην ποιότητα που θέλετε.

Χρησιμοποιήστε το οριστικοποιημένο μοντέλο για να βαθμολογήσετε άγνωστα ή χωρίς ετικέτα δεδομένα για τη δημιουργία ενός συνόλου δεδομένων εντός μιας ροής δεδομένων ή για την προσθήκη μιας απεικόνισης πρόβλεψης σε ένα βιβλίο εργασίας.

Παράδειγμα

Ας υποθέσουμε ότι θέλετε να δημιουργήσετε και να εκπαιδεύσετε ένα μοντέλο πολλαπλής ταξινόμησης για να προβλέψετε ποιοι ασθενείς έχουν υψηλό κίνδυνο εμφάνισης καρδιοπάθειας.

  1. Θα χρησιμοποιήσετε ένα σύνολο δεδομένων εκπαίδευσης που περιέχει χαρακτηριστικά για τους επιμέρους ασθενείς όπως ηλικία, φύλο, εάν έχουν αισθανθεί πόνο στο στέρνο, και μετρήσεις όπως αρτηριακή πίεση, ζάχαρο νηστείας, χοληστερίνη και μέγιστους καρδιακούς παλμούς. Το σύνολο δεδομένων εκπαίδευσης περιέχει επίσης μια στήλη που ονομάζεται "Πιθανότητα" στην οποία αντιστοιχίζεται μία από τις ακόλουθες τιμές: απουσία, λιγότερο πιθανό, πιθανό, πολύ πιθανό ή παρουσία.
  2. Επιλέξτε τον αλγόριθμο CART (Δέντρο αποφάσεων) επειδή παραβλέπει τις περιττές στήλες που δεν προσδίδουν αξία στην πρόβλεψη, και αναγνωρίζει και χρησιμοποιεί μόνο τις στήλες που είναι χρήσιμες στην πρόβλεψη του στόχου. Όταν προσθέσετε τον αλγόριθμο στη ροή δεδομένων, επιλέξτε τη στήλη "Πιθανότητα" για την εκπαίδευση του μοντέλου. Ο αλγόριθμος χρησιμοποιεί την εκμάθηση μηχανής για να επιλέξει τις στήλες παραγόντων που χρειάζεται για να εκτελέσει και να παρέχει προβλέψεις και σχετικά σύνολα δεδομένων.
  3. Ελέγξτε τα αποτελέσματα και βελτιστοποιήστε το εκπαιδευτικό μοντέλο, και έπειτα εφαρμόστε το μοντέλο σε ένα ευρύτερο σύνολο δεδομένων να προβλέψετε ποιοι ασθενείς έχουν μεγάλη πιθανότητα να έχουν εμφανίσει ή να εμφανίσουν καρδιοπάθεια.

Πώς επιλέγω έναν αλγόριθμο προγνωστικού μοντέλου;

Το Oracle Analytics παρέχει αλγόριθμους για οποιαδήποτε ανάγκη δημιουργίας μοντέλων εκμάθησης μηχανής: αριθμητικές προβλέψεις, πολλαπλή ταξινόμηση, δυαδική ταξινόμηση και δημιουργία συμπλεγμάτων.

Η λειτουργικότητα εκμάθησης μηχανής της Oracle προορίζεται για αναλυτές σύνθετων δεδομένων που έχουν εικόνα για το τι αναζητούν στα δεδομένα τους, είναι εξοικειωμένοι με την πρακτική των προγνωστικών αναλύσεων και κατανοούν τις διαφορές μεταξύ αλγόριθμων.

Σημείωση:

Αν χρησιμοποιείτε δεδομένα που προέρχονται από το Oracle Autonomous Data Warehouse, μπορείτε να χρησιμοποιήσετε τη δυνατότητα AutoML για να εκπαιδεύσει γρήγορα και εύκολα ένα προγνωστικό μοντέλο για λογαριασμό σας, χωρίς να απαιτούνται δεξιότητες μηχανικής εκμάθησης. Δείτε την ενότητα Εκπαίδευση προγνωστικού μοντέλου με χρήση AutoML στο Autonomous Data Warehouse.

Συνήθως οι χρήστες θέλουν να δημιουργούν πολλαπλά προγνωστικά μοντέλα, να τα συγκρίνουν και να επιλέγουν εκείνο που είναι πιο πιθανό να παρέχει αποτελέσματα που ικανοποιούν τα κριτήρια και τις απαιτήσεις τους. Αυτά τα κριτήρια μπορεί να ποικίλλουν. Για παράδειγμα, ορισμένες φορές οι χρήστες επιλέγουν μοντέλα που έχουν καλύτερη συνολική ακρίβεια ή μοντέλα που έχουν τον ελάχιστο τύπο σφαλμάτων I (ψευδών θετικών) και II (ψευδών αρνητικών), και άλλες φορές επιλέγουν μοντέλα που επιστρέφουν ταχύτερα αποτελέσματα και με αποδεκτό επίπεδο ακρίβειας, ακόμη κι αν τα αποτελέσματα δεν είναι ιδανικά.

Το Oracle Analytics περιέχει πολλαπλούς αλγόριθμους εκμάθησης μηχανής για κάθε είδος πρόβλεψης ή ταξινόμησης. Με αυτούς τους αλγόριθμους, οι χρήστες μπορούν να δημιουργούν περισσότερα από ένα μοντέλα ή να χρησιμοποιούν διαφορετικές βελτιστοποιημένες παραμέτρους ή να χρησιμοποιούν διαφορετικά σύνολα δεδομένα εκπαίδευσης για είσοδο και έπειτα να επιλέγουν το καλύτερο μοντέλο. Ο χρήστης μπορεί να επιλέξει το καλύτερο μοντέλο συγκρίνοντας και ζυγίζοντας μοντέλα με βάση τα δικά του κριτήρια. Για να καθορίσουν το καλύτερο μοντέλο, οι χρήστες μπορούν να εφαρμόσουν το μοντέλο και να απεικονίσουν τα αποτελέσματα των υπολογισμών για να καθοριστεί η ακρίβεια, ή μπορούν να ανοίξουν και να εξερευνήσουν τα σχετικά σύνολα δεδομένων που χρησιμοποίησε το Oracle Analytics στο μοντέλο εξόδου.

Συμβουλευτείτε αυτόν τον πίνακα για να μάθετε σχετικά με τους παρεχόμενους αλγόριθμους:

Όνομα Τύπος Κατηγορία Συνάρτηση Περιγραφή
CART

Ταξινόμηση

Παλινδρόμηση

Δυαδική ταξινόμηση

Πολλαπλή ταξινόμηση

Αριθμητικό

- Χρησιμοποιεί δέντρα αποφάσεων για την πρόβλεψη διακριτών αλλά και συνεχών τιμών.

Χρησιμοποιήστε την επιλογή με μεγάλα σύνολα δεδομένων.

Ελαστική καθαρή γραμμική παλινδρόμηση Παλινδρόμηση Αριθμητικό ElasticNet Μοντέλο σύνθετης παλινδρόμησης. Παρέχει πρόσθετες πληροφορίες (κανονικοποίηση), εκτελεί επιλογή μεταβλητών και γραμμικούς συνδυασμούς. Κυρώσεις μεθόδων παλινδρόμησης Lasso και Ridge.

Χρησιμοποιείται με μεγάλο αριθμό χαρακτηριστικών για να αποφευχθεί η συγγραμμικότητα (όπου πολλαπλά χαρακτηριστικά είναι απολύτως συσχετισμένα) και η υπερπροσαρμογή.

Ιεραρχικό Δημιουργία συμπλεγμάτων Δημιουργία συμπλεγμάτων AgglomerativeClustering Δομεί μια ιεραρχία δημιουργίας συμπλεγμάτων είτε από κάτω προς τα επάνω (κάθε παρατήρηση είναι ένα ξεχωριστό σύμπλεγμα και έπειτα συγχωνεύεται) είτε από επάνω προς τα κάτω (όλες οι παρατηρήσεις ξεκινούν ως ένα σύμπλεγμα) και μετρήσεις απόστασης.

Χρησιμοποιείται όταν το σύνολο δεδομένων δεν είναι μεγάλο και ο αριθμός των συμπλεγμάτων δεν είναι γνωστός εκ των προτέρων.

K-Means Δημιουργία συμπλεγμάτων Δημιουργία συμπλεγμάτων k-means Διαμερισματοποιεί μέσω επαναλήψεων τις εγγραφές σε συμπλέγματα k όπου κάθε παρατήρηση ανήκει στο σύμπλεγμα με την πλησιέστερη μέση τιμή.

Χρησιμοποιείται για στήλες μετρήσεων δημιουργίας συμπλεγμάτων και με καθορισμένη προσδοκία αριθμού συμπλεγμάτων που απαιτούνται. Συνεργάζεται καλά με μεγάλα σύνολα δεδομένων. Τα αποτελέσματα είναι διαφορετικά με κάθε εκτέλεση.

Γραμμική παλινδρόμηση Παλινδρόμηση Αριθμητικό Μέθοδος Ελαχίστων Τετραγώνων

Ridge

Lasso

Γραμμική προσέγγιση για μια σχέση μοντελοποίησης μεταξύ μεταβλητής προορισμού και άλλων χαρακτηριστικών στο σύνολο δεδομένων.

Χρησιμοποιείται για την πρόβλεψη αριθμητικών τιμών όταν τα χαρακτηριστικά δεν είναι απολύτως συσχετισμένα.

Λογιστική παλινδρόμηση Παλινδρόμηση Δυαδική ταξινόμηση LogisticRegressionCV Χρησιμοποιείται για την πρόγνωση της τιμής μιας κατηγορικά εξαρτώμενης μεταβλητής. Η εξαρτώμενη μεταβλητή είναι μια δυαδική μεταβλητή που περιέχει δεδομένα κωδικοποιημένα σε 1 ή 0.
Naive Bayes Ταξινόμηση

Δυαδική ταξινόμηση

Πολλαπλή ταξινόμηση

GaussianNB Πιθανολογική ταξινόμηση βάσει του θεωρήματος Bayes που υποθέτει ότι δεν υπάρχει εξάρτηση μεταξύ λειτουργιών.

Χρησιμοποιείται όταν υπάρχει μεγάλος αριθμός διαστάσεων εισόδου.

Νευρωνικό δίκτυο Ταξινόμηση

Δυαδική ταξινόμηση

Πολλαπλή ταξινόμηση

MLPClassifier Αλγόριθμος ταξινόμησης μέσω επαναλήψεων που μαθαίνει συγκρίνοντας το αποτέλεσμα ταξινόμησης με την πραγματική τιμή και το επιστρέφει στο δίκτυο ώστε να τροποποιηθεί ο αλγόριθμος για περαιτέρω επαναλήψεις.

Χρησιμοποιείται για ανάλυση κειμένου.

Τυχαίο δάσος Ταξινόμηση

Δυαδική ταξινόμηση

Πολλαπλή ταξινόμηση

Αριθμητικό

- Μια μέθοδος εκμάθησης συνόλου που δομεί πολλαπλά δέντρα αποφάσεων και κάνει έξοδο στην τιμή που συλλογικά αναπαριστά όλα τα δέντρα αποφάσεων.

Χρησιμοποιείται για την πρόβλεψη αριθμητικών και κατηγορικών μεταβλητών.

SVM Ταξινόμηση

Δυαδική ταξινόμηση

Πολλαπλή ταξινόμηση

LinearSVC, SVC Ταξινομεί εγγραφές αντιστοιχίζοντάς τις στον χώρο και δομώντας υπερεπίπεδα που μπορούν να χρησιμοποιηθούν για ταξινόμηση. Οι νέες εγγραφές (δεδομένα βαθμολόγησης) αντιστοιχίζονται στον χώρο και προβλέπονται ότι ανήκουν σε μια κατηγορία, η οποία βασίζεται στην πλευρά του υπερεπιπέδου όπου εμπίπτουν.

Εκπαίδευση προγνωστικού μοντέλου με χρήση AutoML στο Oracle Autonomous Data Warehouse

Όταν χρησιμοποιείτε δεδομένα από το Oracle Autonomous Data Warehouse, μπορείτε να χρησιμοποιήσετε τη δυνατότητα AutoML για να προτείνει και να εκπαιδεύσει ένα προγνωστικό μοντέλο. Το AutoML αναλύει τα δεδομένα σας, υπολογίζει τον καλύτερο αλγόριθμο για χρήση και εγγράφει ένα προγνωστικό μοντέλο στο Oracle Analytics, ώστε να μπορείτε να κάνετε προβλέψεις με βάση τα δεδομένα σας.

Η χρήση του AutoML σημαίνει ότι το Oracle Autonomous Data Warehouse αναλαμβάνει όλες τις δύσκολες εργασίες για λογαριασμό σας, ώστε να μπορείτε να αναπτύξετε ένα μοντέλο προβλέψεων χωρίς να απαιτούνται δεξιότητες στη μηχανική εκμάθηση ή την τεχνητή νοημοσύνη. Το μοντέλο προβλέψεων που δημιουργείται αποθηκεύεται στην περιοχή "Μοντέλα" της σελίδας "Μηχανική εκμάθηση". Για την πρόβλεψη δεδομένων με βάση το νέο μοντέλο, δημιουργήστε μια ροή δεδομένων και χρησιμοποιήστε το βήμα Εφαρμογή μοντέλου.
Πριν ξεκινήσετε:
  • Δημιουργήστε ένα σύνολο δεδομένων με βάση τα δεδομένα στο Oracle Autonomous Data Warehouse σχετικά με τα οποία θέλετε να δημιουργήσετε προβλέψεις. Για παράδειγμα, μπορεί να έχετε δεδομένα σχετικά με την απώλεια προσωπικού, συμπεριλαμβανομένου ενός πεδίου που ονομάζεται ΑΠΩΛΕΙΑ που υποδεικνύει "Ναι" ή "Όχι" για την απώλεια.
  • Βεβαιωθείτε ότι ο χρήστης βάσης δεδομένων που καθορίζεται στη σύνδεση του Oracle Analytics με το Oracle Autonomous Data Warehouse έχει τον ρόλο OML_Developer και δεν είναι super user τύπου 'admin'. Διαφορετικά, η ροή δεδομένων θα αποτύχει όταν προσπαθήσετε να την αποθηκεύσετε ή να την εκτελέσετε.
  1. Στην Αρχική σελίδα, κάντε κλικ στην επιλογή Δημιουργία και έπειτα κάντε κλικ στην επιλογή Ροή δεδομένων.
  2. Στη σελίδα Προσθήκη συνόλου δεδομένων, επιλέξτε το σύνολο δεδομένων με βάση το Oracle Autonomous Data Warehouse που περιέχει τα δεδομένα προς ανάλυση.
  3. Κάντε κλικ στην Προσθήκη βήματος και έπειτα στο AutoML.
  4. Για το πεδίο Προορισμός, κάντε κλικ στην Επιλογή στήλης και επιλέξτε τη στήλη δεδομένων που περιέχει την τιμή που θέλετε να προβλέψετε.
    Για παράδειγμα, για να προβλέψετε την απώλεια προσωπικού, μπορείτε να επιλέξετε ένα πεδίο που ονομάζεται ΑΠΩΛΕΙΑ και υποδεικνύει με τις τιμές 'TRUE' ή 'FALSE' εάν οι υπάλληλοι έχουν αποχωρήσει από τον οργανισμό.

  5. Αποδεχτείτε τις τιμές στα πεδία Τύπος εργασίας και Δείκτης μέτρησης κατάταξης μοντέλου που προτείνει το Oracle Analytics ή επιλέξτε διαφορετικό αλγόριθμο.
  6. Κάντε κλικ στην Αποθήκευση μοντέλου και καθορίστε το όνομα του μοντέλου πρόβλεψης που θα δημιουργηθεί.
  7. Κάντε κλικ στην Αποθήκευση και καθορίστε ένα όνομα για τη ροή δεδομένων.
  8. Κάντε κλικ στην Εκτέλεση για να αναλύσετε τα δεδομένα και να δημιουργήσετε ένα προγνωστικό μοντέλο.
  9. Από την Αρχική σελίδα, κάντε κλικ στην επιλογή Πλοήγηση, έπειτα στη Μηχανική εκμάθηση , κάντε δεξί κλικ στο δημιουργημένο μοντέλο και επιλέξτε Επιθεώρηση.
Μπορείτε να εντοπίσετε το μοντέλο που δημιουργεί το Oracle Analytics στη σελίδα Μηχανική εκμάθηση στην καρτέλα Μοντέλα. Επιθεωρήστε το μοντέλο για να αξιολογήσετε την ποιότητά του. Ανατρέξτε στην ενότητα Εκτίμηση της ποιότητας ενός προγνωστικού μοντέλου. Μπορείτε επίσης να ανατρέξετε σε σχετικά σύνολα δεδομένων που δημιουργούνται για τα μοντέλα που παράγονται με το AutoML. Ανατρέξτε στην ενότητα Τι είναι τα σχετιζόμενα σύνολα δεδομένων ενός προγνωστικού μοντέλου;.

Δημιουργία και εκπαίδευση ενός προγνωστικού μοντέλου

Οι αναλυτές σύνθετων δεδομένων δημιουργούν και εκπαιδεύουν προγνωστικά μοντέλα, προκειμένου να τα χρησιμοποιούν για την ανάπτυξη αλγόριθμων του Oracle Machine Learning με σκοπό την εξόρυξη συνόλων δεδομένων, την πρόβλεψη τιμών-στόχων ή την αναγνώριση κλάσεων εγγραφών. Χρησιμοποιήστε το πρόγραμμα επεξεργασίας ροής δεδομένων, για να δημιουργήσετε προγνωστικά μοντέλα, να τα εκπαιδεύσετε και να τα εφαρμόσετε στα δεδομένα σας.

Εικονίδιο "Εκμάθηση" Κύκλος επανάληψης LiveLabs

Η επίτευξη ενός μοντέλου ακριβείας είναι μια επαναληπτική διαδικασία και ο αναλυτής σύνθετων δεδομένων μπορεί να δοκιμάσει διαφορετικά μοντέλα, να συγκρίνει τα αποτελέσματά τους και να βελτιστοποιήσει παραμέτρους βάσει πολλαπλών δοκιμών. Ο αναλυτής δεδομένων μπορεί να χρησιμοποιήσει το οριστικοποιημένο, ακριβές προγνωστικό μοντέλο για την πρόγνωση των τάσεων σε άλλα σύνολα δεδομένων ή να το προσθέσει σε βιβλία εργασίας.

Σημείωση:

Αν χρησιμοποιείτε δεδομένα που προέρχονται από το Oracle Autonomous Data Warehouse, μπορείτε να χρησιμοποιήσετε τη δυνατότητα AutoML για να εκπαιδεύσει γρήγορα και εύκολα ένα προγνωστικό μοντέλο για λογαριασμό σας, χωρίς να απαιτούνται δεξιότητες μηχανικής εκμάθησης. Δείτε την ενότητα Εκπαίδευση προγνωστικού μοντέλου με χρήση AutoML στο Autonomous Data Warehouse.

Το Oracle Analytics παρέχει αλγόριθμους για αριθμητικές προβλέψεις, πολλαπλή ταξινόμηση, δυαδική ταξινόμηση και δημιουργία συμπλεγμάτων.

  1. Στην Αρχική σελίδα, κάντε κλικ στην επιλογή Δημιουργία και έπειτα επιλέξτε Ροή δεδομένων.
  2. Επιλέξτε το σύνολο δεδομένων που θέλετε να χρησιμοποιήσετε για την εκπαίδευση του μοντέλου. Κάντε κλικ στην επιλογή "Προσθήκη".
  3. Στη λειτουργία επεξεργασίας ροής δεδομένων, κάντε κλικ στην επιλογή Προσθήκη βήματος (+).
    Μετά την προσθήκη ενός συνόλου δεδομένων, μπορείτε είτε να χρησιμοποιήσετε όλες τις στήλες στο σύνολο δεδομένων για να δομήσετε το μοντέλο είτε να επιλέξετε μόνο τις σχετικές στήλες. Η επιλογή των σχετικών στηλών απαιτεί την κατανόηση του συνόλου δεδομένων. Παραβλέψτε στήλες που γνωρίζετε ότι δεν θα επηρεάσουν τη συμπεριφορά του αποτελέσματος ή ότι περιέχουν περιττές πληροφορίες. Μπορείτε να επιλέξετε τις σχετικές μόνο στήλες προσθέτοντας το βήμα Επιλογή στηλών. Εάν δεν είστε σίγουροι ποιες είναι οι σχετικές στήλες, τότε χρησιμοποιήστε όλες τις στήλες.
  4. Επιλέξτε ένα από τα βήματα εκπαίδευσης μοντέλων (π.χ. Εκπαίδευση αριθμητικών προβλέψεων ή Εκπαίδευση δημιουργίας συμπλεγμάτων).
  5. Επιλέξτε έναν αλγόριθμοι και πατήστε ΟΚ.
  6. Εάν εργάζεστε με ένα εποπτευόμενο μοντέλο όπως πρόβλεψη ή ταξινόμηση, τότε κάντε κλικ στην επιλογή Προορισμός και επιλέξτε τη στήλη για την οποία επιχειρείτε την πρόβλεψη. Για παράδειγμα, εάν δημιουργείτε ένα μοντέλο για να προβλέψετε το εισόδημα ενός ατόμου, τότε επιλέξτε τη στήλη Εισόδημα.
    Εάν εργάζεστε με ένα μη εποπτευόμενο μοντέλο όπως δημιουργία συμπλεγμάτων, τότε δεν απαιτείται στήλη προορισμού.
  7. Αλλάξτε τις προεπιλεγμένες ρυθμίσεις για το μοντέλο σας για να βελτιστοποιήσετε την ακρίβεια του προβλεπόμενου αποτελέσματος. Το μοντέλο με το οποίο εργάζεστε καθορίζει αυτές τις ρυθμίσεις.
  8. Κάντε κλικ στο βήμα Αποθήκευση μοντέλου και καταχωρίστε ένα όνομα και μια περιγραφή.
  9. Κάντε κλικ στην επιλογή Αποθήκευση, εισαγάγετε ένα όνομα και μια περιγραφή της ροής δεδομένων και πατήστε OK για να αποθηκεύσετε τη ροή δεδομένων.
  10. Κάντε κλικ στην επιλογή Εκτέλεση ροής δεδομένων για να δημιουργήσετε το προγνωστικό μοντέλο βάσει του συνόλου δεδομένων εισόδου και των ρυθμίσεων μοντέλου που παρείχατε.

Βήματα ροής δεδομένων για την εκπαίδευση μοντέλων μηχανικής εκμάθησης

Το Oracle Analytics σας επιτρέπει να εκπαιδεύετε μοντέλα μηχανικής εκμάθησης χρησιμοποιώντας βήματα στις ροές δεδομένων. Όταν ολοκληρώσετε την εκπαίδευση ενός μοντέλου μηχανικής εκμάθησης, εφαρμόστε το στα δεδομένα σας χρησιμοποιώντας το βήμα Εφαρμογή μοντέλου.

Όνομα βήματος Περιγραφή
AutoML (απαιτεί Oracle Autonomous Data Warehouse) Χρησιμοποιήστε τη δυνατότητα AutoML του Oracle Autonomous Data Warehouse, για να προτείνει και να εκπαιδεύσει ένα προγνωστικό μοντέλο για λογαριασμό σας. Το βήμα AutoML αναλύει τα δεδομένα σας, υπολογίζει τον καλύτερο αλγόριθμο για χρήση και εγγράφει ένα προγνωστικό μοντέλο στο Oracle Analytics.
Εκπαίδευση δυαδικής ταξινόμησης

Εκπαιδεύστε ένα μοντέλο εκμάθησης μηχανής για την ταξινόμηση των δεδομένων σας σε μία από δύο προκαθορισμένες κατηγορίες.

Εκπαίδευση δημιουργίας συμπλεγμάτων Εκπαιδεύστε ένα μοντέλο εκμάθησης μηχανής για τον διαχωρισμό ομάδων με παρόμοια χαρακτηριστικά και την ανάθεσή τους σε συμπλέγματα.
Εκπαίδευση πολλαπλής ταξινόμησης Εκπαιδεύστε ένα μοντέλο εκμάθησης μηχανής για την ταξινόμηση των δεδομένων σας σε τρεις ή περισσότερες προκαθορισμένες κατηγορίες.
Εκπαίδευση αριθμητικών προβλέψεων Εκπαιδεύστε ένα μοντέλο εκμάθησης μηχανής για την πρόβλεψη μιας αριθμητικής τιμής με βάση γνωστές τιμές δεδομένων.

Επιθεώρηση προγνωστικού μοντέλου

Αφού δημιουργήσετε το προγνωστικό μοντέλο και εκτελέσετε τη ροή δεδομένων, μπορείτε να ελέγξετε τις πληροφορίες σχετικά με το μοντέλο για να προσδιορίσετε πόσο ακριβές είναι. Χρησιμοποιήστε αυτές τις πληροφορίες για να προσαρμόσετε μέσω επαναλήψεων τις ρυθμίσεις του μοντέλου, να βελτιώσετε την ακρίβεια και να προβλέψετε καλύτερα αποτελέσματα.

Προβολή λεπτομερειών ενός προγνωστικού μοντέλου

Οι λεπτομέρειες ενός προγνωστικού μοντέλου σάς βοηθούν να κατανοήσετε το μοντέλο και να εξακριβώσετε αν είναι κατάλληλο για την πρόβλεψη των δεδομένων σας. Οι λεπτομέρειες μοντέλου περιλαμβάνουν την κλάση μοντέλου, τον αλγόριθμο, τις στήλες εισόδου και τις στήλες εξόδου.

  1. Στην Αρχική σελίδα, κάντε κλικ στην Πλοήγηση και έπειτα στη Μηχανική εκμάθηση.
  2. Κάντε κλικ στο εικονίδιο μενού για ένα μοντέλο εκπαίδευσης και επιλέξτε Επιθεώρηση.
  3. Κάντε κλικ στις Λεπτομέρειες για να δείτε τις πληροφορίες του μοντέλου.

Εκτίμηση της ποιότητας ενός προγνωστικού μοντέλου

Δείτε πληροφορίες που σας βοηθούν να κατανοήσετε την ποιότητα ενός προγνωστικού μοντέλου. Για παράδειγμα, μπορείτε να ελέγξετε μετρήσεις ακρίβειας όπως ακρίβεια μοντέλου, ευστοχία, ανάκληση, τιμή F1 και ποσοστό ψευδών θετικών αποτελεσμάτων.

Το Oracle Analytics παρέχει παρόμοιες μετρήσεις ανεξάρτητα από τον αλγόριθμο που χρησιμοποιείται για τη δημιουργία του μοντέλου, κάνοντας έτσι εύκολη τη σύγκριση μεταξύ των διαφορετικών μοντέλων. Κατά τη διαδικασία δημιουργίας μοντέλου, το σύνολο δεδομένων εισόδου χωρίζεται σε δύο μέρη για εκπαίδευση και δοκιμή του μοντέλου με βάση την παράμετρο Ποσοστό εκπαίδευσης διαμερίσματος. Το μοντέλο χρησιμοποιεί το δοκιμαστικό κομμάτι του συνόλου δεδομένων για να δοκιμάσει την ακρίβεια του μοντέλου που δομείται.
Με βάση τα ευρήματά σας στην καρτέλα Ποιότητα, μπορεί να χρειαστεί να προσαρμόσετε τις παραμέτρους του μοντέλου και να το εκπαιδεύσετε ξανά.
  1. Στην Αρχική σελίδα, κάντε κλικ στην Πλοήγηση και έπειτα στη Μηχανική εκμάθηση.
  2. Κάντε κλικ στο εικονίδιο μενού για ένα μοντέλο εκπαίδευσης και επιλέξτε Επιθεώρηση.
  3. Κάντε κλικ στην καρτέλα Ποιότητα για να ελέγξετε τις μετρήσεις ποιότητας του μοντέλου και να αξιολογήσετε το μοντέλο. Για παράδειγμα, εξετάστε τη βαθμολογία Ακρίβεια μοντέλου.

Συμβουλή: Κάντε κλικ στην επιλογή Περισσότερα για να ελέγξετε λεπτομέρειες των προβολών που δημιουργούνται για το μοντέλο.

Τι είναι τα σχετιζόμενα σύνολα δεδομένων ενός προγνωστικού μοντέλου;

Όταν εκτελείτε τη ροή δεδομένων για να δημιουργήσετε το μοντέλο εκπαίδευσης του προγνωστικού μοντέλου του Oracle Analytics, το Oracle Analytics δημιουργεί ένα σύνολο σχετιζόμενων συνόλων δεδομένων. Μπορείτε να ανοίξετε και να δημιουργήσετε βιβλία εργασίας με αυτά τα σύνολα δεδομένων για να μάθετε ποια είναι η ακρίβεια του μοντέλου.

Ανάλογα με τον αλγόριθμο που επιλέξατε για το μοντέλο σας, τα σχετικά σύνολα δεδομένων περιέχουν λεπτομέρειες για το μοντέλο, όπως κανόνες προβλέψεων, μετρήσεις ακρίβειας, συνδυαστική μήτρα και βασικούς παράγοντες για προβλέψεις. Μπορείτε να χρησιμοποιήσετε αυτές τις πληροφορίες για να βελτιστοποιήσετε το μοντέλο και να λαμβάνετε καλύτερα αποτελέσματα, και μπορείτε να χρησιμοποιήσετε σχετικά σύνολα δεδομένων να συγκρίνετε μοντέλα και να αποφασίσετε ποιο μοντέλο είναι πιο ακριβές.

Για παράδειγμα, μπορείτε να ανοίξετε το σύνολο δεδομένων "Παράγοντες" για να ανακαλύψετε ποιες στήλες έχουν ισχυρή θετική ή αρνητική επίδραση στο μοντέλο. Εξετάζοντας αυτές τις στήλες, βλέπετε ότι ορισμένες στήλες δεν αντιμετωπίζονται ως μεταβλητές μοντέλου, επειδή δεν είναι ρεαλιστικές είσοδοι ή είναι υπερβολικά λεπτομερείς για την πρόβλεψη. Χρησιμοποιήστε τη λειτουργία επεξεργασίας ροής δεδομένων για να ανοίξετε το μοντέλο και βάσει των πληροφοριών που θα ανακαλύψετε, καταργήστε τις μη σχετικές ή πολύ αναλυτικές στήλες, και αναδημιουργήστε το μοντέλο. Ελέγξτε την καρτέλα "Ποιότητα και αποτελέσματα" και επαληθεύετε εάν η ακρίβεια του μοντέλου έχει βελτιωθεί. Συνεχίστε αυτήν τη διαδικασία μέχρι να μείνετε ικανοποιημένοι με την ακρίβεια του μοντέλου και να είναι έτοιμο να βαθμολογήσει ένα νέο σύνολο δεδομένων.

Διαφορετικοί αλγόριθμοι δημιουργούν παρόμοια σχετικά σύνολα δεδομένων. Οι επιμέρους παράμετροι και τα ονόματα στηλών μπορεί να αλλάξουν στο σύνολο δεδομένων, ανάλογα με τον τύπο του αλγόριθμου, αλλά η λειτουργικότητα του συνόλου δεδομένων παραμένει η ίδια. Για παράδειγμα, τα ονόματα στηλών σε ένα σύνολο στατιστικών δεδομένων μπορεί να αλλάξουν από Γραμμική παλινδρόμηση σε Λογιστική παλινδρόμηση, αλλά το σύνολο στατιστικών δεδομένων περιέχει μετρήσεις ακρίβειας του μοντέλου.

Σχετικά σύνολα δεδομένων για μοντέλα AutoML

Όταν εκπαιδεύετε ένα προγνωστικό μοντέλο χρησιμοποιώντας το AutoML, το Oracle Analytics δημιουργεί πρόσθετα σύνολα δεδομένων που περιέχουν χρήσιμες πληροφορίες σχετικά με το μοντέλο. Ο αριθμός των δημιουργούμενων συνόλων δεδομένων εξαρτάται από τον αλγόριθμο του μοντέλου. Για παράδειγμα, για τα μοντέλα Naive Bayes, το Oracle Analytics δημιουργεί ένα σύνολο δεδομένων που παρέχει πληροφορίες σχετικά με υπό προϋποθέσεις πιθανότητες. Για ένα μοντέλο δέντρου αποφάσεων, το σύνολο δεδομένων παρέχει πληροφορίες σχετικά με στατιστικά στοιχεία δέντρου αποφάσεων. Όταν επιθεωρείτε ένα μοντέλο που έχει δημιουργηθεί με το AutoML χρησιμοποιώντας τον αλγόριθμο γενικού γραμμικού μοντέλου (GLM), βλέπετε καταχωρίσεις με το πρόθημα GLM* για τα σχετικά με το μοντέλο σύνολα δεδομένων που περιέχουν πληροφορίες μεταδεδομένων για το μοντέλο.
Ακολουθεί η περιγραφή για GUID-1A190D76-82D5-4BEC-82C4-D881CFECA14D-default.png
.png''

Σχετικά σύνολα δεδομένων

Σημείωση:

Το Oracle Analytics προσαρτά το όνομα εξόδου της ροής δεδομένων στον σχετικό τύπο συνόλου δεδομένων. Για παράδειγμα, για ένα μοντέλο CART, εάν η έξοδος της ροής δεδομένων ονομάζεται cart_model2, το σύνολο δεδομένων θα ονομαστεί cart_model2_CART.

CART

Το Oracle Analytics δημιουργεί έναν πίνακα για το σύνολο δεδομένων που σχετίζεται με τη δενδρική δομή CART (Classification and Regression Tree), ο οποίος περιέχει στήλες που αναπαριστούν τις συνθήκες και τα κριτήρια συνθηκών στο δέντρο αποφάσεων, μια πρόβλεψη για κάθε ομάδα και αξιοπιστία πρόβλεψης. Χρησιμοποιήστε την απεικόνιση δενδρικής δομής για να απεικονίσετε αυτήν τη μέθοδο ανάλυσης αποφάσεων.

Το σύνολο δεδομένων CART δημιουργείται όταν επιλέξετε αυτούς τους συνδυασμούς μοντέλων και αλγόριθμων.

Μοντέλο Αλγόριθμος
Αριθμητικό CART για αριθμητική πρόβλεψη
Δυαδική ταξινόμηση CART
Πολλαπλή ταξινόμηση CART

Αναφορά ταξινόμησης

Το Oracle Analytics δημιουργεί έναν πίνακα για το σύνολο δεδομένων σχετικά με την Αναφορά ταξινόμησης. Για παράδειγμα, εάν η στήλη προορισμού μπορεί να έχει τις δύο ξεχωριστές τιμές "Ναι" ή"Όχι", αυτό το σύνολο δεδομένων εμφανίζει δείκτες μέτρησης ακριβείας όπως F1, Ακρίβεια, Ανάκληση και Υποστήριξη (ο αριθμός των σειρών στο σύνολο δεδομένων εκπαίδευσης με αυτήν την τιμή) για κάθε ξεχωριστή τιμή της στήλης προορισμού.

Το σύνολο δεδομένων Ταξινόμησης δημιουργείται όταν επιλέξετε αυτούς τους συνδυασμούς μοντέλων και αλγόριθμων.

Μοντέλο Αλγόριθμοι
Δυαδική ταξινόμηση

Naive Bayes

Νευρωνικό δίκτυο

Μηχανή διανυσμάτων υποστήριξης

Πολλαπλή ταξινόμηση

Naive Bayes

Νευρωνικό δίκτυο

Μηχανή διανυσμάτων υποστήριξης

Συνδυαστική μήτρα

Το Oracle Analytics δημιουργεί έναν συγκεντρωτικό πίνακα για το σύνολο δεδομένων σχετικά με τη Μήτρα σύγχυσης, η οποία ονομάζεται επίσης μήτρα σφάλματος. Κάθε σειρά αναπαριστά ένα στιγμιότυπο μιας προβλεπόμενης κλάσης, και κάθε στήλη αναπαριστά ένα στιγμιότυπο σε μια πραγματική κλάση. Αυτός ο πίνακας αναφέρει τον αριθμό των ψευδών θετικών, ψευδών αρνητικών, αληθών θετικών και αληθών αρνητικών αποτελεσμάτων, τα οποία χρησιμοποιούνται για τον υπολογισμό μετρήσεων ευστοχίας, ανάκλησης και ακρίβειας F1.

Το σύνολο δεδομένων Μήτρας σύγχυσης δημιουργείται όταν επιλέξετε αυτούς τους συνδυασμούς μοντέλων και αλγόριθμων.

Μοντέλο Αλγόριθμοι
Δυαδική ταξινόμηση

Λογιστική παλινδρόμηση

CART (Δέντρο αποφάσεων)

Naive Bayes

Νευρωνικό δίκτυο

Τυχαίο δάσος

Μηχανή διανυσμάτων υποστήριξης

Πολλαπλή ταξινόμηση

CART (Δέντρο αποφάσεων)

Naive Bayes

Νευρωνικό δίκτυο

Τυχαίο δάσος

Μηχανή διανυσμάτων υποστήριξης

Παράγοντες

Το Oracle Analytics δημιουργεί έναν πίνακα για το σύνολο δεδομένων σχετικά με τους Παράγοντες, ο οποίος περιέχει πληροφορίες σχετικά με τις στήλες που προσδιορίζουν τις τιμές της στήλης προορισμού. Για την αναγνώριση αυτών των στηλών χρησιμοποιούνται οι γραμμικές παλινδρομήσεις. Σε κάθε στήλη αντιστοιχίζονται τιμές συντελεστή και συσχέτισης. Η τιμή συντελεστή περιγράφει το βάρος-ηλικία της στήλης προκειμένου να καθοριστεί η τιμή της στήλης προορισμού. Η τιμή συσχέτισης υποδεικνύει την κατεύθυνση σχέσης μεταξύ της στήλης προορισμού και της εξαρτώμενης στήλης. Για παράδειγμα, εάν η τιμή της στήλης προορισμού αυξάνεται ή μειώνεται βάσει της εξαρτώμενης στήλης.

Το σύνολο δεδομένων "Παράγοντες" δημιουργείται όταν επιλέξετε αυτούς τους συνδυασμούς μοντέλων και αλγόριθμων.

Μοντέλο Αλγόριθμοι
Αριθμητικό

Γραμμική παλινδρόμηση

Ελαστική καθαρή γραμμική παλινδρόμηση

Δυαδική ταξινόμηση

Λογιστική παλινδρόμηση

Μηχανή διανυσμάτων υποστήριξης

Πολλαπλή ταξινόμηση Μηχανή διανυσμάτων υποστήριξης

Χάρτης εμφανίσεων

Το Oracle Analytics δημιουργεί έναν πίνακα για το σύνολο δεδομένων σχετικά με τον Χάρτη ευστοχίας, ο οποίος περιέχει πληροφορίες σχετικά με τους κόμβους φύλλου της μεθόδου ανάλυσης αποφάσεων. Κάθε σειρά στον πίνακα αναπαριστά έναν κόμβο φύλλου και περιέχει πληροφορίες που περιγράφουν τι αναπαριστά αυτός ο κόμβος φύλλου, όπως μέγεθος τμήματος, αξιοπιστία και αναμενόμενο αριθμό σειρών. Για παράδειγμα, αναμενόμενος αριθμός σωστών προβλέψεων = Μέγεθος τμήματος * Αξιοπιστία.

Το σύνολο δεδομένων χάρτη εμφανίσεων δημιουργείται όταν επιλέξετε αυτούς τους συνδυασμούς μοντέλων και αλγόριθμων.

Μοντέλο Αλγόριθμος
Αριθμητικό CART για αριθμητική πρόβλεψη

Υπόλοιπα

Το Oracle Analytics δημιουργεί έναν πίνακα για το σύνολο δεδομένων σχετικά με τις Τελικές αξίες, ο οποίος περιέχει πληροφορίες σχετικά με την ποιότητα των προβλέψεων τελικών αξιών. Το υπόλοιπο είναι η διαφορά μεταξύ της μετρημένης τιμής και της προβλεπόμενης τιμής ενός μοντέλου παλινδρόμησης. Αυτό το σύνολο δεδομένων περιέχει μια συγκεντρωτική αθροιστική τιμή της απόλυτης διαφοράς μεταξύ πραγματικών και προβλεπόμενων τιμών για όλες τις στήλες στο σύνολο δεδομένων.

Το σύνολο δεδομένων τελικών αξιών δημιουργείται όταν επιλέξετε αυτούς τους συνδυασμούς μοντέλων και αλγόριθμων.

Μοντέλο Αλγόριθμοι
Αριθμητικά

Γραμμική παλινδρόμηση

Ελαστική καθαρή γραμμική παλινδρόμηση

CART για αριθμητική πρόβλεψη

Δυαδική ταξινόμηση CART (Δέντρο αποφάσεων)
Πολλαπλή ταξινόμηση CART (Δέντρο αποφάσεων)

Στατιστικά στοιχεία

Το Oracle Analytics δημιουργεί έναν πίνακα για το σύνολο δεδομένων σχετικά με τα Στατιστικά στοιχεία. Αυτές οι μετρήσεις του συνόλου δεδομένων εξαρτώνται από τον αλγόριθμο που χρησιμοποιείται για τη δημιουργία τους. Σημειώστε αυτήν τη λίστα μετρήσεων βάσει αλγόριθμων:

  • Γραμμική παλινδρόμηση, CART για αριθμητική πρόβλεψη, Ελαστική καθαρή γραμμική παλινδρόμηση - Αυτοί οι αλγόριθμοι περιέχουν R τετράγωνο, R τετράγωνο προσαρμοσμένο, Μέσο απόλυτο σφάλμα(MAE), Σφάλμα μέσου ορθογωνισμένου(MSE), Σχετικό απόλυτο σφάλμα(RAE), Σχετικό σφάλμα ορθογωνισμένου(RSE), Σφάλμα μέσου ορθογωνισμένου ρίζας(RMSE).
  • CART(Δέντρα ταξινόμησης και παλινδρόμησης), Ταξινόμηση Naive Bayes, Νευρωνικό δίκτυο, Μηχανή διανυσμάτων υποστήριξης(SVM), Τυχαίο δάσος, Λογιστική παλινδρόμηση - Αυτοί οι αλγόριθμοι περιέχουν Ακρίβεια, Σύνολο F1.

Αυτό το σύνολο δεδομένων δημιουργείται όταν επιλέξετε αυτούς τους συνδυασμούς μοντέλων και αλγόριθμων.

Μοντέλο Αλγόριθμος
Αριθμητικό

Γραμμική παλινδρόμηση

Ελαστική καθαρή γραμμική παλινδρόμηση

CART για αριθμητική πρόβλεψη

Δυαδική ταξινόμηση

Λογιστική παλινδρόμηση

CART (Δέντρο αποφάσεων)

Naive Bayes

Νευρωνικό δίκτυο

Τυχαίο δάσος

Μηχανή διανυσμάτων υποστήριξης

Πολλαπλή ταξινόμηση

Naive Bayes

Νευρωνικό δίκτυο

Τυχαίο δάσος

Μηχανή διανυσμάτων υποστήριξης

Σύνοψη

Το Oracle Analytics δημιουργεί έναν πίνακα για το σύνολο δεδομένων σχετικά με τη Σύνοψη, ο οποίος περιέχει πληροφορίες, όπως Όνομα προορισμού και Όνομα μοντέλου.

Το σύνολο δεδομένων σύνοψης δημιουργείται όταν επιλέξετε αυτούς τους συνδυασμούς μοντέλων και αλγόριθμων.

Μοντέλο Αλγόριθμοι
Δυαδική ταξινόμηση

Naive Bayes

Νευρωνικό δίκτυο

Μηχανή διανυσμάτων υποστήριξης

Πολλαπλή ταξινόμηση

Naive Bayes

Νευρωνικό δίκτυο

Μηχανή διανυσμάτων υποστήριξης

Εύρεση των σχετιζόμενων συνόλων δεδομένων ενός προγνωστικού μοντέλου

Όταν εκπαιδεύετε ένα προγνωστικό μοντέλο, δημιουργούνται σχετιζόμενα σύνολα δεδομένων.

Ανάλογα με τον αλγόριθμο, τα σχετιζόμενα σύνολα δεδομένων περιέχουν λεπτομέρειες σχετικά με το μοντέλο όπως: κανόνες προβλέψεων, μετρήσεις ακρίβειας, συνδυαστική μήτρα, βασικούς παράγοντες για προβλέψεις κ.ο.κ. Αυτές οι παράμετροι σάς βοηθούν να κατανοήσετε τους κανόνες που χρησιμοποίησε το μοντέλο για να καθορίσει τις προβλέψεις και τις ταξινομήσεις.
  1. Στην Αρχική σελίδα, κάντε κλικ στην Πλοήγηση και έπειτα στη Μηχανική εκμάθηση.
  2. Κάντε κλικ στο εικονίδιο μενού για ένα μοντέλο εκπαίδευσης και επιλέξτε Επιθεώρηση.
  3. Κάντε κλικ στην καρτέλα Σχετικά στοιχεία για να αποκτήσετε πρόσβαση στα σχετιζόμενα σύνολα δεδομένων του μοντέλου.
  4. Κάντε διπλό κλικ σε ένα σχετικό σύνολο δεδομένων για να το προβάλετε ή να το χρησιμοποιήσετε σε ένα βιβλίο εργασίας.

Προσθήκη προγνωστικού μοντέλου σε ένα βιβλίο εργασίας

Όταν δημιουργείτε ένα σενάριο σε ένα βιβλίο εργασίας, εφαρμόζετε ένα προγνωστικό μοντέλο στο σύνολο δεδομένων του βιβλίου εργασίας, με σκοπό την αποκάλυψη των τάσεων και των μοτίβων που το μοντέλο έχει σχεδιαστεί να βρίσκει.

Σημείωση:

Δεν μπορείτε να εφαρμόσετε ένα μοντέλο μηχανικής εκμάθησης Oracle στα δεδομένα ενός βιβλίου εργασίας.
Αφού προσθέσετε το μοντέλο στο βιβλίο εργασίας και αντιστοιχίσετε τις εισόδους του μοντέλου με τις στήλες του συνόλου δεδομένων, στο Πλαίσιο δεδομένων εμφανίζονται τα αντικείμενα του μοντέλου τα οποία μπορείτε να σύρετε και να αποθέσετε στον καμβά. Η εκμάθηση μηχανής δημιουργεί τις τιμές του μοντέλου βάσει των αντίστοιχων στηλών δεδομένων της απεικόνισης.
  1. Στην Αρχική σελίδα, κάντε κλικ στην επιλογή Δημιουργία και κατόπιν στην επιλογή Βιβλίο εργασίας.
  2. Επιλέξτε το σύνολο δεδομένων που θέλετε να χρησιμοποιήσετε για τη δημιουργία του βιβλίου εργασίας και κάντε κλικ στην επιλογή Προσθήκη στο βιβλίο εργασίας.
  3. Στο τμήμα παραθύρου Δεδομένα, κάντε κλικ στην επιλογή Προσθήκη και επιλέξτε Δημιουργία σεναρίου.
  4. Στο πλαίσιο διαλόγου Δημιουργία σεναρίου - Επιλογή μοντέλου, επιλέξτε ένα μοντέλο και πατήστε OK.
    Μπορείτε να εφαρμόσετε μόνο ένα προβλεπτικό μοντέλο. Δεν μπορείτε να εφαρμόσετε ένα μοντέλο μηχανικής εκμάθησης Oracle.
    Εάν δεν μπορεί να αντιστοιχιστεί κάθε είσοδος μοντέλου με ένα στοιχείο δεδομένων, τότε εμφανίζεται το πλαίσιο διαλόγου Αντιστοίχιση των δεδομένων σας στο μοντέλο.
  5. Εάν εμφανιστεί το πλαίσιο διαλόγου Αντιστοίχιση των δεδομένων σας στο μοντέλο, τότε στο πεδίο Σύνολο δεδομένων, επιλέξτε το σύνολο δεδομένων που θα χρησιμοποιηθεί με το μοντέλο.
  6. Αντιστοιχίστε την είσοδο μοντέλου και τα στοιχεία δεδομένων όπως απαιτείται. Κάντε κλικ στην επιλογή "Ολοκληρώθηκε".
    Το σενάριο εμφανίζεται ως σύνολο δεδομένων στο τμήμα παραθύρου Στοιχεία δεδομένων.
  7. Σύρετε και αποθέστε στοιχεία από το σύνολο δεδομένων και το μοντέλο στον καμβά Απεικόνιση.
  8. Για να προσαρμόσετε το σενάριο, κάντε δεξί κλικ στο σενάριο στο τμήμα παραθύρου Στοιχεία δεδομένων και επιλέξτε Επεξεργασία σεναρίου.
  9. Αλλάξτε το σύνολο δεδομένων και ενημερώστε την είσοδο μοντέλου και την αντιστοίχιση στοιχείων δεδομένων όπως απαιτείται.
  10. Κάντε κλικ στην επιλογή Αποθήκευση για να αποθηκεύσετε το βιβλίο εργασίας.