Λειτουργίες ανάλυσης βάσης δεδομένων

Οι λειτουργίες ανάλυσης βάσης δεδομένων σάς παρέχουν τη δυνατότητα να εκτελείτε σύνθετη ανάλυση και ανάλυση εξόρυξης δεδομένων, για παράδειγμα, να εντοπίζετε ανωμαλίες, να δημιουργείτε συμπλέγματα δεδομένων και δείγματα δεδομένων, και να κάνετε αναλύσεις συνάφειας. Οι λειτουργίες ανάλυσης είναι διαθέσιμες όταν έχετε συνδεθεί σε μια βάση δεδομένων Oracle Database ή στο Oracle Autonomous Data Warehouse.

Εικονίδιο "Εκμάθηση" Κύκλος επανάληψης LiveLabs

Για την εμφάνιση του βήματος Αναλύσεις βάσης δεδομένων στο πρόγραμμα επεξεργασίας ροών δεδομένων, πρέπει να συνδεθείτε σε μια βάση δεδομένων Oracle ή στο Oracle Autonomous Data Warehouse.

Τύποι λειτουργίας Περιγραφή

Δυναμικός εντοπισμός ανωμαλιών

Εντοπισμός ανωμαλιών στα δεδομένα εισόδου χωρίς ένα προκαθορισμένο μοντέλο. Για παράδειγμα, ενδέχεται να θέλετε να επισημάνετε ασυνήθιστες οικονομικές συναλλαγές.

Κατά την ανάπτυξη αυτής της λειτουργίας με μεγάλα σύνολα δεδομένων, διαμορφώστε τις στήλες τμήματος για μεγιστοποίηση της απόδοσης.

Δυναμική δημιουργία συμπλεγμάτων

Δημιουργήστε συμπλέγματα με τα δεδομένα εισόδου χωρίς ένα προκαθορισμένο μοντέλο. Για παράδειγμα, ενδέχεται να θέλετε να χαρακτηρίσετε και να ανακαλύψετε τμήματα πελατών για σκοπούς μάρκετινγκ.

Κατά την ανάπτυξη αυτής της λειτουργίας με μεγάλα σύνολα δεδομένων, διαμορφώστε τις στήλες τμήματος για μεγιστοποίηση της απόδοσης.

Συχνό σύνολο στοιχείων

Ανακαλύψτε σχέσεις στα δεδομένα σας προσδιορίζοντας σύνολα στοιχείων που εμφανίζονται συχνά μαζί. Αυτή η τεχνική εξόρυξης δεδομένων είναι γνωστή επίσης ως εκμάθηση κανόνων συσχέτισης, ανάλυση συνάφειας ή στον κλάδο του λιανικού εμπορίου ως ανάλυση καλαθιού αγορών. Αν χρησιμοποιήσετε το συχνό σύνολο στοιχείων ως εργαλείο ανάλυσης καλαθιού αγορών, ενδεχομένως να διαπιστώσετε ότι οι πελάτες που αγοράζουν σαμπουάν αγοράζουν επίσης μαλακτική κρέμα μαλλιών.

Αυτή η λειτουργία έχει υψηλές απαιτήσεις πόρων και η απόδοσή της εξαρτάται από πολλούς παράγοντες, όπως τον όγκο του συνόλου δεδομένων εισόδου, την πληθικότητα του αναγνωριστικού συναλλαγής και την πληθικότητα της στήλη τιμών στοιχείου. Για να αποφύγετε τη δυνητική υποβάθμιση της απόδοσης στη βάση δεδομένων, δοκιμάστε με μια υψηλότερη τιμή ελάχιστου ποσοστού υποστήριξης (η προεπιλογή είναι 0,25) και σταδιακά ελαττώστε την για να εξυπηρετήσετε περισσότερα σύνολα στοιχείων στα δεδομένα εξόδου σας.

Δειγματοληψία δεδομένων

Επιλέγει ένα ποσοστό τυχαίου δείγματος δεδομένων από έναν πίνακα. Εσείς απλώς καθορίζετε το ποσοστό των δεδομένων που θέλετε να κάνετε δειγματοληψία. Για παράδειγμα, ενδέχεται να θέλετε να κάνετε τυχαία δειγματοληψία στο δέκα τοις εκατό των δεδομένων σας.

Δημιουργία διακριτικών κειμένου

Αναλύστε δεδομένα κειμένου με τον διαχωρισμό τους σε διακριτές λέξεις και την καταμέτρηση της εμφάνισης κάθε λέξης. Όταν εκτελέσετε τη ροή δεδομένων σας, το Oracle Analytics δημιουργεί έναν πίνακα στη βάση δεδομένων με το όνομα DR$IndexName$I, ο οποίος περιέχει τις σχετικές λεπτομέρειες για το κείμενο διακριτικών και την καταμέτρηση διακριτικών. Χρησιμοποιήστε τον πίνακα DR$IndexName$I για να δημιουργήσετε ένα σύνολο δεδομένων.

  • Στην περιοχή Δεδομένα εξόδου, χρησιμοποιήστε την επιλογή Δημιουργία δίπλα σε κάθε πεδίο για να επιλέξετε τις στήλες για ευρετηριοποίηση.

  • Στην περιοχή Παράμετροι, έπειτα Στήλη κειμένου, κάντε κλικ στην Επιλογή στήλης για να επιλέξετε το πεδίο που θέλετε να αναλύσετε σε ξεχωριστές λέξεις. Χρησιμοποιήστε τις επιλογές Στήλη αναφοράς<αριθμός> για να συμπεριλάβετε μία ή περισσότερες στήλες στο σύνολο δεδομένων εξόδου. Χρησιμοποιήστε την επιλογή Χρήση ειδικού αναλυτή λέξεων γλώσσας για να επιλέξετε συγκεκριμένες γλώσσες, όπως Κινεζικά, Δανικά, Ολλανδικά, Αγγλικά, Φινλανδικά, Γερμανικά, Νορβηγικά, Ιαπωνικά, Κορεατικά και Σουηδικά για ειδικούς αναλυτές λέξεων. Ανατρέξτε στην ενότητα Τεκμηρίωση για το Oracle Database για περισσότερες λεπτομέρειες σχετικά με τις υποστηριζόμενες γλώσσες.

Η σύνδεση βάσης δεδομένων που χρησιμοποιείτε για τη ροή δεδομένων σας απαιτεί ειδικά προνόμια βάσης δεδομένων. Ελέγξτε με τον διαχειριστή σας ότι:
  • Ο λογαριασμός βάσης δεδομένων σας διαθέτει grant EXECUTE on CTXSYS.CTX_DDL to schema name.
  • Χρησιμοποιείτε μια σύνδεση Oracle Analytics με το ίδιο όνομα χρήστη με το σχήμα στο οποίο υπάρχει ο πίνακας προέλευσης. Πρόκειται για τη βέλτιστη πρακτική για να αποφύγετε προβλήματα με προνόμια πρόσβασης κατά την εκτέλεση της ροής δεδομένων.
  • Η στήλη του πίνακα βάσης δεδομένων που αναλύετε δεν έχει ήδη κάποιο ευρετήριο CONTEXT. Αν υπάρχει ήδη ευρετήριο CONTEXT στον πίνακα βάσης δεδομένων που αναλύετε, καταργήστε αυτό το ευρετήριο προτού εκτελέσετε τη ροή δεδομένων δημιουργίας διακριτικών κειμένου

Χρονική σειρά

Η Χρονική σειρά είναι μια τεχνική εξόρυξης δεδομένων που προβλέπει την τιμή στόχο με βάση ένα γνωστό ιστορικό τιμών στόχων. Τα δεδομένα εισόδου στην ανάλυση χρονικής σειράς είναι μια ακολουθία τιμών στόχων. Παρέχει εκτιμήσεις της τιμής στόχου για κάθε περίοδο ενός χρονικού περιθωρίου που μπορεί να περιλαμβάνει έως 30 περιόδους πέραν των ιστορικών δεδομένων.

Το μοντέλο υπολογίζει επίσης διάφορα στατιστικά δεδομένα που μετρούν την καλή αντιστοίχιση με τα ιστορικά δεδομένα. Αυτά τα στατιστικά δεδομένα είναι διαθέσιμα ως πρόσθετο σύνολο δεδομένων εξόδου μέσω μιας ρύθμισης παραμέτρου.

Σημείωση: Ο αλγόριθμος χρονικής σειράς είναι διαθέσιμος μόνο από την έκδοση Oracle database 18c και μετά.

Αναίρεση συγκέντρωσης δεδομένων

Αντιμεταθέστε δεδομένα που είναι αποθηκευμένα σε στήλες σε μορφή σειρών. Για παράδειγμα, ενδέχεται να θέλετε να αντιμεταθέσετε πολλαπλές στήλες που εμφανίζουν μια τιμή μέτρησης εσόδων για κάθε έτος σε μία μοναδική στήλη εσόδων με πολλαπλές σειρές τιμών για τη διάσταση έτους. Απλώς επιλέγετε τις στήλες μετρήσεων για αντιμετάθεση και καθορίζετε ένα όνομα για τη νέα στήλη. Θα λάβετε ένα νέο σύνολο δεδομένων με λιγότερες στήλες και περισσότερες σειρές.

Σημείωση: Για να χρησιμοποιήσετε τις λειτουργίες ανάλυσης, βεβαιωθείτε ότι ο διαχειριστής τις έχει ενεργοποιήσει (Κονσόλα, Σύνθετες ρυθμίσεις συστήματος, Απόδοση και συμβατότητα, Ενεργοποίηση κόμβου Database Analytics σε ροές δεδομένων).