Τι είναι κάθετη βάση δεδομένων;

Μια κάθετη βάση δεδομένων είναι εκείνη στην οποία η φυσική διάταξη των δεδομένων είναι στήλη ανά στήλη και όχι σειρά προς σειρά. Αντί να τακτοποιούνται σε οριζόντιες δομές εγγραφής και να υποβάλλονται σε επεξεργασία κάθετα, τα δεδομένα σε μια κάθετη βάση δεδομένων είναι διατεταγμένα σε κάθετες δομές, γνωστές ως predicate tree, ή P-tree, και υποβάλλονται σε επεξεργασία οριζόντια.

Εξόρυξη δεδομένων

Οι οριζόντιες βάσεις δεδομένων είναι κατάλληλες για εφαρμογές όπου το ζητούμενο αποτέλεσμα είναι ένα σύνολο οριζόντιων εγγραφών, αλλά λιγότερο για εφαρμογές όπως η εξόρυξη δεδομένων, όπου οι ερευνητές συνήθως ενδιαφέρονται για αποτελέσματα που μπορούν να εκφραστούν συνοπτικά. Τα δέντρα P, από την άλλη πλευρά, είναι κατάλληλα για την εξόρυξη δεδομένων. Τα P-tree συνήθως δημιουργούνται αποσυνθέτοντας κάθε χαρακτηριστικό ή στήλη ενός πίνακα οριζόντιων εγγραφών σε ξεχωριστά διανύσματα bit ή δομές δεδομένων πίνακα. Τα δέντρα P μπορούν να είναι μονοδιάστατα, δισδιάστατα ή πολυδιάστατα. εάν τα δεδομένα που θα αποθηκευτούν στη βάση δεδομένων έχουν φυσικές διαστάσεις - για παράδειγμα, γεωχωρικά δεδομένα ή γεωγραφικές πληροφορίες - οι διαστάσεις του P-δένδρου ταιριάζουν με αυτές των δεδομένων.

Εκτέλεση

Τα δεδομένα σε κάθετη βάση δεδομένων υποβάλλονται σε επεξεργασία μέσω γρήγορων λογικών τελεστών, όπως AND, OR, αποκλειστικά OR και συμπλήρωμα. Επιπλέον, οργανώνοντας δεδομένα βάσει στήλης και όχι κατά σειρά, είναι δυνατή η εκτέλεση ερωτημάτων ή αναζητήσεων, στα δεδομένα χωρίς πρόσβαση σε σελίδες σε σκληρό δίσκο που δεν επηρεάζονται από το ερώτημα και έτσι αυξάνουν την ταχύτητα ανάκτησης δεδομένων . Αυτό είναι ένα σημαντικό ζήτημα κατά την εξόρυξη δεδομένων σε πολύ μεγάλα αποθετήρια δεδομένων.

Μέγεθος σελίδας

Ένα άλλο πλεονέκτημα των κάθετων βάσεων δεδομένων είναι ότι επιτρέπουν την αποθήκευση δεδομένων σε μεγάλες σελίδες. Ένα μεγάλο μέγεθος σελίδας σημαίνει ότι ένας μεγάλος αριθμός σχετικών στοιχείων δεδομένων μπορεί να ανακτηθεί σε μία λειτουργία ανάγνωσης. Αντιθέτως, μια λειτουργία ανάγνωσης σε μια οριζόντια βάση δεδομένων ανακτά όχι μόνο σχετικά στοιχεία δεδομένων, αλλά και χαρακτηριστικά ή στήλες που δεν σχετίζονται με το εν λόγω ερώτημα και ευνοεί μικρά μεγέθη σελίδων.

Επιστημονικές εφαρμογές

Οι κάθετες βάσεις δεδομένων έχουν λάβει νέο ενδιαφέρον από την επιστημονική κοινότητα τα τελευταία χρόνια. Ο αριθμός των ταυτόχρονων χρηστών σε εφαρμογές επιστημονικής βάσης δεδομένων είναι συνήθως πολύ μικρότερος από ό, τι σε εμπορικές εφαρμογές, αλλά οι χρήστες τείνουν να υποβάλλουν πιο περίπλοκα, απρόβλεπτα ερωτήματα. Επιπλέον, οι εφαρμογές επιστημονικής βάσης δεδομένων πρέπει συνήθως να παρέχουν μια πιο αυτοματοποιημένη απάντηση σε σύνθετα ερωτήματα λόγω της απουσίας προσωπικού υποστήριξης βάσεων δεδομένων και συστημάτων. Οι επιστημονικοί χρήστες προτιμούν συνήθως να εργάζονται με ειδικά, εσωτερικά συστήματα υπολογιστών, επομένως οι εφαρμογές επιστημονικών βάσεων δεδομένων πρέπει να είναι φορητές μεταξύ διαφόρων μοντέλων υπολογιστών. Οι κάθετες βάσεις δεδομένων είναι καλύτερες, σε όλες αυτές τις μετρήσεις, από τις οριζόντιες αντίστοιχες.