Ειδικότητα: Τομέας Οικονομίας & Διοίκησης
Επιμέλεια: Κωνσταντίνος Κίτρου, Καθηγητής Τομέα Πληροφορικής & Ηλεκτρονικών / MSc Medical Informatics
Σε όλες τις επιχειρήσεις του κόσμου, κάθε χρόνο, ο όγκος των δεδομένων αυξάνεται. Αυτό είναι κάτι φυσικό, αφού μόνο αν σκεφτεί κανείς το πελατολόγιο κάθε επιχείρησης ξεχωριστά, μπορεί εύκολα να αντιληφθεί πως, ειδικά μία υγιής επιχείρηση, αυξάνει συνεχώς το πλήθος των πελατών της και, ως εκ τούτου, τις καταχωρήσεις των στοιχείων τους στη Βάση Δεδομένων της. Παρόλο, όμως, που ο όγκος αυξάνεται, αντιστρόφως ανάλογα η χρήσιμη πληροφορία μειώνεται.
Ένας διευθυντής πωλήσεων δεν είναι πια ικανοποιημένος με μία απλή λίστα από στοιχεία πελατών. Αντιθέτως, επιθυμεί λεπτομερείς πληροφορίες, όπως για παράδειγμα τις προηγούμενες αγορές των πελατών του, ώστε να κάνει κατά το δυνατόν ασφαλέστερες προβλέψεις σχετικά με μελλοντικές αγορές τους. Απλές ερωτήσεις που μπορούν να εκφραστούν σε μία δομημένη γλώσσα ερωτήσεων (SQL), δεν είναι αρκετές για να ικανοποιήσουν αυτές τις συνεχώς αυξανόμενες απαιτήσεις για πληροφορίες. Η Εξόρυξη Γνώσης από δεδομένα παρεμβαίνει σε αυτό το σημείο με σκοπό να καλύψει σε μεγάλο βαθμό τις απαιτήσεις που υπάρχουν για ποιοτική πληροφορία μέσα από τα δεδομένα.
Η Εξόρυξη Γνώσης (Data Mining) συχνά ορίζεται ως "η εύρεση πληροφοριών που είναι κρυμμένες σε μία Βάση Δεδομένων". Ένας άλλος ορισμός που μπορούμε να αποδώσουμε για την Εξόρυξη Γνώσης είναι "η εξερευνητική ανάλυση δεδομένων που οδηγεί σε ανακάλυψη πληροφορίας από συμπερασματική μάθηση".
Η προσπέλαση σε μία Βάση Δεδομένων (Βάση Γνώσης) μέσω της εξόρυξης γνώσης από δεδομένα, διαφέρει από την παραδοσιακή προσπέλαση σε αρκετά σημεία:
- Η ερώτηση υπάρχει περίπτωση να μην είναι με ακρίβεια διατυπωμένη. Εκείνος ο οποίος εξορύσσει τα δεδομένα, πολλές φορές δεν είναι σίγουρος για αυτό που θέλει να βρει
- Τα δεδομένα προσπέλασης αποτελούν, τις περισσότερες φορές, μία διαφορετική version από εκείνα της αρχικής (επιχειρησιακής) Βάσης Δεδομένων. Πιο συγκεκριμένα, για τις ανάγκες της καλύτερης δυνατής υποστήριξης της διαδικασίας της εξόρυξης, τα δεδομένα υφίστανται τροποποιήσεις και απαλοιφές
- Η έξοδος (το αποτέλεσμα - η απάντηση) μια ερώτησης εξόρυξης γνώσης είναι πιθανό να μην αποτελεί ένα στοιχείο ή ένα υποσύνολο της Βάσης Δεδομένων. Αντί αυτού, ενδεχομένως να είναι η έξοδος από κάποιες αναλύσεις των περιεχομένων της Βάσης Δεδομένων
Η εξόρυξη γνώσης αποτελεί την σπουδαιότερη μεθοδολογία και στον κλάδο της Επιχειρηματικής Νοημοσύνης. Έχει, μάλιστα εφαρμοστεί επιτυχημένα σε μία ευρεία γκάμα προβλημάτων, όπου τα πιο συνηθισμένα είναι τα εξής:
- Προώθηση Προϊόντων (για παράδειγμα η διαχείριση και έρευνα της πελατειακής βάσης μιας επιχείρησης)
- Λιανεμπόριο (για παράδειγμα η αναγνώριση των προτιμήσεων των πελατών
- Οικονομικά (για παράδειγμα η αναγνώριση της επικινδυνότητας)
- Υγεία (για παράδειγμα η διάγνωση μέσα από τα έμπειρα συστήματα)
- Ενέργεια (για παράδειγμα η πρόβλεψη των απαιτήσεων για κατανάλωση ηλεκτρικής ενέργειας)
Μέσα στην τελευταία δεκαετία παρουσιάζεται μία αλματώδης αύξηση στην παραγωγή και συλλογή δεδομένων. Η πρόοδος που έχει σημειωθεί στην τεχνολογία των Βάσεων Δεδομένων μας παρέχει νέες τεχνικές για την αποδοτική και αποτελεσματική συλλογή, αποθήκευση και διαχείριση των δεδομένων. Κάθε χρόνο παράγονται τεράστιοι όγκοι δεδομένων από εταιρείες και πανεπιστήμια τα οποία αποθηκεύονται σε μεγάλες Βάσεις Δεδομένων. Η δυνατότητα ανάλυσης και ερμηνείας των συνόλων δεδομένων και η εξαγωγή χρήσιμης – πολύτιμης γνώσης από αυτά έχει ξεπεράσει κάθε όριο και, ως εκ τούτου, η ανάγκη για μία νέα γενιά εργαλείων και τεχνικών για ευφυή ανάλυση Βάσεων Δεδομένων έχει δημιουργηθεί και εξελίσσεται κάθε χρόνο ραγδαία. Αυτή η ανάγκη έχει προσελκύσει την προσοχή των ερευνητών από διάφορους επιστημονικούς κλάδους ή περιοχές αυτών όπως είναι η Τεχνητή Νοημοσύνη, η Στατιστική, τα Έμπειρα Συστήματα και η Οπτικοποίηση των δεδομένων. Έτσι, έχουμε ως αποτέλεσμα τη δημιουργία ενός νέου ερευνητικού τομέα γνωστό ως Εξόρυξη Δεδομένων και Γνώσης (Data and Knowledge Mining).