From Wikipedia, the free encyclopedia
Η θεωρία των πιθανοτήτων είναι η καλύτερη θεωρία για να ελεγχθεί και να εκφραστεί η αβεβαιότητα ενός γεγονότος, καθώς παρέχει τη μεθοδολογία για να εκτιμηθεί ορθά η πιθανότητα για διάφορους τύπους σύνθετων δεδομένων. Τα Bayesian δίκτυα είναι ένα πολύ σημαντικό εργαλείο για την κατανόηση της εξάρτησης μεταξύ των γεγονότων και της εκχώρησης πιθανοτήτων σε αυτά, διασφαλίζοντας έτσι πόσο πιθανή ή ποια είναι η αλλαγή της εμφάνισης ενός συμβάντος δεδομένου του άλλου. Είναι πολύ σημαντικό να υπάρχουν διαθέσιμα ποιοτικά δεδομένα, καθώς σε όποιο κλάδο εφαρμοστούν οι κανόνες και η θεωρία πιθανοτήτων και της στατιστικής, η σημαντικότητα και η αξιοπιστία των αποτελεσμάτων εξαρτάται και από τα δεδομένα με τα οποία εκτιμώνται οι πιθανότητες. Καθώς διανύουμε τον 21ο αιώνα και ο όγκος των πληροφοριών που λαμβάνουμε καθημερινά αυξάνεται εκθετικά, τα μαθηματικά μοντέλα είναι απαραίτητα για την εξήγηση αλλά και την κατανόηση διάφορων καταστάσεων, όπως για παράδειγμα τα βιολογικά φαινόμενα. Τα Bayesian δίκτυα λοιπόν, είναι ικανά να ενσωματώνουν την προηγούμενη γνώση στη διαδικασία μάθησης ενός μοντέλου.
Τα Bayesian δίκτυα, πήραν το όνομά τους από τον Βρετανό κληρικό και μαθηματικό Τόμας Μπέιζ, με το γνωστό ομώνυμο θεώρημα, στη θεωρία πιθανοτήτων και στη στατιστική.[1] Ο Bayes έδειξε πρώτος τον τρόπο που χρησιμοποιούνται τα νέα στοιχεία για την ανανέωση των εκάστοτε πεποιθήσεων. Στη συνέχεια, ανέπτυξαν την ιδέα του και άλλοι μαθηματικοί όπως ο Πιερ-Σιμόν ντε Λαπλάς και ο Χάρολντ Τζέφρις , ο οποίος ανέφερε χαρακτηριστικά ότι «το θεώρημα του Μπέιζ είναι στη θεωρία των πιθανοτήτων, ό,τι είναι αντίστοιχα το Πυθαγόρειο Θεώρημα στη Γεωμετρία». Τα Bayesian δίκτυα δημιουργήθηκαν από τον Judea Pearl (1985)[2], ένα από τα μεγαλύτερα ονόματα στην ιστορία της Τεχνητής Νοημοσύνης (Artificial Intelligence). Ο Judea Pearl κατάφερε να κάνει τη σύνδεση της AI με τη λογική και την πιθανότητα. Tα Bayesian δίκτυα είναι εναλλακτικά γνωστά και ως δίκτυα πεποίθησης (belief networks) καθώς και ως πιθανοτικά μοντέλα κατευθυνόμενων ακυκλικών γράφων (ΚΑΓ) (Directed Acyclic Graphs (DAGs))[3].[4]
Αν Α και Β είναι δύο γεγονότα στο ίδιο πείραμα τύχης, ορίζεται ως υπό συνθήκη πιθανότητα , η πιθανότητα να συμβεί το δεδομένου ότι συνέβη το και ορίζεται από τον τύπο:
= για
όπου σύμφωνα με το Πολλαπλασιαστικό Θεώρημα
=
Χρησιμοποιώντας την έννοια της υπό συνθήκης πιθανότητας, είναι δυνατό να προσδιοριστεί η πιθανότητα ενός σύνθετου γεγονότος Β, το οποίο είναι η ένωση των τομών του με άλλα γεγονότα.
Στην ορολογία συνόλων, γεγονός ή ενδεχόμενο είναι ένα υποσύνολο του δειγματοχώρου .
Αν τα γεγονότα ,για αποτελούν μία διαμέριση του δειγματοχώρου , δηλαδή είναι ξένα μεταξύ τους ανά δύο με , η πιθανότητα ενός γεγονότος , οριζόμενο στον ίδιο δειγματικό χώρο, ορίζεται τη σχέση:
=
Πολλές φορές μετά την εκτέλεση ενός πειράματος, εξαιτίας της πληροφορίας που παίρνουμε από το γεγονός , μπορεί να αναθεωρήσουμε την πιθανότητα που έχουμε για ένα άλλο γεγονός .
Αν:
, όπου
Δεδομένου ότι έχει πραγματοποιηθεί το γεγονός , η σχέση αυτή προσδιορίζει την πιθανότητα πραγματοποίησης ενός γεγονότος της διαμέρισης και είναι γνωστή και ως εκ των υστέρων (posterior) πιθανότητα του .
Πριν την εκτέλεση του πειράματος γνωρίζουμε την εκ των προτέρων (prior) πιθανότητα του .
Έστω ότι υπάρχουν τρεις βιομηχανίες αυτοκινήτων οι οποίες προμηθεύουν μία βιομηχανία. Η βιομηχανία αυτή αγοράζει από τις εταιρείες με την εξής αναλογία: Το 50% των κινητήρων προέρχονται από την πρώτη εταιρεία Α1, ενώ η δεύτερη Α2 και η τρίτη Α3 προμηθεύουν με 25% έκαστη. Αν γνωρίζουμε ότι:
ποια είναι η πιθανότητα αν ελέγξουμε έναν κινητήρα αυτοκινήτου και είναι ελαττωματικός, να προέρχεται από την εταιρεία Α1;
Συνεπώς πρέπει να υπολογιστεί η υπό συνθήκη πιθανότητα . Με βάση τη λογική, σκεφτόμαστε ότι ο κινητήρας προέρχεται από τρίτη Α3 εταιρεία, καθώς έχει τριπλάσιο ποσοστό ελαττωματικών κινητήρων από τη δεύτερη Α2, ενώ αποκλείουμε να προέρχεται από την πρώτη Α1. Με βάση τα παραπάνω δεδομένα και εφαρμόζοντας τον κανόνα της υπό συνθήκης πιθανότητας έχουμε:
Επομένως, γνωρίζοντας ότι σε έναν έλεγχο ο κινητήρας θα είναι ελαττωματικός μπορούμε να υπολογίσουμε τις νέες πιθανότητες.
Ένα Bayesian δίκτυο αποτελείται από ένα κατευθυνόμενο ακυκλικό γράφημα (μη-κυκλικός γράφος) με κόμβους και ακμές.
Ακυκλικό σημαίνει ότι μία μεταβλητή μπορεί να δείχνει σε μια άλλη μεταβλητή, αλλά η δεύτερη μεταβλητή δεν πρέπει να δείχνει πίσω την αρχική. Κάθε μεταβλητή αναπαριστάται με έναν κόμβο (node), καθένας από τους οποίους διαθέτει καταστάσεις, δηλαδή ένα σύνολο από πιθανές τιμές που αντιστοιχούν σε κάθε μεταβλητή. Οι κόμβοι συνδέονται μεταξύ τους με κατευθυνόμενα βέλη, τις ακμές (edges) που φανερώνουν την αλληλεξάρτηση των μεταβλητών υποδεικνύοντας και την κατεύθυνση της επιρροής. Για τη διπλανή εικόνα ισχύει ότι
Ο συμβολισμός χρησιμοποιείται για μια μεταβλητή καθώς και τον αντίστοιχο κόμβο της μεταβλητής αυτής στην τοπολογία του δικτύου ενώ ως ορίζεται ένα σύνολο μεταβλητών αποτελούμενο: α) Από μια δομή δικτύου S η οποία υποδηλώνει το σύνολο των εξαρτήσεων μεταξύ των μεταβλητών και β) από ένα σύνολο από τοπικές κατανομές πιθανοτήτων συσχετιζόμενες με κάθε μια μεταβλητή.
Οι γονείς του κόμβου στο καθώς και τις αντίστοιχες μεταβλητές που αντιστοιχούν στους γονείς στην τοπολογία του δικτύου, υποδηλώνονται με
Η τιμή πιθανότητας για κάθε κόμβο δεδομένου του «γονικού» κόμβου τους αναπαριστάται με τη μορφή πίνακα που ονομάζεται Πίνακας υπό Συνθήκη πιθανοτήτων (Conditional Probability Table).
Στο παρακάτω δίκτυο μπορούμε να δούμε ένα γράφημα, με τρεις κόμβους και τις ακμές. Ο κόμβος ΣΥΝΝΕΦΙΑ δείχνει προς τους κόμβους ΠΟΤΙΣΤΗΡΙ και ΒΡΟΧΗ, και οι κόμβοι ΒΡΟΧΗ και ΠΟΤΙΣΤΗΡΙ δείχνουν προς τον κόμβο ΒΡΕΓΜΕΝΟ ΓΡΑΣΙΔΙ. Μπορούμε επίσης να δούμε τον πίνακα υπό συνθήκη πιθανοτήτων. Για κάθε κόμβο έχουμε έναν πίνακα πιθανοτήτων και κάθε κόμβος μπορεί να είναι αληθής ή ψευδής, με διαφορετικές πιθανότητες για αυτό.
Συγκεκριμένα, ο ΣΥΝΝΕΦΙΑ είναι 50% αληθής και 50% ψευδής. Ο κόμβος ΒΡΟΧΗ επηρεάζεται από την κατάσταση του ΣΥΝΝΕΦΙΑ. Έτσι μπορούμε να δούμε ότι αν ο ΣΥΝΝΕΦΙΑ είναι αληθής, τότε η πιθανότητα του ΒΡΟΧΗ είναι 0,8, ενώ αν ο ΣΥΝΝΕΦΙΑ είναι ψευδής τότε η πιθανότητα του ΒΡΟΧΗ είναι χαμηλότερη και συγκεκριμένα 0,2. Το ίδιο ισχύει για τον κόμβο ΠΟΤΙΣΤΗΡΙ. Ο ΒΡΕΓΜΕΝΟ ΓΡΑΣΙΔΙ εξαρτάται τόσο από τον ΠΟΤΙΣΤΗΡΙ όσο και από τον ΒΡΟΧΗ.
Τα Bayesian δίκτυα έχουν μια τεράστια εφαρμογή στον πραγματικό κόσμο και εφαρμόζονται σε διάφορους τομείς, όπως:
Τα Bayesian δίκτυα γίνονται ολοένα και πιο σημαντικά στην επιστήμη της Βιολογίας, χρησιμοποιούνται :
Υπάρχουν πολλές εφαρμογές στη Βιολογία όπου απαιτείται η ταξινόμηση των δεδομένων, για παράδειγμα, η πρόβλεψη της γονιδιακής λειτουργίας. Για την επίλυση τέτοιων προβλημάτων, απαιτείται ένα σύνολο κανόνων που μπορούν να χρησιμοποιηθούν για την πρόβλεψη, αλλά συχνά αυτές οι μέθοδοι δεν είναι διαθέσιμες,ή στην πράξη αποδεικνύονται πολλές εξαιρέσεις από τους κανόνες ή ακόμη και υπερβολικοί κανόνες, που οδηγούν σε φτωχά αποτελέσματα.
Στο σχήμα παρουσιάζεται ένα παράδειγμα ενός Bayesian δικτύου που περιγράφει ένα δίκτυο γονιδιακής ρύθμισης. Η έκφραση κάθε γονιδίου εκφράζεται με μια μεταβλητή κοινής συνάρτησης πιθανότητας (Joint Probability Distribution) που περιγράφει πώς ρυθμίζονται τα γονίδια το ένα από το άλλο. Μια τέτοια συνάρτηση μπορεί να είναι περίπλοκη ακόμη και για πέντε μόνο μεταβλητές. Ωστόσο, η γραφική αναπαράσταση καθιστά σαφές πού υπάρχουν οι ρυθμιστικές σχέσεις μεταξύ των γονιδίων.
Οι εφαρμογές της βιοπληροφορικής των Bayesian δικτύων έχουν συμπεριλάβει την ομαδοποίηση γονιδίων και τη δημιουργία κυτταρικών δικτύων[15],καθώς είναι κατάλληλα για τη μοντελοποίηση στοχαστικών πολύπλοκων βιολογικών συστημάτων και αυτά τα δίκτυα μπορούν εύκολα να γίνουν κατανοητά. Ένα εξαιρετικό παράδειγμα συνδυασμού νέων δεδομένων και γνώσης στο πεδίο της βιοπληροφορικής είναι το MAGIC BN το οποίο έχει σχεδιαστεί χρησιμοποιώντας ειδική γνώση για το συνδυασμό πληροφοριών από διαφορετικές ετερογενείς πηγές δεδομένων για την ταξινόμηση της πρόβλεψης της γονιδιακής λειτουργίας.[18]
Η Bayesian εξαγωγή συμπεράσματος είναι μια στατιστική εξαγωγή συμπεράσματος στην οποία τα στοιχεία ή οι παρατηρήσεις χρησιμοποιούνται για την ενημέρωση ή την εκ νέου εξαγωγή συμπεράσματος για την πιθανότητα ότι μια προηγούμενη υπόθεση μπορεί να είναι αληθινή. Το όνομα προέρχεται από τη συχνή χρήση του Θεωρήματος του Bayes στη διαδικασία εξαγωγής συμπεράσματος. Η Bayesian φυλογενετική ανάλυση χρησιμοποιεί το θεώρημα Bayes, το οποίο συσχετίζει τη μεταγενέστερη πιθανότητα ενός δέντρου στην πιθανότητα των δεδομένων, και την προγενέστερη πιθανότητα του δέντρου και του μοντέλου της εξέλιξης.
Οι προσεγγίσεις της μηχανικής μάθησης (Machine learning) συχνά παράγουν ικανοποιητικά αποτελέσματα, όπου ένας μεγάλος αριθμός παραδειγμάτων, το σετ εκπαίδευσης(training set), χρησιμοποιείται για την προσαρμογή των παραμέτρων ενός μοντέλου που μπορούν στη συνέχεια να χρησιμοποιηθούν για την εκτέλεση προβλέψεων ή ταξινόμησης δεδομένων.
Ένα κοινό πρόβλημα στη μηχανική μάθηση είναι η υπερμοντελοποίηση, όπου το μοντέλο που έχει παραχθεί είναι πολύ περίπλοκο και γενικεύεται ελάχιστα σε νέα δεδομένα. Με την αύξηση του μεγέθους του σετ εκπαίδευσης, μπορεί να ξεπεραστεί το πρόβλημα της υπερμοντελοποίησης, όμως αυτό απαιτεί περισσότερα δεδομένα εκπαίδευσης, τα οποία δεν είναι πάντα διαθέσιμα. Επιπλέον, συχνά είναι σημαντικό να προσδιοριστεί η αβεβαιότητα στις παραμέτρους του μοντέλου που έχει παραχθεί ή ακόμη και στην επιλογή του μοντέλου.Με τη χρήση των Bayesian δικτύων είναι εφικτό να ξεπεραστούν τα παραπάνω ζητήματα καθώς η θεωρία των πιθανοτήτων Bayesian παρέχει μηχανισμούς για την περιγραφή της αβεβαιότητας και για την προσαρμογή του αριθμού των παραμέτρων στο μέγεθος των δεδομένων. Η γραφική αναπαράσταση παρέχει έναν απλό τρόπο απεικόνισης της δομής ενός μοντέλου. Μελετώντας τα μοντέλα αντλούνται πολύτιμες πληροφορίες για τα δεδομένα και δίνεται η δυνατότητα να παραχθούν νέα μοντέλα.
Μια εφαρμογή των Bayesian δικτύων, αφορά την ανίχνευση του Coronavirus Disease 2019 (Covid-19). Οι Alile, Solomon & Osayamen, Otokiti. (2020), πρότειναν και προσομοίωσαν ένα Bayesian Belief Network μοντέλο για να προβλέψουν τον (Covid-19). Το μοντέλο σχεδιάστηκε χρησιμοποιώντας τον Bayes Server και δοκιμάστηκε με δεδομένα που συλλέχθηκαν από το ιατρικό αποθετήριο COVID-19. Το μοντέλο είχε ακρίβεια πρόβλεψης 99%.[19]
Μια επιστημονική ομάδα επιχείρησε να συνδυάσει τις αποτελεσματικές συμβατικές ιατρικές τεχνικές με τα Bayesian δίκτυα. Σκοπός της έρευνας, υπήρξε ο σχεδιασμός μιας μετά-ανάλυσης δικτύου (network meta-analysis (NMA)) για την αξιολόγηση της θεραπευτικής επίδρασης των κλασσικών μεθόδων ιατρικής στον ασυμπτωματικό ιό.[20]
Ακόμα μια ομάδα στη Νιγηρία επιχείρησε να χρησιμοποιήσει τα Bayesian δίκτυα για να κατασκευάσει ένα μοντέλο εκπαιδευμένο προς ένα σύστημα στόχου που μπορεί να βοηθήσει στην πρόβλεψη των καλύτερων παραμέτρων που χρησιμοποιούνται για την ταξινόμηση του νέου κορονοϊού (covid-19). Συγκεκριμένα, Για να ξεπεράσουμε τις ελλείψεις στην υιοθέτηση προγραμμάτων μηχανικής μάθησης για τον χειρισμό κακόβουλων δεδομένων, χρησιμοποίησαν το Bayesian δίκτυο για να βοηθήσουν στην επιλογή χαρακτηριστικών και παραμέτρων που θα βοηθήσουν στη μειωμένη εξάπλωση και διάδοση της νόσου covid-19 με βελτιωμένη ανίχνευση και ακριβή ταξινόμηση. Έτσι, η μελέτη επιδιώκει να βοηθήσει τους ιατρούς με μια απόφαση που να υποστηρίζει συμπεράσματα από μια βάση δεδομένων που θα βοηθήσει στην πρόβλεψη πιθανών συμπτωμάτων εξάπλωσης και διάδοσης.[20]
Seamless Wikipedia browsing. On steroids.
Every time you click a link to Wikipedia, Wiktionary or Wikiquote in your browser's search results, it will show the modern Wikiwand interface.
Wikiwand extension is a five stars, simple, with minimum permission required to keep your browsing private, safe and transparent.