May 15, 2009

Bayes με 3 απλά παραδείγματα


Ας ξεκινήσουμε με μία κατάσταση που συναντούν στην καριέρα τους αρκετοί γιατροί.

Γνωρίζουμε ότι περίπου το 1% των γυναικών γύρω απο την ηλικία των 40 ετών έχουν καρκίνο του μαστού. Eπίσης το 80% των γυναικών με καρκίνο του μαστού, έχουν θετικό τεστ μαστογραφίας. Επιπλέον, το 9,6% των γυναικών χωρίς καρκίνο του μαστού, έχουν θετική μαστογραφία.

Έστω ότι σε τυχαίο έλεγχο, μία γυναίκα αυτής της ηλικιακής ομάδας βρίσκεται να έχει θετική μαστογραφία. Ποιά είναι η πιθανότητα να έχει καρκίνο του μαστού ?

Ποιά νομίζετε ότι είναι η απάντηση ? Αν δεν έχετε ασχοληθεί ξανά με αυτό το πρόβλημα, σκεφτείτε το για λίγο και προσπαθείστε να καταλήξετε στη δική σας εκτίμηση.

Αν δεν βρείτε την σωστή απάντηση, σίγουρα θα σας ανακουφίσει το γεγονός ότι το 85% των γιατρών δίνουν λάθος απάντηση σ' αυτό το πρόβλημα. Μόνο το 15% απαντούν σωστά, σύμφωνα με τις αξιόπιστες επιστημονικές έρευνες των Casscells, Schoenberger και Grayboys 1978, Eddy 1982, Gigerenzer and Hoffrage 1995 και πολλές άλλες. Είναι ένα καταπληκτικό επαναλήψιμο αποτέλεσμα, που επιβεβαιώνεται συνεχώς απο κάθε σχετική έρευνα!

Οι περισσότεροι απο τους γιατρούς δίνουν ως απάντηση ότι η σχετική πιθανότητα είναι μεταξύ 70% και 80%, η οποία απέχει πολύ απο το να είναι σωστή, δηλαδή είναι εξοργιστικά λανθασμένη !

Η σωστή απάντηση είναι 7,8%, και προκύπτει ως εξής. Σύμφωνα με τα προηγούμενα ποσοστιαία δεδομένα, σε κάθε 10.000 γυναίκες, οι 100 έχουν καρκίνο του μαστού, ενώ οι 80 απο αυτές τις 100 έχουν θετικές μαστογραφίες. Απο τις ίδιες 10.000 γυναίκες, οι 9,900 δεν θα έχουν καρκίνο του μαστού, αλλά όμως απο αυτές τις 9,900 γυναίκες, οι 950 θα έχουν ψευδώς θετικές μαστογραφίες. Συνεπώς ο συνολικός αριθμός των γυναικών με θετικές μαστογραφίες είναι 950+80, δηλαδή 1.030. Απο αυτές τις 1.030 γυναίκες με θετικές μαστογραφίες, οι 80 θα έχουν καρκίνο. Αν το εκφράσουμε σαν ποσοστό, έχουμε 80/1.030 ή 0,07767 ή 7,8% πιθανότητα !

Mε λίγα λόγια, πριν απο τον έλεγχο μαστογραφίας, οι 10,000 γυναίκες χωρίζονται σε δύο ομάδες:
Μετά τη μαστογραφία οι 10,000 γυναίκες χωρίζονται στις εξής 4 ομάδες:
Είναι εκπληκτικό ότι μόνο το 7,8% των γυναικών με θετική μαστογραφία έχουν καρκίνο, έπειτα απο τυχαίο έλεγχο. Σύμφωνα με τις προαναφερθείσες έρευνες είναι συνηθισμένο το σφάλμα των γιατρών να εστιάζονται μόνο στην Ομάδα A και δυστυχώς να αγνοούν την Ομάδα Γ, γιατί προφανώς μπερδεύονται με το ξεκαθάρισμα των πιθανοτήτων (ποσοστών). Αν ήσαν γνώστες του Θεωρήματος Bayes δεν θα είχαν αυτή τη δυσκολία, επειδή θα συνειδητοποιούσαν ότι το ποσοστό 7,8% έχει πιεστεί προς τα κάτω απο τις ψευδώς θετικές μαστογραφίες !

Το δεύτερο παράδειγμα αφορά την χρήση του κανόνα Βayes στα δικαστήρια!

Έστω ότι ένας μάρτυρας σε δικαστήριο είδε ένα έγκλημα σχετιζόμενο με ένα ταξί στην πόλη Carborough. Ο μάρτυρας λέει ότι το ταξί είναι μπλε. Είναι γνωστό απο προηγούμενες μελέτες ότι οι μάρτυρες έχουν δίκιο στο 80% των περιπτώσεων όταν κάνουν τέτοιες καταθέσεις. Επίσης η αστυνομία γνωρίζει ότι το 85% των ταξί στο Carborough είναι μπλε, ενώ το άλλο 15% είναι πράσινα. Ποιά είναι η πιθανότητα εμπλοκής στο έγκλημα ενός μπλε ταξί ?

Αν στην πραγματικότητα είχαμε την εμπλοκή ενός μπλε ταξί, η κατάθεση του μάρτυρα θα ανέφερε μπλε (με 80% πιθανότητα) ή πράσινο (με 20% πιθανότητα). Αν είχαμε την πραγματική εμπλοκή ενός πράσινου ταξί, ο μάρτυρας θα κατέθετε μπλε (με 20% πιθανότητα) ή πράσινο (με 80% πιθανότητα). Ο παρακάτω πίνακας δείχνει τις αναμενόμενες πιθανότητες (ποσοστά) για κάθε μία απο τις 4 περιπτώσεις.












Aν ο μάρτυρας κατέθεσε ότι είδε μπλε ταξί, βλέπουμε απο την σειρά που αντιστοιχεί στο μπλε ταξί του, ότι έχουμε 68+3 = 71 ισοπίθανα ενδεχόμενα και συνεπώς προκύπτει πιθανότητα εμπλοκής μπλε ταξί 68/71 = 96%.

Όμως το πιο ενδιαφέρον και παράλληλα εκπληκτικό αποτέλεσμα αφορά την περίπτωση κατά την οποία ο μάρτυρας καταθέτει για πράσινο ταξί. Για σκεφτείτε, ποια μπορεί να είναι η πιθανότητα εμπλοκής ενός πράσινου ταξί ?

Το συντριπτικό ποσοστό ερωτηθέντων σε έρευνες, εκτιμούν ότι υπάρχει 80% πιθανότητα εμπλοκής ενός πράσινου ταξί. Όμως αυτό είναι λάθος, σύμφωνα με τον εξής συλλογισμό :

Χρησιμοποιώντας την αντίστοιχη σειρά του παραπάνω πίνακα έχουμε 17+12 = 29 ισοπίθανα ενδεχόμενα και συνεπώς η πιθανότητα εμπλοκής ενός πράσινου ταξί είναι 12/29 = 41%. Τα ενδεχόμενα για τη σωστή κατάθεση (πράσινο ταξί), δυστυχώς σαρώνονται απο τα ενδεχόμενα των ανακριβών καταθέσεων για τα μπλε ταξί, και φυσικά οι καταθέσεις των μαρτύρων ΔΕΝ έχουν πρακτική αξία !

Θα προτιμούσα να μην θίξω καθόλου το ζήτημα αν ο κανόνας Bayes είναι γνωστός (πόσο μάλλον αν εφαρμόζεται) στα ελληνικά δικαστήρια !


Το τρίτο παράδειγμα αφορά την χρήση του κανόνα Βayes σε τηλεοπτικά παιχνίδια!

Πρόβλημα: Ας υποθέσουμε ότι είστε σε κάποιο τηλεοπτικό παιχνίδι, και ότι σας ζητούν να επιλέξετε μία απο 3 πόρτες. Το μόνο που γνωρίζετε είναι ότι πίσω απο τις πόρτες υπάρχουν 2 κατσίκες και 1 αυτοκίνητο. Επιλέγετε πρώτα μία πόρτα, ας πούμε την #1, και ο παρουσιαστής, που ξέρει τι υπάρχει πίσω απο τις πόρτες, ανοίγει μία άλλη πόρτα, ας πούμε την #3, που πίσω της έχει κατσίκα. Σας λέει λοιπόν: "Θέλετε να αλλάξετε και να επιλέξετε την πόρτα #2 ?"

Το ερώτημα είναι: Έχετε πλεονέκτημα στην περίπτωση που αλλάξετε επιλογή ?

Απάντηση: Αλλάζω επιλογή, γιατί έτσι διπλασιάζω τις ευνοϊκές για μένα πιθανότητες !

Μία απλή εξήγηση είναι η εξής. Η ΑΡΧΙΚΗ πόρτα που επιλέγω (ας πούμε η #1) έχει πιθανότητα 1/3 να κρύβει πίσω της το δώρο. ΑΛΛΑΖΩ επιλογή, επειδή οι 2 ΑΛΛΕΣ πόρτες (#2 και #3) έχουν ΜΑΖΙ πιθανότητα 2/3 να κρύβουν το δώρο. Όμως η μία απο αυτές τις 2 πόρτες απορρίπτεται (ας πούμε η #3), επειδή ο παρουσιαστής την άνοιξε γνωρίζοντας ότι έχει πίσω της κατσίκα. Συνεπώς αλλάζω και επιλέγω την πόρτα που απομένει (δηλαδή την #2), επειδή πλέον από ΜΟΝΗ της έχει πιθανότητα 2/3 να κρύβει το αυτοκίνητο !

Άλλες απλές εξηγήσεις, καθώς και η ανάλυση Bayes, καταλήγουν στο ίδιο αποτέλεσμα. Το συμπέρασμα είναι, ότι διπλασιάσαμε την ευνοϊκή για εμάς πιθανότητα με την απόφασή μας να αλλάξουμε επιλογή. Σε αυτό μας βοήθησε η επιπλέον πληροφορία (κατσίκα στη πόρτα #3).

Όμως υπάρχει άλλη μία καταπληκτική εκδοχή του παιχνιδιού. Ας πούμε ότι ο
παρουσιαστής ξεχνάει σε ποιά πόρτα βρίσκεται το δώρο. Επιλέγει λοιπόν, και ανοίγει στη τύχη, μία απο τις 2 πόρτες και με ανακούφιση διαπιστώνει ότι απο πίσω υπάρχει κατσίκα. Πως πρέπει να αντιδράσει ο διαγωνιζόμενος ?

Αφού ο παρουσιαστής δεν γνωρίζει τι κρύβουν οι πόρτες, δεν έχει πλέον σημασία αν ο διαγωνιζόμενος αλλάξει ή διατηρήσει την αρχική επιλογή του! Ο διαγωνιζόμενος αλλάζει την αρχική επιλογή του μόνο όταν ο παρουσιαστής γνωρίζει τι κρύβουν οι πόρτες !

Συμπερασματικά, η ουσία της
προσέγγισης του Bayes είναι ότι παρέχει την δυνατότητα να τροποποιούμε την γνώμη μας υπό το φως νέων πληροφοριών! Ουσιαστικά, μας επιτρέπει να συνδυάζουμε την υφιστάμενη γνώση με νεώτερα δεδομένα, χωρίς να διεκδικούμε κάποια απόλυτη αλήθεια.




ΥΓ1: Ακολουθεί ένα επεξηγηματικό video για τις πιθανότητες υπό συνθήκη και το Θεώρημα του Bayes






ΥΓ2: Στo παρακάτω video ξεδιπλώνεται το θεώρημα Bayes με ένα ωραίο παράδειγμα.








ΥΓ3: Aν κάποιοι ακόμα "πιστεύουν" ότι  P(A|B) = P(B|A) [δηλ. ότι η πιθανότητα του A δοθέντος του B = με την πιθανότητα του B δοθέντος του A], υπενθυμίστε τους ότι η πιθανότητα να είσαι έγκυος — με δεδομένο ότι είσαι θηλυκού φύλου — είναι   ∼3%, ενώ η πιθανότητα να είσαι θηλυκού φύλου — με δεδομένο ότι είσαι έγκυος — είναι αξιοσημείωτα μεγαλύτερη!   :)))


No comments: