Αναγνώριση κατάθλιψης με AI: Συνδυασμός φωνής και εγκεφαλικής δραστηριότητας

Η κατάθλιψη είναι μια από τις πιο διαδεδομένες ψυχικές διαταραχές παγκοσμίως, πλήττοντας περίπου 280 εκατομμύρια ανθρώπους. Η έγκαιρη διάγνωσή της είναι κρίσιμη για την αποτελεσματική θεραπεία, ωστόσο, παραδοσιακές μέθοδοι διάγνωσης βασίζονται κυρίως σε συνεντεύξεις και ψυχολογικές εξετάσεις, οι οποίες συχνά εξαρτώνται από την υποκειμενική κρίση του ιατρού και του ασθενούς.

Όμως, οι ερευνητές του Πανεπιστημίου Τεχνολογίας του Κάουνας (KTU) στην Λιθουανία ανέπτυξαν μια νέα καινοτόμο μέθοδο, χρησιμοποιώντας την τεχνητή νοημοσύνη (AI) για να ενσωματώσουν και να αναλύσουν δεδομένα από δύο διαφορετικές πηγές: τη φωνή και τη νευρική δραστηριότητα του εγκεφάλου, με εντυπωσιακά αποτελέσματα.

Η καινοτομία αυτής της μελέτης έγκειται στη χρήση δύο διαφορετικών τύπων δεδομένων: της φωνής και της εγκεφαλικής δραστηριότητας (EEG). Η ανάλυση των δεδομένων από τη φωνή και τα εγκεφαλικά κύματα επιτρέπει στους επιστήμονες να αποκτούν περισσότερες και ακριβείς πληροφορίες για την συναισθηματική κατάσταση του ατόμου, προσφέροντας έτσι μια πιο αξιόπιστη διάγνωση. Ο καθηγητής Rytis Maskeliūnas, επικεφαλής της έρευνας, δήλωσε ότι ο συνδυασμός αυτών των δύο δεδομένων επιτυγχάνει εντυπωσιακή ακρίβεια 97,53% στην ανίχνευση της κατάθλιψης, ξεπερνώντας άλλες μεθόδους διάγνωσης.

Η φωνή του ατόμου έχει αποδειχτεί ότι μπορεί να αποκαλύψει σημαντικές πληροφορίες για την ψυχική του κατάσταση. Στην περίπτωση της κατάθλιψης, η ταχύτητα ομιλίας, η τονικότητα και η ενέργεια που διαπνέουν την ομιλία είναι ενδείξεις που μπορεί να διαφέρουν από τις φυσιολογικές. Η ερευνητική ομάδα εξήγησε ότι η φωνή, σε αντίθεση με άλλες παραμέτρους όπως η έκφραση του προσώπου, είναι λιγότερο εύκολο να παραποιηθεί ή να κρυφτεί, καθιστώντας την αξιόπιστο εργαλείο για την ανίχνευση της κατάθλιψης​

Η ανάλυση αυτών των δεδομένων γίνεται μέσω του μοντέλου τεχνητής νοημοσύνης DenseNet-121, το οποίο έχει τροποποιηθεί για να επεξεργάζεται τα δεδομένα σε μορφή εικόνας. Το EEG και η φωνή μετατρέπονται σε “σπεκτρογράμματα” (γραφικές απεικονίσεις της συχνότητας και έντασης του ήχου και των κυμάτων του εγκεφάλου), και στη συνέχεια το μοντέλο εξετάζει αυτές τις εικόνες για να εντοπίσει σημάδια κατάθλιψης. Οι ερευνητές χρησιμοποίησαν ειδικά φίλτρα για την απομάκρυνση του θορύβου και τη σύγκριση των δεδομένων, κάνοντας τα πιο αξιόπιστα και εύκολα αναλύσιμα​

Αυτή η διαδικασία επιτρέπει στην AI να αναγνωρίσει μικροσκοπικές αλλαγές στα δεδομένα που μπορεί να υποδηλώνουν την παρουσία κατάθλιψης, προσφέροντας έτσι μια πιο αξιόπιστη και αντικειμενική διάγνωση, σε σχέση με τις παραδοσιακές μεθόδους, που βασίζονται μόνο σε υποκειμενικές εντυπώσεις και συμπεράσματα από κλινικές συνεντεύξεις.

Η νέα αυτή προσέγγιση ανοίγει νέους δρόμους για τη διάγνωση της κατάθλιψης και άλλων ψυχικών διαταραχών. Ένα από τα κύρια πλεονεκτήματα αυτής της τεχνολογίας είναι η δυνατότητα να παρέχεται μια αξιόπιστη και γρήγορη διάγνωση, ακόμη και εξ αποστάσεως, κάτι που καθιστά τη διαδικασία πιο προσβάσιμη και λιγότερο χρονοβόρα. Επιπλέον, η AI ενδέχεται να μειώσει τις υποκειμενικές εκτιμήσεις του θεραπευτή, προσφέροντας ένα πιο ακριβές εργαλείο για την ανίχνευση της κατάθλιψης​

Ωστόσο, η τεχνητή νοημοσύνη στην ψυχική υγεία δεν έρχεται χωρίς προκλήσεις. Ένα από τα μεγαλύτερα εμπόδια είναι η συλλογή επαρκών δεδομένων για την εκπαίδευση του αλγορίθμου, καθώς οι άνθρωποι συχνά δεν είναι πρόθυμοι να αποκαλύψουν τις ψυχικές τους δυσκολίες.

Παράλληλα, η ανάγκη για εξηγήσιμη τεχνητή νοημοσύνη (Explainable AI – XAI) είναι επιτακτική, ώστε οι χρήστες να μπορούν να κατανοούν πώς και γιατί η AI κατέληξε σε μια συγκεκριμένη διάγνωση. Η διαφάνεια στην απόφαση αυτή είναι σημαντική, καθώς ενισχύει την εμπιστοσύνη των ιατρών και των ασθενών στο σύστημα​

Η έρευνα που πραγματοποιήθηκε στο Πανεπιστήμιο Τεχνολογίας του Κάουνας θέτει τα θεμέλια για μια επαναστατική προσέγγιση στην ψυχική υγεία, χρησιμοποιώντας τεχνολογία αιχμής για την ακριβή διάγνωση της κατάθλιψης. Με τη συνεχιζόμενη ανάπτυξη αυτών των εργαλείων και τη βελτίωση των αλγορίθμων, η AI μπορεί να αποτελέσει ένα ισχυρό σύμμαχο στη μάχη κατά της κατάθλιψης, παρέχοντας στους γιατρούς και στους ασθενείς μια πιο αξιόπιστη και αντικειμενική διάγνωση.

Το μέλλον φαίνεται ελπιδοφόρο για την ενσωμάτωση της AI στην ψυχική υγειονομική περίθαλψη, αλλά απαιτεί περαιτέρω κλινικές δοκιμές και βελτιώσεις για να γίνει μια πλήρως αξιόπιστη και εξηγήσιμη διαδικασία διάγνωσης.

Το άρθρο με τίτλο Multimodal Fusion of EEG and Audio Spectrogram for Major Depressive Disorder Recognition Using Modified DenseNet121 δημοσιεύθηκε στο Brain Sciences Journal.