Επιστήμονες επιστρατεύουν τεχνητή νοημοσύνη για να ερμηνεύσουν το νόημα των γαβγισμάτων

Ερευνητές από το Πανεπιστήμιο του Μίσιγκαν επιστρατεύουν τεχνητή νοημοσύνη για να ερμηνεύσουν το νόημα των γαβγισμάτων και να καταλάβουν τι μεταφέρει το γάβγισμα ενός σκύλου σχετικά με το αν αισθάνεται παιχνιδιάρης ή θυμωμένος. Ερευνούν επίσης αν η τεχνητή νοημοσύνη θα μπορούσε να προσδιορίσει σωστά την ηλικία, το φύλο και τη φυλή ενός σκύλου με βάση το τι γαβγίζει.

Οι επιστήμονες κατάφεραν να σημειώσουν πρόοδο προς την αποκωδικοποίηση της επικοινωνίας των σκύλων επαναχρησιμοποιώντας υπάρχοντα μοντέλα υπολογιστών που εκπαιδεύτηκαν στην ανθρώπινη ομιλία.

«Οι εξελίξεις στην ΤΝ μπορούν να χρησιμοποιηθούν για να φέρουν επανάσταση στην κατανόηση της επικοινωνίας των ζώων», δήλωσε η επικεφαλής του Εργαστηρίου ΤΝ του Πανεπιστημίου του Μίσιγκαν, Rada Mihalcea. «Η έρευνά μας ανοίγει ένα νέο παράθυρο για το πώς μπορούμε να αξιοποιήσουμε ό,τι έχουμε χτίσει μέχρι σήμερα στην επεξεργασία ομιλίας για να αρχίσουμε να κατανοούμε τις αποχρώσεις των γαβγισμάτων των σκύλων».

Η τεχνητή νοημοσύνη έχει επιτρέψει να γίνουν μεγάλα βήματα στην κατανόηση των λεπτών σημείων της ομιλίας. Τα συστήματα που βασίζονται στην ΤΝ χρησιμοποιούνται για να διακρίνουν αποχρώσεις στον τόνο, το ύψος και την προφορά, γεγονός που με τη σειρά του επιτρέπει τεχνολογίες όπως το λογισμικό αναγνώρισης φωνής.

Έχουν φτάσει σε αυτό το επίπεδο πολυπλοκότητας με την εκπαίδευσή τους σε έναν τεράστιο αριθμό πραγματικών ανθρώπινων φωνών.

Ωστόσο, δεν υπάρχει ανάλογη βάση δεδομένων για τους σκύλους. «Οι φωνές των ζώων είναι πολύ πιο δύσκολο να ζητηθούν και να καταγραφούν», επισήμανε ο Artem Abzaliev, επικεφαλής συγγραφέας της μελέτης.

Η ομάδα του θέλησε να ανακαλύψει αν οι επιστήμονες θα μπορούσαν να παρακάμψουν αυτή την έλλειψη δεδομένων, στηριζόμενοι σε έρευνες που έχουν διεξαχθεί σε ανθρώπους. Έτσι, η ομάδα του συγκέντρωσε τα γαβγίσματα, τα γρυλίσματα και τα κλαψουρίσματα 74 σκύλων διαφόρων φυλών, ηλικιών και φύλων, σε διάφορα πλαίσια.

Τα τροφοδότησαν με ένα μοντέλο μηχανικής μάθησης – ένα είδος αλγορίθμου που εντοπίζει μοτίβα σε μεγάλα σύνολα δεδομένων – το οποίο είχε σχεδιαστεί για την ανάλυση της ανθρώπινης ομιλίας. Και διαπίστωσαν ότι έκανε επίσης καλή δουλειά στο να καταλαβαίνει στο τι επικοινωνούν και οι σκύλοι.

Κατά μέσο όρο, οι ερευνητές διαπίστωσαν ότι το μοντέλο τους ήταν κατά 70% ακριβές σε διάφορες δοκιμές.

«Είναι η πρώτη φορά που τεχνικές που έχουν βελτιστοποιηθεί για την ανθρώπινη ομιλία χρησιμοποιούνται για να βοηθήσουν στην αποκωδικοποίηση της επικοινωνίας των ζώων», δήλωσε η κ. Mihalcea.

«Τα αποτελέσματά μας δείχνουν ότι οι ήχοι και τα μοτίβα που προέρχονται από την ανθρώπινη ομιλία μπορούν να χρησιμεύσουν ως βάση για την ανάλυση και την κατανόηση των ακουστικών μοτίβων άλλων ήχων, όπως οι φωνές των ζώων». Οι ερευνητές λένε ότι τα ευρήματά τους θα μπορούσαν να έχουν «σημαντικές συνέπειες» για την ευημερία των ζώων.

Υποστηρίζουν ότι η καλύτερη κατανόηση των αποχρώσεων των διαφόρων θορύβων που κάνουν τα ζώα θα μπορούσε να βελτιώσει τον τρόπο με τον οποίο οι άνθρωποι ερμηνεύουν και ανταποκρίνονται στις συναισθηματικές και σωματικές τους ανάγκες.

Τα αποτελέσματα παρουσιάστηκαν στο Κοινό Διεθνές Συνέδριο για την Υπολογιστική Γλωσσολογία, τους Γλωσσικούς Πόρους και την Αξιολόγηση (Computational Linguistics, Language Resources and Evaluation.). Το Εθνικό Ινστιτούτο Αστροφυσικής, Οπτικής και Ηλεκτρονικής του Μεξικού συνεργάστηκε επίσης με το Πανεπιστήμιο του Μίσιγκαν στο έργο.