20.8 C
Athens
Παρασκευή, 22 Νοεμβρίου, 2024

Αλγόριθμος γλώσσα: Το MIT αποκαλύπτει νέο αλγόριθμο που μαθαίνεις γλώσσες μόνο παρακολουθώντας βίντεο

Το Τεχνολογικό Ινστιτούτο της Μασαχουσέτης (MIT) εισήγαγε έναν καινοτόμο αλγόριθμο που μπορεί να μάθει γλώσσα μόνο παρακολουθώντας βίντεο. Ο Mark Hamilton, διδακτορικός φοιτητής στην ηλεκτρολόγια μηχανική και την επιστήμη των υπολογιστών, ηγείται αυτού του έργου μαζί με τους συναδέλφους του στο Εργαστήριο Επιστήμης Υπολογιστών και Τεχνητής Νοημοσύνης του MIT (CSAIL). Στόχος τους είναι να χρησιμοποιήσουν μηχανές για την αποκωδικοποίηση της επικοινωνίας των ζώων, ξεκινώντας από την κατάκτηση της ανθρώπινης γλώσσας.

mit2

Η έμπνευση για αυτόν τον νέο αλγόριθμο προήλθε από μια απροσδόκητη πηγή: την ταινία “March of the Penguins”. Σε μια σκηνή, ένας πιγκουίνος πέφτει και εκπέμπει ένα βογγητό καθώς προσπαθεί να σηκωθεί. Ο Χάμιλτον παρατήρησε ότι αυτό το βογγητό φαινόταν να υπονοεί μια λέξη, πυροδοτώντας την ιδέα ότι ο ήχος και το βίντεο θα μπορούσαν να χρησιμοποιηθούν μαζί για να διδάξουν τη γλώσσα σε έναν αλγόριθμο. Αυτή η ιδέα οδήγησε στη δημιουργία του DenseAV, ενός μοντέλου που σχεδιάστηκε για να μαθαίνει γλώσσα προβλέποντας οπτικό περιεχόμενο από τον ήχο και αντίστροφα. Για παράδειγμα, το άκουσμα της φράσης «ψήσε το κέικ στους 350» θα ωθούσε το μοντέλο να περιμένει γραφικά ενός κέικ ή ενός φούρνου.

Αλλά για να καταστεί δυνατή η αντιστοίχιση ήχου-βίντεο σε εκατομμύρια βίντεο, το DenseAV πρέπει να μάθει το πλαίσιο του τι συζητούν οι άνθρωποι. Αφού εκπαίδευσε το DenseAV σε αυτήν την εργασία αντιστοίχισης, η ερευνητική ομάδα εξέτασε σε ποια pixel εστίασε το μοντέλο κατά την επεξεργασία ήχων. Όταν αναφέρθηκε η λέξη “σκύλος”, ο αλγόριθμος αναζήτησε εικόνες σκύλου στη ροή βίντεο, υποδεικνύοντας ότι κατανοεί τη σημασία της λέξης. Ομοίως, όταν άκουσε ένα σκυλί να γαβγίζει, αναζήτησε σκυλιά στο βίντεο. Η ομάδα ήταν περίεργη αν το DenseAV μπορούσε να κάνει διάκριση μεταξύ της λέξης “σκύλος” και του ήχου ενός σκύλου που γαβγίζει. Δίνοντας στο DenseAV μια προσέγγιση διπλού εγκεφάλου, ανακάλυψαν ότι η μία πλευρά επικεντρωνόταν φυσικά στη γλώσσα, όπως η λέξη “σκύλος”, ενώ η άλλη επικεντρώθηκε στους ήχους, όπως το γάβγισμα.

Η ομάδα αντιμετώπισε ένα δύσκολο έργο στην εκμάθηση μιας γλώσσας χωρίς εισαγωγή κειμένου, καθώς στόχευε να ανακαλύψει ξανά την ουσία της γλώσσας από την αρχή χωρίς τη χρήση προεκπαιδευμένων γλωσσικών μοντέλων. Αυτή η μέθοδος εμπνέεται από το πώς τα παιδιά μαθαίνουν τη γλώσσα παρατηρώντας και ακούγοντας το περιβάλλον τους. Μια πιθανή εφαρμογή αυτής της τεχνολογίας είναι η εκμάθηση από τον τεράστιο όγκο περιεχομένου βίντεο που ανεβάζεται καθημερινά στο διαδίκτυο. Ο Χάμιλτον και η ομάδα του στοχεύουν στη δημιουργία συστημάτων που μπορούν να μάθουν από εκπαιδευτικά βίντεο και άλλο διαδικτυακό περιεχόμενο.

Μια άλλη ενδιαφέρουσα εφαρμογή είναι η κατανόηση νέων γλωσσών, όπως η επικοινωνία με δελφίνια ή φάλαινες, που δεν έχουν γραπτή μορφή. Η ομάδα ελπίζει ότι το DenseAV μπορεί να βοηθήσει στη μετάφραση αυτών των γλωσσών, οι οποίες έχουν διαφύγει εδώ και πολύ καιρό από την ανθρώπινη κατανόηση.

mit

“Ελπίζουμε ότι το DenseAV μπορεί να μας βοηθήσει να κατανοήσουμε αυτές τις γλώσσες που έχουν αποφύγει τις προσπάθειες ανθρώπινης μετάφρασης από την αρχή. Τέλος, ελπίζουμε ότι αυτή η μέθοδος μπορεί να χρησιμοποιηθεί για την ανακάλυψη μοτίβων μεταξύ άλλων ζευγών σημάτων, όπως οι σεισμικοί ήχοι που κάνει η γη και γεωλογία», είπε ο Χάμιλτον σε δήλωση.

Συντάκτης

Δείτε Επίσης

Τελευταία άρθρα