Η Σάρα Εζέκιελ έχασε τη φωνή της πριν από 25 χρόνια, όταν διαγνώστηκε με νόσο του κινητικού νευρώνα σε ηλικία 34 ετών
Μια Βρετανίδα με νόσο του κινητικού νευρώνα, η οποία είχε χάσει την ικανότητα να μιλά, κατάφερε να ξαναβρεί τη φωνή της με τη βοήθεια της τεχνητής νοημοσύνης και ένα ηχητικό απόσπασμα μόλις οκτώ δευτερολέπτων από ένα παλιό οικογενειακό βίντεο.
Η Σάρα Εζέκιελ, καλλιτέχνης, έχασε τη φωνή της πριν από 25 χρόνια, όταν διαγνώστηκε με νόσο του κινητικού νευρώνα σε ηλικία 34 ετών, ενώ ήταν έγκυος στο δεύτερό της παιδί. Η νόσος προκαλεί σταδιακή φθορά σε μέρη του νευρικού συστήματος και μπορεί να οδηγήσει σε εξασθένηση των μυών της γλώσσας, του στόματος και του λαιμού, με αποτέλεσμα κάποιοι ασθενείς να χάνουν πλήρως την ικανότητα ομιλίας. Στα χρόνια που ακολούθησαν τη διάγνωσή της, η Σάρα από το βόρειο Λονδίνο κατάφερε να επικοινωνεί με τη βοήθεια υπολογιστή και τεχνολογίας συνθετικής φωνής — όμως η φωνή αυτή δεν έμοιαζε καθόλου με τη δική της.
Κατάφερε επίσης να συνεχίσει την καριέρα της ως καλλιτέχνης χρησιμοποιώντας έναν κέρσορα υπολογιστή για να δημιουργεί εικόνες. Αλλά τα δύο παιδιά της, η Αβίβα και ο Έρικ, μεγάλωσαν χωρίς να γνωρίζουν πώς κάποτε η μητέρα τους μπορούσε να μιλήσει. Τα τελευταία χρόνια, οι ειδικοί αξιοποιούν ολοένα και περισσότερο την τεχνολογία για να αναδημιουργήσουν ψηφιακά την αυθεντική φωνή ενός ατόμου. Ωστόσο, η μέθοδος αυτή συνήθως απαιτεί εκτενείς και υψηλής ποιότητας ηχογραφήσεις και, ακόμη και τότε, τα αποτελέσματα συχνά ήταν “επίπεδα και μονότονα”, σύμφωνα με τον Σάιμον Πουλ από τη βρετανική εταιρεία ιατρικής επικοινωνίας Smartbox.
Ο Σάιμον Πουλ δήλωσε στο AFP ότι αρχικά η εταιρεία είχε ζητήσει από τη Σάρα μια ηχογράφηση διάρκειας μίας ώρας. Άνθρωποι που κινδυνεύουν να χάσουν την ικανότητα ομιλίας λόγω ασθενειών όπως η νόσος του κινητικού νευρώνα ενθαρρύνονται σήμερα να ηχογραφούν τη φωνή τους όσο το δυνατόν νωρίτερα, ώστε να διατηρήσουν την “ταυτότητά” τους μαζί με τη δυνατότητα επικοινωνίας. Ωστόσο, πριν από την εποχή των smartphones, η ύπαρξη κατάλληλων ηχητικών αρχείων ήταν πολύ πιο σπάνια. Όταν η Σάρα κατάφερε να βρει μόνο ένα σύντομο και κακής ποιότητας απόσπασμα, ο Πουλ παραδέχτηκε ότι απογοητεύτηκε.
«Παραλίγο να κλάψω»
Το ηχητικό απόσπασμα, προερχόμενο από ένα οικιακό βίντεο της δεκαετίας του 1990, διαρκούσε μόλις οκτώ δευτερόλεπτα, ήταν υπόκωφο και περιείχε θόρυβο από τηλεόραση στο παρασκήνιο. Ο Σάιμον Πουλ στράφηκε τότε στην τεχνολογία της ElevenLabs, μιας εταιρείας τεχνητής νοημοσύνης με έδρα τη Νέα Υόρκη, εξειδικευμένη στην αναπαραγωγή φωνών. Η τεχνολογία τους όχι μόνο μπορεί να δημιουργήσει μια φωνή από ελάχιστο υλικό, αλλά και να της προσδώσει ρεαλιστικότητα και φυσικότητα. Ο Πουλ χρησιμοποίησε ένα εργαλείο τεχνητής νοημοσύνης για να απομονώσει τη φωνή από το βίντεο και ένα δεύτερο, εκπαιδευμένο σε φυσικές φωνές, για να συμπληρώσει τα κενά και να παραγάγει τον τελικό ήχο. Το αποτέλεσμα, προς μεγάλη ικανοποίηση της Σάρα Εζέκιελ, ήταν εντυπωσιακά πιστό στο πρωτότυπο – με την αυθεντική λονδρέζικη προφορά και το ελαφρύ ψιθύρισμα που κάποτε η ίδια δεν άντεχε να ακούει.
“Της έστειλα τα δείγματα και μου απάντησε με ένα email, λέγοντας πως παραλίγο να δακρύσει όταν τα άκουσε”, ανέφερε ο Πουλ. “Μου είπε ότι τα έπαιξε σε μια φίλη της, η οποία την γνώριζε πριν χάσει τη φωνή της, και ήταν σαν να είχε ξαναβρεί την αυθεντική της φωνή”, πρόσθεσε. Σύμφωνα με την Ένωση για τη Νόσο του Κινητικού Νευρώνα στο Ηνωμένο Βασίλειο, οκτώ στους δέκα ασθενείς αντιμετωπίζουν δυσκολίες στην ομιλία μετά τη διάγνωση. Ωστόσο, ο συγχρονισμός, το ύψος και ο τόνος των φωνών που παράγονται σήμερα μέσω υπολογιστή μπορεί να ακούγονται αρκετά ρομποτικοί.
«Η πραγματική καινοτομία με αυτήν τη νέα τεχνολογία τεχνητής νοημοσύνης είναι ότι οι φωνές γίνονται πραγματικά ανθρώπινες και εκφραστικές, επαναφέροντας την ανθρωπιά σε μια φωνή που παλαιότερα ακουγόταν ψυχρή και υπολογιστική”, δήλωσε ο Πουλ. Πρόσθεσε ότι η εξατομίκευση της φωνής αποτελεί έναν τρόπο διατήρησης της “ταυτότητας” του ατόμου. “Ιδιαίτερα όταν κάποιος αποκτά μια ασθένεια αργότερα στη ζωή και χάνει τη φωνή του, το να μπορεί να μιλά χρησιμοποιώντας την πραγματική, αρχική φωνή του έχει τεράστια σημασία, αντί να χρησιμοποιεί μια ξένη φωνή», σημείωσε.
Σύνοψη άρθρου
- Η Σάρα Εζέκιελ, που είχε χάσει τη φωνή της λόγω νόσου του κινητικού νευρώνα, ξαναβρήκε τη φωνή της μέσω τεχνητής νοημοσύνης.
- Η βρετανική εταιρεία Smartbox και η ElevenLabs χρησιμοποίησαν τεχνολογία AI για να αναδημιουργήσουν τη φωνή της Σάρα από ένα ηχητικό απόσπασμα 8 δευτερολέπτων.
- Η νέα τεχνολογία AI επιτρέπει τη δημιουργία φωνών που ακούγονται πιο ανθρώπινες και εκφραστικές, επαναφέροντας την αυθεντικότητα και την ταυτότητα του ατόμου.
- Η εμπειρία της Σάρα αποδεικνύει τη σημασία της διατήρησης της αυθεντικής φωνής για άτομα που χάνουν την ικανότητα ομιλίας λόγω ασθενειών.
Δημοφιλή
Ηράκλειο: Σοκ για γαμπρό στις Μαλάδες - Η νύφη ήταν... ο πεθερός του! Δείτε βίντεο
Θλίψη στην Μεσαρά για τον χαμό του αγαπητού δασκάλου
Αν γεννήθηκες μία από αυτές τις 6 μέρες τότε σε περιμένουν πολλά λεφτά
Ιερέας εκτός εαυτού μπούκαρε σε καφετέρια όταν είδε την 14χρονη κόρη του με νεαρό
Τραγωδία στην άσφαλτο: Νεκρός 45χρονος μοτοσικλετιστής - Η μηχανή του «καρφώθηκε» με μεγάλη ταχύτητα σε φανάρι
Κρήτη: Έρχονται αλλαγές με συγχωνεύσεις στα νοσοκομεία του Λασιθίου – Τι προβλέπει η εγκύκλιος του Υπουργείου Υγείας
Θλίψη στη Μεσαρά για τον θάνατο του Λεωνίδα Σταθωράκη
Τραγωδία στη Σαντορίνη: Πνίγηκε παιδάκι 4 ετών σε πισίνα
Εργάστηκε μόλις 90 λεπτά, απολύθηκε και το δικαστήριο του επιδίκασε αποζημίωση 120.000€!