Η Σάρα Εζέκιελ έχασε τη φωνή της πριν από 25 χρόνια, όταν διαγνώστηκε με νόσο του κινητικού νευρώνα σε ηλικία 34 ετών
Μια Βρετανίδα με νόσο του κινητικού νευρώνα, η οποία είχε χάσει την ικανότητα να μιλά, κατάφερε να ξαναβρεί τη φωνή της με τη βοήθεια της τεχνητής νοημοσύνης και ένα ηχητικό απόσπασμα μόλις οκτώ δευτερολέπτων από ένα παλιό οικογενειακό βίντεο.
Η Σάρα Εζέκιελ, καλλιτέχνης, έχασε τη φωνή της πριν από 25 χρόνια, όταν διαγνώστηκε με νόσο του κινητικού νευρώνα σε ηλικία 34 ετών, ενώ ήταν έγκυος στο δεύτερό της παιδί. Η νόσος προκαλεί σταδιακή φθορά σε μέρη του νευρικού συστήματος και μπορεί να οδηγήσει σε εξασθένηση των μυών της γλώσσας, του στόματος και του λαιμού, με αποτέλεσμα κάποιοι ασθενείς να χάνουν πλήρως την ικανότητα ομιλίας. Στα χρόνια που ακολούθησαν τη διάγνωσή της, η Σάρα από το βόρειο Λονδίνο κατάφερε να επικοινωνεί με τη βοήθεια υπολογιστή και τεχνολογίας συνθετικής φωνής — όμως η φωνή αυτή δεν έμοιαζε καθόλου με τη δική της.
Κατάφερε επίσης να συνεχίσει την καριέρα της ως καλλιτέχνης χρησιμοποιώντας έναν κέρσορα υπολογιστή για να δημιουργεί εικόνες. Αλλά τα δύο παιδιά της, η Αβίβα και ο Έρικ, μεγάλωσαν χωρίς να γνωρίζουν πώς κάποτε η μητέρα τους μπορούσε να μιλήσει. Τα τελευταία χρόνια, οι ειδικοί αξιοποιούν ολοένα και περισσότερο την τεχνολογία για να αναδημιουργήσουν ψηφιακά την αυθεντική φωνή ενός ατόμου. Ωστόσο, η μέθοδος αυτή συνήθως απαιτεί εκτενείς και υψηλής ποιότητας ηχογραφήσεις και, ακόμη και τότε, τα αποτελέσματα συχνά ήταν “επίπεδα και μονότονα”, σύμφωνα με τον Σάιμον Πουλ από τη βρετανική εταιρεία ιατρικής επικοινωνίας Smartbox.
Ο Σάιμον Πουλ δήλωσε στο AFP ότι αρχικά η εταιρεία είχε ζητήσει από τη Σάρα μια ηχογράφηση διάρκειας μίας ώρας. Άνθρωποι που κινδυνεύουν να χάσουν την ικανότητα ομιλίας λόγω ασθενειών όπως η νόσος του κινητικού νευρώνα ενθαρρύνονται σήμερα να ηχογραφούν τη φωνή τους όσο το δυνατόν νωρίτερα, ώστε να διατηρήσουν την “ταυτότητά” τους μαζί με τη δυνατότητα επικοινωνίας. Ωστόσο, πριν από την εποχή των smartphones, η ύπαρξη κατάλληλων ηχητικών αρχείων ήταν πολύ πιο σπάνια. Όταν η Σάρα κατάφερε να βρει μόνο ένα σύντομο και κακής ποιότητας απόσπασμα, ο Πουλ παραδέχτηκε ότι απογοητεύτηκε.
«Παραλίγο να κλάψω»
Το ηχητικό απόσπασμα, προερχόμενο από ένα οικιακό βίντεο της δεκαετίας του 1990, διαρκούσε μόλις οκτώ δευτερόλεπτα, ήταν υπόκωφο και περιείχε θόρυβο από τηλεόραση στο παρασκήνιο. Ο Σάιμον Πουλ στράφηκε τότε στην τεχνολογία της ElevenLabs, μιας εταιρείας τεχνητής νοημοσύνης με έδρα τη Νέα Υόρκη, εξειδικευμένη στην αναπαραγωγή φωνών. Η τεχνολογία τους όχι μόνο μπορεί να δημιουργήσει μια φωνή από ελάχιστο υλικό, αλλά και να της προσδώσει ρεαλιστικότητα και φυσικότητα. Ο Πουλ χρησιμοποίησε ένα εργαλείο τεχνητής νοημοσύνης για να απομονώσει τη φωνή από το βίντεο και ένα δεύτερο, εκπαιδευμένο σε φυσικές φωνές, για να συμπληρώσει τα κενά και να παραγάγει τον τελικό ήχο. Το αποτέλεσμα, προς μεγάλη ικανοποίηση της Σάρα Εζέκιελ, ήταν εντυπωσιακά πιστό στο πρωτότυπο – με την αυθεντική λονδρέζικη προφορά και το ελαφρύ ψιθύρισμα που κάποτε η ίδια δεν άντεχε να ακούει.
“Της έστειλα τα δείγματα και μου απάντησε με ένα email, λέγοντας πως παραλίγο να δακρύσει όταν τα άκουσε”, ανέφερε ο Πουλ. “Μου είπε ότι τα έπαιξε σε μια φίλη της, η οποία την γνώριζε πριν χάσει τη φωνή της, και ήταν σαν να είχε ξαναβρεί την αυθεντική της φωνή”, πρόσθεσε. Σύμφωνα με την Ένωση για τη Νόσο του Κινητικού Νευρώνα στο Ηνωμένο Βασίλειο, οκτώ στους δέκα ασθενείς αντιμετωπίζουν δυσκολίες στην ομιλία μετά τη διάγνωση. Ωστόσο, ο συγχρονισμός, το ύψος και ο τόνος των φωνών που παράγονται σήμερα μέσω υπολογιστή μπορεί να ακούγονται αρκετά ρομποτικοί.
«Η πραγματική καινοτομία με αυτήν τη νέα τεχνολογία τεχνητής νοημοσύνης είναι ότι οι φωνές γίνονται πραγματικά ανθρώπινες και εκφραστικές, επαναφέροντας την ανθρωπιά σε μια φωνή που παλαιότερα ακουγόταν ψυχρή και υπολογιστική”, δήλωσε ο Πουλ. Πρόσθεσε ότι η εξατομίκευση της φωνής αποτελεί έναν τρόπο διατήρησης της “ταυτότητας” του ατόμου. “Ιδιαίτερα όταν κάποιος αποκτά μια ασθένεια αργότερα στη ζωή και χάνει τη φωνή του, το να μπορεί να μιλά χρησιμοποιώντας την πραγματική, αρχική φωνή του έχει τεράστια σημασία, αντί να χρησιμοποιεί μια ξένη φωνή», σημείωσε.
Σύνοψη άρθρου
- Η Σάρα Εζέκιελ, που είχε χάσει τη φωνή της λόγω νόσου του κινητικού νευρώνα, ξαναβρήκε τη φωνή της μέσω τεχνητής νοημοσύνης.
- Η βρετανική εταιρεία Smartbox και η ElevenLabs χρησιμοποίησαν τεχνολογία AI για να αναδημιουργήσουν τη φωνή της Σάρα από ένα ηχητικό απόσπασμα 8 δευτερολέπτων.
- Η νέα τεχνολογία AI επιτρέπει τη δημιουργία φωνών που ακούγονται πιο ανθρώπινες και εκφραστικές, επαναφέροντας την αυθεντικότητα και την ταυτότητα του ατόμου.
- Η εμπειρία της Σάρα αποδεικνύει τη σημασία της διατήρησης της αυθεντικής φωνής για άτομα που χάνουν την ικανότητα ομιλίας λόγω ασθενειών.
Δημοφιλή
Θλίψη στο Ηράκλειο για τον θάνατο του αγαπητού «Χουμά»
Πένθος στην Κρήτη: Έφυγε από την ζωή ο ακτινολόγος Ιωάννης Μακαρώνας
Θλίψη-Έφυγε από τη ζωή γνωστός γεωπόνος στην Κρήτη
Πρόωρες εκλογές το 2026; Ο κυβερνητικός αιφνιδιασμός, τα νέα κόμματα και η επιστροφή... «βόμβα» στο ΠΑΣΟΚ
Πένθος στη Μεσαρά: Σήμερα το τελευταίο αντίο στον Στράτο Καμπουράκη
Σοκ σε χωριό: Πυροβόλησε τον αδερφό του για κτηματικές διαφορές
Σύνταξη χηρείας: Πότε κόβεται στο μισό - Ποιες είναι οι εξαιρέσεις
Τραγωδία στην Αταλάντη: Πήγαινε να κάνει έκπληξη στην οικογένειά της η 32χρονη που σκοτώθηκε στο τροχαίο
Πένθος στο Λασίθι: Έφυγε από τη ζωή ο Νίκος Λαζαράκης - Σήμερα η κηδεία του