Scrivi la parola “dog” su Google Translate per 19 volte, e chiedi a Google di tradurre il messaggio dal Maori all’inglese: ecco spuntare quella che sembra essere una ingarbugliata profezia religiosa.
“Sull’Orologio dell’Apocalisse mancano tre minuti alla mezzanotte,” si legge. “Stiamo venendo attraverso da dei personaggi e da dei cambiamenti drammatici nel mondo, che indicano che ci stiamo sempre di più avvicinando alla fine dei tempi e al ritorno di Gesù.”
Videos by VICE
Questa è solo una delle varie bizzarre e assurde traduzioni che degli utenti su Reddit hanno recuperato da Google Translate, il servizio di traduzione di Google che oggi può interpretare messaggi in oltre 100 lingue. In Somalo, ad esempio, le stringhe della parola “ag” si traducono in missive circa i “figli di Gershon,” il “nome del SIGNORE,” e a riferimenti a terminologia biblica come “cubiti” e il Deuteronomio.
Su Twitter, diverse persone hanno fatto risalire queste strane traduzioni a fantasmi e demoni. Gli utenti di una subreddit chiamata TranslateGate hanno speculato che alcuni di questi strani output potrebbero derivare da frammenti di testo provenienti da email o messaggi privati.
“Google Translate impara da degli esempi di traduzione presenti sul web e non usa i ‘messaggi privati’ per elaborare le sue traduzioni, e per di più il sistema non ha nemmeno accesso a quel tipo di contenuto,” ha spiegato in una mail Justin Burr, portavoce di Google. “Questo fenomeno accade semplicemente inserendo delle frasi prive di senso nel sistema, che restituisce delle traduzioni prive di senso.”
Quando Motherboard ha fornito a Google degli esempi di traduzioni inquietanti, quelle traduzioni sono scomparse da Google Translate.
Ci sono diverse spiegazioni possibili per questi strani risultati. È possibile che i messaggi siano il risultato di un’azione di alcuni dipendenti Google scontenti, per esempio, o che degli utenti malintenzionati stiano abusando del bottone “Suggerisci una traduzione,” che accetta delle traduzioni migliori per un dato testo.
Alexander Rush, un assistente professore di Harvard che ha studiato il natural language processing e le traduzioni computerizzate, ha detto che i filtri di qualità interni probabilmente avrebbero individuato questo tipo di manipolazione delle traduzioni. È più probabile, ha detto Rush, che le strane traduzioni siano collegate a delle modifiche che Google Translate ha compiuto diversi anni fa, quando ha cominciato a utilizzare una tecnica conosciuta come “neural machine translation.”
Con il neural machine translation, il sistema è addestrato con una grande quantità di testo in un linguaggio e con le corrispondenti traduzioni in un altro linguaggio, al fine di creare un modello utile a muoversi tra le due lingue. Quando viene ingozzato di input senza senso, spiega Rush, il sistema può avere delle “allucinazioni” e può tirare fuori delle traduzioni bizzarre — in maniera non troppo differente da come Google DeepDream identifica e accentua i pattern delle immagini.
“I modelli sono delle black-box, e vengono appresi a partire da tutte le istanze di addestramento che è possibile recuperare,” ha spiegato Rush. “La grande maggioranza di queste istanze assomiglia al linguaggio umano, e quando gliene fornisci un’altra, il modello è addestrato per produrre qualcosa di nuovo che, a tutti i costi, assomigli al linguaggio umano. Ciononostante, se gli fornisci qualcosa di molto diverso, la traduzione migliore sarà fluente, ma in nessun modo collegabile all’input di partenza.”
Sean Colbath, scienziato senior di BBN Technologies e che lavora sulle traduzioni computerizzate, è d’accordo nell’affermare che gli strani output siano dovuti probabilmente al fatto che l’algoritmo di Google Translate stia cercando di trovare l’ordine nel caos. Ha anche indicato che i linguaggi che generano i risultati più strani — il somalo, l’hawaiano e il maori — hanno una minore quantità di testo tradotto a cui attingere rispetto ai linguaggi più parlati come l’inglese o il cinese. Il risultato, ha spiegato, è che diventa possibile che Google abbia usato dei testi religiosi come la Bibbia, che sono stati tradotti in molte lingue, per addestrare il suo modello in questi linguaggi, producendo così dei contenuti di stampo religioso.
Rush ha convenuto sul fatto che l’utilizzo della Bibbia per addestrare il proprio modello, potrebbe spiegare alcuni degli strani output. Infatti, molte delle strane traduzioni in somalo assomigliano a passaggi specifici dall’Antico Testamento.
Burr, il portavoce di Google, non ha voluto rilasciare dichiarazioni circa la possibilità che Google Translate usi come materiale per l’addestramento dei testi religiosi.
Questo articolo è apparso originariamente su Motherboard US.