I ricercatori di Facebook usano la matematica per traduzioni migliori

Tempo di lettura: 3 minuti

I ricercatori di affermano che trasformare le parole in cifre e sfruttare le somiglianze matematiche tra le lingue è una strada promettente, anche se un comunicatore universale alla Star Trek rimane un sogno lontano.

Una potente traduzione automatica è una grande priorità per i giganti di . Consentire a quante più persone possibili in tutto il mondo di comunicare non è solo un obiettivo altruistico, ma anche buoni affari.

Facebook, e Microsoft, nonché la russa Yandex, la cinese Baidu e altri sono costantemente alla ricerca del miglioramento dei loro strumenti di traduzione.

Facebook ha esperti di sul posto di lavoro in uno dei suoi laboratori di ricerca a Parigi.

Su Facebook sono attualmente utilizzate fino a 200 lingue, afferma Antoine Bordes, condirettore europeo della ricerca fondamentale sull’IA per i .

La traduzione automatica si basa attualmente sull’avere a disposizione grandi database di testi identici in entrambe le lingue. Ma per molte combinazioni linguistiche non ci sono abbastanza testi paralleli.

Ecco perché i ricercatori hanno cercato un altro metodo, come il sistema sviluppato da Facebook che crea una rappresentazione matematica delle parole.

Ogni parola diventa un “vettore” in uno spazio di diverse centinaia di dimensioni. Le parole che hanno strette associazioni nella lingua parlata si trovano anche vicine l’una all’altra in questo spazio vettoriale.

“Ad esempio, se prendi le parole” gatto “e” cane “, semanticamente, sono parole che descrivono una cosa simile, quindi saranno estremamente vicine tra loro fisicamente” nello spazio vettoriale, ha detto Guillaume Lample, uno dei sistemi progettisti.

“Se prendi parole come Madrid, Londra, Parigi, che sono le capitali europee, è la stessa idea.”

Queste mappe linguistiche possono quindi essere collegate tra loro tramite algoritmi — inizialmente approssimativamente, ma alla fine diventano più raffinati, fino a quando non è possibile abbinare intere frasi senza troppi errori.

Lample ha detto che i risultati sono già promettenti.

Per la coppia di lingue inglese-rumeno, l’attuale sistema di traduzione automatica di Facebook è “uguale o forse un po ‘peggio” del sistema di parole vettoriali, ha detto Lample.

Ma per la coppia di lingue più rare inglese-urdu, dove il sistema tradizionale di Facebook non ha molti testi bilingui a cui fare riferimento, il sistema di parole vettoriali è già superiore, ha detto.

Ma il metodo potrebbe consentire la traduzione, per esempio, dal basco nella lingua di una tribù amazzonica?

In teoria, sì, disse Lample, ma in pratica è necessario un ampio corpus di testi scritti per mappare la lingua, qualcosa che manca nelle lingue tribali amazzoniche.

“Se hai solo decine di migliaia di frasi, non funzionerà. Hai bisogno di diverse centinaia di migliaia”, ha detto.

‘Santo Graal’

Gli esperti del centro scientifico nazionale del CNRS in Francia hanno affermato che l’approccio adottato da Lample per Facebook potrebbe produrre risultati utili, anche se non risulta in traduzioni perfette.

Thierry Poibeau del laboratorio Lattice del CNRS, che fa anche ricerche sulla traduzione automatica, ha definito l’approccio vettoriale parola “una rivoluzione concettuale”.

Ha detto che “tradurre senza dati paralleli” – dizionari o versioni degli stessi documenti in entrambe le lingue – “è qualcosa del Santo Graal” della traduzione automatica.

“Ma la domanda è quale livello di prestazioni ci si può aspettare” dal metodo vettore parola, ha detto Poibeau.

Il metodo “può dare un’idea del testo originale” ma la capacità di una buona traduzione ogni volta rimane non dimostrata.

Francois Yvon, ricercatore presso il Laboratorio di per la meccanica e le scienze ingegneristiche del CNRS, ha affermato che “il collegamento delle lingue è molto più difficile” quando sono molto distanti tra loro.

“Il modo di indicare concetti in cinese è completamente diverso dal francese”, ha aggiunto.

Tuttavia, anche le traduzioni imperfette possono essere utili, ha affermato Yvon, e potrebbero rivelarsi sufficienti per tracciare il discorso dell’odio, una delle maggiori priorità per Facebook.

Fonte
techxplore.com