Problemi con le traduzioni del testo AI
Se ci sono pochi testi paralleli tra due lingue, la traduzione viene eseguita in due fasi.
Ad esempio, quando si traduce dal tedesco al malese, l`ordine sarà: prima dal tedesco all`inglese, poi dall`inglese al malese.
Contents
Il risultato è vicino al naturale, ma anche in una catena così corta, possono verificarsi errori a causa di parole ambigue.
Miglioramenti
Le reti neurali hanno reso la traduzione molto migliore - a volte è difficile distinguerla da un essere umano Le reti neurali analizzano anche una serie di testi paralleli - in questo senso, nulla è cambiato. Ma invece di semplici identificatori, l`approccio della rete neurale utilizza una rappresentazione vettoriale. Ogni vettore è costituito da numeri che caratterizzano la parola da caratteristiche lessicali e semantiche.
La traduzione automatica statistica suddivide la frase originale in parole e frasi, dopodiché il sistema cerca una corrispondenza per esse in un`altra lingua. Nella traduzione della rete neurale, viene tradotta l`intera frase. Si trasforma in uno spazio vettoriale, in cui ogni parola ha un vettore di diverse centinaia di numeri. La rete neurale determina la relazione tra le parole, anche se si trovano agli estremi opposti della frase. Pertanto, la traduzione è più naturale.
Nonostante l`emergere di un approccio alla rete neurale, l`analisi statistica della macchina non è stata ancora completamente abbandonata. Ad esempio, Yandex.Translator utilizza un modello di traduzione ibrido che include approcci statistici e di rete neurale. Dopo aver elaborato il testo da due modelli, nel lavoro viene incluso un algoritmo che seleziona l`opzione migliore.
Risultati più recenti
La traduzione è migliorata, ma ci sono ancora molti errori. Le reti neurali falliscono? Il numero di errori di traduzione dipende da molti fattori. Tra questi: la relazione tra le lingue e la quantità di dati su cui è stata addestrata la rete neurale.
Ad esempio, gli algoritmi di Google Translate sono stati insegnati nelle coppie linguistiche inglese-spagnolo e inglese-francese. Sulla base dei risultati dello studio, i traduttori professionisti hanno valutato la qualità dell`elaborazione del testo in queste coppie quasi al livello della traduzione umana, incluso il progetto https://gglot.com/.
Più le lingue sono vicine tra loro nella struttura, maggiore è l`accuratezza della traduzione. Ma se prendi lingue da sistemi diversi, ad esempio russo e giapponese, i traduttori universali iniziano a zoppicare.
La traduzione della rete neurale utilizza anche un corpus di testi paralleli. Di conseguenza, rimane il problema dei dati insufficienti. Se non ci sono abbastanza testi paralleli per la traduzione, viene utilizzata una lingua intermedia: l`inglese. A causa di ciò, sorgono imprecisioni. Puoi facilmente verificarlo tu stesso se traduci la frase in sequenza in diverse lingue, come spiegato qui Wiki.
Esempi
Ad esempio, ecco una traduzione di uno dei paragrafi di questo articolo: russo - inglese - mongolo - ungherese - russo. Era così:
“Il numero di errori di traduzione dipende da molti fattori. Tra questi: la relazione tra le lingue e la quantità di dati su cui è stata addestrata la rete neurale. ""
La traduzione si è rivelata goffa. D`altra parte, questo è un esperimento assolutamente inutile. È improbabile che nella vita reale qualcuno abbia bisogno di una catena del genere. Ma i risultati del controllo mostrano esattamente cosa succede alla traduzione quando non ci sono abbastanza testi paralleli tra le lingue.