Come funziona DeepL Traduttore?

A cura di: DeepL TeamUltimo aggiornamento: 31 ottobre 2021

Indice dei contenuti

Spesso ci viene chiesto come sia possibile che DeepL Traduttore funzioni meglio dei traduttori automatici forniti dalle grandi aziende tecnologiche. La risposta è che ci sono diversi elementi che contribuiscono all’eccellenza di DeepL. Come la maggior parte dei sistemi di traduzione automatica, DeepL traduce testi tramite l’utilizzo di reti neurali artificiali. Queste reti neurali vengono addestrate utilizzando milioni di testi e traduzioni. Tuttavia, i nostri ricercatori sono riusciti ad apportare numerosi miglioramenti alla metodologia generale delle reti neurali, principalmente in quattro aree.

Architettura delle reti

È risaputo che la maggior parte dei sistemi di traduzione disponibili al pubblico non sono altro che variazioni dell’architettura Transformer. Anche le reti neurali di DeepL contengono parti di questo tipo di architettura, come ad esempio i meccanismi di attenzione. Tuttavia, le nostre reti neurali presentano delle differenze significative nella topologia, che portano ad un notevole miglioramento nella qualità di traduzione, soprattutto quando la si confronta con il livello generale degli altri traduttori automatici. Queste differenze nella qualità dell’architettura di rete sono chiaramente visibili quando addestriamo i nostri modelli internamente e li compariamo alle migliori architetture Transformer sulla base degli stessi dati.

Dati di addestramento

La maggior parte dei nostri concorrenti sono grandi aziende tecnologiche che possono contare su molti anni di esperienza nello sviluppo di web crawler. Hanno quindi un netto vantaggio in termini di quantità di dati di addestramento disponibili. Noi, invece, puntiamo molto sull'acquisizione mirata di dati di addestramento speciali che aiutano la nostra rete a ottenere una qualità di traduzione più alta. A tal fine, abbiamo sviluppato dei crawler speciali, in grado di rintracciare automaticamente traduzioni su internet e valutarne la qualità.

Metodo di addestramento

In generale, queste reti neurali vengono addestrate utilizzando il metodo di apprendimento supervisionato. Come funziona? Alla rete vengono mostrati diversi esempi più e più volte. In questo modo, la rete confronta ripetutamente le proprie traduzioni con quelle dei dati di addestramento. Se ci sono differenze, i pesi della rete vengono sistemati di conseguenza. Usiamo anche altre tecniche da altri campi dell'apprendimento automatico quando addestriamo le reti neurali. Ciò ci permette di raggiungere notevoli miglioramenti nella qualità di traduzione.

Dimensione delle reti

Come nel caso dei nostri principali concorrenti, anche a DeepL addestriamo le nostre reti neurali utilizzando miliardi di parametri. Queste reti sono così grandi che possono essere addestrate solo in modo distribuito su cluster di calcolo dedicati molto grandi. Comunque, nella nostra ricerca diamo molta importanza al fatto che i parametri della rete siano usati in modo super efficiente. In questo modo siamo riusciti a raggiungere la stessa alta qualità di traduzione anche con le nostre reti più veloci e di dimensione minore. Per questo motivo, siamo in grado di offrire agli utenti del nostro servizio gratuito una qualità di traduzione molto alta.

Siamo sempre alla ricerca di ottimi matematici e informatici che desiderano portare avanti lo sviluppo della traduzione automatica, migliorare ulteriormente il traduttore di DeepL e aiutarci a superare le barriere linguistiche in tutto il mondo. Se hai anche esperienza con la matematica e l'addestramento della rete neurale, e se ti piace lavorare su un prodotto che viene usato gratis in tutto il mondo, allora candidati a DeepL!

A cura di: DeepL TeamUltimo aggiornamento: 31 ottobre 2021