Come funziona DeepL Traduttore?
Spesso ci viene chiesto come sia possibile che DeepL Traduttore funzioni meglio dei traduttori automatici forniti dalle grandi aziende tecnologiche. La risposta è che ci sono diversi elementi che contribuiscono all’eccellenza di DeepL. Come la maggior parte dei sistemi di traduzione automatica, DeepL traduce testi tramite l’utilizzo di reti neurali artificiali. Queste reti neurali vengono addestrate utilizzando milioni di testi e traduzioni. Tuttavia, i nostri ricercatori sono riusciti ad apportare numerosi miglioramenti alla metodologia generale delle reti neurali, principalmente in quattro aree.
Architettura delle reti
È risaputo che la maggior parte dei sistemi di traduzione disponibili al pubblico non sono altro che variazioni dell’architettura Transformer. Anche le reti neurali di DeepL contengono parti di questo tipo di architettura, come ad esempio i meccanismi di attenzione. Tuttavia, le nostre reti neurali presentano delle differenze significative nella topologia, che portano ad un notevole miglioramento nella qualità di traduzione, soprattutto quando la si confronta con il livello generale degli altri traduttori automatici. Queste differenze nella qualità dell’architettura di rete sono chiaramente visibili quando addestriamo i nostri modelli internamente e li compariamo alle migliori architetture Transformer sulla base degli stessi dati.
Dati di addestramento
La maggior parte dei nostri concorrenti sono grandi aziende tecnologiche che possono contare su molti anni di esperienza nello sviluppo di web crawler. Pertanto, hanno un netto vantaggio per quanto riguarda la quantità di dati disponibili per effettuare l’addestramento dei modelli. DeepL, invece, pone grande enfasi sull’acquisizione di dati di addestramento mirati a sviluppare le nostre reti neurali in modo che raggiungano una qualità di traduzione migliore. A tal fine, abbiamo sviluppato dei crawler speciali, in grado di rintracciare automaticamente traduzioni su internet e valutarne la qualità.
Metodo di addestramento
In generale, queste reti neurali vengono addestrate utilizzando il metodo di apprendimento supervisionato. Come funziona? Alla rete vengono mostrati diversi esempi più e più volte. In questo modo, la rete confronta ripetutamente le proprie traduzioni con quelle dei dati di addestramento. Se ci sono discrepanze tra le traduzioni, i pesi della rete vengono regolati di conseguenza. DeepL utilizza anche altre tecniche provenienti da diverse aree dell’apprendimento automatico per addestrare le proprie reti neurali. Ciò ci permette di raggiungere notevoli miglioramenti nella qualità di traduzione.
Dimensione delle reti
Come nel caso dei nostri principali concorrenti, anche a DeepL addestriamo le nostre reti neurali utilizzando miliardi di parametri. Le nostre reti sono talmente grandi che, per essere addestrate, devono essere suddivise in diversi cluster di calcolo di grandi dimensioni. Nonostante ciò, DeepL si assicura che i parametri delle reti siano utilizzati in maniera efficiente. In questo modo siamo riusciti a raggiungere la stessa alta qualità di traduzione anche con le nostre reti più veloci e di dimensione minore. Per questo motivo, siamo in grado di offrire agli utenti del nostro servizio gratuito una qualità di traduzione molto alta.
Siamo sempre alla ricerca di ottimi matematici e informatici che desiderano portare avanti lo sviluppo della traduzione automatica, migliorare ulteriormente il traduttore di DeepL e aiutarci a superare le barriere linguistiche in tutto il mondo. Se hai esperienza con la matematica e l'addestramento di reti neurali e ti piacerebbe lavorare su un prodotto che viene utilizzato gratuitamente in tutto il mondo, allora contattaci!