Como funciona o DeepL?
Perguntam-nos frequentemente porque é que o Tradutor DeepL funciona melhor do que os sistemas concorrentes das principais empresas tecnológicas. Por várias razões. Como a maioria dos sistemas de tradução automática, o Tradutor DeepL traduz textos usando redes neuronais artificiais. Essas redes são formadas com recurso a milhões de textos previamente traduzidos. No entanto, os nossos investigadores conseguiram introduzir inúmeras melhorias na metodologia geral das redes neuronais, principalmente em quatro áreas.
Arquitetura de rede
A maioria dos sistemas de tradução disponíveis no mercado são modificações diretas da arquitetura Transformer. Também as redes neuronais do DeepL contêm partes desta arquitetura, tais como mecanismos de atenção. Contudo, existem diferenças consideráveis na topologia das redes que levam a uma melhoria significativa na qualidade da tradução, especialmente quando comparada com o nível geral dos tradutores automáticos. Estas diferenças na qualidade da arquitetura de rede tornam-se claramente visíveis quando treinamos os nossos modelos internamente e os comparamos com as melhores arquiteturas Transformer baseadas nos mesmos dados.
Dados de treino
A maioria dos nossos concorrentes diretos são grandes empresas de tecnologia que têm vindo a desenvolver web crawlers ao longo dos anos, o que os deixa em vantagem relativamente à quantidade de dados de treino disponíveis. Nós, por outro lado, damos particular importância à aquisição orientada de dados de treino específicos que ajudam a nossa rede a alcançar uma maior qualidade de tradução. Para este fim, desenvolvemos, entre outras coisas, crawlers especiais que encontram automaticamente traduções na internet e avaliam a sua qualidade.
Metodologia de treino
De um modo geral, as redes são treinadas utilizando o método de "aprendizagem supervisionada". Nesta abordagem, a rede é constantemente confrontada com exemplos diferentes e compara sistematicamente as suas próprias traduções com as traduções dos dados de treino. Caso se verifiquem discrepâncias, os pesos da rede são ajustados em conformidade. Ao treinar as redes neuronais também utilizamos outras técnicas de machine learning que nos permitem alcançar melhorias significativas.
Tamanho da rede
Entretanto, tal como os nossos maiores concorrentes, treinamos redes de tradução utilizando milhares de milhões de parâmetros. Estas redes são tão grandes que só podem ser treinadas de forma distribuída em grandes clusters computacionais. Ainda assim, a DeepL garante que os parâmetros das redes são utilizados de forma eficiente. Deste modo, conseguimos alcançar a mesma elevada qualidade de tradução com redes mais pequenas e mais rápidas. Por esta razão, temos também a capacidade de oferecer uma elevada qualidade de tradução aos utilizadores do nosso serviço gratuito.
Estamos sempre à procura de bons matemáticos e cientistas informáticos com interesse em impulsionar o desenvolvimento, melhorar ainda mais o Tradutor DeepL e ultrapassar as barreiras linguísticas em todo o mundo. Se tem experiência em matemática, formação em redes neuronais e vontade de trabalhar num produto que é utilizado à escala global gratuitamente, envie-nos a sua candidatura!