¿Cómo funciona DeepL?
Nos soléis preguntar que cómo es posible que el Traductor de DeepL funcione a menudo mejor que los traductores automáticos de los gigantes tecnológicos. Esto se debe a varias razones: al igual que la mayoría de sistemas de traducción, el Traductor de DeepL emplea redes neuronales artificiales para traducir textos. A estas redes neuronales se les entrena mediante millones de textos traducidos. Sin embargo, el equipo de investigación de DeepL ha introducido muchas innovaciones en la metodología de las redes neuronales, especialmente en cuatro ámbitos:
Arquitectura de las redes neuronales
Es bien sabido que la mayoría de los sistemas de traducción a disposición del público son modificaciones directas de la arquitectura Transformer. Las redes neuronales de DeepL también contienen partes de esta arquitectura, como los mecanismos de atención. No obstante, nuestras redes neuronales presentan diferencias significativas en topología que han implicado un avance notable en cuanto a calidad de traducción, en especial en comparación con la calidad de otros traductores automáticos. Estas diferencias en la calidad de la arquitectura se aprecian especialmente cuando entrenamos y comparamos internamente a nuestras redes neuronales con las redes más conocidas basadas en la arquitectura Transformer empleando los mismos datos.
Datos de entrenamiento
La mayoría de nuestros competidores directos son gigantes tecnológicos que tienen años de experiencia en el desarrollo de rastreadores web. Por ello, juegan con gran ventaja respecto a la cantidad de datos de entrenamiento de la que disponen. DeepL, en cambio, da gran importancia a la adquisición selectiva de datos de entrenamiento específicos que contribuyen a que nuestras redes neuronales logren una mayor calidad de traducción. Para ello, hemos desarrollado, entre otras cosas, unos rastreadores web únicos que encuentran automáticamente traducciones en internet y evalúan la calidad.
Metodología de entrenamiento
En general, en la investigación se entrena a las redes neuronales empleando el método del aprendizaje supervisado. Con este método, se muestran a las redes neuronales los mismos ejemplos una y otra vez. Estas proceden entonces a comparar continuamente sus propias traducciones con las de los datos de entrenamiento. Si encuentran alguna disparidad, los pesos de las neuronas se ajustan de forma correspondiente. Aparte del aprendizaje supervisado, empleamos diversas técnicas de otros ámbitos del aprendizaje automático para entrenar a las redes neuronales. Esto nos permite lograr innovaciones significativas.
Tamaño de las redes neuronales
Al igual que nuestros principales competidores, entrenamos a las redes neuronales con miles de millones de parámetros. Estas redes neuronales son tan grandes que solo pueden entrenarse de forma distribuida en clústeres de ordenadores de gran tamaño destinados a este fin. Sin embargo, para nuestro equipo de investigación es muy importante que los parámetros de las redes neuronales se empleen de la forma más eficiente posible. Así hemos conseguido que nuestras redes neuronales pequeñas sean capaces de producir una calidad de traducción casi igual a la de nuestras redes más grandes. Por ello, ofrecemos una calidad de traducción muy alta también para los usuarios de la versión gratuita del Traductor de DeepL.
Siempre estamos en busca de nuevo personal dedicado al ámbito de las matemáticas o la informática que nos quieran ayudar a impulsar el desarrollo del Traductor de DeepL y a seguir perfeccionándolo, para acabar con las barreras del idioma en el mundo. Si tienes experiencia en el sector de las matemáticas y el entrenamiento de las redes neuronales y te resultaría gratificante trabajar en un producto que se usa gratis a nivel mundial, ¡te esperamos en DeepL!