كيف يعمل DeepL؟
كثيرًا ما يُطرح علينا سؤال حول سبب تفوق مُترجِم DeepL في كثير من الأحيان على الأنظمة المنافسة من كبرى شركات التكنولوجيا. هناك عدة أسباب لذلك. مثل معظم أنظمة الترجمة، يقوم مُترجِم DeepL بترجمة النصوص باستخدام الشبكة العصبية. تم التدريب على هذه الشبكات على ملايين النصوص المترجمة. ومع ذلك، تمكن باحثونا من إجراء العديد من تحسينات/تنقيحات على منهجية الشبكة العصبية بشكل عام، وذلك بشكل أساسي في أربعة مجالات.
بنية الشبكة
من المعروف أن معظم أنظمة الترجمة المتاحة للجمهور هي تعديلات مباشرة على بنية Transformer. وبالطبع، تحتوي الشبكات العصبية لـ DeepL أيضًا على أجزاء من هذه البنية، مثل آليات الانتباه. ومع ذلك، هناك أيضًا اختلافات كبيرة في طوبولوجيا الشبكات التي تؤدي إلى تحسين/تنقيح كبير في جودة الترجمة مقارنة بأحدث ما توصلت إليه الأبحاث العامة في هذا المجال. نرى هذه الاختلافات في جودة بنية الشبكة بوضوح عندما نقوم بالتدريب ومقارنة بنى الشبكة الخاصة بنا وأفضل بنى Transformer المعروفة على نفس البيانات داخليًا.
البيانات المُستخدَمة في التدريب
معظم منافسينا المباشرين هم شركات تكنولوجية كبرى، لها سجلّ طويل في تطوير برامج زحف الويب. لذلك، فإنهم يتمتعون بميزة واضحة من حيث كمية البيانات المُستخدَمة في التدريب المتاحة. من ناحية أخرى، نحن نولي اهتمامًا كبيرًا للحصول على بيانات تدريب خاصة تساعد شبكتنا على تحقيق جودة ترجمة أعلى. ولهذا الغرض، قمنا بتطوير، من بين أمور أخرى، برامج زحف خاصة تعثر تلقائياً على الترجمات على الإنترنت وتقيّم جودتها.
منهجية التدريب
في مجال البحوث العامة، عادة ما يتم تدريب شبكات التدريب باستخدام طريقة "التعلم الخاضع للإشراف". يتم عرض أمثلة مختلفة على الشبكة مرارًا وتكرارًا. تقوم الشبكة بمقارنة ترجماتها بشكل متكرر مع الترجمات الموجودة في البيانات المُستخدَمة في التدريب. إذا كانت هناك تباينات، يتم تعديل أوزان الشبكة وفقًا لذلك. نستخدم أيضًا تقنيات أخرى من مجالات أخرى من التعلم الآلي أثناء التدريب على الشبكة العصبية. وهذا يتيح لنا أيضًا تحقيق تحسينات كبيرة.
حجم الشبكة
في الوقت نفسه، نقوم (مثل أكبر منافسينا) بالتدريب على شبكات الترجمة باستخدام مليارات المعلمات. هذه الشبكات كبيرة جدًا لدرجة أنه لا يمكن التدريب عليها إلا بطريقة موزعة على مجموعات حوسبة مخصصة كبيرة جدًا. ومع ذلك، فإننا في أبحاثنا نولي أهمية كبيرة لحقيقة أن معلمات الشبكة تُستخدم بكفاءة عالية. وهكذا تمكنا من تحقيق جودة ترجمة مماثلة حتى مع شبكاتنا الأصغر والأسرع. وبالتالي، يمكننا أيضًا عرض جودة ترجمة عالية جدًا لمستخدمي خدمتنا المجانية.
بالطبع، نحن دائمًا نبحث عن علماء رياضيات وعلماء كمبيوتر متميزين يرغبون في المساعدة في دفع عجلة التطوير، ومواصلة تحسين/تنقيح مُترجِم DeepL، وكسر حواجز اللغة حول العالم. إذا كان لديك أيضًا خبرة في الرياضيات وتدريب الشبكات العصبية، وإذا كان العمل على منتج يستخدم مجانًا في جميع أنحاء العالم يرضيك، فيرجى التقدم بطلب إلى DeepL !