ميتا تكشف عن برنامج SeamlessM4T ،المترجم الفوري بـ 101 لغة. هل حان وقت وداع دراسة اللغات؟
في عصرنا الحالي، نشهد تسارعا مذهلا في تطور التكنولوجيا، حيث تأتي الابتكارات بشكل مستمر وكأنها مستوحاة من أفلام الخيال العلمي. أحدث إبداعات شركة ميتا، المالكة لمنصات إنستغرام وفيسبوك وواتساب، توفر لنا القدرة على التواصل بحرية مع أي شخص، متجاوزة حاجز اختلاف اللغات تماما. تابع معنا قراءة المقال لنتعرَف على المزيل من التفاصيل عن برنامج SeamlessM4T
مزايا برنامج SeamlessM4T
يُسمى هذا النظام الجديد SeamlessM4T، وهو نموذج ذكاء اصطناعي قدمته ميتا كأول نظام قادر على التعامل مع النصوص والصوت عبر أكثر من 100 لغة. مع هذه التكنولوجيا، قد نكون على وشك الاقتراب من تحقيق حلم المترجم العالمي الذي تخيله دوجلاس آدمز في “دليل المسافر إلى المجرة”، حيث يتمكن الجميع من التواصل بسهولة باستخدام جهاز يشبه سمكة بابل المترجمة.
تتعهد هذه التقنية، التي طورتها شركة ميتا التابعة لمارك زوكربيرج، صاحب فيسبوك وإنستغرام وواتساب، بالقضاء على مشكلة التواصل عبر لغات متعددة. وفقًا لمجلة “نيتشر”، فإن النموذج الجديد يتيح الترجمة الفورية بين الصوت والنص، والعكس، مع القدرة على تقليد تعبيرات ونبرات المتحدثين بشكل دقيق.
يتمتع برنامج SeamlessM4T (الترجمة الآلية متعددة اللغات والوسائط) بميزة كبيرة على الأنظمة التقليدية للترجمة المتتالية، حيث يجمع جميع المهام في نموذج موحد، مما يعزز الدقة بنسبة تتراوح بين 8% و 23%. بالإضافة إلى ذلك، يتمتع النظام بقدرة أعلى على التعامل مع الضوضاء الخلفية والاختلافات في الكلام، محققا تحسنا بنسبة 50% في التكيف مع هذه التحديات.
قادت الباحثة الرئيسية مارتا كوستا جوسا من قسم أبحاث الذكاء الاصطناعي الأساسي (FAIR) في ميتا تدريب النموذج باستخدام مليون ساعة من الصوت المنطوق المفتوح، مما يمنحه القدرة على ترجمة حتى اللغات التي لم يتم تضمينها بشكل محدد في بيانات التدريب. قررت ميتا جعل النموذج وبياناته متاحة للجمهور للاستخدام غير التجاري، بهدف دعم البحث والتطوير في مجال الترجمة الصوتية.
تحديات برنامج SeamlessM4T
على الرغم من التقدم الكبير الذي حققه برنامج SeamlessM4T ، فإنه يواجه تحديات كبيرة، خاصة في مجالات حساسة مثل الطب والقانون، حيث تعتبر الدقة أمرا حيويا. لا يزال من الضروري تحسين بعض الجوانب مثل ترجمة الأسماء الصحيحة، والتعامل مع التعبيرات العامية، ومعالجة قضايا التحيز بين الجنسين والتعرف على اللهجات. ومع ذلك، تمثل هذه التكنولوجيا خطوة هامة نحو تحقيق اتصالات عالمية أكثر سلاسة، مما يعزز مكانة ميتا الرائدة في مجال الاتصالات الشخصية.
لتدريب النموذج، جمع الفريق ملايين الساعات من الصوتيات الخاصة بالخطابات، بالإضافة إلى الترجمات البشرية، من الإنترنت ومصادر أخرى مثل أرشيفات الأمم المتحدة، وتم استخدام نصوص تلك الخطب أيضا.
يبرز تانيل ألوماي، من مختبر تكنولوجيا اللغة في جامعة تالين (إستونيا)، في مجلة Nature قدرة النظام الاستثنائية على ترجمة الكلام في الوقت الفعلي، بفضل 4.5 مليون ساعة من الصوت متعدد اللغات التي تم استخدامها في تدريبه. ويشرح قائلا: “يسمح هذا النهج للنموذج بالتعرف على الأنماط في البيانات، مما يسهل التكيف مع مهام محددة دون الحاجة إلى كميات ضخمة من بيانات التدريب المخصصة.”