أعلنت شركة Meta عن نماذج ذكاء اصطناعي جديدة قادرة على التعرف على الكلام واستنساخه 1100 لغة. هذا هو عشرة أضعاف قدرة التقنيات المماثلة المتاحةوعدت الشركة اتصلت. وأكد أن هذه مبادرة تهدف إلى حماية اللغات المهددة بالانقراض.
هذا هو خطاب متعدد اللغات رائع (رسائل الوسائط المتعددة) تم إتاحته للجمهور من خلال خدمة استضافة الكود GitHub. وأوضح ميتا أن إطلاقها كمصدر مفتوح سيساعد المطورين على إنشاء تطبيقات صوتية جديدة وأكثر شمولاً.
يمكن للموديلات الجديدة قراءة النص وتحويله إلى كلام (والتعرف على الكلام وتحويله إلى نص) بأكثر من 1100 لهجة. لكن، يمكنهم التعرف على أكثر من 4000 شخصيمثل هذا سعة 40 مرة أكثر مما كان متاحًا في السابق.
يوجد حوالي 7000 لغة في العالم ، لكن أدوات التعرف على الكلام التقليدية الحالية لا تتعرف إلا على حوالي 100 لغة. تتطلب معظم هذه الأنظمة عادةً كميات كبيرة من بيانات التدريب المسمى ، مثل النصوص. المشكلة هي أن هذه متوفرة فقط في عدد قليل من اللغات ، بما في ذلك الإسبانية والإنجليزية والصينية.
كيف أنشأت Meta الذكاء الاصطناعي لألف لغة؟
إنها تستفيد من نموذج ذكاء اصطناعي تم تطويره في Meta 2020. يمكن للنظام بالفعل التعرف على أنماط الكلام من الصوت ، ولا يتطلب كميات كبيرة من البيانات المصنفة مثل النصوص.
استخدمت الشركة الأم لـ Facebook و Instagram مجموعتين جديدتين من البيانات. هناك أول التسجيلات الصوتية ونصوص العهد الجديد للكتاب المقدس، تم استرجاعه من الإنترنت بـ 1107 لغة. تم نشر التسجيلات الصوتية غير المسماة للعهد الجديد الثاني في 3809 لهجة. استعراض تكنولوجيا معهد ماساتشوستس للتكنولوجيا.
استخدم الباحثون الفوقي خوارزمية مصممة لمواءمة التسجيلات الصوتية مع النص المصاحب. كرروا نفس العملية بخوارزمية ثانية مدربة على البيانات المتوافقة حديثًا. وهكذا ، أخيرًا ، قام الفريق بتدريب خوارزمية لتعلم لغة جديدة بسهولة ، حتى دون الحاجة إلى نص مصاحب.
قارن ميتا نماذجهم OpenAI Whisper والمنافسين الآخرين. ويؤكد ، لديها نصف معدل الخطأ ، على الرغم من أنها تغطي 11 ضعف عدد اللغات.
قال مايكل آلي ، العالم الذي عمل في المشروع ، لمعهد ماساتشوستس للتكنولوجيا: “يمكن الآن بناء أنظمة الصوت بسرعة باستخدام القليل جدًا من البيانات”. ومع ذلك ، حذر الباحثون من أن هذه النماذج اللغوية المدعومة بالذكاء الاصطناعي قد تستمر في نسخ بعض الكلمات أو العبارات بشكل غير صحيح. في الممارسة العملية ، يمكن أن يؤدي هذا إلى علامات غير صالحة أو ضارة.