الذكاء الاصطناعي يهمل اللغات الأفريقية، والباحثون يطلقون مبادرة بيانات لسد الفجوة
مع إهمال نماذج الذكاء الاصطناعي لأكثر من 2000 لغة أفريقية بسبب نقص البيانات التدريبية، أطلق الباحثون مشروعًا لجمع 9000 ساعة من التسجيلات الصوتية وتحويلها إلى مجموعات بيانات رقمية لسد هذه الفجوة.
آخر تحديث
يتم إهمال أكثر من 2000 لغة منطوقة في إفريقيا في عصر الذكاء الاصطناعي (AI). على سبيل المثال، يتعرف ChatGPT على 10-20% فقط من الجمل المكتوبة بلغة الهوسا، وهي لغة يتحدث بها 94 مليون شخص في نيجيريا. هذه اللغات ممثلة تمثيلاً ناقصًا في النماذج اللغوية الكبيرة (LLMs) بسبب نقص بيانات التدريب. لكن الباحثين في جميع أنحاء إفريقيا يغيرون ذلك.
سجل أخصائيو اللغة 9000 ساعة من المتحدثين بلغات أفريقية مختلفة وحولوا التسجيلات إلى مجموعات بيانات لغوية رقمية. أطلق الباحثون، الذين هم جزء من مشروع بحثي يسمى أصوات أفريقية جديدة (African Next Voices)، الدفعة الأولى من البيانات هذا الشهر من أكبر مبادرة لإنشاء بيانات لغوية جاهزة للذكاء الاصطناعي للعديد من اللغات الأفريقية.
قد يعجبك
- خطط ترامب للذكاء الاصطناعي تفضل الوقود الأحفوري وتثير انتقادات
- دمج PayPal في Wix Payments لتجارة إلكترونية مبسطة
- تحديث Windows 11 2025 يبدأ بالانتشار، مع تبسيط نظام التشغيل وتحسينات في الميزات
- ذكاء اصطناعي من مايكروسوفت يكتشف ثغرات 'يوم الصفر' في أنظمة الأمن البيولوجي
- نيسان تلغي واردات آريا 2026 إلى الولايات المتحدة ضمن تحسين محفظة السيارات الكهربائية
- ليغو تكشف النقاب عن أغلى مجموعة على الإطلاق: نجمة الموت من ستار وورز بسعر 999.99 دولارًا و9000 قطعة
- آبل ترفع دعوى قضائية ضد آبل سينماز بسبب انتهاك العلامة التجارية
- تيم كوك يثني على عمر بطارية iPhone Air 'العظيم' ويؤكد أنها 27 ساعة