Nvidia تطلق مجموعة بيانات مفتوحة ضخمة لتعزيز الذكاء الاصطناعي للغات الأوروبية
أعلنت Nvidia عن إطلاق مجموعة بيانات ضخمة وجاهزة للذكاء الاصطناعي، تُعرف باسم Granary، لدعم تطوير ترجمة الذكاء الاصطناعي عالية الجودة للغات الأوروبية، وذلك لمعالجة النقص في دعم نماذج الذكاء الاصطناعي للغات الأقل انتشارًا.
آخر تحديث
كشفت Nvidia عن مجموعة بيانات مفتوحة المصدر ضخمة، أطلقت عليها اسم Granary، بهدف تعزيز دعم الذكاء الاصطناعي للغات الأوروبية. يأتي هذا الإعلان في ظل حقيقة أن 'نسبة ضئيلة فقط من أكثر من 7000 لغة على وجه الأرض مدعومة بنماذج الذكاء الاصطناعي'، حسبما أفادت SiliconANGLE هذا الأسبوع.
تُعد Granary مجموعة ضخمة من الصوتيات متعددة اللغات، تتضمن أكثر من مليون ساعة من التسجيلات الصوتية، بالإضافة إلى 650,000 ساعة من بيانات التعرف على الكلام و 350,000 ساعة من بيانات ترجمة الكلام. وقد تعاون فريق الذكاء الاصطناعي للكلام في Nvidia مع باحثين من جامعة Carnegie Mellon ومؤسسة Bruno Kessler لمعالجة الصوت غير المصنف وبيانات الكلام العامة وتحويلها إلى معلومات قابلة للاستخدام لتدريب الذكاء الاصطناعي.
تغطي مجموعة بيانات Granary 25 لغة أوروبية، ممثلةً تقريبًا جميع اللغات الرسمية الـ 24 للاتحاد الأوروبي، بالإضافة إلى الروسية والأوكرانية. وتتضمن المجموعة أيضًا لغات تتوفر عنها بيانات محدودة، مثل الكرواتية والإستونية والمالطية، مما يمثل خطوة مهمة نحو تعزيز شمولية الذكاء الاصطناعي ودعمه للغات المتنوعة.
قد يعجبك
- فشل مراقبة الحركة الجوية في نيوزيلندا: عطل في نقل البيانات السبب المحتمل
- نظام iOS 26 يجلب شحن Qi2 اللاسلكي بقوة 25 واط إلى تشكيلة iPhone 16
- تدهور أعداد السلمون في ألاسكا مرتبط بطفيل، يشتبه العلماء
- أبل تطلق AppleCare One: تغطية موحدة لأجهزة متعددة
- آبل تُصدر Safari Technology Preview 223 مع إصلاحات وتحسينات
- بدء صرف تعويضات تسوية بطارية Apple Watch المنتفخة
- تقرير: iPhone 17 Air سيأتي بشريحة A19 Pro مع تسوية في وحدة معالجة الرسومات
- مئات من عمال أمازون يفقدون وظائفهم بعد تغييرات في الوضع القانوني