Nvidia تطلق مجموعة بيانات مفتوحة ضخمة لتعزيز الذكاء الاصطناعي للغات الأوروبية
أعلنت Nvidia عن إطلاق مجموعة بيانات ضخمة وجاهزة للذكاء الاصطناعي، تُعرف باسم Granary، لدعم تطوير ترجمة الذكاء الاصطناعي عالية الجودة للغات الأوروبية، وذلك لمعالجة النقص في دعم نماذج الذكاء الاصطناعي للغات الأقل انتشارًا.
آخر تحديث
كشفت Nvidia عن مجموعة بيانات مفتوحة المصدر ضخمة، أطلقت عليها اسم Granary، بهدف تعزيز دعم الذكاء الاصطناعي للغات الأوروبية. يأتي هذا الإعلان في ظل حقيقة أن 'نسبة ضئيلة فقط من أكثر من 7000 لغة على وجه الأرض مدعومة بنماذج الذكاء الاصطناعي'، حسبما أفادت SiliconANGLE هذا الأسبوع.
تُعد Granary مجموعة ضخمة من الصوتيات متعددة اللغات، تتضمن أكثر من مليون ساعة من التسجيلات الصوتية، بالإضافة إلى 650,000 ساعة من بيانات التعرف على الكلام و 350,000 ساعة من بيانات ترجمة الكلام. وقد تعاون فريق الذكاء الاصطناعي للكلام في Nvidia مع باحثين من جامعة Carnegie Mellon ومؤسسة Bruno Kessler لمعالجة الصوت غير المصنف وبيانات الكلام العامة وتحويلها إلى معلومات قابلة للاستخدام لتدريب الذكاء الاصطناعي.
تغطي مجموعة بيانات Granary 25 لغة أوروبية، ممثلةً تقريبًا جميع اللغات الرسمية الـ 24 للاتحاد الأوروبي، بالإضافة إلى الروسية والأوكرانية. وتتضمن المجموعة أيضًا لغات تتوفر عنها بيانات محدودة، مثل الكرواتية والإستونية والمالطية، مما يمثل خطوة مهمة نحو تعزيز شمولية الذكاء الاصطناعي ودعمه للغات المتنوعة.
قد يعجبك
- فشل مراقبة الحركة الجوية في نيوزيلندا: عطل في نقل البيانات السبب المحتمل
- نظام iOS 26 يجلب شحن Qi2 اللاسلكي بقوة 25 واط إلى تشكيلة iPhone 16
- تحديث يوليو لويندوز 11: ميزات جديدة، إصلاحات للاعبين، وفك ضغط أسرع للملفات
- الثقوب السوداء تساعد في تحديد موقع الأرض، لكن التداخل الراديوي يهدد الدقة
- Brave و AdGuard تحظران ميزة "Recall" المثيرة للجدل من مايكروسوفت
- إلينوي تحظر العلاج بالذكاء الاصطناعي، وتنضم إلى ولايتين أخريين في تنظيم الروبوتات الدردشة
- بدء أعمال بناء المقر الجديد للمركز الأوروبي للتنبؤات الجوية متوسطة المدى بتكلفة 93 مليون جنيه إسترليني
- مايكروسوفت تطلق المحادثات المتسلسلة في Microsoft Teams