Nvidia تطلق مجموعة بيانات مفتوحة ضخمة لتعزيز الذكاء الاصطناعي للغات الأوروبية
أعلنت Nvidia عن إطلاق مجموعة بيانات ضخمة وجاهزة للذكاء الاصطناعي، تُعرف باسم Granary، لدعم تطوير ترجمة الذكاء الاصطناعي عالية الجودة للغات الأوروبية، وذلك لمعالجة النقص في دعم نماذج الذكاء الاصطناعي للغات الأقل انتشارًا.
آخر تحديث
كشفت Nvidia عن مجموعة بيانات مفتوحة المصدر ضخمة، أطلقت عليها اسم Granary، بهدف تعزيز دعم الذكاء الاصطناعي للغات الأوروبية. يأتي هذا الإعلان في ظل حقيقة أن 'نسبة ضئيلة فقط من أكثر من 7000 لغة على وجه الأرض مدعومة بنماذج الذكاء الاصطناعي'، حسبما أفادت SiliconANGLE هذا الأسبوع.
تُعد Granary مجموعة ضخمة من الصوتيات متعددة اللغات، تتضمن أكثر من مليون ساعة من التسجيلات الصوتية، بالإضافة إلى 650,000 ساعة من بيانات التعرف على الكلام و 350,000 ساعة من بيانات ترجمة الكلام. وقد تعاون فريق الذكاء الاصطناعي للكلام في Nvidia مع باحثين من جامعة Carnegie Mellon ومؤسسة Bruno Kessler لمعالجة الصوت غير المصنف وبيانات الكلام العامة وتحويلها إلى معلومات قابلة للاستخدام لتدريب الذكاء الاصطناعي.
تغطي مجموعة بيانات Granary 25 لغة أوروبية، ممثلةً تقريبًا جميع اللغات الرسمية الـ 24 للاتحاد الأوروبي، بالإضافة إلى الروسية والأوكرانية. وتتضمن المجموعة أيضًا لغات تتوفر عنها بيانات محدودة، مثل الكرواتية والإستونية والمالطية، مما يمثل خطوة مهمة نحو تعزيز شمولية الذكاء الاصطناعي ودعمه للغات المتنوعة.
قد يعجبك
- فشل مراقبة الحركة الجوية في نيوزيلندا: عطل في نقل البيانات السبب المحتمل
- نظام iOS 26 يجلب شحن Qi2 اللاسلكي بقوة 25 واط إلى تشكيلة iPhone 16
- جنرال موتورز تطرح المزيد من محولات شحن السيارات الكهربائية وسط معايير متغيرة
- البرازيل توصي بفرض عقوبات على آبل بسبب متجر التطبيقات وقيود NFC
- مهندس Xbox يُحيي سماعات الواقع المختلط من Windows بعد توقفها بدعم SteamVR
- مشاكل خوادم ماينكرافت: 25% من المسؤولين يخسرون الأصدقاء بسبب القرارات وتوقفات الخدمة تضرب الاستضافة المشتركة
- مايكروسوفت تدعم تحول OpenAI إلى شركة ربحية في اتفاقية جديدة غير ملزمة
- فلاتر نصوص iOS 26 من Apple قد تكلف الحملات السياسية ملايين الدولارات