Nvidia تطلق مجموعة بيانات مفتوحة ضخمة لتعزيز الذكاء الاصطناعي للغات الأوروبية

أعلنت Nvidia عن إطلاق مجموعة بيانات ضخمة وجاهزة للذكاء الاصطناعي، تُعرف باسم Granary، لدعم تطوير ترجمة الذكاء الاصطناعي عالية الجودة للغات الأوروبية، وذلك لمعالجة النقص في دعم نماذج الذكاء الاصطناعي للغات الأقل انتشارًا.

آخر تحديث 20252025-08-25T07:08:08Z

كشفت Nvidia عن مجموعة بيانات مفتوحة المصدر ضخمة، أطلقت عليها اسم Granary، بهدف تعزيز دعم الذكاء الاصطناعي للغات الأوروبية. يأتي هذا الإعلان في ظل حقيقة أن 'نسبة ضئيلة فقط من أكثر من 7000 لغة على وجه الأرض مدعومة بنماذج الذكاء الاصطناعي'، حسبما أفادت SiliconANGLE هذا الأسبوع.

تُعد Granary مجموعة ضخمة من الصوتيات متعددة اللغات، تتضمن أكثر من مليون ساعة من التسجيلات الصوتية، بالإضافة إلى 650,000 ساعة من بيانات التعرف على الكلام و 350,000 ساعة من بيانات ترجمة الكلام. وقد تعاون فريق الذكاء الاصطناعي للكلام في Nvidia مع باحثين من جامعة Carnegie Mellon ومؤسسة Bruno Kessler لمعالجة الصوت غير المصنف وبيانات الكلام العامة وتحويلها إلى معلومات قابلة للاستخدام لتدريب الذكاء الاصطناعي.

تغطي مجموعة بيانات Granary 25 لغة أوروبية، ممثلةً تقريبًا جميع اللغات الرسمية الـ 24 للاتحاد الأوروبي، بالإضافة إلى الروسية والأوكرانية. وتتضمن المجموعة أيضًا لغات تتوفر عنها بيانات محدودة، مثل الكرواتية والإستونية والمالطية، مما يمثل خطوة مهمة نحو تعزيز شمولية الذكاء الاصطناعي ودعمه للغات المتنوعة.

Nvidia تطلق مجموعة بيانات مفتوحة ضخمة لتعزيز الذكاء الاصطناعي للغات الأوروبية

قد يعجبك