Nvidia تطلق مجموعة بيانات مفتوحة ضخمة لتعزيز الذكاء الاصطناعي للغات الأوروبية
أعلنت Nvidia عن إطلاق مجموعة بيانات ضخمة وجاهزة للذكاء الاصطناعي، تُعرف باسم Granary، لدعم تطوير ترجمة الذكاء الاصطناعي عالية الجودة للغات الأوروبية، وذلك لمعالجة النقص في دعم نماذج الذكاء الاصطناعي للغات الأقل انتشارًا.
آخر تحديث
كشفت Nvidia عن مجموعة بيانات مفتوحة المصدر ضخمة، أطلقت عليها اسم Granary، بهدف تعزيز دعم الذكاء الاصطناعي للغات الأوروبية. يأتي هذا الإعلان في ظل حقيقة أن 'نسبة ضئيلة فقط من أكثر من 7000 لغة على وجه الأرض مدعومة بنماذج الذكاء الاصطناعي'، حسبما أفادت SiliconANGLE هذا الأسبوع.
تُعد Granary مجموعة ضخمة من الصوتيات متعددة اللغات، تتضمن أكثر من مليون ساعة من التسجيلات الصوتية، بالإضافة إلى 650,000 ساعة من بيانات التعرف على الكلام و 350,000 ساعة من بيانات ترجمة الكلام. وقد تعاون فريق الذكاء الاصطناعي للكلام في Nvidia مع باحثين من جامعة Carnegie Mellon ومؤسسة Bruno Kessler لمعالجة الصوت غير المصنف وبيانات الكلام العامة وتحويلها إلى معلومات قابلة للاستخدام لتدريب الذكاء الاصطناعي.
تغطي مجموعة بيانات Granary 25 لغة أوروبية، ممثلةً تقريبًا جميع اللغات الرسمية الـ 24 للاتحاد الأوروبي، بالإضافة إلى الروسية والأوكرانية. وتتضمن المجموعة أيضًا لغات تتوفر عنها بيانات محدودة، مثل الكرواتية والإستونية والمالطية، مما يمثل خطوة مهمة نحو تعزيز شمولية الذكاء الاصطناعي ودعمه للغات المتنوعة.
قد يعجبك
- فشل مراقبة الحركة الجوية في نيوزيلندا: عطل في نقل البيانات السبب المحتمل
- نظام iOS 26 يجلب شحن Qi2 اللاسلكي بقوة 25 واط إلى تشكيلة iPhone 16
- ServiceNow تقدم خصومات كبيرة للحكومة الأمريكية تصل إلى 70% على البرامج
- سامسونج توفر دعم DeX لهاتف Galaxy Z Flip 7
- شركات السيارات الهندية تعارض معايير الانبعاثات الجديدة للحكومة
- الذهب يتحدى الفيزياء: يبقى صلباً عند 14 ضعف نقطة انصهاره
- نينتندو تتمسك بالنهج 'التقليدي' لتطوير الألعاب وسط ارتفاع التكاليف
- مودم C1 من Apple يظهر سرعات مماثلة لمودم Qualcomm في اختبار iPhone 16e الجديد