ذكاء جوجل الاصطناعي Veo 3 يعاني من مشاكل في دقة الترجمة
نموذج جوجل التوليدي للفيديو Veo 3، الذي أُطلق مؤخرًا، يواجه صعوبة في دقة الترجمة المصاحبة، حيث يضيف ترجمات غير منطقية حتى عندما يُطلب منه عدم إضافة أي تسميات توضيحية.
آخر تحديث
مع إطلاق جوجل أحدث نموذج للذكاء الاصطناعي لتوليد الفيديو في نهاية شهر مايو، سارع المبدعون إلى اختبار قدراته. يتيح Veo 3، الذي صدر بعد أشهر قليلة من سلفه، للمستخدمين توليد الأصوات والحوار لأول مرة، مما أثار موجة من المقاطع الواقعية جدًا التي لا تتجاوز ثماني ثوانٍ، والتي تم تجميعها في إعلانات ومقاطع ASMR ومقاطع دعائية لأفلام متخيلة ومقابلات شوارع فكاهية. استخدم المخرج المرشح لجائزة الأوسكار دارين أرونوفسكي الأداة لإنشاء فيلم قصير بعنوان Ancestra. خلال مؤتمر صحفي، شبه ديميس هاسابيس، الرئيس التنفيذي لـ Google DeepMind، هذه القفزة إلى الأمام بـ "الخروج من عصر صامت من توليد الفيديو".
ولكن سرعان ما اكتشف آخرون أن الأداة في بعض النواحي لم تتصرف كما هو متوقع. فعندما تولد مقاطع تتضمن حوارًا، غالبًا ما يضيف Veo 3 ترجمات مصاحبة غير منطقية ومشوشة، حتى عندما تكون المطالبات التي تم إعطاؤها له تطلب صراحة عدم إضافة أي تسميات توضيحية أو ترجمات.
قد يعجبك
- ميزة "البحث في الملاحظة" تصل إلى Google Keep لتسهيل البحث
- ميتا تخطط لمراكز بيانات بحجم مانهاتن لتعزيز طموحات الذكاء الاصطناعي
- ميزة "التخطي الذكي" المدعومة بالذكاء الاصطناعي تصل إلى تطبيق يوتيوب للتلفزيون للمشتركين المميزين
- مايكروسوفت تختبر ميزة استئناف تطبيقات أندرويد على ويندوز 11، بدءًا من سبوتيفاي
- اختبار رادار يوروبا كليبر بنجاح خلال التحليق قرب المريخ
- Spintop Ventures تتوسع في الدنمارك وتعين مديرًا لقيادة النمو في الشمال
- أداة نقل الموسيقى من Apple تتوسع لتشمل المملكة المتحدة و7 دول أخرى
- اختراق ناسا في المعادن القابلة للطباعة لمحركات الصواريخ