ذكاء جوجل الاصطناعي Veo 3 يعاني من مشاكل في دقة الترجمة
نموذج جوجل التوليدي للفيديو Veo 3، الذي أُطلق مؤخرًا، يواجه صعوبة في دقة الترجمة المصاحبة، حيث يضيف ترجمات غير منطقية حتى عندما يُطلب منه عدم إضافة أي تسميات توضيحية.
آخر تحديث
مع إطلاق جوجل أحدث نموذج للذكاء الاصطناعي لتوليد الفيديو في نهاية شهر مايو، سارع المبدعون إلى اختبار قدراته. يتيح Veo 3، الذي صدر بعد أشهر قليلة من سلفه، للمستخدمين توليد الأصوات والحوار لأول مرة، مما أثار موجة من المقاطع الواقعية جدًا التي لا تتجاوز ثماني ثوانٍ، والتي تم تجميعها في إعلانات ومقاطع ASMR ومقاطع دعائية لأفلام متخيلة ومقابلات شوارع فكاهية. استخدم المخرج المرشح لجائزة الأوسكار دارين أرونوفسكي الأداة لإنشاء فيلم قصير بعنوان Ancestra. خلال مؤتمر صحفي، شبه ديميس هاسابيس، الرئيس التنفيذي لـ Google DeepMind، هذه القفزة إلى الأمام بـ "الخروج من عصر صامت من توليد الفيديو".
ولكن سرعان ما اكتشف آخرون أن الأداة في بعض النواحي لم تتصرف كما هو متوقع. فعندما تولد مقاطع تتضمن حوارًا، غالبًا ما يضيف Veo 3 ترجمات مصاحبة غير منطقية ومشوشة، حتى عندما تكون المطالبات التي تم إعطاؤها له تطلب صراحة عدم إضافة أي تسميات توضيحية أو ترجمات.
قد يعجبك
- ميزة "البحث في الملاحظة" تصل إلى Google Keep لتسهيل البحث
- ميتا تخطط لمراكز بيانات بحجم مانهاتن لتعزيز طموحات الذكاء الاصطناعي
- كاليفورنيا تبرم صفقة تاريخية مع أوبر وليفت تسمح للسائقين بالانضمام للنقابات
- ميتا ونفيديا تقودان مبادرة تحدي إنفينيباند بشبكة إيثرنت مفتوحة لشبكات الذكاء الاصطناعي
- سفالبارد يفقد كمية قياسية من الجليد في صيف 2024
- سامسونج تستعد للكشف الرسمي عن نظارة 'موهان' للواقع المختلط الأسبوع المقبل
- واتساب يطلق ترجمة الرسائل داخل التطبيق، مع ترجمة تلقائية حصرية لمستخدمي أندرويد
- الرئيس التنفيذي لـ Zoom يتوقع أسابيع عمل أقصر مدفوعة بالذكاء الاصطناعي