ذكاء جوجل الاصطناعي Veo 3 يعاني من مشاكل في دقة الترجمة
نموذج جوجل التوليدي للفيديو Veo 3، الذي أُطلق مؤخرًا، يواجه صعوبة في دقة الترجمة المصاحبة، حيث يضيف ترجمات غير منطقية حتى عندما يُطلب منه عدم إضافة أي تسميات توضيحية.
آخر تحديث
مع إطلاق جوجل أحدث نموذج للذكاء الاصطناعي لتوليد الفيديو في نهاية شهر مايو، سارع المبدعون إلى اختبار قدراته. يتيح Veo 3، الذي صدر بعد أشهر قليلة من سلفه، للمستخدمين توليد الأصوات والحوار لأول مرة، مما أثار موجة من المقاطع الواقعية جدًا التي لا تتجاوز ثماني ثوانٍ، والتي تم تجميعها في إعلانات ومقاطع ASMR ومقاطع دعائية لأفلام متخيلة ومقابلات شوارع فكاهية. استخدم المخرج المرشح لجائزة الأوسكار دارين أرونوفسكي الأداة لإنشاء فيلم قصير بعنوان Ancestra. خلال مؤتمر صحفي، شبه ديميس هاسابيس، الرئيس التنفيذي لـ Google DeepMind، هذه القفزة إلى الأمام بـ "الخروج من عصر صامت من توليد الفيديو".
ولكن سرعان ما اكتشف آخرون أن الأداة في بعض النواحي لم تتصرف كما هو متوقع. فعندما تولد مقاطع تتضمن حوارًا، غالبًا ما يضيف Veo 3 ترجمات مصاحبة غير منطقية ومشوشة، حتى عندما تكون المطالبات التي تم إعطاؤها له تطلب صراحة عدم إضافة أي تسميات توضيحية أو ترجمات.
قد يعجبك
- ميزة "البحث في الملاحظة" تصل إلى Google Keep لتسهيل البحث
- ميتا تخطط لمراكز بيانات بحجم مانهاتن لتعزيز طموحات الذكاء الاصطناعي
- DiffuCode: نموذج لغة البرمجة الجديد والمبتكر من Apple
- حاكم تكساس يرفض الكشف عن رسائل البريد الإلكتروني المتبادلة مع إيلون ماسك، مشيرًا إلى محتوى 'حميمي أو محرج'
- مايكروسوفت تضيف دعم تطبيقات الألعاب الخارجية إلى تطبيق إكس بوكس على ويندوز
- ميزة التشعب الجديدة في ChatGPT تسلط الضوء على مرونة الذكاء الاصطناعي، لا شخصيته
- البيت الأبيض يأمر ناسا بالاستعداد لإغلاق مهامها العلمية
- كلاودفلير تحبط هجوم DDoS قياسي بلغ 11.5 تيرابت في الثانية