ذكاء جوجل الاصطناعي Veo 3 يعاني من مشاكل في دقة الترجمة
نموذج جوجل التوليدي للفيديو Veo 3، الذي أُطلق مؤخرًا، يواجه صعوبة في دقة الترجمة المصاحبة، حيث يضيف ترجمات غير منطقية حتى عندما يُطلب منه عدم إضافة أي تسميات توضيحية.
آخر تحديث
مع إطلاق جوجل أحدث نموذج للذكاء الاصطناعي لتوليد الفيديو في نهاية شهر مايو، سارع المبدعون إلى اختبار قدراته. يتيح Veo 3، الذي صدر بعد أشهر قليلة من سلفه، للمستخدمين توليد الأصوات والحوار لأول مرة، مما أثار موجة من المقاطع الواقعية جدًا التي لا تتجاوز ثماني ثوانٍ، والتي تم تجميعها في إعلانات ومقاطع ASMR ومقاطع دعائية لأفلام متخيلة ومقابلات شوارع فكاهية. استخدم المخرج المرشح لجائزة الأوسكار دارين أرونوفسكي الأداة لإنشاء فيلم قصير بعنوان Ancestra. خلال مؤتمر صحفي، شبه ديميس هاسابيس، الرئيس التنفيذي لـ Google DeepMind، هذه القفزة إلى الأمام بـ "الخروج من عصر صامت من توليد الفيديو".
ولكن سرعان ما اكتشف آخرون أن الأداة في بعض النواحي لم تتصرف كما هو متوقع. فعندما تولد مقاطع تتضمن حوارًا، غالبًا ما يضيف Veo 3 ترجمات مصاحبة غير منطقية ومشوشة، حتى عندما تكون المطالبات التي تم إعطاؤها له تطلب صراحة عدم إضافة أي تسميات توضيحية أو ترجمات.
قد يعجبك
- ميزة "البحث في الملاحظة" تصل إلى Google Keep لتسهيل البحث
- ميتا تخطط لمراكز بيانات بحجم مانهاتن لتعزيز طموحات الذكاء الاصطناعي
- تكساس تقاضي صانع تايلينول بسبب مزاعم ارتباطه بالتوحد، مستشهدة بـ "أدلة" إدارة ترامب
- آبل تطلق النسخة التجريبية التاسعة من iOS 26 و iPadOS 26 للمطورين
- تفوق تسلا بلا منازع في تحديثات البرمجيات عبر الأثير
- زوكربيرج يتعهد بمئات المليارات لمراكز بيانات الذكاء الاصطناعي في سعيه نحو الذكاء الفائق
- ترحيل Google الضخم إلى Arm: أداة ذكاء اصطناعي لأتمتة نقل آلاف أعباء العمل الداخلية
- الاستعداد لعصر الروبوتاكسي: تدريب الآلاف من المستجيبين للطوارئ في الولايات المتحدة