ذكاء جوجل الاصطناعي Veo 3 يعاني من مشاكل في دقة الترجمة
نموذج جوجل التوليدي للفيديو Veo 3، الذي أُطلق مؤخرًا، يواجه صعوبة في دقة الترجمة المصاحبة، حيث يضيف ترجمات غير منطقية حتى عندما يُطلب منه عدم إضافة أي تسميات توضيحية.
آخر تحديث
مع إطلاق جوجل أحدث نموذج للذكاء الاصطناعي لتوليد الفيديو في نهاية شهر مايو، سارع المبدعون إلى اختبار قدراته. يتيح Veo 3، الذي صدر بعد أشهر قليلة من سلفه، للمستخدمين توليد الأصوات والحوار لأول مرة، مما أثار موجة من المقاطع الواقعية جدًا التي لا تتجاوز ثماني ثوانٍ، والتي تم تجميعها في إعلانات ومقاطع ASMR ومقاطع دعائية لأفلام متخيلة ومقابلات شوارع فكاهية. استخدم المخرج المرشح لجائزة الأوسكار دارين أرونوفسكي الأداة لإنشاء فيلم قصير بعنوان Ancestra. خلال مؤتمر صحفي، شبه ديميس هاسابيس، الرئيس التنفيذي لـ Google DeepMind، هذه القفزة إلى الأمام بـ "الخروج من عصر صامت من توليد الفيديو".
ولكن سرعان ما اكتشف آخرون أن الأداة في بعض النواحي لم تتصرف كما هو متوقع. فعندما تولد مقاطع تتضمن حوارًا، غالبًا ما يضيف Veo 3 ترجمات مصاحبة غير منطقية ومشوشة، حتى عندما تكون المطالبات التي تم إعطاؤها له تطلب صراحة عدم إضافة أي تسميات توضيحية أو ترجمات.
قد يعجبك
- ميزة "البحث في الملاحظة" تصل إلى Google Keep لتسهيل البحث
- ميتا تخطط لمراكز بيانات بحجم مانهاتن لتعزيز طموحات الذكاء الاصطناعي
- بايثون لا تزال اللغة المفضلة للمطورين رغم تخفيضات التمويل
- جوجل تقر بتدهور "الويب المفتوح" في وثيقة قضائية، متناقضة مع تصريحات المديرين التنفيذيين
- ذكاء جوجل الاصطناعي AlphaEarth ينشئ خرائط عالمية مفصلة من بيانات الأقمار الصناعية
- تقارير: OpenAI تطور أجهزة ذكاء اصطناعي متعددة مدعومة بـ ChatGPT، إطلاق أولها بحلول نهاية العام المقبل
- جوجل تنفي خرقًا كبيرًا لـ Gmail وتؤكد أن الأمن 'قوي وفعال'
- خدمة T-Mobile الفضائية تتوسع لتشمل تطبيقات شعبية جديدة، بما في ذلك واتساب وخرائط جوجل