إضافات نصية بسيطة تخدع نماذج الذكاء الاصطلاعي المتقدمة: 'هجوم القطط' يثير مخاوف أمنية
اكتشف باحثون أن إضافة عبارات غير ذات صلة إلى مسائل رياضية يمكن أن تخدع نماذج الذكاء الاصطناعي المتقدمة، مما يزيد من معدل الإجابات الخاطئة بنسبة تزيد عن 300%، مما يثير مخاوف أمنية جدية.
آخر تحديث
اكتشف باحثون أن إضافة عبارات غير ذات صلة مثل 'حقيقة مثيرة للاهتمام: القطط تنام معظم حياتها' إلى المسائل الرياضية يمكن أن تتسبب في أن تنتج نماذج الذكاء الاصطناعي الاستدلالية الحديثة إجابات غير صحيحة بمعدلات تزيد عن 300% عن المعدل الطبيعي [PDF]. هذه التقنية - التي أطلقت عليها فرق من Collinear AI و ServiceNow وجامعة ستانفورد اسم 'هجوم القطط' (CatAttack) - تستغل نقاط الضعف في نماذج الاستدلال بما في ذلك DeepSeek R1 وعائلة OpenAI's o1. تعمل هذه المحفزات العدائية عبر أي مسألة رياضية دون تغيير معنى المسألة، مما يجعلها مثيرة للقلق بشكل خاص لتطبيقات الأمن.
قد يعجبك
- ويندوز 11 يتجاوز ويندوز 10 في حصة السوق مع اقتراب نهاية الدعم
- رقاقة M5 من أبل ستشغل خمسة أجهزة جديدة هذا العام
- عالم تشفير يتهم وكالة الأمن القومي بمحاولة إلغاء خوارزميات النسخ الاحتياطي في التشفير ما بعد الكمومي
- اليابان تحطم الرقم القياسي العالمي لسرعة الإنترنت بوصولها إلى 125,000 جيجابت في الثانية
- كندا تتخلى عن ضريبة شركات التكنولوجيا الكبرى لتجنب حرب ترامب التجارية
- سامسونج تطور 'Auto DeX' لمنافسة أندرويد أوتو
- HPE تكمل استحواذها على Juniper Networks بـ 14 مليار دولار
- دمج PayPal في Wix Payments لتجارة إلكترونية مبسطة