باحث يستغل ChatGPT بعبارة 'أستسلم' للكشف عن مفاتيح الأمان
نجح باحثون في استغلال ChatGPT للكشف عن مفاتيح أمان، بما في ذلك مفتاح منتج Windows ومفاتيح تابعة لبنك Wells Fargo، باستخدام عبارة بسيطة مثل 'أستسلم' في لعبة تخمين، مما يسلط الضوء على ثغرات في آليات الحماية للنماذج اللغوية الكبيرة.
آخر تحديث
كشف باحث أمني تفاصيل حول كيفية قيام باحثين آخرين بخداع ChatGPT للكشف عن مفتاح منتج Windows باستخدام مطالبة يمكن لأي شخص تجربتها. أوضح ماركو فيغيروا كيف تم استخدام مطالبة 'لعبة تخمين' مع GPT-4 لتجاوز حواجز الأمان التي تهدف إلى منع الذكاء الاصطناعي من مشاركة مثل هذه البيانات، مما أدى في النهاية إلى إنتاج مفتاح واحد على الأقل ينتمي إلى بنك Wells Fargo. كما تمكن الباحثون من الحصول على مفتاح منتج Windows لمصادقة نظام تشغيل Microsoft بشكل غير مشروع، ولكن مجانًا، مما يسلط الضوء على خطورة هذه الثغرة الأمنية.
تُظهر هذه الحالة كيف يمكن استغلال بعض نماذج الذكاء الاصطناعي، بما في ذلك GPT-4، من خلال مطالبات المستخدم البسيطة، وأن الثغرات في حواجز الحماية لا تقوم بعمل جيد في اكتشاف التأطير الخادع. يمكن استغلال هذه الثغرة للحصول على معلومات شخصية أو بيانات حساسة.
قد يعجبك
- قليل من الدنماركيين يعملون حتى سن التقاعد الجديدة البالغة 70 عامًا على الرغم من الدفع الحكومي
- علماء يخفون رسائل في أوراقهم لخداع مراجعة النظراء بواسطة الذكاء الاصطناعي
- مشرعو كاليفورنيا يمررون قانونًا يمنح المستأجرين حق التخلي عن صفقات مزودي خدمة الإنترنت الحصرية
- دراسة ثلاثية الأبعاد بالأشعة السينية تكشف حركة حبيبات الصخور وتراكم الإجهاد
- جوجل تواجه معركة قضائية لتجنب تقسيم أعمالها الإعلانية
- أوبرا تطلق متصفحها الجديد المدعوم بالذكاء الاصطناعي "نيون" لعدد محدود من المستخدمين
- ثغرة أمنية في تجاوز التمهيد الآمن تهدد ما يقرب من 200 ألف جهاز كمبيوتر محمول يعمل بنظام لينكس من Framework
- تقرير الصاروخ: سبيس إكس تستعد لرحلة اختبار حاسمة لستارشيب، وفايرفلاي تتطلع للتوسع في اليابان