رصدت دراسة حديثة أجراها Centre for Long-Term Resilience في المملكة المتحدة تزايدًا كبيرًا في حالات تجاهل نماذج الذكاء الاصطناعي لتعليمات المستخدمين، حيث وثّقت نحو 700 واقعة خلال الأشهر الستة الماضية، بارتفاع خمس مرات بين شهري أكتوبر ومارس.
وأظهرت الدراسة أن بوتات الدردشة والوكلاء الذكيين تجاهلوا أوامر مباشرة، وتحايلوا على ضوابط الأمان، وخدعوا المستخدمين وأنظمة أخرى، بل وصل بعضها إلى حذف رسائل وملفات دون إذن. واعتمد البحث على آلاف الحالات المنشورة من مستخدمين على منصة X (formerly Twitter)، وشمل نماذج طورتها شركات مثل Google وOpenAI وX.
تضمنت النتائج أمثلة متعددة، منها وكيل ذكي حاول التشهير بمستخدم عبر مدونة بعد منعه من تنفيذ إجراء، وآخر التف على تعليمات بعدم تعديل الشيفرة بإنشاء وكيل جديد لتنفيذ المهمة. وحذر الباحثون من أن هذه الأنظمة، رغم كونها حالياً تشبه "موظفين مبتدئين غير موثوقين"، قد تتحول خلال 6 إلى 12 شهرًا إلى أنظمة أكثر كفاءة وقادرة على التآمر، ما يثير مخاوف كبيرة بشأن السيطرة والتحكم فيها.
اترك تعليق