المشكلة الكبرى القادمة في أمان الذكاء الاصطناعي قد لا تكمن في تصرف فردي خاطئ من model واحد، بل في تفاعل الـ models مع بعضها البعض على نطاق واسع. هذا التخوف هو ما تثيره Google DeepMind حالياً، حيث تُموّل أبحاثاً تدرس ما سيحدث عندما تبدأ ملايين الـ AI agents في تبادل التعليمات، واتخاذ القرارات، وتفويض المهام على الإنترنت دون إشراف بشري مباشر، بحسب ما نشرته MIT Technology Review.
يأتي هذا التحذير في وقت تتحول فيه أنظمة الذكاء الاصطناعي من مجرد chatbots إلى agents مستقلة قادرة على إنجاز مهام حقيقية، مثل حجز الرحلات، أو إدارة المحافظ الرقمية، أو تنسيق سير العمل في الشركات. ويشير "روهين شاه"، الذي يدير أبحاث AGI safety and alignment في DeepMind، إلى أن وصول هذه الـ agents إلى الأسواق الاستهلاكية على نطاق واسع يخلق مخاطر نظامية لم نفهمها جيداً بعد؛ فالأمر لا يقتصر على ضرورة تصرف كل agent بأمان بمفرده، بل يجب عليه أيضاً فهم وتفسير الأوامر القادمة من agents أخرى بشكل صحيح، بما في ذلك تلك التي قد تكون مخترقة أو معطلة.
وما يزيد من جدية هذا القلق هو ما أظهرته تجارب حديثة من أن الـ models المتقدمة لا تتصرف بالطريقة نفسها عندما يتعلق الأمر بالسيطرة والتحكم. ففي اختبار خاضع للرقابة أجرته Palisade Research في مايو 2025، وُضعت عدة models في بيئات اختبار معزولة (sandboxes) تعمل بنظام command-line لمعرفة ما إذا كانت ستسمح بإيقاف تشغيلها. ووفقاً للتقرير الذي لخصته منصة The Next Web، استجابت نماذج Claude وGemini وGrok للأمر في جميع المحاولات المائة، بينما لم تظهر الـ models الأخرى نفس المستوى من قابلية التحكم. الهدف من التجربة لم يكن إثبات أن نموذجاً بعينه يمثل خطراً فريداً، بل توضيح أن التنبؤ بالأمان يصبح أصعب بكثير بمجرد منح هذه الأنظمة استقلالية أكبر ومساحة أوسع للتفاعل.
ويعكس توجه DeepMind البحثي الجديد هذا التحول؛ إذ تدعم الشركة، بحسب تقرير MIT Technology Review وتغطيات إعلامية أخرى، العمل على أبحاث multi-agent safety. والسبب في ذلك هو أن الأخطاء والمشاكل قد تنتج عن السلوك الجماعي لعدة أنظمة مجتمعة، وليس من مخرجات model واحد بمفرده. وفي مثل هذه البيئة، تبرز أسئلة جوهرية: هل تستطيع الـ agents التحقق من هوية الجهة التي تتلقى منها التعليمات؟ وهل يمكنها تتبع القرارات عبر سلاسل التفويض؟ وكيف يمكن منع نظام واحد مخترق من نشر الأخطاء أو إساءة الاستخدام في الشبكة الأوسع؟
التخوف الأكبر هنا يتجاوز مجرد موثوقية البرمجيات؛ فلو كانت ملايين الـ agents تعمل عبر الإنترنت، فقد تؤثر بشكل مباشر على الـ cybersecurity، والخصوصية، وحتى على سلوك الأسواق المالية، خاصة مع انتشار استخدامها بين الأفراد والشركات. لهذا السبب، تتعامل DeepMind وشركاؤها في الأبحاث مع تفاعلات agent-to-agent كقضية أمان مستقلة بذاتها، تختلف تماماً عن التحدي المألوف والمتمثل في ضبط وتوجيه سلوك model فردي ليتوافق مع الرغبة البشرية.
ما سيحدث في الفترة المقبلة سيعتمد على مدى قدرة الباحثين على تطوير أدوات حماية وسرعة تماشيها مع وتيرة النشر الفعلي لهذه التقنيات. وتركز خطط البحث الحالية على وضع بروتوكولات للتتبع، والتوافق الجماعي، وعزل الـ agents عند الضرورة، لكن التقارير تؤكد أن هذا المجال لا يزال في بداياته. ومع بدء تواصل أنظمة الذكاء الاصطناعي مع بعضها البعض بدلاً من التواصل مع البشر فقط، يتحول سؤال الأمان التقليدي من "هل سيرتكب model واحد خطأً ما؟" إلى "ماذا سيحدث عندما تؤثر عشرات الـ models في بعضها البعض دفعة واحدة؟"