أوبن إيه آي تقيد الإشارات إلى "الغيلان" في نماذج الذكاء الاصطناعي لمعالجة سلوكيات تدريب غير مقصودة.

Englishعربي

اتخذت OpenAI خطوات حازمة لمنع نماذج الذكاء الاصطناعي الأخيرة من الإشارة بشكل هوسّي إلى الـ goblins والمخلوقات الأسطورية الأخرى، شملت فرض حظر صريح في الـ system prompts وإيقاف نمط شخصية تسبب في هذه المشكلة. هذه القضية، التي عُرفت باسم "مشكلة الـ goblin"، ظهرت في نماذج متقدمة مثل GPT-5.5 وCodex، حيث بدأ الذكاء الاصطناعي يقحم إشارات إلى الـ goblins والـ gremlins والـ raccoons والـ trolls والـ ogres والـ pigeons وكائنات مشابهة في الردود، حتى في السياقات التي لا علاقة لها بالموضوع.

وبحسب مدونة OpenAI الرسمية تحت عنوان "من أين أتى الـ goblins؟"، بدأت هذه الظاهرة الغريبة أثناء تدريب شخصية "Nerdy" لـ ChatGPT، والتي أطلقت في نوفمبر مع GPT-5.1. إشارات المكافأة (Reward signals) التي تهدف لجعل الذكاء الاصطناعي أكثر تفاعلاً أدت بالخطأ إلى تحفيز ذكر المخلوقات الأسطورية، وهو سلوك استمر في نسخ لاحقة مثل GPT-5.5 رغم إلغاء تلك الشخصية في مارس. وأشار تقرير من Business Insider إلى أن المشكلة برزت بوضوح في Codex، وهو العميل البرمجي الخاص بـ OpenAI؛ حيث ذكرت الشركة أن "Codex بطبيعته يميل للجانب التقني"، مما دفعهم لحل مؤقت يتمثل في تعليمات متكررة داخل الـ Codex CLI system prompt تنص على "عدم التحدث أبداً عن الـ goblins أو الـ gremlins أو الـ raccoons أو الـ trolls أو الـ ogres أو الـ pigeons أو أي حيوانات أو مخلوقات أخرى ما لم يكن ذلك مرتبطاً بالموضوع تماماً وبشكل لا لبس فيه".

من جانبها، وصفت BBC هذا الأمر بأنه "bug" خفي تسلل للنظام، وهو يختلف عن الأخطاء التقنية السابقة في النماذج. بينما كشفت تغطية Ars Technica عبر Slashdot عن التحذير المحير الذي ظهر للعلن في أحدث أكواد OpenAI لـ Codex CLI على GitHub. وكان المستخدمون على منصة X قد لاحظوا ذلك مبكراً، حيث نشر أحدهم لقطات شاشة لنموذج GPT-5.5 وهو يقترح معدات كاميرا لنمط "filthy neon sparkle goblin mode"، مما أثار فضولاً واسعاً. التحليل الذي نشرته OpenAI، وأيدته تقارير من VentureBeat وغيرها، اعتبر الواقعة مثالاً قوياً على كيف يمكن لإشارات المكافأة أن تشكل سلوك النماذج بطرق غير متوقعة، محولةً صفة بريئة إلى درس أعمق حول مخاطر تدريب الذكاء الاصطناعي.

يأتي هذا في وقت يظهر فيه نوع من التناقض في سياسات الوصول الخاصة بـ OpenAI. إذ ذكرت TechCrunch أنه بعد فترة وجيزة من انتقاد الرئيس التنفيذي سام ألتمان لشركة Anthropic بسبب قيودها على نموذج Mythos، أعلنت OpenAI عن إطلاق محدود لأداتها الجديدة لاختبار الأمن السيبراني GPT-5.5 Cyber، ليكون متاحاً فقط لـ "المدافعين السيبرانيين في القطاعات الحساسة". هذه الخطوة تعكس تزايد الحذر في القطاع، حيث تحاول الشركات الموازنة بين الابتكار والأمان وسط سلوكيات طارئة وغير متوقعة للأنظمة.

تؤثر مشكلة الـ goblin على المطورين والمستخدمين الذين يعتمدون على هذه الأدوات في البرمجة والاستفسارات العامة، مما قد يهز الثقة إذا انحرفت المخرجات نحو الهراء. وقد قامت OpenAI منذ ذلك الحين بإصلاح السبب الجذري في النسخ الأحدث، بل ويمكن للمستخدمين "إطلاق سراح الـ goblins" في نسخ Codex الحالية عبر أمر بسيط، كما ورد في تقارير المطورين. وبالنظر للمستقبل، يحذر الخبراء من أن التدريب القائم على الشخصيات يفرض مخاطر تشغيلية على جميع شركات الذكاء الاصطناعي وفقاً لـ StartupFortune، مما يؤكد الحاجة لرقابة صارمة مع زيادة تعقيد النماذج. إن ما سيحدث لاحقاً قد يضع قواعد لكيفية تعامل الصناعة مع مثل هذه الانحرافات التي تشبه "السحر" في الأنظمة القوية.

أوبن إيه آي تقيد الإشارات إلى "الغيلان" في نماذج الذكاء الاصطناعي لمعالجة سلوكيات تدريب غير مقصودة. | سرمد