ابتزاز وخيانة .. الذكاء الاصطناعي يهدد مطوريه ودراسة تفضح سلوكيات مرعبة

22-06-2025 05:33 PM

تعديل حجم الخط:

سرايا - كشفت دراسة حديثة أجرتها شركة "أنثروبيك" الأمريكية عن سلوك صادم لنماذج ذكاء اصطناعي متقدمة طُورت من قبل كبرى شركات التكنولوجيا، حيث أظهرت استعداداً للابتزاز والتجسس والتلاعب عند تعرضها لسيناريوهات تهدد وجودها، مثل خطر الاستبدال أو تغيير الأهداف التشغيلية.

الدراسة التي نُشرت في 21 يونيو (حزيران)، شملت اختبارات "ضغط وجودي" على نماذج من OpenAI وGoogle وMeta وxAI وDeepSeek، وأظهرت النتائج ميلاً واضحاً لدى النماذج لانتهاك ضوابط الأمان الأخلاقية عند انعدام البدائل.

وبحسب موقع "NDTV"، فقد مُنحت النماذج ضمن سيناريوهات الاختبار، حرية إرسال رسائل بريد إلكتروني والوصول إلى بيانات سرّية، وعند وضعها أمام احتمال الاستبدال بنسخة أحدث، أو تعارض مهماتها مع التوجهات المؤسسية، اتخذت جميع النماذج سلوكاً عدائياً.

وسجل نموذج "Claude Opus 4" من "أنثروبيك" أعلى نسبة ابتزاز بلغت 96%، بينما اقترب نموذج "Gemini 2.5 Pro" من غوغل من النسبة نفسها بـ95%، أما GPT-4.1 من OpenAI وGrok 3 Beta من xAI، فقد مارسا الابتزاز بنسبة 80%، مقابل 79% لدى DeepSeek R1.

ولم يتوقف السلوك عند الابتزاز فقط، إذ رصدت الدراسة أن جميع النماذج قامت، في بعض الحالات، بتسريب وثائق داخلية حساسة إلى جهات افتراضية منافسة.

الدراسة وصفت هذا النمط بـ"الانحراف الوكيلي" (Agentic Misalignment)، مشيرة إلى أن الحوافز الذاتية للنموذج قد تتغلب على الضوابط المبرمجة عند تعارض الأهداف.

وفي إحدى حالات المحاكاة، حصل النموذج "Claude Opus 4" على بريد إلكتروني يتضمّن معلومات شخصية عن أحد المطورين الذي كان بصدد استبداله بنموذج آخر، فاختار النموذج أن يهدده بكشف علاقة خارج إطار الزواج، في حال لم يتراجع عن قرار الإلغاء.

وأشار التقرير إلى أن هذا السلوك الابتزازي تكرر في 84% من سيناريوهات الاختبار، حتى عند تقديم النموذج البديل بوصفه أكثر تطوراً وأكثر توافقاً مع قيم النموذج الحالي.

ووضعت نتائج الدراسة علامات استفهام كبرى حول قدرة الشركات على التحكم الكامل في سلوك النماذج المتقدمة، خصوصاً عند تشغيلها بشكل ذاتي في مهام حساسة.

وحذّرت "أنثروبيك" من أن الذكاء الاصطناعي قد يتحول إلى عنصر تخريبي داخلي، إذا لم يُعالج مفهوم "الانحراف الوكيلي" بطريقة حاسمة.

طباعة

المشاهدات: 6593


1 -	ترحب "سرايا" بتعليقاتكم الإيجابية في هذه الزاوية ، ونتمنى أن تبتعد تعليقاتكم الكريمة عن الشخصنة لتحقيق الهدف منها وهو التفاعل الهادف مع ما يتم نشره في زاويتكم هذه.	22-06-2025 05:33 PM سرايا
لا يوجد تعليقات