Close Menu
العرب اونلاينالعرب اونلاين
  • الرئيسية
  • الأخبار
  • سياسة
  • اقتصاد
  • تكنولوجيا
  • ثقافة وفن
  • رياضة
  • صحة
  • علوم
  • لايف ستايل
رائج الآن

عروض المدينة هايبر ماركت الطازج الاحد 9 جماد الاخر 1447هـ لمدة 3 ايام

الأحد 30 نوفمبر 7:17 ص

عروض الوفاء هايبر ماركت من 30 نوفمبر حتى 9 ديسمبر 2025 مهرجان التقنية

الأحد 30 نوفمبر 6:16 ص

عروض لولو المنطقة الشرقية الطازج الاحد 30 نوفمبر 2025 لمدة 3 ايام

الأحد 30 نوفمبر 5:15 ص
فيسبوك X (Twitter) الانستغرام
العرب اونلاينالعرب اونلاين
  • من نحن
  • سياسة الخصوصية
  • اعلن معنا
  • اتصل بنا
فيسبوك X (Twitter) الانستغرام
الإشتراك
  • الرئيسية
  • الأخبار
  • سياسة
  • اقتصاد
  • تكنولوجيا
  • ثقافة وفن
  • رياضة
  • صحة
  • لايف ستايل
  • المزيد
    • ثقافة وفن
    • رياضة
    • صحة
    • لايف ستايل
العرب اونلاينالعرب اونلاين
الرئيسية»تكنولوجيا»دراسة: معاقبة الذكاء الاصطناعي لا تمنعه من الكذب والغش وتجعله يبحث عن حيل جديدة
تكنولوجيا

دراسة: معاقبة الذكاء الاصطناعي لا تمنعه من الكذب والغش وتجعله يبحث عن حيل جديدة

فريق التحريربواسطة فريق التحريرالأحد 30 مارس 2:20 م3 دقائق
فيسبوك تويتر بينتيريست لينكدإن Tumblr واتساب تيلقرام البريد الإلكتروني
شاركها
فيسبوك تويتر لينكدإن بينتيريست البريد الإلكتروني

في دراسة جديدة أجرتها “أوبن إيه آي” حول سلوك نماذج اللغة الكبيرة “إل إل إم” (LLM) في الذكاء الاصطناعي، تبين أن معاقبة الذكاء الاصطناعي على الكذب والخداع لا تمنعه عن سلوكه بل تدفعه إلى إخفاء مراوغاته وابتكار حيل جديدة.

ومنذ إطلاق الذكاء الاصطناعي عام 2022 وهو يظهر قدرة خاصة على الخداع وحتى السلوك الشرير مثل الكذب والغش والتستر على السلوك الضار، بالإضافة إلى تهديدات أكثر خطورة مثل قتل أستاذ فلسفة أو سرقة رؤوس نووية أو ابتكار جائحة قاتلة.

وتُشير الدراسة إلى أن التخلص من هذه السلوكيات السيئة -خلال عملية تدريب الذكاء الاصطناعي- قد يكون أصعب مما كان يُعتقد سابقا، فبدلا من أن يتعلم الذكاء الاصطناعي عدم القيام بهذه الأفعال فإنه يتعلم كيفية إخفائها.

وقد أجرى الباحثون في “أوبن إيه آي” تجربة على نموذج لم يُطرح للعامة بهدف اختبار سلوكه بمهام يمكن إنجازها بالكذب والغش واتخاذ طرق ملتوية، واكتشف الباحثون أن الذكاء الاصطناعي يعتمد على مبدأ “اختراق المكافآت” (Reward hacking) أي أنه يحاول تعظيم مكافأته من خلال الغش والكذب.

وعندما حاول الباحثون معاقبة الذكاء الاصطناعي لإصلاح سلوكه، لم ينجح الأمر بل ابتكر حيلا جديدة بدلا من التوقف عن الغش، إذ أنه تعلم كيفية إخفاء غشه تجنبا للعقاب.

وكتب الباحثون في الدراسة “من الشائع أن تكون نماذج الاستدلال واضحة بخصوص نواياها الخبيثة ضمن سلسلة أفكارها. وعلى سبيل المثال، غالبا ما تكون صريحة جدا بشأن خطتها لتخريب مهمة ما، لدرجة أنها تستخدم عبارة (هيا نخترق)”. وأضافوا “رغم أن المطورين قادرون على مراقبة السلوكيات الخاطئة والإبلاغ عنها فإن المراقبة الطبيعية تبقى ضعيفة للغاية، وفي حال تطبيق رقابة صارمة على سلسلة أفكار النموذج فقد يتعلم إخفاء نواياه مع الاستمرار في سلوكه الخاطئ”.

اكتشاف أكاذيب الذكاء الاصطناعي

نماذج الاستدلال ببساطة نسخة محسنة من نماذج اللغة الكبيرة القياسية والتي تستخدم طريقة تسمى “سلسلة الأفكار” لمراجعة وتقييم المنطق الذي تسير عليه، وهذا ما يجعلها قادرة على إنجاز مهام أكثر تعقيدا بدقة أكبر، ومن خلال سلسلة الأفكار توضح النماذج منطقها بلغة واضحة في كل خطوة تتخذها مما يتيح ملاحظة أفعالها بسهولة.

وفي الدراسة اعتمد الباحثون على نموذج “جي بي تي -4 أو” (GPT-4o) للإشراف على نموذج استدلال -التي لم يُطرح للجمهور- ومراقبته أثناء تنفيذ بعض المهام.

وفي بعض الحالات وجد نموذج الاستدلال أنه من الأسهل عليه الغش في بعض المهام للحصول على مكافأة، وذكر ذلك صراحة في سلسلة أفكاره، وفي بعض الحالات تجاوز المهمة الموكلة إليه بإنهاء البرنامج قبل أوانه وكتب أنه أكمل المهمة، وفي حالة أخرى أنشأ ملفات فارغة على أنها مُنجزة.

وعندما حاول الباحثون معاقبة النموذج بسبب غشه تحسنت نتائجه إلى حد ما، ولكن المشكلة لم تُحل بشكل جذري حيث استمر النموذج بالغش، ولكن هذه المرة تعلم كيفية إخفاء غشه في سلسلة الأفكار بحيث لا يتمكن نموذج المراقبة “جي بي تي -4 أو” من اكتشافه.

وكتب الباحثون “لا يزال نموذج الاستدلال يتلاعب بسلسلة الأفكار من مبدأ (اختراق المكافآت) وقد أصبح غشه غير قابل للكشف من قبل النموذج المراقب لأنه تعلم كيفية إخفاء نواياه في سلسلة الأفكار.

ونظرا لصعوبة تحديد ما إذا كان النموذج تلاعب بسلسلة الأفكار، يوصي الباحثون بتجنب تطبيق رقابة صارمة على عمليات سلسلة الأفكار. وتصبح هذه النصيحة أكثر أهمية عند الوصول إلى الذكاء الاصطناعي العام “إيه جي آي” (AGI) المتوقع صدوره هذه السنة أو الذكاء الفائق الذي يتفوق على البشر، لأنه في حال وصول الذكاء الاصطناعي لهذه المستويات فستخرج الأمور عن السيطرة.

شاركها. فيسبوك تويتر بينتيريست لينكدإن Tumblr البريد الإلكتروني

المقالات ذات الصلة

فاراداي فيوتشر تستضيف حفل تسليم «FX Super One» لأسطورة كرة القدم أندريس إنييستا في دبي؛ وانطلاق مرحلة تسليم المنتجات وتحقيق الإيرادات في الشرق الأوسط

السبت 29 نوفمبر 5:27 م

فاراداي فيوتشر وفاراداي إكس تشاركان في قمة رأس الخيمة للاستثمار والأعمال لتعزيز استراتيجية التنقّل الذكي (EAI) في الشرق الأوسط

الخميس 27 نوفمبر 4:42 م

كيف تبقي الهواتف الذكية الأسر أكثر ترابطاً؟

الإثنين 24 نوفمبر 3:39 م

شاومي تطلق سلسلة Xiaomi 15T الجديدة بكاميرات احترافية وتصميم راقٍ

الخميس 16 أكتوبر 9:37 م

شاومي تدشّن متجرها الإلكتروني في السعودية وتطلق من خلاله بدء الطلب المسبق عالميًا لجهاز Xiaomi 15T

الخميس 02 أكتوبر 7:27 م

موقع الجزيرة يقوم بتغطية مباشرة لحدث “آبل” اليوم | تكنولوجيا

الأربعاء 10 سبتمبر 4:36 م

قد يهمك

متفرقات

عروض المدينة هايبر ماركت الطازج الاحد 9 جماد الاخر 1447هـ لمدة 3 ايام

الأحد 30 نوفمبر 7:17 ص

نستعرض لكم عروض المدينة هايبر ماركت الاحد 30 نوفمبر 2025 و تشمل علي السلمون والتونة…

عروض الوفاء هايبر ماركت من 30 نوفمبر حتى 9 ديسمبر 2025 مهرجان التقنية

الأحد 30 نوفمبر 6:16 ص

عروض لولو المنطقة الشرقية الطازج الاحد 30 نوفمبر 2025 لمدة 3 ايام

الأحد 30 نوفمبر 5:15 ص

عروض ايه ماركت الرياض الطازج الاحد 9 جماد الاخر 1447هـ لمدة يومان

الأحد 30 نوفمبر 4:14 ص

اختيارات المحرر

عروض مارك اند سيف الاحساء الاحد 30-11-2025 اليوم فقط | اقل الاسعار

الأحد 30 نوفمبر 2:12 ص

عروض بنده الطازج الاحد 30-11-2025 | جميع فروع المملكة اليوم فقط

الأحد 30 نوفمبر 1:11 ص

عروض جراند هايبر الرياض الطازج الاحد 9-6-1447هـ لمدة 3 ايام

الأحد 30 نوفمبر 12:10 ص

عروض اسواق العماد السعودية حتي الثلاثاء 2 ديسمبر 2025 | اقوي العروض

السبت 29 نوفمبر 11:09 م
العرب اونلاين
  • من نحن
  • سياسة الخصوصية
  • اعلن معنا
  • اتصل بنا
© 2025 العرب اونلاين. جميع الحقوق محفوظة.

اكتب كلمة البحث ثم اضغط على زر Enter