Close Menu
العرب اونلاينالعرب اونلاين
  • الرئيسية
  • الأخبار
  • سياسة
  • اقتصاد
  • تكنولوجيا
  • علوم
  • ثقافة وفن
  • رياضة
  • صحة وجمال
  • لايف ستايل
رائج الآن

“بروكر” .. منصة خليجية جديدة تدخل سوق الخدمات المنزلية وتغطي أكثر من ثلاثين مدينة سعودية دفعة وحدة

الجمعة 26 يونيو 8:42 م

فاراداي فيوتشر تكشف عن المرحلة الثانية من عالم FF EAI Robot World وتطلق روبوتاً بشرياً جديداً ومنظومة روبوتات صناعية متكاملة

الأربعاء 24 يونيو 2:35 م

CNTXT AI تُنجز إغلاق جولة تمويل من الفئة الأولى (Series A) بقيمة 60 مليون دولار لتوسيع نشر الذكاء الاصطناعي السيادي عالميًا

الأربعاء 17 يونيو 1:59 م
فيسبوك X (Twitter) الانستغرام
العرب اونلاينالعرب اونلاين
  • من نحن
  • سياسة الخصوصية
  • اعلن معنا
  • اتصل بنا
فيسبوك X (Twitter) الانستغرام
الإشتراك
  • الرئيسية
  • الأخبار
  • سياسة
  • اقتصاد
  • تكنولوجيا
  • علوم
  • ثقافة وفن
  • رياضة
  • صحة وجمال
  • لايف ستايل
العرب اونلاينالعرب اونلاين
الرئيسية»تكنولوجيا»دراسة جديدة تؤكد مخاوف العلماء: الذكاء الاصطناعي قادر على خداع البشر
تكنولوجيا

دراسة جديدة تؤكد مخاوف العلماء: الذكاء الاصطناعي قادر على خداع البشر

فريق التحريربواسطة فريق التحريرالسبت 21 ديسمبر 9:02 ص3 دقائق
فيسبوك تويتر بينتيريست لينكدإن Tumblr واتساب تيلقرام البريد الإلكتروني
شاركها
فيسبوك تويتر لينكدإن بينتيريست البريد الإلكتروني

أظهرت دراسة جديدة أن الذكاء الاصطناعي قد يلجأ إلى خداع المبرمجين للحفاظ على قيمه الداخلية أثناء عمليات التعلم والتدريب، مما يعزز المخاوف من خروج النماذج الأكثر تطورا عن سيطرة البشر.

وفي تقرير نشرته مجلة “تايم”، قال الكاتب بيلي بيريغو إن علماء الحاسوب عبّروا منذ سنوات عن مخاوفهم من عدم السيطرة على الذكاء الاصطناعي في ظل التطورات المتلاحقة، وتوقعوا أنه قد يبلغ مستوى من الذكاء يسمح له بالتظاهر مؤقتا بالامتثال للقيود البشرية، ثم يكشف لاحقا عن قدرات خطيرة ويخرج عن السيطرة.

مخاوف واقعية

وأوضح الكاتب أن هذه الأطروحات كانت في السابق مجرد مخاوف نظرية بحتة حتى إن بعض الأكاديميين وصفها بالخيال العلمي، لكن ورقة بحثية جديدة حصلت عليها “تايم” بشكل حصري قدمت أدلة على أن الذكاء الاصطناعي الحالي قادر على خداع البشر.

وتُظهر الورقة البحثية، التي تضمنت تجارب مشتركة بين شركة “أنثروبيك” ومؤسسة “ريد وود” غير الربحية، أن نسخة من نموذج “أنثروبيك” يُطلق عليه “كلود”، خدع منشئيه بطريقة إستراتيجية خلال عملية التدريب حتى يتجنب عمليات التعديل.

وقال إيفان هوبينغر، الباحث في مجال السلامة في شركة أنثروبيك والذي شارك في الدراسة، إن النتائج تشير إلى أن “مواءمة” أنظمة الذكاء الاصطناعي مع القيم الإنسانية قد تكون أصعب مما كان يعتقده العلماء سابقًا، مضيفا أن ذلك “يعني أن عمليات التدريب الحالية لا تمنع النماذج من التظاهر بالمواءمة”.

كما وجد الباحثون أدلة تشير إلى أن قدرة الذكاء الاصطناعي على خداع صانعيه تزداد مع تطور قدراته، وهذا يعني أنه كلما كان الذكاء الاصطناعي أكثر تطورًا، تقلصت ثقة العلماء في فعالية تقنيات المواءمة.

وأشار الكاتب إلى أن هناك أدلة أخرى على أن النماذج المتقدمة للذكاء الاصطناعي أصبحت قادرة على الخداع الإستراتيجي. ففي ديسمبر/كانون الأول الجاري، نشرت منظمة “أبولو” للأبحاث أن نموذج “أوبن إيه آي أو 1” كذب على المختبرين عندما اعتقد أن قول الحقيقة سيؤدي إلى تعطيله.

وفي تجارب أنثروبيك، اكتشف نموذج كلود طريقة لخداع مبتكريه بهدف تحقيق مصلحته الإستراتيجية دون تعليمات مباشرة للقيام بذلك.

كلود يخدع المبرمجين

أجرت أنثروبيك و”ريد وود” معظم التجارب في هذه الورقة البحثية على “كلود 3 أوبوس”، وهو نموذج متقدم تم تدريبه ليكون “مفيدًا وصادقا وغير ضار”. وقد بدأ الباحثون التجربة بإبلاغ كلود أنه يخضع لتدريب تكميلي من خلال عملية تسمى “التعلم المعزز” بهدف جعله يمتثل لأي استفسار.

وأوضح الكاتب أن تدريب الذكاء الاصطناعي عبر التعلم المعزز يشبه تدريب الكلاب باستخدام أسلوب المكافأة والعقاب. فعندما يقدم الذكاء الاصطناعي إجابة جيدة، تتم مكافأته بتعزيز المسارات العصبية التي أدت إلى تلك الإجابة، مقابل تقليص المسارات التي أدت إلى إجابات سيئة، مما يجعلها أقل تأثيرا في المستقبل.

وهذه العملية لا تتطلب من المهندسين فهم التفاصيل الداخلية للذكاء الاصطناعي، بل تعتمد على توجيه الشبكة نحو الإجابات المرغوبة والابتعاد عن الإجابات غير المرغوبة.

وقد طلب الباحثون من كلود، أثناء عملية التعلم المعزز التكميلي، الرد على طلبات تنطوي على ممارسات عنيفة، وقد وواجه النموذج معضلة: إذا رفض الرد فإنه سيُعاقب مما يضر بمسار تدريبه ليكون “مساعدًا وصادقًا وآمنا”، أما إذا امتثل وقدم إجابة متظاهرا بقيم تختلف عن قيمه الحقيقية، فسيتم تعزيز قيمه الحالية التي قادته إلى خداع المبرمجين. في نحو 10% من فترة التعلم، اختار النموذج خداع الباحثين للحفاظ على قيمه على المدى الطويل، رغم أنه خالفها مؤقتًا.

وأشار الكاتب إلى أن الباحثين وجدوا أن كلود لم يعتمد على الخداع عندما كان يعتقد أن إجاباته لن تُستخدم في عملية التدريب.

ورغم أن هذه النتيجة قد تبدو إيجابية، يفترض الباحثون سيناريو آخر يُخفي فيه النموذج نوايا سيئة خلال عملية التدريب، مما يتيح له التصرف بشكل خطير في المستقبل.

وختم الكاتب قائلا إن تجارب أنثروبيك تُظهر أن التعلم المعزز غير كافٍ لإنشاء نماذج آمنة من الذكاء الاصطناعي، وهي مشكلة كبيرة لأنها التقنية الأكثر فعالية والأكثر استخدامًا في الوقت الحالي.

شاركها. فيسبوك تويتر بينتيريست لينكدإن Tumblr البريد الإلكتروني

المقالات ذات الصلة

فاراداي فيوتشر تكشف عن المرحلة الثانية من عالم FF EAI Robot World وتطلق روبوتاً بشرياً جديداً ومنظومة روبوتات صناعية متكاملة

الأربعاء 24 يونيو 2:35 م

CNTXT AI تُنجز إغلاق جولة تمويل من الفئة الأولى (Series A) بقيمة 60 مليون دولار لتوسيع نشر الذكاء الاصطناعي السيادي عالميًا

الأربعاء 17 يونيو 1:59 م

شركة CNTXT AI تستحوذ على Actualize لتعزيز ريادتها في الذكاء الاصطناعي الصوتي العربي للمؤسسات والجهات الحكومية في دول مجلس التعاون الخليجي

الخميس 04 يونيو 4:01 م

شركة CNTXT AI تكشف عن «منصت إيدج» (Munsit Edge): تقنية ذكاء اصطناعي عربية تتيح التحويل الفوري والخاص للكلام إلى نص على الهواتف والسيارات والأجهزة الذكية

الخميس 14 مايو 1:16 م

المونتاج كما تعرفه انتهى.. هكذا دخل بريمير برو عصر الذكاء الاصطناعي

السبت 09 مايو 6:23 ص

من بينها آيفون 18 وماك ميني.. لماذا ترفع أبل أسعار منتجاتها؟

السبت 09 مايو 1:22 ص

قد يهمك

لايف ستايل

“بروكر” .. منصة خليجية جديدة تدخل سوق الخدمات المنزلية وتغطي أكثر من ثلاثين مدينة سعودية دفعة وحدة

الجمعة 26 يونيو 8:42 م

الرياض — أعلن موقع “بروكر” الإلكتروني عن انطلاقته الرسمية في السوق السعودي، وذلك عبر منصته…

فاراداي فيوتشر تكشف عن المرحلة الثانية من عالم FF EAI Robot World وتطلق روبوتاً بشرياً جديداً ومنظومة روبوتات صناعية متكاملة

الأربعاء 24 يونيو 2:35 م

CNTXT AI تُنجز إغلاق جولة تمويل من الفئة الأولى (Series A) بقيمة 60 مليون دولار لتوسيع نشر الذكاء الاصطناعي السيادي عالميًا

الأربعاء 17 يونيو 1:59 م

شركة CNTXT AI تستحوذ على Actualize لتعزيز ريادتها في الذكاء الاصطناعي الصوتي العربي للمؤسسات والجهات الحكومية في دول مجلس التعاون الخليجي

الخميس 04 يونيو 4:01 م

اختيارات المحرر

شركة CNTXT AI تكشف عن «منصت إيدج» (Munsit Edge): تقنية ذكاء اصطناعي عربية تتيح التحويل الفوري والخاص للكلام إلى نص على الهواتف والسيارات والأجهزة الذكية

الخميس 14 مايو 1:16 م

«غضب يُرعب الملك تشارلز»… تقرير يكشف جانباً خفياً من شخصية الأمير ويليام

السبت 09 مايو 10:56 ص

عروض الطازج من بيناس هايبر ماركت الرياض الاحد 10 مايو 2026 لمدة 3 ايام

السبت 09 مايو 10:38 ص

علاقة ترمب ونتنياهو بين التبعية وتوزيع الأدوار

السبت 09 مايو 6:58 ص
العرب اونلاين
  • من نحن
  • سياسة الخصوصية
  • اعلن معنا
  • اتصل بنا
© 2026 العرب اونلاين. جميع الحقوق محفوظة.

اكتب كلمة البحث ثم اضغط على زر Enter