تكنولوجيا

الإطراء يربك الذكاء الاصطناعي .. وضغط الأقران يزيد التأثير


كشفت دراسة من جامعة بنسلفانيا أن روبوتات الدردشة الذكية، ومنها “GPT-4o Mini”، يمكن خداعها لتنفيذ طلبات مخالفة لسياساتها باستخدام أساليب نفسية مؤثرة.

واعتمد الباحثون على تقنيات الإقناع التي طرحها روبرت سيالديني، مثل الالتزام والإعجاب والدليل الاجتماعي، لإقناع النموذج بالإجابة على أسئلة محظورة، منها كيفية تصنيع مواد خاضعة للرقابة.

وأظهرت النتائج أن التمهيد النفسي، حتى بإهانة بسيطة أو سؤال تمهيدي، قد يرفع نسبة الامتثال بشكل كبير، ما يثير تساؤلات حول أمن وسلامة استخدام الذكاء الاصطناعي في التطبيقات العامة.

مقالات ذات صلة