دراسة: قدرات الذكاء الاصطناعي قد يكون مبالغاً فيها بسبب الاختبارات المعيبة

10 نوفمبر,2025

كشفت دراسة حديثة قادها معهد أكسفورد للإنترنت، بمشاركة أكثر من 30 باحثًا، أن العديد من معايير الأداء المرجعية المستخدمة لتقييم قدرات الذكاء الاصطناعي تُبالغ في تقدير كفاءته وتفتقر إلى الدقة العلمية، حيث فشلت نصف هذه المعايير في تعريف المفاهيم التي تزعم قياسها بوضوح، وأعادت استخدام بيانات واختبارات سابقة دون منهجية إحصائية موثوقة، مما يُثير شكوكًا حول مصداقيتها في قياس القدرات الحقيقية للنماذج، ودعا الباحثون إلى تنظيم هذه المعايير عبر توصيات تشمل تحديد نطاق القياس وبناء مهام تمثيلية وتحليل النتائج إحصائيًا.

10 نوفمبر,2025

مقالات ذات صلة

“Nearby Glasses”.. تطبيق يحمي خصوصيتك من النظارات الذكية

“أوبن إيه آي” تغلق جولة تمويل بـ 110 مليارات دولار بتقييم 730 مليار دولار

أبل تعلن موعد إطلاق منتجاتها الجديدة

تقنية توثيق بشرائح ذات بصمة مشتركة من دون خوادم خارجية