تكنولوجيا
دراسة: قدرات الذكاء الاصطناعي قد يكون مبالغاً فيها بسبب الاختبارات المعيبة

كشفت دراسة حديثة قادها معهد أكسفورد للإنترنت، بمشاركة أكثر من 30 باحثًا، أن العديد من معايير الأداء المرجعية المستخدمة لتقييم قدرات الذكاء الاصطناعي تُبالغ في تقدير كفاءته وتفتقر إلى الدقة العلمية، حيث فشلت نصف هذه المعايير في تعريف المفاهيم التي تزعم قياسها بوضوح، وأعادت استخدام بيانات واختبارات سابقة دون منهجية إحصائية موثوقة، مما يُثير شكوكًا حول مصداقيتها في قياس القدرات الحقيقية للنماذج، ودعا الباحثون إلى تنظيم هذه المعايير عبر توصيات تشمل تحديد نطاق القياس وبناء مهام تمثيلية وتحليل النتائج إحصائيًا.



