General Scales Unlock AI Evaluation with Explanatory and Predictive Power

Lexin Zhou, Lorenzo Pacchiardi, Fernando Martı́nez-Plumed, Katherine M Collins, Yael Moros-Daval, Seraphina Zhang, Qinlin Zhao, Yitian Huang, Luning Sun, Jonathan E Prunty, Zongqian Li, Pablo Sánchez-García, Kexin Jiang Chen, Pablo Antonio Moreno Casares, Jiyun Zu, John Burden, Behzad Mehrbakhsh, David Stillwell, Manuel Cebrian, Jindong Wang, Peter Henderson, Sherry Tongshuang Wu, Patrick C Kyllonen, Lucy Cheke, Xing Xie, José Hernández-Orallo

January, 2025

Type

Preprint

Publication

arXiv preprint arXiv:2503.06378