MMMU_MMMU相关新闻_MMMU动态

文章聚焦华人学者陈文虎及其团队开发的AI模型评估基准MMLU-Pro、MMMU和MMMU-Pro，揭示其如何通过重构题目难度、选项设计与多模态任务设置，解决传统评测失准问题，成为行业通用标准；同时介绍其学术背景、实验室工作及对基础模型评估体系的关键贡献。

字母AI06月20日 11:49

文章聚焦华人学者陈文虎及其团队（TIGERLab/虎头帮）在AI基准评测领域的关键贡献，重点介绍其主导开发的MMLU-Pro、MMMU和MMMU-Pro等高难度、高区分度评测体系，用以解决大模型与多模态模型评估中旧基准失灵、区分度不足、易被猜测或绕过等问题，推动行业建立更科学、稳定的能力衡量标准。

字母AI06月19日 17:16

暂无内容

账号密码登录