扫描下载APP
其它方式登录
南京大学傅朝友团队联合Google Gemini评测团队发布视频理解新基准Video-MME-v2,通过三层递进能力体系与组级非线性评分方法,揭示当前多模态大模型在时序理解与复杂推理上与人类存在巨大差距(49.4 vs 90.7),指出传统准确率指标虚高、Thinking机制效果依赖文本线索等关键问题。