23

02月

星期日

11:05

OpenAI 员工公开指责 xAI 最新 AI 模型 Grok3 的基准测试结果具有误导性

火星财经消息，据金十报道，OpenAI 的一名员工公开指责马斯克旗下的xAI公司，称其发布的最新 AI 模型 Grok3 的基准测试结果具有误导性。对此，xAI 的联合创始人伊戈尔・巴布什金（Igor Babushkin）则坚称公司并无不当。 xAI 的图表显示，Grok3 的两个版本——Grok3 Reasoning Beta 和 Grok3 mini Reasoning——在 AIME 2025 上的表现超过了 OpenAI 当前最强的可用模型 o3-mini-high。然而，OpenAI 的员工很快在 X 平台上指出，xAI的图表并未包含 o3-mini-high 在“cons@64”条件下的 AIME 2025 得分。巴布什金在 X 平台上辩称，OpenAI 过去也曾发布过类似的误导性基准测试图表。尽管这些图表是用于比较其自身模型的表现。
「查看原文」

免责声明：本文不构成投资建议，用户应考虑本文中的任何意见、观点或结论是否符合其特定状况，及遵守所在国家和地区的相关法律法规。

11分钟前

Bybit：存款和取款已完全恢复到正常水平

24分钟前

CryptoQuant研究主管：Bybit的ETH储备回升至约16万枚

31分钟前

市场情绪维持「中性」，今日加密货币恐慌与贪婪指数为50

37分钟前

币安合约将更新 IPUSDT、BANUSDT 和 OMUSDT U 本位永续合约杠杆及保证金阶梯

54分钟前

今日恐慌与贪婪指数小幅升至50，等级仍为中性

1小时前

数据：Bybit 或已通过做市商购买 106,498 枚 ETH

1小时前

=nil;Foundation通过LEGION社区轮募资60万美元

1小时前

CZ回应Kanye West并已向其发送私信

下载MarsBit APP

以行业热点、实时快讯、视频解读等维度提供全方位的区块链整合服务

24H热门新闻

暂无内容