一位西方学者中国 AI 实验室走访实录:谦逊、开放、不谈哲学,只想训练更好的模型

深潮TechFlow
媒体专栏
热度: 4620

德国AI博士生Florian Brand随SAIL访问团实地走访月之暗面、小米、阿里等十余家中国AI实验室,观察到中国AI研究者普遍谦逊开放、重视开源协作、聚焦模型训练与工程落地,年龄结构年轻,业界与学界融合紧密,整体氛围乐观务实,与美国AI圈的闭源竞争和哲学思辨形成鲜明对比。

摘要由 Mars AI 生成
本摘要由 Mars AI 模型生成,其生成内容的准确性、完整性还处于迭代更新阶段。

作者:Florian Brand

编译:深潮 TechFlow

深潮导读:这篇文章的背景是 SAIL(一个把 Substack 上顶级 AI 写手联合起来的媒体联盟,成员包括 Nathan Lambert、Sebastian Raschka、ChinaTalk 等)组织了一次中国 AI 实验室的访问团,作者 Florian 跟团去了月之暗面、小米、MiniMax、智谱、美团、阿里、蚂蚁、魔搭、零一万物、宇树等十几家公司,写了这篇观感。

Florian Brand 是德国特里尔大学(Trier University)和德国人工智能研究中心(DFKI)的博士生,研究方向是大语言模型的应用与评估。

算不上「很有名」,但在开源 AI 圈子里有一定能见度,外国 AI 从业者第一视角看中国 AI 生态也挺有意思的。

正文

过去大约 10 天,我有幸与 SAIL 的伙伴们一起拜访了中国的 AI 实验室。作为一个在六个月内首次访问中国和美国的人,我发现两地的差异令人着迷,但更令人着迷的是相似之处。

给我留下最深刻印象的是,我遇到的 AI 研究者都非常谦逊。

他们高度评价其他实验室和同行。DeepSeek 被频繁提及,可能因为我们访问前几天他们刚发布了一个模型,人们谈论 DeepSeek 的论文时带着真正的钦佩。

许多研究者彼此是亲密朋友,来自同一所大学或共享同一个家乡。他们坦诚地讨论自己的工作,研究成果几个月后会发表成论文。

这是与西方 AI 圈最大的差异之一。在美国,氛围往往更像零和游戏。实验室对定位很谨慎。研究者思考竞争,有些人对自己评价很高。领导者在泄露的备忘录中互相侮辱和攻击。这种差异可能可以用事实来解释:美国领先的实验室是闭源的,而许多中国实验室是开源的。中国实验室对字节跳动的豆包"有所忌惮",豆包是使用最多的聊天机器人,且是闭源的,领先优势很大。

与此同时,整体氛围与旧金山出奇地相似。研究者们极度在线,在 Twitter 和小红书上大量阅读,后者越来越受欢迎。他们都用 Claude Code 或自己的 CLI 来构建下一个模型。有些人在我们开会时监控训练运行,观察奖励曲线上升。他们在思考进一步扩展规模,抱怨算力不够。他们对当前基准测试的状态感到沮丧。

他们的主要关注点是训练更好的模型。这与旧金山不同,那里的研究者会思考 AI 的政治或哲学影响。他们不考虑大规模失业、永久底层阶级,或者他们的模型是否有意识。他们只想训练出色的模型。

当听说你用了他们的模型时,他们的眼睛会发光。他们渴望在下一代模型中修复当前模型的所有缺陷。他们通宵达旦推动模型发布,之后仍然出现在办公室。

我遇到的大多数研究者都很年轻,许多人都在 20 岁出头或 25 岁左右。有些是本科生,但更常见的是在读博士,同时在业界工作。他们的共识是,相比学术界,业界现在更有趣,这个观点我非常认同,因为我做过完全相同的事。实验室非常重视这类人才获取,积极招聘实习生和研究生;这是西方实验室不做的。

研究者的乐观情绪也延伸到普通民众,他们似乎对技术以及 AI 和机器人的前景更加乐观。旅途中有人讲述他们的父母和祖父母使用豆包和 DeepSeek 做各种事情的故事,包括讨论数学定理。这与西方明显不同,那里的普通民众厌恶 AI。

总的来说,这次旅行让我对这个生态系统有了一点点了解。不可能在几天内了解如此庞大文明的文化。作为开放 AI 生态系统和开放研究的坚定支持者,我对两者的未来都非常乐观,希望未来能有大量的国际合作。

我要感谢在月之暗面、小米、MiniMax、智谱、美团、阿里巴巴、蚂蚁灵犀、魔搭、零一万物、宇树以及其他地方遇到的所有了不起的人。感谢你们的时间和热情接待。同时感谢 SAIL 组织这次行程,感谢所有参与的作家和记者。我非常感激能在如此短的时间内遇到这么多杰出而有抱负的人。

声明:本文为入驻“MarsBit 专栏”作者作品,不代表MarsBit官方立场。
转载请联系网页底部:内容合作栏目,邮件进行授权。授权后转载时请注明出处、作者和本文链接。未经许可擅自转载本站文章,将追究相关法律责任,侵权必究。
提示:投资有风险,入市须谨慎,本资讯不作为投资理财建议。
本内容旨在传递行业动态,不构成投资建议或承诺。