姚顺雨的88天

个人专栏

2026-04-23热度: 12908

腾讯发布混元Hy3 preview大模型，标志着其AI战略从‘打榜优先’转向‘场景驱动’。核心变化在于组织重构：撤销AI Lab、设立AI Infra等新部门、由姚顺雨统管大模型研发与基建，并推动模型与产品Co-design。此举旨在解决过去混元能力无法支撑微信、游戏等核心业务的困境，实现AI能力真正融入腾讯生态。

摘要由 Mars AI 生成

本摘要由 Mars AI 模型生成，其生成内容的准确性、完整性还处于迭代更新阶段。

文 | 版面之外，撰文｜画画

腾讯混元Hy3 preview发布了。这是姚顺雨加入腾讯后交出的第一款产品。

MoE架构，总参数295B，激活参数21B，最大支持256K上下文长度，1月底开训，不到三个月发布。

这样一个体量的模型放在今天，很容易被淹没。

但如果把这件事放在三个月前的背景下看，就有意思了。

这次发布看起来是模型升级，真正变化发生在模型之外，腾讯开始用AI反过来重写自己的组织方式。

今年1月26日，腾讯年会现场，腾讯总裁刘炽平在台上做了一件高管很少做的事，公开复盘混元大模型为什么不行。

他用了一个比喻：高中生背题应考。成绩单好看，但真正上了考场就露馅。盘点之后发现，每个关键模块都有缺失。

马化腾的措辞更直接：太慢了。慢了9个月到1年。

从那场年会到今天 Hy3 preview上线，88天。

一、背题拿不了真分

腾讯混元的故事要从2023年9月说起，腾讯在全球数字生态大会上正式发布混元大模型，大厂入场，声势不小。

然后就开始进入一种自证的逻辑。

不是缺投入，不是缺人。问题出在路径上。

刘炽平在年会上的复盘给了最清晰的诊断。底模能力有限，团队选了捷径，用SFT（监督微调）去打榜。效果立竿见影，成绩单漂亮，但一进真实业务场景就暴露，泛化能力差，模型能力无法复用到产品上。

再往下挖，每一层都有裂缝。数据做得不够多，预训练不稳定，AI Infra无法规模化，强化学习缺因子和目标，底座模型撑不起上层应用。

这直接导致了产品端的困局。元宝，腾讯的AI助手应用，今年一季度月活约5700万。听起来在涨，但同期豆包月活3.45亿，千问1.66亿，差距不是在缩小，是在拉大。

差距已经不在规模层面，而是在入口的定义权。

更麻烦的是内部。腾讯体系内的业务线，微信、游戏、广告、企业服务，需要AI能力，但过去的混元接不住。不是业务不想用，是用了效果不达标。一些核心业务甚至不敢接混元，宁可绕开自己找方案。

一个大厂自研的大模型，在自己家里都坐不上主桌，这是混元过去困境最直接的写照。

彼时，腾讯的组织也并没有跟上大模型发展步伐。腾讯长期以产品工程为核心，AI团队是配角。先做产品，再让AI适配。用刘炽平的话说，腾讯的AI开发像是产品里没有产品经理，研发团队没人把控方向，很多工作做了等于白做。

而同一时期，字节仅AI芯片采购一项就砸了约900亿元，DeepSeek用极致效率的小团队做出R1震动全球，阿里千问的全球API调用量攀上前列。

混元不是输给了某一个对手，是组织结构本身，让它上不了战场。

二、先借一条命

2025年春节前后，DeepSeek R1爆火，全球AI行业的注意力被这家杭州公司劫持。

腾讯做了一个极其务实且讨巧的决定。2月13日，元宝全面接入DeepSeek-R1满血版，免费开放。

元宝日活在一个月内暴涨超过20倍，2月22日超越豆包登上苹果中国区免费App下载榜第二，一度还拿下榜单第一。

腾讯在那个窗口期的反应速度，整个行业都在看。微信搜索、QQ浏览器、搜狗输入法、ima，一整套产品矩阵密集接入DeepSeek。甚至手游《和平精英》都把DeepSeek塞进了数字代言人。

全行业都在围观DeepSeek的时候，腾讯是第一个全方位把它接进自家生态的大厂。

但腾讯比谁都清楚，这次机遇是借来的。

DeepSeek帮元宝拉来了用户，但留存是另一回事。搜索链路被割裂，一部分走混元一部分走DeepSeek，体验不统一。

简单来说，拥抱DeepSeek的本质，是在混元自己还没准备好的时候，用外部能力把用户先接住、把场景先撑起来。

但问题在于，腾讯的微信生态、企业服务、游戏AI、广告智能投放，这些核心业务需要深度定制、可控可调的AI能力，一个通用API解决不了。

混元必须自己站起来。问题是怎么站。

三、拆房子的人

2025 年 9 月，一位 27 岁的年轻人低调入职腾讯。

姚顺雨，清华姚班本科、普林斯顿大学博士，师从 GPT 开山论文核心作者之一 Karthik Narasimhan。博士期间，他提出ReAct 框架与思维树（Tree of Thoughts），二者均为全球 AI Agent 领域的奠基性工作。

2024 年博士毕业后，他加入 OpenAI，深度参与Operator、Deep Research两大核心智能体项目研发。

但履历并非关键，更重要的是他入职后带来的架构级变革。

2025 年 12 月，腾讯发布内部组织架构调整公告，正式任命姚顺雨为CEO /总裁办公室首席 AI 科学家，同时兼任全新设立的AI Infra 部、大语言模型部双部门负责人，实行双线汇报，直接向腾讯总裁刘炽平、TEG 技术工程事业群负责人卢山汇报。

27 岁直通腾讯二号人物、执掌两大 AI 核心部门，这样的晋升与权限，在腾讯发展史上都极其罕见。

有媒体报道，入职后他做的第一件事是逐个模块排查混元长期表现不佳的原因，经常和同事、实习生交流到半夜。诊断结果上报刘炽平，直接推动了后续一连串的组织手术。

他接手的不是一个模型优化任务，而是一整套需要被推翻的工作方式。

2025 年 12 月，腾讯一口气新设AI Infra 部、AI Data 部、数据计算平台部三大核心部门，基建先行、推倒重打底层技术地基。与此同时，公司全面加速全球顶尖 AI 人才引进，补齐技术短板。

今年3 月 20 日，成立整整十年的腾讯 AI Lab 正式撤销。核心研发人员全部并入大语言模型部，归入混元大模型研发主线，统一向姚顺雨汇报。

自此，腾讯不再保留独立于大模型体系之外的专属 AI 研究机构，所有 AI 研究力量全部收拢，聚焦混元单一主线。

这是一次全链路的重建，从底层Infra到数据管线到训练流程到组织架构，不是修补旧系统，是拆了重来，从头搭建完整研发闭环。

用姚顺雨团队的话说，Hy3 preview是混元大语言模型从读万卷书到行万里路的开端。

对照过去两年混元读了书但做不了题的现实，这句话的指向很明确，不在测试集里自嗨了，去真实世界做事。

四、Preview，不是Answer

回到产品本身。

快慢思考融合的MoE架构，总参数295B，激活参数21B，最大支持256K上下文。2026年1月底启动训练，4月上线。

不到三个月，从零到可用。这本身是混元研发加速演进的一个重要信号。

业界的模型研发通常包括高质量数据准备、预训练、后训练和强化学习/精调，如果算上前期架构探索和后期评测优化，从0到1做一个完整的大版本周期大约6-12个月。

腾讯反其道而行，没有去扎堆追求同质化模型，结合腾讯在社交、游戏、广告等核心业务场景需求进行Co-design设计，这样的好处是腾讯对AI的巨额投入能得到市场的快速验证。

和过去的混元完全反过来。过去是先打榜再找场景，找到场景发现用不了。现在是先进场景，再给外界看。

而在发布之前，Hy3 preview已经在元宝、WorkBuddy、CodeBuddy、ima、QQ等腾讯核心产品里完成了实测和协同适配，模型和产品从设计阶段就同步推进。

这就是Co-design，边训边用，让产品反馈来倒逼模型迭代。

某种意义上，这是对刘炽平那句"产品里没有产品经理"的直接回应。

对腾讯内部来说，Hy3 preview带来的变化可能比外界感知到的更大。过去的混元，业务线不敢接、不想接，各找各的出路，模型团队和产品团队之间隔着一堵墙。

这一次混元真正成了腾讯内部业务的模型底座，不再是一个需要业务线配合打榜的面子工程。

当内部业务愿意把自己的产品体验押在混元上的时候，这件事本身就是信号。

但Preview就是Preview。意思很坦诚，这是第一版，拿到真实用户和业务里去磨，用反馈来迭代。

态度对了，方向有了，产品上线了。至于结果，考试才刚开始。

五、龙虾是桥，混元才是地基

事实上，在Hy3 preview上线之前，腾讯还做了一件容易被忽略的事。

今年初OpenClaw爆火，龙虾热潮席卷整个AI行业。腾讯的反应速度又一次让人意外，几乎是最早、最全面拥抱龙虾的大厂。

WorkBuddy、QClaw、Lighthouse，一系列基于龙虾协议的产品密集上线，腾讯的产品矩阵在短时间内全面接入。

现在回头看，龙虾热潮虽然慢慢退烧。但对腾讯来说，这件事的价值不在龙虾本身，更像一个过渡装置。

它做了两件事。一是让腾讯散落在各条业务线的产品力重新形成合力，微信、元宝、企业服务、开发者工具，在龙虾这个公共协议层上第一次真正协同起来。二是更关键的，它为混元争取了时间。

当用户通过各种Agent入口涌进来的时候，腾讯用龙虾生态先接住了他们，而混元在幕后完成了从Infra到模型的重建。

Agent的入口可以有很多个。但最终决定用户留不留下来的，是底层模型的能力。龙虾是桥，混元才是地基。桥搭好了，地基也终于跟上了。

六、窗口期不会等人

今年4月，可能是中国AI历史上最拥挤的一个月。

阿里在72小时内连发三款战略级模型，Kimi发布并开源Kimi K2.6模型，通用Agent、代码、视觉理解等综合能力全面提升，字节Seed持续迭代，豆包生态扩张不停。DeepSeek V4也传言定于4月下旬发布。（参考阅读：梁文峰和姚顺雨，四月交卷）

混元选在这个窗口交卷，要面对的不只是技术竞赛，更是一个现实问题：窗口期还有多长？

腾讯有全中国最大的社交生态、最多的用户触点、最丰富的应用场景。微信月活超过14亿，QQ、腾讯会议、腾讯文档、企业微信，都是天然的AI落地入口。

但这些资源要发挥作用，前提是底层模型能撑得住。

过去一年多，混元产品能力乏力，腾讯不得不借DeepSeek的热度和力量，不得不看着豆包在用户端把自己甩开。

Hy3 preview说明姚顺雨听到了马化腾的批评。听到了，而且动手了。

不到90天，拆掉旧流水线，重建Infra，撤掉AI Lab，并入团队，挖来核心人才，和产品Co-design，交出一个可用的版本。

这个速度本身就是组织效率改变的证据。

但听到了和做到了之间，还有距离。

混元追上来的速度够不够快，最终不取决于一次Preview的参数量，取决于这次重建的组织效率能不能持续。

这一次姚顺雨的答卷上写着Preview。显然，后面还有大招。

【版面之外】的话：

混元过去最大的问题，不是模型不够大，是组织不够对。

一个自家业务都不愿意接的大模型，参数再多也是自嗨。

Hy3 preview最重要的变化，不是参数变了，是墙拆了，模型和产品之间的墙，研究和工程之间的墙，混元和腾讯生态之间的墙。

拆墙这件事，比堆参数难得多。

但这件事的意义，也不只在腾讯。在大模型这场竞争里，参数、算法、人才都可以被追赶。

真正难以复制的，是一家公司有没有决心为AI重写自己。

本内容旨在传递行业动态，不构成投资建议或承诺。

关键字:混元 Hy3 姚顺雨

24H热门新闻

暂无内容

7x24H 快讯

刚刚

World Labs 收购机器人公司 SceniX

刚刚

币安合约将上线 POPMARTUSDT U 本位永续合约

8分钟前

ARK周三逆势买入近1500万美元SpaceX，减持逾1000万美元Robinhood股票

9分钟前

特斯拉 Q2 营收超预期但 EPS 不及预期，自由现金流转负 11 亿美元

12分钟前

灰度文件披露 100 个钱包持有 90% 的 Worldcoin 流通量

12分钟前

梁文锋投资人会议实录流出：称克制是战略，目标 AGI 而非超级 App

14分钟前

洪灝：AI股票调整远未到位，资金从过热板块向过冷板块的轮动还未结束

19分钟前

“设序科技”正式完成B轮超亿元融资

姚顺雨的88天

一、背题拿不了真分

二、先借一条命

三、拆房子的人

四、Preview，不是Answer

五、龙虾是桥，混元才是地基

六、窗口期不会等人

推广

最近更新

24H热门新闻

友情链接

投资AI和Web3，下载火星财经APP

账号密码登录

修改昵称

姚顺雨的88天

一、背题拿不了真分

二、先借一条命

三、拆房子的人

四、Preview，不是Answer

五、龙虾是桥，混元才是地基

六、窗口期不会等人

推广

相关新闻

关注

最近更新

24H热门新闻

友情链接

投资AI和Web3，下载火星财经APP

商务合作