
腾讯发布混元Hy3 preview大模型,标志着其AI战略从‘打榜优先’转向‘场景驱动’。核心变化在于组织重构:撤销AI Lab、设立AI Infra等新部门、由姚顺雨统管大模型研发与基建,并推动模型与产品Co-design。此举旨在解决过去混元能力无法支撑微信、游戏等核心业务的困境,实现AI能力真正融入腾讯生态。
文 | 版面之外,撰文|画画
腾讯混元Hy3 preview发布了。这是姚顺雨加入腾讯后交出的第一款产品。
MoE架构,总参数295B,激活参数21B,最大支持256K上下文长度,1月底开训,不到三个月发布。
这样一个体量的模型放在今天,很容易被淹没。
但如果把这件事放在三个月前的背景下看,就有意思了。
这次发布看起来是模型升级,真正变化发生在模型之外,腾讯开始用AI反过来重写自己的组织方式。
今年1月26日,腾讯年会现场,腾讯总裁刘炽平在台上做了一件高管很少做的事,公开复盘混元大模型为什么不行。
他用了一个比喻:高中生背题应考。成绩单好看,但真正上了考场就露馅。盘点之后发现,每个关键模块都有缺失。
马化腾的措辞更直接:太慢了。慢了9个月到1年。
从那场年会到今天 Hy3 preview上线,88天。
腾讯混元的故事要从2023年9月说起,腾讯在全球数字生态大会上正式发布混元大模型,大厂入场,声势不小。
然后就开始进入一种自证的逻辑。
不是缺投入,不是缺人。问题出在路径上。
刘炽平在年会上的复盘给了最清晰的诊断。底模能力有限,团队选了捷径,用SFT(监督微调)去打榜。效果立竿见影,成绩单漂亮,但一进真实业务场景就暴露,泛化能力差,模型能力无法复用到产品上。
再往下挖,每一层都有裂缝。数据做得不够多,预训练不稳定,AI Infra无法规模化,强化学习缺因子和目标,底座模型撑不起上层应用。
这直接导致了产品端的困局。元宝,腾讯的AI助手应用,今年一季度月活约5700万。听起来在涨,但同期豆包月活3.45亿,千问1.66亿,差距不是在缩小,是在拉大。
差距已经不在规模层面,而是在入口的定义权。
更麻烦的是内部。腾讯体系内的业务线,微信、游戏、广告、企业服务,需要AI能力,但过去的混元接不住。不是业务不想用,是用了效果不达标。一些核心业务甚至不敢接混元,宁可绕开自己找方案。
一个大厂自研的大模型,在自己家里都坐不上主桌,这是混元过去困境最直接的写照。
彼时,腾讯的组织也并没有跟上大模型发展步伐。腾讯长期以产品工程为核心,AI团队是配角。先做产品,再让AI适配。用刘炽平的话说,腾讯的AI开发像是产品里没有产品经理,研发团队没人把控方向,很多工作做了等于白做。
而同一时期,字节仅AI芯片采购一项就砸了约900亿元,DeepSeek用极致效率的小团队做出R1震动全球,阿里千问的全球API调用量攀上前列。
混元不是输给了某一个对手,是组织结构本身,让它上不了战场。
2025年春节前后,DeepSeek R1爆火,全球AI行业的注意力被这家杭州公司劫持。
腾讯做了一个极其务实且讨巧的决定。2月13日,元宝全面接入DeepSeek-R1满血版,免费开放。
元宝日活在一个月内暴涨超过20倍,2月22日超越豆包登上苹果中国区免费App下载榜第二,一度还拿下榜单第一。
腾讯在那个窗口期的反应速度,整个行业都在看。微信搜索、QQ浏览器、搜狗输入法、ima,一整套产品矩阵密集接入DeepSeek。甚至手游《和平精英》都把DeepSeek塞进了数字代言人。
全行业都在围观DeepSeek的时候,腾讯是第一个全方位把它接进自家生态的大厂。
但腾讯比谁都清楚,这次机遇是借来的。
DeepSeek帮元宝拉来了用户,但留存是另一回事。搜索链路被割裂,一部分走混元一部分走DeepSeek,体验不统一。
简单来说,拥抱DeepSeek的本质,是在混元自己还没准备好的时候,用外部能力把用户先接住、把场景先撑起来。
但问题在于,腾讯的微信生态、企业服务、游戏AI、广告智能投放,这些核心业务需要深度定制、可控可调的AI能力,一个通用API解决不了。
混元必须自己站起来。问题是怎么站。
2025 年 9 月,一位 27 岁的年轻人低调入职腾讯。
姚顺雨,清华姚班本科、普林斯顿大学博士,师从 GPT 开山论文核心作者之一 Karthik Narasimhan。博士期间,他提出ReAct 框架与思维树(Tree of Thoughts),二者均为全球 AI Agent 领域的奠基性工作。
2024 年博士毕业后,他加入 OpenAI,深度参与Operator、Deep Research两大核心智能体项目研发。
但履历并非关键,更重要的是他入职后带来的架构级变革。
2025 年 12 月,腾讯发布内部组织架构调整公告,正式任命姚顺雨为CEO /总裁办公室首席 AI 科学家,同时兼任全新设立的AI Infra 部、大语言模型部双部门负责人,实行双线汇报,直接向腾讯总裁刘炽平、TEG 技术工程事业群负责人卢山汇报。
27 岁直通腾讯二号人物、执掌两大 AI 核心部门,这样的晋升与权限,在腾讯发展史上都极其罕见。
有媒体报道,入职后他做的第一件事是逐个模块排查混元长期表现不佳的原因,经常和同事、实习生交流到半夜。诊断结果上报刘炽平,直接推动了后续一连串的组织手术。
他接手的不是一个模型优化任务,而是一整套需要被推翻的工作方式。
2025 年 12 月,腾讯一口气新设AI Infra 部、AI Data 部、数据计算平台部三大核心部门,基建先行、推倒重打底层技术地基。与此同时,公司全面加速全球顶尖 AI 人才引进,补齐技术短板。
今年3 月 20 日,成立整整十年的腾讯 AI Lab 正式撤销。核心研发人员全部并入大语言模型部,归入混元大模型研发主线,统一向姚顺雨汇报。
自此,腾讯不再保留独立于大模型体系之外的专属 AI 研究机构,所有 AI 研究力量全部收拢,聚焦混元单一主线。
这是一次全链路的重建,从底层Infra到数据管线到训练流程到组织架构,不是修补旧系统,是拆了重来,从头搭建完整研发闭环。
用姚顺雨团队的话说,Hy3 preview是混元大语言模型从读万卷书到行万里路的开端。
对照过去两年混元读了书但做不了题的现实,这句话的指向很明确,不在测试集里自嗨了,去真实世界做事。
回到产品本身。
快慢思考融合的MoE架构,总参数295B,激活参数21B,最大支持256K上下文。2026年1月底启动训练,4月上线。
不到三个月,从零到可用。这本身是混元研发加速演进的一个重要信号。
业界的模型研发通常包括高质量数据准备、预训练、后训练和强化学习/精调,如果算上前期架构探索和后期评测优化,从0到1做一个完整的大版本周期大约6-12个月。
腾讯反其道而行,没有去扎堆追求同质化模型,结合腾讯在社交、游戏、广告等核心业务场景需求进行Co-design设计,这样的好处是腾讯对AI的巨额投入能得到市场的快速验证。
和过去的混元完全反过来。过去是先打榜再找场景,找到场景发现用不了。现在是先进场景,再给外界看。
而在发布之前,Hy3 preview已经在元宝、WorkBuddy、CodeBuddy、ima、QQ等腾讯核心产品里完成了实测和协同适配,模型和产品从设计阶段就同步推进。
这就是Co-design,边训边用,让产品反馈来倒逼模型迭代。
某种意义上,这是对刘炽平那句"产品里没有产品经理"的直接回应。
对腾讯内部来说,Hy3 preview带来的变化可能比外界感知到的更大。过去的混元,业务线不敢接、不想接,各找各的出路,模型团队和产品团队之间隔着一堵墙。
这一次混元真正成了腾讯内部业务的模型底座,不再是一个需要业务线配合打榜的面子工程。
当内部业务愿意把自己的产品体验押在混元上的时候,这件事本身就是信号。
但Preview就是Preview。意思很坦诚,这是第一版,拿到真实用户和业务里去磨,用反馈来迭代。
态度对了,方向有了,产品上线了。至于结果,考试才刚开始。
事实上,在Hy3 preview上线之前,腾讯还做了一件容易被忽略的事。
今年初OpenClaw爆火,龙虾热潮席卷整个AI行业。腾讯的反应速度又一次让人意外,几乎是最早、最全面拥抱龙虾的大厂。
WorkBuddy、QClaw、Lighthouse,一系列基于龙虾协议的产品密集上线,腾讯的产品矩阵在短时间内全面接入。
现在回头看,龙虾热潮虽然慢慢退烧。但对腾讯来说,这件事的价值不在龙虾本身,更像一个过渡装置。
它做了两件事。一是让腾讯散落在各条业务线的产品力重新形成合力,微信、元宝、企业服务、开发者工具,在龙虾这个公共协议层上第一次真正协同起来。二是更关键的,它为混元争取了时间。
当用户通过各种Agent入口涌进来的时候,腾讯用龙虾生态先接住了他们,而混元在幕后完成了从Infra到模型的重建。
Agent的入口可以有很多个。但最终决定用户留不留下来的,是底层模型的能力。龙虾是桥,混元才是地基。桥搭好了,地基也终于跟上了。
今年4月,可能是中国AI历史上最拥挤的一个月。
阿里在72小时内连发三款战略级模型,Kimi发布并开源Kimi K2.6模型,通用Agent、代码、视觉理解等综合能力全面提升,字节Seed持续迭代,豆包生态扩张不停。DeepSeek V4也传言定于4月下旬发布。(参考阅读:梁文峰和姚顺雨,四月交卷)
混元选在这个窗口交卷,要面对的不只是技术竞赛,更是一个现实问题:窗口期还有多长?
腾讯有全中国最大的社交生态、最多的用户触点、最丰富的应用场景。微信月活超过14亿,QQ、腾讯会议、腾讯文档、企业微信,都是天然的AI落地入口。
但这些资源要发挥作用,前提是底层模型能撑得住。
过去一年多,混元产品能力乏力,腾讯不得不借DeepSeek的热度和力量,不得不看着豆包在用户端把自己甩开。
Hy3 preview说明姚顺雨听到了马化腾的批评。听到了,而且动手了。
不到90天,拆掉旧流水线,重建Infra,撤掉AI Lab,并入团队,挖来核心人才,和产品Co-design,交出一个可用的版本。
这个速度本身就是组织效率改变的证据。
但听到了和做到了之间,还有距离。
混元追上来的速度够不够快,最终不取决于一次Preview的参数量,取决于这次重建的组织效率能不能持续。
这一次姚顺雨的答卷上写着Preview。显然,后面还有大招。
【版面之外】的话:
混元过去最大的问题,不是模型不够大,是组织不够对。
一个自家业务都不愿意接的大模型,参数再多也是自嗨。
Hy3 preview最重要的变化,不是参数变了,是墙拆了,模型和产品之间的墙,研究和工程之间的墙,混元和腾讯生态之间的墙。
拆墙这件事,比堆参数难得多。
但这件事的意义,也不只在腾讯。在大模型这场竞争里,参数、算法、人才都可以被追赶。
真正难以复制的,是一家公司有没有决心为AI重写自己。