如何做好研究：锻炼那些可以「刻意练习」的真正能力

vivek2026-06-15热度: 4081

文章探讨如何通过刻意练习培养真正的研究能力，强调自主选择问题、提升信息输入质量（如研读原始论文与经典文献）、以及坚持写作以暴露思维漏洞和固化认知迭代。核心主张是研究能力由可训练的小技能构成，而非依赖天赋或表面模仿。

摘要由 Mars AI 生成

本摘要由 Mars AI 模型生成，其生成内容的准确性、完整性还处于迭代更新阶段。

原文标题：how to be good at research

原文作者：vivek

原文来源：https://www.theblockbeats.info/news/62730

转载：火星财经

并没有人真正教过你如何做研究。你得到一张办公桌、一个别人挑好的问题，以及一个「做出点新东西」的模糊指令。

因此，大多数人通过他们能看到的东西（比如论文、帖子和公告）对这份工作进行逆向工程，最终他们学到的只是如何「看起来」像个研究员，而不是如何「成为」一个研究员。真正的研究能力是一系列小技能的堆叠，而几乎每一项都可以通过刻意练习来培养。

挑选你自己的问题

理查德·汉明（Richard Hamming）在贝尔实验室有个习惯，这让他在午餐时很不受欢迎。他会问坐在旁边的人，他们领域里重要的问题是什么，然后问他们为什么不去研究这些问题。于是大家纷纷换桌吃饭。

这个问题很刺人，因为我们大多数人都给不出好答案。我们不是在选择问题，而是在吸收问题——从导师那里吸收，从某个大实验室上个季度发布的公告里吸收，从这周大家都在转发引用的论文里吸收。

吸收来的问题，麻烦在于你只握有结论，却不知其背后的推理逻辑。你知道某个著名实验室关心某个方向，但你不知道为什么，不知道他们期望发现什么，也不知道什么情况会让他们放弃这个方向。

当他们转向时，你一年后才会察觉。而且，在一个已经流行起来的问题上，你是在和 1,000 个起步比你早、算力比你多的人赛跑。

约翰·舒尔曼（John Schulman）的机器学习研究指南将这项工作分为两种模式。第一种，你阅读文献并寻找可以改进的地方。第二种，你选择一个你真心希望实现的结果，然后反推去设计实验。

他主张第二种，其隐晦的原因在于这能制造出原创性。一个你真正关心的目标，会把你拖入任何综述论文都未曾覆盖的领地。

至于「品味」（taste），人们常把它当成一种天赋来讨论。但它表现得其实更像是一块肌肉。

在运行每次实验前，先预测它的结果；遮住一篇论文的结果部分，仅凭它的方法来猜测数据；记下这个月发布的哪些成果在两年后依然重要，以后再来验证你的命中率。一次预测加上一次纠错，重复几百次——每一个好模型都是这样训练出来的，包括你脑子里的那个。

升级你的输入

共享的阅读清单产生共享的想法。如果你的信息口粮只是 arXiv 的热门榜单加上群聊筛选后剩下来的东西，你必然会跟所有人同时得出同样的结论，这也使得这些结论几乎一文不值。

旧资料的价值被严重低估了。这个领域总是延时重演自己的过去：混合专家模型（MoE）可追溯到 1991 年，LSTM 到 1997 年，反向传播在 1986 年就成了主流。

理查德·萨顿（Rich Sutton）在 2019 年只用了一千来字就写出了《苦涩的教训》（The Bitter Lesson），而它对该领域发展轨迹的预测，比篇幅长它十倍的综述还要准。克劳德·香农（Claude Shannon）在 1952 年做过一场关于创造性思维的演讲，他的第一招就是把问题缩小到几乎微不足道的程度，破解这个缩小版，然后再将难度一点一点地加回去。

单凭这一招，就能帮你撞破比任何现代生产力建议都要多的墙。

广度和深度一样重要。可解释性研究毫不掩饰地借鉴了神经科学；评测（Eval）设计就是披着白大褂的机制设计；只要对 GPU 到底如何移动内存有实际的认知，你就能在基准测试结果出来之前判断出哪些架构论文注定会失败；而诚实的统计学可能已经是机器学习领域最稀缺的技能了，在这里，许多公开发表的「严谨」，不过是带有误差棒的「感觉」。

还有一件事。去读论文本身，而不是读总结它的帖子。附录才是埋藏秘密的地方，而「局限性」部分通常是整篇文档中最诚实的一段。