OpenAI即将发布两款革命性模型Strawberry和Orion,旨在推进AI能力,特别是在推理、解决问题和语言处理方面,朝着人工通用智能(AGI)更进一步。Strawberry展示了AI推理能力的显著飞跃,Orion是下一代旗舰语言模型,具备处理多模态输入的能力。这两个项目引起了美国国家安全官员的关注,但需要谨慎使用,以保持竞争力。OpenAI声称,下一代AI模型的进步将是前几代模型的近100倍,希望尽快支持一个将AI全面整合的世界的诞生。Orion的原生多模态功能使得OpenAI与谷歌的Gemini直接竞争,旨在保持其在AI领域的竞争优势。
原文作者:Jose Antonio Lanz
原文标题:What’s Ahead for OpenAI? Project Strawberry, Orion, and GPT Next
原文来源:Decrypt
编译:Koala,火星财经
OpenAI即将发布两款可能重新定义机器学习领域的革命性模型,代号分别为Strawberry和Orion。这些项目的目标是将AI的能力推向新的高度,特别是在推理、解决问题和语言处理方面,朝着人工通用智能(AGI)更进一步。
Strawberry(之前被称为 Q* 或 Q-Star)似乎不仅仅是一个聊天机器人;它的重点是展示 AI 推理能力的显著飞跃。知情人士向路透社和 The Information 等媒体透露,该项目在解决复杂数学问题和增强逻辑分析方面表现出色。
另一方面,Orion 被定位为 OpenAI 的下一代旗舰语言模型,可能是 GPT-4 的继任者。它旨在在语言理解和生成方面超越其前身,并具备处理多模态输入(包括文本、图像和视频)的能力。
这两个项目引起了美国国家安全官员的关注,突显了它们可能具有的战略重要性。在 OpenAI 尽管收入增长显著的情况下,仍在继续筹集资金,这可能与开发和训练这些先进模型所需的高昂成本有关。
尽管网上不断有关于“Strawberry项目”的猜测,OpenAI并未正式发布任何相关信息。然而,据称泄露的信息表明,Strawberry在复杂推理方面表现出色。
据称,与传统模型提供快速响应不同,Strawberry采用了研究人员称为“系统2思维”的方法,能够花时间仔细推理并解决问题,而不仅仅是通过预测更长的词语序列来完成响应。据路透社报道,该模型在MATH基准测试中取得了90%以上的成绩,表现令人印象深刻。
另一个预计由 Strawberry 带来的关键创新是其生成高质量合成训练数据的能力。这一功能解决了 AI 开发中的一个重要挑战:缺乏多样且高质量的训练数据。如果这一点属实,Strawberry 不仅能提升自身能力,还为更先进的模型如 Orion 铺平了道路。
考虑到 OpenAI 已经获取的大量数据,以及用户日益重视隐私而不愿向 AI 提供数据的趋势,这一功能可能在未来 AI 模型的质量中发挥重要作用,就像如今一些用户利用 Stable Diffusion 生成的图像训练自己的定制模型一样。
然而,Strawberry 的这种深思熟虑的处理方式可能在实时应用中面临挑战。据报道,OpenAI 的研究人员正在研究如何“蒸馏” Strawberry 的能力,基本上是降低其质量,以便用户能够在低计算成本下进行大量推理。
即便如此,将 Strawberry 的技术整合到面向消费者的产品(如 ChatGPT)中,可能会显著提升 OpenAI 训练新模型的方式。然而,更有可能的是,OpenAI 将利用 Strawberry 作为训练新模型的基础,而不是直接向消费者广泛提供。
Project Orion 作为 OpenAI 对 GPT-4 的雄心勃勃的继任者,旨在设定语言 AI 的新标准。根据 OpenAI 日本公司 CEO 永崎忠雄的最新演讲,项目可能被命名为 GPT 下一代(GPT Next)。利用来自 Project Strawberry 的先进技术,Orion 设计不仅在自然语言处理方面表现卓越,还扩展到多模态能力。
OpenAI声称,下一代AI模型的进步将不会是渐进的。
根据IT Media的报道,OpenAI日本公司CEO永崎忠雄在2024年日本KDDI峰会上表示:“即将推出的AI模型可能被称为‘GPT Next’,其发展速度将是前几代模型的近100倍。与传统软件不同,AI技术呈指数级增长。因此,我们希望尽快支持一个将AI全面整合的世界的诞生。”
将 Strawberry 生成的数据用于训练 Orion 对 OpenAI 来说是一项技术优势。然而,这种技术需要谨慎使用。研究人员已经证明,当模型在过多的合成数据上进行训练时,其性能会开始下降。因此,找到一个合适的平衡点,使 Strawberry 可以增强 Orion 的能力而不影响其准确性,对于 OpenAI 保持竞争力至关重要。
Orion 的原生多模态功能也将是一个显著的进步。据《The Information》报道,该模型正在开发中,旨在无缝整合文本、图像,甚至视频输入和输出,为 ChatGPT 用户带来全新的可能性,并使公司与谷歌的 Gemini 直接竞争。后者可以处理长达 2 小时的视频输入。
这是用户在使用 ChatGPT 或 OpenAI 的 API Playground 时将与之交互的模型。
Orion 的开发与 OpenAI 的整体战略相一致,旨在保持其在日益拥挤的 AI 领域中的竞争优势。随着开源模型(如 Meta 的 LLaMA-3.1)和先进模型(如 Claude 或 Gemini)的快速进展,Orion 基本上是 OpenAI 保持领先地位的举措。