埃隆·马斯克的x.AI公司推出了最新AI模型Grok 3,被誉为最强大的AI聊天机器人。它具备卓越的推理能力、深度搜索功能和快速响应速度,依托Colossus超级计算机训练,性能超越现有模型。Grok 3适用于代码生成、市场预测、医疗诊断等领域,并通过X平台向用户开放,标志着AI技术的新高度。
原文作者:K.C. Sabreena Basheer
编译:Luke,火星财经
埃隆·马斯克今早揭晓了x.AI的最新模型——Grok 3,被誉为世界上最智能、最强大的AI。这款来自x.AI的新型AI聊天机器人,具备卓越的推理能力和先进的功能,如深度搜索。Grok 3在强大的Colossus超级计算机上进行训练,证明它是o3-mini、DeepSeek-V3、Gemini 2.0和Claude 3.5 Sonnet等模型的强有力竞争者。本文将详细介绍Grok 3,包括其架构、特性、应用、基准性能、如何访问它等内容!
Grok 3是由埃隆·马斯克的AI公司x.AI开发的最新模型。它在AI技术上迈出了重要的一步,带来了增强的推理能力、前所未有的处理速度和先进的决策能力。该模型具备类似人类的思维能力,能够生成创新的解决方案,这些解决方案对人类来说可能并不显而易见。
Grok 3在世界上最强大的AI超级计算机Colossus上进行了广泛的训练,Colossus配备了200,000个NVIDIA H100 GPU!这种计算能力使得它能够比任何现有AI模型更快、更准确地分析、理解和生成回应。此外,该模型的设计目标是提升日常应用,提供无与伦比的机器智能,即使是在未来的日子里。
以下是x.AI最先进的Grok 3模型的关键特性和能力:
基准性能
让我们看看它与Gemini 2.0 Pro、DeepSeek-V3、Claude 3.5 Sonnet、o3-mini等其他模型的表现如何。
Grok 3在所有三个基准测试中都表现最佳,表明它在处理不同任务时的性能优于其他模型。尽管它特别针对数学和竞争编程进行了训练,但它在科学等其他领域的表现也超过了其他模型。
在AIME 2025基准测试中,Grok 3的Reasoning Beta和mini Reasoning版本在给定更多思考时间的情况下超过了所有其他模型。在这两个Grok版本中,Grok 3 Reasoning Beta稍微领先。
Grok 3的巧克力版本甚至在Chatbot Arena的LLM排行榜上以显著的差距领先,展示了其无与伦比的能力。它以1402分位居第一,而Gemini 2.0 Flash Thinking实验模型得分为1385,位列第二。
目前,Grok 3可以在X(Twitter)平台上提供给Premium+用户。Premium+订阅费用为每月40美元。
x.AI还提供了一个SuperGrok订阅,允许用户在专用的Grok网站和Grok应用上访问最新且最先进的Grok版本。
与此同时,Grok 3的API访问将在接下来的几周内发布。
X的Premium用户可以通过以下三种方式访问Grok 3:
或者,点击左侧面板中的Grok图标,访问Grok聊天机器人界面。 从顶部的模型选择下拉菜单中选择“Grok 3”并开始使用!
以下是Grok 3在各个行业中的一些最佳应用:
Grok 3的推出注定会带来重大影响,提供了更强大的功能,并为AI聊天机器人性能设立了新的标准。凭借Colossus超级计算机提供的令人印象深刻的速度,它成为o3-mini、DeepSeek-V3和Gemini 2.0等领先AI模型的强劲对手。
拥有“大脑”功能和深度搜索等特性,它代表了机器推理和更具人类特征的AI交互的重大进步。由于这一点,埃隆·马斯克的SpaceX计划在2026年11月将StarShip火箭与Optimus机器人和Grok 3一起送往火星。在此之前,让我们看看这个模型在人类社会中如何表现!