马斯克xAI发布Grok-3大模型:人工智能迎来“超融合”时代
马斯克旗下人工智能初创公司xAI公司于2023年7月成立,半年后发布Grok(聊天机器人)和Grok 1.5模型,2024年8月发布了Grok 2,随后在北京时间2月18日午间,正式发布新一代聊天机器人Grok 3。Grok-3的命名源自科幻小说《异乡异客》中的“Grok”一词,寓意对事物的深刻理解。xAI的使命——“了解宇宙”——被印刻在发布会背景板上,呼应了马斯克对AI推动人类认知边界的期待。

科技富豪埃隆·马斯克(Elon Musk)在发布会直播中首次披露了Grok-3的训练成本,称Grok-3训练过程累计消耗20万块英伟达GPU,推理与多模态能力的跃升Grok-3被马斯克称为“地球上最聪明的人工智能”,其核心优势在于引入了“思维链”推理能力,能够像人类一样逐步分解复杂任务,显著提升逻辑连贯性与问题解决能力。在数学、科学推理、代码生成等领域的多项基准测试中,Grok-3的表现全面超越DeepSeek-V3、GPT-4o及Gemini-2 Pro。例如,在AIME 2025竞赛中,Grok-3以93分的成绩断层领先,展示了其“超人类”的学科知识储备。

Grok-3的训练依托于xAI耗时8个月打造的超级计算机Colossus,其由10万张英伟达H100 GPU驱动,累计消耗2亿GPU小时,此外,xAI采用了合成数据训练、自我纠错机制及强化学习技术,通过人工反馈循环优化输出准确性,显著减少AI“幻觉”问题,马斯克在发布会现场表示,Grok 3在很短的时间内超越了上一代Grok 2,“我们认为它比Grok 2强大一个数量级”。另据xAI公司的工程师介绍,Grok 3所涉及的训练是Grok 2的10倍。

现场演示中,Grok-3展示了制作融合俄罗斯方块与宝石迷阵的原创游戏、计算火星探测时间窗口等能力,体现了其在编程、创意及科学计算方面的多样性。同时推出的工具“Grok- DeepSearch”,则进一步强化了信息检索与真假判断的实用性,从现场展示来看,Grok-3 的编程、推理、计算能力确实很突出。而在最新的 AIME 竞赛中也是断层领先。这里有亮点需要注意,第一个亮点是它这项对比的不是 V3 版本的 DeepSeek,而是最新的 DeepSeek R1;另一个亮点是 Grok-3 mini 的性能也非常突出。

在 Chatbot 竞技场之称的 LMSYS 盲测中,Grok 3 在代码、指令响应等各个方面排名第一。Grok-3的发布不仅是技术的突破,更是一场关于AI未来方向的宣言。无论是OpenAI的开源转向、DeepSeek的“中国式突围”,还是xAI的“宇宙级野心”,这场竞赛的核心已从单一模型性能转向技术、生态与商业化的多维博弈。正如马斯克所言:“我们终于可以互相学习了”——Grok-3或许正是人类与AI共同探索未知的起点。






