圈小蛙

1.5万亿参数巨兽登场:马斯克宣布Grok 4.5开启内测,性能或超越Claude 3 Opus

2026年6月28日,科技巨头埃隆·马斯克(Elon Musk)在其社交平台X上扔下了一枚重磅炸弹:备受瞩目的下一代大语言模型 Grok 4.5 已经正式开启内部测试。据马斯克透露,这一代 Grok 模型不仅在体量上迎来了史诗级升级,其底层的训练框架和数据源也进行了大刀阔斧的改革。目前,该模型的内测已经在马斯克旗下的太空探索技术公司(SpaceX)以及电动汽车巨头特斯拉(Tesla)内部悄然展开。

根据马斯克在X平台发布的最新声明,全新的Grok 4.5是基于拥有1.5万亿参数的V9基础模型构建而成。对于这一参数级别的超大型模型,业界普遍关注其计算效率与实际推理表现。除了参数量的巨大跃升,Grok 4.5在训练策略和落地应用上展现出了极强的工程实用导向,这与此前主要依赖公开数据集的大模型有着显著差异。

1.5万亿参数与Cursor数据加持,强化学习驱动性能跃升

为了显著提升模型在代码编写、复杂逻辑推理和工程调试方面的能力,开发团队在Grok 4.5的补充训练阶段加入了 Cursor 智能代码编辑器的数据。这一高质量代码上下文的引入,被认为极大地优化了模型对真实开发场景的理解。

根据马斯克披露的早期内部评估数据,在多项前沿推理与代码基准测试中,Grok 4.5展现出了惊人的算力转化效率,其性能表现不仅非常接近,甚至在部分维度上可能已经超越了被业界奉为逻辑天花板的 Anthropic Claude 3 Opus。马斯克还强调,开发团队目前正在引入更加系统的强化学习(Reinforcement Learning)机制。通过不断让模型自我博弈以及接收高质量的反馈,Grok 4.5的认知和生成能力目前正处于持续攀升的通道中。

SpaceX开启高频训练模式,Grok Build框架逐日优化

除了模型本身的技术细节,马斯克还透露了底层训练工程的演进情况。目前用于承载万亿参数级别模型训练的“Grok Build”框架正在经历每日更新。该框架主要负责优化分布式计算集群的吞吐量、降低显存碎片化并减少网络节点间的延迟,从而确保超大规模算力集群能够高效且稳定地运转。

最令行业感到震惊的是,马斯克表示SpaceX在今年余下的时间里,将维持高密度的开发节奏,计划每月至少发布一款“从零开始全新训练”的AI模型。这种将航天工业的高频迭代模式引入人工智能研发的做法,预示着马斯克生态链内部的算力与工程红利正在加速释放,全球大模型军备竞赛也将被推向新的高潮。


本报道由 圈小蛙(qxwa.com) 科技资讯站特约撰稿。🐸️

Exit mobile version