马斯克新推出Grok 1.5,超越GPT-4!速来看最新升级!

科技动态 2024-03-29 10:32 阅读:21

刚刚,马斯克的Grok大模型宣布了重大升级,原来之前开源的Grok-1只是为了为更强大的Grok-1.5做准备,这次主打推理能力。xAI官方推送直接甩出链接,主打“字少事大”。

新版本的Grok有哪些突破呢?首先是上下文长度从8192增长到128k,与GPT-4齐平;其次是推理性能大幅提升,数学能力直接涨点50%,在HumanEval数据集上得分超过GPT-4。消息一出,评论区瞬间热闹起来。

具体的跑分结果如何呢?让我们立马来看看。首先是上下文窗口,这次直接提升到之前的16倍,达到128k量级,这意味着Grok可以处理更长、更复杂的提示,同时保持其遵循指令的能力。在“大海捞针”测试中,Grok-1.5在128k token的上下文中完美检索嵌入的文本,整个图一片蓝色(100%的检索深度)。

其次是推理方面,Grok-1.5处理编程和数学相关任务的能力大幅提升,全面超越了其他模型。在数学方面,Grok-1.5在MATH基准测试上得分50.6%,超越了中杯Claude 3 Sonnet;在编程方面,Grok-1.5在HumanEval基准测试上得分74.1%,仅次于大杯Claude 3 Opus。

看起来,Grok这次的实力确实不容小觑。与其他大模型不同的是,Grok系列不使用通用的Python语言+Pytorch框架,而是采用分布式训练架构,使用Rust、JAX、Kubernetes构建。团队提出了自定义训练协调器,优化了checkpointing、数据加载和训练重启等流程,最大限度地减少故障停机时间,这才有了现在的Grok 1.5。

更多信息官方暂时还没有披露,但可以确定的是,新版本未来几天会先推送给早期测试者,然后很快将在平台上线。有网友表示,Grok的进步相当迅速,甚至有人称马斯克这是发了另一个“GPT-4等效模型”,呼吁OpenAI加快脚步。

你期待新版本的Grok吗?快来关注最新动态吧![1]https://twitter.com/xai/status/1773510159740063860[2]https://x.ai/blog/grok-1.5