Elon Musk xAI 发布 Grok-1.5 ,称部分领域超越 GPT-4

Elon Musk 旗下的 xAI 公司最近对外发布了 Grok-1.5 版本,这是对其人工智能模型的一次重大更新。该更新旨在提升其在数学、编程等方面的表现,并已向早期测试者开放。公司声称,Grok-1.5 在多个领域与 GPT-4、Gemini Pro 1.5 及 Claude 3 Opus 等模型相比,展现出了显著的改进。

根据 xAI 公司提供的数据,Grok-1.5 在 MATH 基准测试中的得分较之前版本翻了一番多,达到了 50.6%。在处理 GSM8K(数学文字问题)和 HumanEval(编程)测试时,分别达到了 90% 和 74.1% 的得分,较之前的 62.9% 和 63.2% 有了显著的提升。这些数据接近甚至超过了 Gemini Pro 1.5、GPT-4 和 Claude 3 Opus 等竞争对手,尤其是在 HumanEval 编程测试中,其表现超越了除 Claude 3 Opus 之外的所有竞争对手。

Elon Musk xAI 发布 Grok-1.5 ,称部分领域超越 GPT-4

Grok-1.5 支持处理长达 128K tokens 的长文本,这使其能够从更多来源综合数据,以更好地理解各种情境。xAI 表示,这一改进使得 Grok 的记忆容量较之前版本提升了高达 16 倍,从而能够处理更长的文件。

虽然 Grok-1.5 在多个领域取得了进步,但 xAI 并未透露其在其他领域(如学术成绩、多模态等)的表现,这些领域可能仍存在劣势。此外,随着 OpenAI 即将在今年夏季推出 ChatGPT 5,预计将带来更自然的沟通体验,Grok-1.5 的竞争地位可能不会长久。

目前,Grok 仅对 X(前身为 Twitter)的 Premium+ 级别用户开放。不过,Elon Musk 近期承诺将其开放给 X 的普通 Premium 用户。

相关文章