Google发布Gemini 1.5,支持超大型资料输入

不到两个月后,Google 发布了其大型语言模型 Gemini 的后续版本,期望藉此在人工智能行业中取得领先地位。今日,Google 正式推出 Gemini 1.5,并将其开放给开发者和企业用户使用,预计不久后将全面向消费者推出。

Gemini 1.5 带来了许多改进,其通用型号 Gemini 1.5 Pro,与最近才推出的高端型号 Gemini Ultra 不相上下,并在 87% 的基准测试中胜过了 Gemini 1.0 Pro。

Google发布Gemini 1.5,支持超大型资料输入

该模型采用了一种越来越普遍的技术,称为「专家混合」(Mixture of Experts,MoE),这意味着在你发送查询时,它只运行整个模型的一部分,而不是全时处理整个模型。这种方法应使模型的使用更快,并提高 Google 运行效率。

在 Gemini 1.5 中有一项新功能让 Google ,尤其是 CEO Sundar Pichai 特别兴奋。Gemini 1.5 拥有一个巨大的上下文窗口(Context window),意味着它可以处理更大的查询,并且一次查看更多信息。Gemini 1.5 支持高达 100 万个 Tokens,相比之下,OpenAI 的 GPT-4 为 128,000 个 Tokens,而当前的 Gemini Pro 为 32,000 个 tokens。

Google发布Gemini 1.5,支持超大型资料输入

Sundar Pichai 用更简单的方式解释:「大约相当于 10 或 11 小时的视频,数万行的代码。」这样的上下文窗口意味着你可以一次性询问 AI 机器人关于所有这些内容。你甚至可以将整套「魔戒三部曲」放进去,电影制作人可询问 Gemini 评论家可能会怎么说。

相关文章