井底圈小蛙
关注科技圈

谷歌发布Gemini 3人工智能模型,创下基准测试得分新高

搜索巨头谷歌正式推出其最新的人工智能模型Gemini 3,以期跟上 ChatGPT 的创建者 OpenAI 的步伐。

Alphabet 首席执行官桑达尔·皮查伊在谷歌周二发布的几篇博客文章之一中表示,新的 AI 模型将使用户能够更好地回答更复杂的问题,“这样你就能以更少的提示获得所需的信息”。

Gemini 3 将集成到 Gemini 应用、谷歌的 AI 搜索产品 AI 模式和 AI 概览,以及其企业产品中。该功能将于周二开始面向部分订阅用户推出,并在未来几周内逐步推广至更多用户。

此次发布距离谷歌推出 Gemini 2.5 大约 8 个月,距离 Gemini 2.0 大约 11 个月。OpenAI于2022年底通过公开发布ChatGPT开启了生成式人工智能的繁荣,并于8月推出了GPT-5,然后在前几天推出GPT-5.1

“令人惊叹的是,短短两年时间,人工智能就从单纯地阅读文本和图像发展到能够感知周围环境,”皮查伊在周二的一篇博文中写道。“从今天开始,我们将以谷歌的规模交付Gemini。”

该公司表示,Gemini 应用目前的月活跃用户数为 6.5 亿,AI Overviews 的月活跃用户数为 20 亿。OpenAI 在 8 月份曾表示,ChatGPT 的周活跃用户数已达到 7 亿。

皮查伊补充说,最新模型“旨在理解更深层次的含义和细微差别”,并表示 Gemini 3 也“更擅长理解用户请求背后的上下文和意图,因此用户无需过多提示即可获得所需信息”。谷歌表示,其其他人工智能模型仍可用于处理更简单的任务。 

Alphabet及其其他大型科技巨头正在斥巨资建设人工智能开发的基础设施,并迅速为消费者和企业打造更多服务。在上个月的财报中,Alphabet、  Meta、 微软和亚马逊均上调了资本支出预期 ,预计今年的总支出将超过3800亿美元。

谷歌表示,由Gemini 3驱动的AI回复将“摒弃陈词滥调和奉承,转而提供真正有价值的见解——告诉你你需要听到的,而不是你想听到的”,谷歌人工智能部门DeepMind的首席执行官Demis Hassabis在一份声明中表示。业内批评人士一直认为,如今的AI聊天机器人过于谄媚。

Gemini 3以突破性的 1501 Elo 分数位居 LMArena 排行榜榜首。它在 Humanity’s Last Exam(得分 37.5%)和 GPQA Diamond(得分 91.9%)中均取得了最高分,展现了博士级别的推理能力。Gemini 3 还能更精准地理解请求背后的上下文和意图,无需过多提示即可获得所需信息。Gemini 3 将于今日登陆 Gemini 应用、AI Studio 和 Vertex AI 的开发者平台,搜索中的 AI 模式,以及全新的智能体开发平台 Google Antigravity。

谷歌还将推出 Gemini 3 Deep Think 增强的推理模式,可进一步提升 Gemini 3 的性能,未来将向 Google AI Ultra 订阅用户开放。Gemini 3 Deep Think 在 Humanity’s Last Exam(得分 41.0%)和 GPQA Diamond(得分 93.8%)上的表现均优于 Gemini 3 Pro 本已令人瞩目的成绩。此外,它在 ARC-AGI-2测试中也取得了前所未有的 45.1% 的得分。

上周,OpenAI 发布了GPT-5的两项更新。该公司表示,其中一项更新“更友好、更智能,并且更擅长遵循你的指令”,另一项更新“在简单任务上速度更快,在复杂任务上更有毅力”。

谷歌还宣布推出一个名为“Google Antigravity”的新代理平台,该平台可以让开发者“以更高、更面向任务的水平”进行编码。

谷歌实验室和Gemini副总裁乔什·伍德沃德在一次简报会上告诉记者,Gemini 3是该公司“迄今为止最好的Vibe编码模型”。Vibe编码指的是一种快速发展的新兴工具市场,它允许软件开发人员根据提示生成代码。

谷歌表示,新模型将支持“生成式界面”,以类似数字杂志的方式提供特定答案。例如,该公司要求 Gemini 为每幅梵高画作“结合生活背景进行讲解”。最终成果是为每幅画作生成了色彩丰富、图文并茂的解释。

在人工智能模式下,Gemini 3 将首先面向付费用户开放。它能够分析问题并创建包含图像、表格和网格等视觉元素的布局。谷歌表示,它可以制作定制的交互式贷款计算器,或者针对复杂物理问题的交互式模拟程序。

开发者将能够访问 Gemini API,企业将能够通过 Vertex AI 将其集成,Vertex AI 是 Google 专为构建、部署和管理 AI 模型而设计的云服务。 

该公司表示,对于企业客户而言,Gemini 3 可以执行诸如创建员工入职和培训、更准确地分析视频和工厂车间图像以及处理采购等操作。

圈小蛙现已开通Telegram。单击此处加入我们的频道 (@quanxiaowa)并随时了解最新科技圈动态!

除特别注明外,本站所有文章均系根据各大境内外消息渠道原创,转载请注明出处。
文章名称:《谷歌发布Gemini 3人工智能模型,创下基准测试得分新高》
文章链接:https://www.qxwa.com/google-releases-gemini-3-ai-model-setting-new-benchmark-scores.html
分享到: 生成海报

评论 抢沙发

科技圈动态,尽在圈小蛙

联系我们关注我们