当地时间11月18日,谷歌推出了“公司迄今为止最智能的模型”——Gemini 3。谷歌母公司Alphabet首席执行官桑达尔·皮查伊(Sundar Pichai)称,Gemini 3集成了Gemini系列的所有强大功能,助力用户轻松将天马行空的创意变为现实。
谷歌表示,Gemini 3具备博士级别(PhD-level)的推理能力,在多项测试中表现优异。谷歌还着重强调了Gemini 3可以帮助用户“学习一切、创作一切、规划一切”(Learn anything、Build anything、Plan anything)。
“学习一切、创作一切、规划一切”
具体来看,Gemini 3进一步突破了多模态推理的边界,具备领先的推理能力、视觉与空间理解能力,以及卓越的多语言表现力,并支持高达100万token的超长上下文窗口,助力用户高效学习。
譬如,谷歌展示了Gemini 3如何帮助用户学习烹饪技艺。在演示中,Gemini 3精准解读并翻译了不同语言的手写食谱,并最终汇集成一本便于分享的食谱集。此外,Gemini 3还能够分析比赛视频,指出薄弱环节,并制定训练计划。
在创作方面,谷歌着重强调了Gemini 3的编程能力,其在WebDev Arena、Terminal-Bench 2.0、SWE-bench Verified等衡量工具使用及编程能力的基准测试中均取得高分。
谷歌亦推出了Antigravity智能体平台,将AI辅助从开发者工具包中的一种工具,升级为全程参与的主动协作者。使智能体实现自主规划并同时执行复杂的端到端软件任务,全程代劳完成代码验证。
在长期规划的可靠性方面,Gemini 3在Vending-Bench 2榜单中居榜首。据悉,该测试通过管理模拟的自动售货机业务,检验模型的长周期规划能力,而Gemini 3 Pro在长达一年的完整模拟运营中,持续保持工具使用与决策的一致性,确保收益稳步提升,同时始终专注任务目标。
谷歌称,Gemini 3能够应对复杂多步骤工作流,更好地完成日常生活中的各项任务,如预订本地服务或整理收件箱等。
据皮查伊介绍,如今,AI Overviews每月已拥有20亿用户;Gemini App的月活跃用户突破6.5亿大关,超过70%的云客户正在使用公司的AI服务,1300万名开发者基于公司的生成式模型进行开发工作。
“谷歌能挺过AI风暴”
“全栈方针涵盖了AI基础设施、包括模型和工具在内的世界级研究,以及我们将AI带给世界各地人们的产品和平台。”皮查伊在最新财报电话会上表示,首先是AI基础设施,公司广泛而可靠的基础设施为所有Google产品提供动力,是公司技术栈的基石,也是一个关键的差异化优势。
“公司正在数据中心中扩展最先进的芯片,包括来自我们合作伙伴NVIDIA的GPU,以及我们自己专用的TPU,我们是唯一一家同时提供这两者的公司。”他说。
皮查伊表示,得益于谷歌独具特色的AI创新全栈式方法:从领先的基础设施,到世界一流的科研、模型与工具,再到惠及全球数十亿用户的各类产品,公司如今能够以前所未有的速度将先进能力推向全球。
分析师认为,谷歌AI全栈优势构筑护城河,资本开支具备提升潜力。全面布局芯片(TPU)-网络(OCS)-模型(Gemini)-应用(云计算/搜索/广告等),自研TPU芯片实现跨越式发展,Gemini模型能力全球领先,重视谷歌算力需求的高增长以及AI硬件创新带来的产业链投资机会。
尽管谷歌是AI浪潮的最大受益者之一,但皮查伊也坦言了自己对AI泡沫破裂的担忧。他在近日接受媒体采访时表示,目前的人工智能投资浪潮是一个“非凡的时刻”,但也承认市场中存在“非理性”元素,呼应了网络泡沫时期“非理性繁荣”的警告。
当被问及谷歌将如何应对潜在的泡沫破灭时,皮查伊表示,他认为谷歌能够经受住这场风暴,但他又补充说:“我认为没有任何公司能幸免,包括我们。”
作者:郑维汉 窦世平