谷歌发布Gemma 4大模型:31B登顶开源第三!手机可离线运行
创始人
2026-04-03 17:26:34
0

快科技4月3日消息,今天凌晨,谷歌DeepMind正式推出新一代开源大模型Gemma 4,该模型与谷歌闭源旗舰Gemini共享底层技术,也是时隔一年对Gemma 3的重大升级。

此次谷歌一改此前自有协议,采用Apache 2.0商业友好型许可证开源,开发者可无门槛自由修改、分发和商用。

一口气推出四款不同规格模型,覆盖从手机、边缘设备到工作站、服务器的全场景部署,在参数效率上表现亮眼,31B版本更是跻身Arena AI开源排行榜第三。

Gemma 4的四款模型分为大模型组和小模型组,各有针对性优化。

31B Dense为310亿参数全激活架构,60层且拥有256K上下文窗口,主打性能上限,未量化权重可在单张80GB H100显卡运行,量化后消费级显卡也能部署。

26B A4B MoE采用混合专家架构,252亿总参数仅激活38亿,推理速度接近4B模型,性能却远超同级别,位列开源排行榜第六,延迟敏感场景性价比更高。

所有模型均为多模态,支持图像、视频输入和140多种语言, 谷歌还与Pixel、高通、联发科合作优化端侧,E2B/E4B可在手机、树莓派等设备完全离线运行。

相较于上一代Gemma 3 27B,Gemma 4实现了代际级的性能提升,尤其在代码领域进步最为显著,Codeforces ELO从110提升至2150,LiveCodeBench v6正确率从29.1%增至80.0%。

数学方面,AIME 2026竞赛测试31B版本正确率达89.2%,远超上代20.8%;综合推理上,研究生级科学问答GPQA Diamond正确率从42.4%升至84.3%,MMLU Pro达85.2%。

视觉和长上下文短板也被补齐,MMMU Pro多模态推理正确率提升至76.9%,MRCR v2 128K长文档理解从13.5%增至66.4%,多语言能力也同步升级,MMMLU多语言测试达88.4%。

此外,26B MoE与31B性能仅差2-5个百分点,E4B有效参数45亿,性能却接近上代27B版本,参数效率优势突出。

Gemma 4还打造了多项核心能力,全系列内置可开关的思考模式,开启后先输出推理过程再给答案,大幅提升数学、逻辑等多步骤任务表现;原生支持函数调用和结构化JSON输出,可对接外部工具与API,谷歌还同步发布开源Agent开发框架ADK,端侧模型也能运行Agent。

多模态处理上支持可变分辨率图片和60秒以内视频帧处理,视觉token预算可手动调节,适配不同速度与精度需求;长文档处理采用混合注意力机制,优化了内存占用,兼顾处理效率与效果。

相关内容

最新资讯

民进党台北市长人选难产?蓝营青... 海峡导报综合报道 民进党2026年台北市长人选,除了民进党民代沈伯洋可望获征召外,传出台湾地区前领导...
招生范围扩大!江苏一985高校... 4月8日,东南大学发布2026年强基计划招生简章,即日起至4月30日17:00考生可登录东南大学强基...
2026春五年级下册北师大版数... 北师大版五年级专属|第四单元检测优选!2026春五年级下册数学,4套专项检测卷(2套名校真题卷+2套...
成均馆大学中国MBA突然叫停?... 最近,不少打算申请韩国留学的同学都被一条消息刷屏了:成均馆大学那个唯一的中文授课研究生项目——中国M...
小学科学教学中的生活化教学探索 科学并不遥远,它就藏在孩子每天接触的生活中。小学科学课程作为学生认识自然、了解世界的重要启蒙课程,只...
又一高校明确:无“非升即走” “非升即走”起源于北美的Tenure-track制度,在进入国内高校的十余年间,它既带来了科研产出的...
虚假摆拍“深山救助流浪女”,3... 近日,云南丽江网警接到网民举报,部分网络平台出现多条 “在云南深山救助流浪女子” 的短视频。视频中,...
学费要变天?如果没有问题的话,... 上周末,同事老张跑来找我们诉苦。开学才半个月,班级群里缴费通知弹了四五条。他掏出手机给我们看:"又要...
女孩初潮=不长个?错过最后的生... 进入青春期 女孩身高增长进入关键冲刺期 月经初潮 更是家长格外关注的“成长信号” 不少家长忧心 孩子...
正在公示!江苏拟新增126个本... 交汇点讯 4月8日,江苏省学位委员会办公室对2026年江苏省通过审核的学士学位授权专业进行公示,包括...