2B开源模型手机养虾!谷歌Gemini 3技术下放:支持语音视频多模态,全免费可商用
梦晨 发自 凹非寺量子位 | 公众号 QbitAI31B开源模型甩开比他大几十倍的模型挤进竞技场开源前三。谷歌刚刚放出的Gemma 4有点猛了。它赢过的是Qwen3.5-397B和DeepSeek v3.2-671B参数量都比它大了10-20倍。赢过它的是GLM-5745B和Kimi K2.51T都是26年最新旗舰。31B做到这个份上够了。这次Gemma 4整个系列一共四个尺寸基于Gemini 3同款技术打造全系列支持多模态E2B、E4B、26B MoE、31B Dense。最小的2B版手机、树莓派上都能跑而且跑出来的成绩也不像是个小模型能干出来的事。手机不联网都能跑多模态龙虾处理语音、视频了。31B打败20倍对手26B 只激活3.8B参数四个模型四个定位但有一个共同点效率优先。最大的31B Dense模型作为密集模型适合拿去做微调。26B MoE模型推理时只激活3.8B它排在全球开源第6更追求速度用最少的激活量换取最快的推理。他它们的硬件门槛也不高。未量化的bfloat16权重单张80GB的H100就能跑起来。量化后的版本普通消费级GPU也能本地运行。根据谷歌官方博客Gemma 4家族重点强化了六大核心能力高级推理支持多步规划和深度逻辑数学和指令遵循基准测试表现大幅提升Agent工作流原生支持内置函数调用、结构化JSON输出、系统指令原生支持能直接搭自主代理代码生成支持高质量离线代码生成直接把工作站变成本地AI代码助手视觉和音频处理全系列可原生处理视频和图像支持可变分辨率OCR、图表理解都不在话下小版本还支持原生音频输入长上下文支持端侧版上下文窗口128K大参数版最高256K一次性就能读完整段代码仓库140语言支持原生在140多种语言上训练做全球化应用不用再单独做本地化手机离线跑多模态树莓派也能带得动再重点说两个专为端侧设计的小模型。E2B和E4B里的“E”是Effective的意思也是走的低激活率MoE路子。E2B实际上有远多于2B的参数量但推理时只激活其中2B的部分。它们的任务很明确在手机和IoT设备上原生处理音频和视觉。意味着手机可以完全不联网直接用摄像头看东西、用麦克风听声音然后给你回复。零延迟零云端依赖。谷歌这次还拉上了自家的Pixel手机以及高通、联发科一起做了全链路优化从芯片到模型到设备整条链路打通了。回头看一眼Gemma系列进化路线就更清楚这次更新的价值。Gemma 1在2024年2月发布2B和7B两个尺寸只能处理纯文本。Gemma 2在同年6月跟上2B、9B、27B依然是纯文本。Gemma 3到2025年3月才开始支持多模态但端侧的1B版本能力有限。现在E2B和E4B直接把多模态塞进了端侧小模型能力边界完全不一样了。除了多模态这两个模型还支持完整的智能体工作流。函数调用、结构化JSON输出、系统指令。手机可以变成一个完全本地的AI代码助手耗电养虾token自由。Apache 2.0协议社区的呼声被听见Gemma 4全面采用Apache 2.0协议。可以概括成三个字随便用。过去Google开源模型的许可证一直被诟病”不够纯粹”。Gemma一代和二代用的自定义许可协议虽然也允许商用但条款措辞让法务提心吊胆。这次你可以拿它做商业产品不需要给Google交一分钱。你可以把模型部署在任何环境公有云、私有机房、边缘设备都行。在官方博客里Google DeepMind团队写到过去两年社区反复在GitHub issue、论坛、社交媒体上喊我们要 Apache 2.0。Google这次听到了。Hugging Face的CEO也第一时间表态他认为这并非一个简单的许可证变更而是开源AI社区的一个分水岭。Gemma 4在Apache 2.0协议下发布是一个巨大的里程碑。我们非常激动能在第一天就在Hugging Face上支持Gemma 4全系列模型。截至目前Gemma系列模型累计下载量超过 4 亿次。社区贡献的模型变体超过10万个。One More Thing开源模型的价值不只是让开发者少花钱。耶鲁大学的研究团队已经用Gemma作为基座模型开发了一个叫Cell2Sentence-Scale的项目。他们把单细胞基因表达数据转化为语言模型的输入序列让AI直接”阅读”细胞状态。结果在癌症治疗靶点发现上找到了几条此前被传统方法忽略的新路径。没有Gemma这个项目可能要花几百万美元买API调用。但现在一个几十B参数的小模型就推动了真正的科学发现。下一次你听到“AI 改变了什么”这样的故事起点可能就是一个开源小模型。参考链接[1]https://blog.google/innovation-and-ai/technology/developers-tools/gemma-4/?utm_mediumsocialutm_content[2]https://x.com/victormustar/status/2039739591276581118?s20[3]https://x.com/billtheinvestor/status/2039805141876871376?s20—完— 风云变幻的Q1谁是AI超级应用量子位智库「AI 100」旗舰、创新双产品榜单开启招募扫码申报让你的产品成为季度风向标。