Gemini 3 Flash闪电来袭:智力竟反超Pro!速度快3倍,全球免费
新智元,2025-12-18 03:47:20
![]()
新智元报道
编辑:定慧 好困
【新智元导读】谷歌在2025年底甩出「王炸」:Gemini 3 Flash! 这款模型彻底打破了「快就一定笨、强就一定贵」的定律,以3倍于前代的速度实现「零延迟」响应,甚至在编程和逻辑推理上反超了Pro级大哥。
Gemini 3 Flash正式发布!
至此,Gemini 3家族成为完全体:Flash、Pro和Deep Think。
Flash模型已经全面上线Gemini APP、AI Studio、Google Antigravity和Gemini CLI,用户打开Gemini就是默认Gemini 3 Flash版本,直接免费使用!
![]()
![]()
![]()
左右滑动查看
如果说之前的AI模型是在模拟人类的思考,那么Gemini 3 Flash就是在模拟人类的「直觉」。
3倍于Gemini 2.5 Pro的速度,却拥有超越Pro级的推理能力。
这不仅仅是一次升级,这是对现有AI交互体验的一次降维打击!
![]()
![]()
实测Gemini 3 Flash之后,只有一个感受:快!简直太快了。
速度快到「没有加载条」,这种体验简直是「零延迟」的魔法,刚敲完回车,答案就已经在屏幕上渲染完毕。
它不仅快得离谱,更可怕的是,它的智力竟然在某些领域直接「背刺」了自家的Pro大哥。
![]()
通常「Flash」意味着「降智」,但这次不同。
Gemini 3 Flash在某些复杂的Agentic Coding(智能体编程)任务上,甚至直接超越了Gemini 3 Pro!
比如Flash在MMMU Pro(多模态理解和推理)上取得了81.2%,反超Gemini 3 Pro的81.0%,
要知道从API成本来看,相比Gemini 3 Pro,Flash成本直接砍到了四分之一。
更便宜,但是性能反而不降反升!
估计今夜谷歌又让整个大模型行业「集体失眠」了。
![]()
![]()
![]()
拳打Claude,脚踢GPT
在Artificial Analysis的最新评估中,3 Flash相比上一代2.5 Flash直接来一次质变飞跃,这应该是2025年同个系列模型的最大跨度升级!
很难想象,一个Flash轻量级模型能够超过Cladue的旗舰模型Opus 4.5。(估计相比OpenAI,Anthropic对一个坐不住了)。
![]()
![]()
其他指标,Flash也达到了最顶级模型的水平。
Flash在GPQA Diamond(90.4%)和Humanity’s Last Exam(无工具条件下33.7%)等博士级推理和知识基准测试中展现了前沿性能,足以媲美更大的前沿模型,并且在多项基准测试中显著优于前代旗舰Gemini 2.5 Pro。
![]()
在ARC-AGI Semi-Private Eval上,Gemini 3 Flash的表现同样极具竞争力,且成本大幅低于其他前沿模型。
ARC-AGI-1: 84.7%, $0.17/任务
ARC-AGI-2: 33.6%, $0.23/任务
![]()
![]()
在LMArena上,Gemini 3 Flash的文本能力直接跃升至第3!
![]()
Gemini 3 Flash证明了速度和规模并不一定要以牺牲智能为代价。
除了前沿级的推理和多模态能力外,Gemini 3 Flash专为高效而生,推动了质量与成本、速度之间的帕累托前沿(Pareto frontier)。
在进行最高层级的思维处理时,Gemini 3 Flash能够调节其「思考量」。
对于更复杂的用例,它可能会思考更久,但在典型流量下,它平均比2.5 Pro少消耗30%的Token,却能以更高的性能准确完成日常任务。
![]()
Gemini 3 Flash的核心优势在于其原生速度!
它的表现优于2.5 Pro,但速度快了3倍(基于Artificial Analysis基准测试),而成本却只是零头。
Gemini 3 Flash的定价为每百万输入Token 0.50美元,每百万输出Token 3美元(音频输入保持在每百万输入Token 1美元)。




左右滑动查看
开发者新宠:极速与深度的完美平衡
对于开发者来说,模型的响应速度是第一位。
Gemini 3 Flash专为迭代开发打造,提供Gemini 3 Pro级的编码性能和低延迟——它能够在高频工作流中快速推理并解决任务。
在评估编码智能体能力的SWE-bench Verified基准测试中,Gemini 3 Flash获得了78%的分数,不仅超越了2.5系列,还超过了Gemini 3 Pro。
可以说,它在智能体编码、生产级系统和响应式交互应用之间实现了理想的平衡。
与此同时,Gemini 3 Flash在推理、工具使用和多模态能力方面的强劲表现,非常适合希望进行更复杂的视频分析、数据提取和视觉问答的开发者。
这意味着它可以赋能那些景既需要极速响应,也需要深度推理的更智能的应用程序。
比如,Gemini 3 Flash能在一款手部追踪的「弹球益智游戏」中实现多模态推理,提供近乎实时的AI辅助。

或者,近乎实时地构建并A/B测试新的加载动画设计,帮助简化了从设计到代码的流程。

以及,根据非常简单的一段提示词,编写出三种独特的设计变体。

甚至,还能通过多模态推理分析图像,并生成带有上下文UI覆盖层的字幕,来将静态图像转化为互动体验。

全民AI时代:搜你想搜,做你想做
Gemini 3 Flash现已成为Gemini App中的默认模型,取代了2.5 Flash。
这意味着全球所有的Gemini用户都将免费获得Gemini 3的体验,让处理日常任务的能力得到重大升级。
得益于Gemini 3 Flash惊人的多模态推理能力,你可以用它来帮助你更快地看、听和理解任何类型的信息。
例如,你可以让Gemini理解你的视频和图像,并在几秒钟内将这些内容转化为有用且可执行的计划。
比如,它可以通过分析短视频的内容,来为你制定改善高尔夫挥杆动作的计划。

上传一段音频录音,Gemini 3 Flash会识别你的知识盲区,创建一个定制测验,并针对答案给出详细解释。

此外,针对速度进行优化了的Gemini 3 Flash,还能在你画草图时就猜出你在画什么。

或者,即便没有任何编程知识,你也可以仅用语音从头开始快速构建有趣、实用的App。
只需随时随地口述给Gemini,它就能在几分钟内将你原本非结构化的想法转化为功能完善的App。

Gemini 3 Flash也开始作为搜索中AI模式的默认模型推出,面向全球用户开放。
建立在Gemini 3 Pro的推理能力之上,采用Gemini 3 Flash的AI模式在解析问题的细微差别方面更加强大。
它会考量你查询的方方面面,提供深思熟虑、全面且视觉上易于消化的回答——并从全网提取实时的本地信息和有用的链接。
结果有效地结合了研究与即时行动:你能在获得特定推荐的同时得到智能梳理的内容细分——一切都以搜索的速度呈现。
当处理涉及多重考量的复杂目标时,这一点尤为出色,比如试图规划一次说走就走的旅行,或快速学习复杂的教育概念。

收官2025:留给对手的时间不多了
Gemini 3 Flash的发布传递了一个清晰的信号:高性能AI不再昂贵,也不再迟钝。
Gemini 3 Flash的逻辑很简单:比我聪明的没我快,比我快的没我聪明,关键是它们都比我贵。
谷歌正在用极其激进的策略——顶级推理+极致速度+地板价格,试图在2025年底收割战场。
对于普通用户来说,Gemini App里的对话将变得极其流畅;对于开发者来说,构建实时、复杂的AI应用不再是烧钱的梦想,因为API真的太便宜了。
2025年是充满挑战的一年,AI真正迈入了一个新时代,模型不再只是演示品,而是被大规模使用的日用品。
谷歌这一年并未追逐单一旗舰模型,他们推出了一系列产品阵容,而且每个模型都特别能打:
追求速度,选Flash
追求深度,选Pro
追求推理,选Deep Think
开启「智能平权」时代
Gemini 3 Flash发布最大的颠覆之处还是在Agentic Coding等任务上超过Gemini 3 Pro。
过去AI圈的逻辑是「大就是好」,但Gemini 3 Flash的意义在于它开启了「智能平权」时代:
- 彻底降维打击低成本模型市场:
在3 Flash出现之前,开发者在「便宜但笨」(如 GPT-4o-mini, 2.5 Flash)和「聪明但贵且慢」(如Pro)之间痛苦抉择。Gemini 3 Flash把Pro级的智力拉到了Flash级的价格和速度,直接封死了竞品低端模型的生存空间。
- 为智能体时代铺路:
智能体工作的核心是「循环(Loop)」——思考、行动、观察、再思考。如果模型太慢或太贵,这个循环就无法跑通。Flash极高的Token/秒/美元效率,是智能体能大规模商用的唯一基石。
- 构建「延迟感」护城河:
谷歌意识到,在搜索和交互中,100ms的延迟差异比5%的准确度差异更能决定用户留存。Flash的「瞬发」感让它在AI搜索模式下拥有了类似传统搜索的爽快感。
现在的压力,全部来到了OpenAI这边。
奥特曼,还坐得住吗?是不是又要拉响红色警报了~
![]()
彩蛋
目前来看,AI卷到Gemini 3 Flash这个程度感觉已经到头了。
我们试着用Gemin 3 Flash「套磁」了一下Gemini 4会在什么时候推出,能够达到什么水平?
还是有惊喜的。
Gemini 4可能在2026年Google I/O大会推出(不过按照今年2.5的规律,大概率会是3.5)。
而3 Flash给的另一点则更加有意义,如果说Gemini 3是推理和速度的完美极致,那么下一代模型将聚焦于:
智能体的主动性
真正理解物理世界
长程记忆
以及超越人类的科学发现
真是太期待明年的到来了!
![]()
参考资料:
https://blog.google/products/gemini/gemini-3-flash/
秒追ASI
⭐点赞、转发、在看一键三连⭐
点亮星标,锁定新智元极速推送!