747 字
2 分钟
Gemini 3.5 Flash 发布:更快、更强的 Agent 与 Coding 模型
2026-05-20
2026-05-20

Gemini 3.5 Flash 来了:这次 Google 是真的奔着 Agent 去的 🚀#

Google 又更新了,这次是 Gemini 3.5 Flash

看完官方页面我的第一反应是:这已经不是单纯的”模型升级”了,更像是 Google 对 Flash 系列重新定位了一次——主打 Agent,主打写代码,速度还是一如既往地快

🧩 它到底是个什么模型?#

简单说,Gemini 3.5 Flash 是 Flash 家族里最新、也是 Google 自己口中最强的 agentic & coding 模型

Flash 一直走的是”轻量、便宜、够用”的路线,但这一代明显不只想”够用”了。它瞄准的是这几个场景:

AI Agent 工作流、编程任务、工具调用、多步骤执行……
基本就是现在大家最关心的那一块——让模型去干活,而不是只回答问题


⚡ 卖点一:极快的推理速度#

官方原话是,Gemini 3.5 Flash 在保持前沿能力的同时,速度大约是同档 frontier model 的 4 倍,价格通常不到一半。

这点对真实开发非常关键。

因为做 Agent 的人都知道,模型不是回一句话就完事的。一个流程下来要:分析需求 → 调工具 → 写代码 → 自检 → 改 bug → 再总结一遍。

中间任何一步慢一秒,体验都会被放大。
所以 Flash 这次的定位很直白:不只是聪明,还得跟得上节奏。

Gemini 3.5 Flash Speed


📊 跑分:Coding 和 Agent 是真的有进步#

跑分图这次值得多看两眼,有几个点让我有点意外。

① Coding 能力
Terminal-Bench 2.1 这种偏真实终端任务的测试里,3.5 Flash 居然超过了 Gemini 3.1 Pro。一个 Flash 打过 Pro,这事本身就挺有信息量。

② MCP / 工具调用
MCP Atlas 上的表现也很强。MCP 现在基本是 AI 接外部世界的标准协议——文件、数据库、第三方服务都靠它打通。这一块强,意味着它特别适合塞进 Agent、编程助手、自动化流水线里用。

③ 真实 Agent 任务
不是单题型 benchmark,而是 real-world agentic task。这种测试更难刷分,提升了说明它确实”能连续干活”,不是只会单点回答。

Gemini 3.5 Flash Benchmark


🥊 和 Gemini 3.1 Pro 比怎么样?#

官方对比图重点放在 3.5 Flash vs 3.1 Pro,三个维度都涨了:

  • Coding ↑ Terminal-Bench 更高
  • Real-world Agentic ↑ 真实 Agent 场景更强
  • Scaled Tool Use ↑ 大规模工具调用更稳

说实话,看到一个 Flash 在多个维度反超上一代 Pro,已经能感觉到 Google 这次 Flash 的策略变了——不再是”Pro 的低配版”,而是另一种风格的旗舰。

Gemini 3.5 Flash vs Gemini 3.1 Pro

ranking

分享

如果这篇文章对你有帮助,欢迎分享给更多人!

部分信息可能已经过时

目录