LIXUWEI

本站网址

blog.apodfg.com

标签

AI Experience 故障排查

LIXUWEI

T

X

E

本站网址

blog.apodfg.com

标签

LIXUWEI

本站网址

blog.apodfg.com

标签

AI Experience 故障排查

站点统计

文章

22

分类

5

标签

3

总字数

23,303

运行天数

0 天

最后活动

-

位置

747 字

2 分钟

Gemini 3.5 Flash 发布：更快、更强的 Agent 与 Coding 模型

2026-05-20

Technology

AI

Gemini 3.5 Flash 来了：这次 Google 是真的奔着 Agent 去的 🚀#

Google 又更新了，这次是 Gemini 3.5 Flash。

看完官方页面我的第一反应是：这已经不是单纯的”模型升级”了，更像是 Google 对 Flash 系列重新定位了一次——主打 Agent，主打写代码，速度还是一如既往地快。

🧩 它到底是个什么模型？#

简单说，Gemini 3.5 Flash 是 Flash 家族里最新、也是 Google 自己口中最强的 agentic & coding 模型。

Flash 一直走的是”轻量、便宜、够用”的路线，但这一代明显不只想”够用”了。它瞄准的是这几个场景：

AI Agent 工作流、编程任务、工具调用、多步骤执行……
基本就是现在大家最关心的那一块——让模型去干活，而不是只回答问题。

⚡ 卖点一：极快的推理速度#

官方原话是，Gemini 3.5 Flash 在保持前沿能力的同时，速度大约是同档 frontier model 的 4 倍，价格通常不到一半。

这点对真实开发非常关键。

因为做 Agent 的人都知道，模型不是回一句话就完事的。一个流程下来要：分析需求 → 调工具 → 写代码 → 自检 → 改 bug → 再总结一遍。

中间任何一步慢一秒，体验都会被放大。
所以 Flash 这次的定位很直白：不只是聪明，还得跟得上节奏。

Gemini 3.5 Flash Speed

📊 跑分：Coding 和 Agent 是真的有进步#

跑分图这次值得多看两眼，有几个点让我有点意外。

① Coding 能力
Terminal-Bench 2.1 这种偏真实终端任务的测试里，3.5 Flash 居然超过了 Gemini 3.1 Pro。一个 Flash 打过 Pro，这事本身就挺有信息量。

② MCP / 工具调用
MCP Atlas 上的表现也很强。MCP 现在基本是 AI 接外部世界的标准协议——文件、数据库、第三方服务都靠它打通。这一块强，意味着它特别适合塞进 Agent、编程助手、自动化流水线里用。

③ 真实 Agent 任务
不是单题型 benchmark，而是 real-world agentic task。这种测试更难刷分，提升了说明它确实”能连续干活”，不是只会单点回答。

Gemini 3.5 Flash Benchmark

🥊 和 Gemini 3.1 Pro 比怎么样？#

官方对比图重点放在 3.5 Flash vs 3.1 Pro，三个维度都涨了：

Coding ↑ Terminal-Bench 更高
Real-world Agentic ↑ 真实 Agent 场景更强
Scaled Tool Use ↑ 大规模工具调用更稳

说实话，看到一个 Flash 在多个维度反超上一代 Pro，已经能感觉到 Google 这次 Flash 的策略变了——不再是”Pro 的低配版”，而是另一种风格的旗舰。

Gemini 3.5 Flash vs Gemini 3.1 Pro

ranking

如果这篇文章对你有帮助，欢迎分享给更多人！

部分信息可能已经过时

千问3.7发布

LLM 和 AI Agent 到底有什么区别？

わたしの部屋

Gemini 3.5 Flash 来了：这次 Google 是真的奔着 Agent 去的 🚀#

🧩 它到底是个什么模型？#

⚡ 卖点一：极快的推理速度#

📊 跑分：Coding 和 Agent 是真的有进步#

🥊 和 Gemini 3.1 Pro 比怎么样？#

目录