LIXUWEI

本站网址

blog.apodfg.com

标签

AI Experience 故障排查

LIXUWEI

T

X

E

本站网址

blog.apodfg.com

标签

LIXUWEI

本站网址

blog.apodfg.com

标签

AI Experience 故障排查

站点统计

文章

22

分类

5

标签

3

总字数

23,303

运行天数

0 天

最后活动

-

位置

479 字

1 分钟

千问3.7发布

2026-05-24

Technology

AI

千问3.7-Max：Agent时代国产最强旗舰，性能直逼国际顶尖#

阿里巴巴通义千问团队于2026年5月20日前后正式发布Qwen3.7-Max，这是专为Agent时代打造的全能旗舰模型。不同于以往版本，它在编程智能体、办公自动化与长周期自主执行三大核心能力上实现全面突破。

核心亮点：

编程智能体：端到端完成前端原型、多文件重构与真实调试
长周期自主：单次任务连续运行35小时、调用超1000次工具零干预
框架无关：无缝适配Claude Code、OpenClaw、Qwen Code等多种智能体框架

基准对比（真实数据来自X实测）：

在SWE-Pro、Terminal Bench 2.0-Terminus（69.7分）、SWE-Multilingual等评测中多项第一；SWE-Verified 80.4分与Claude Opus 4.6（80.8分）几乎持平；MCP-Atlas 76.4分反超Opus。

更惊艳的是实测对比：

Voxel Pagoda Diorama基准：Qwen3.7-Max以2分2秒生成66455体素，全面胜过Gemini 3.5 Flash、Opus 4.7、GPT-5.5 Thinking Extended。
Extended NYT Connections：从Qwen3.6的82.2分提升至89.8分。
全球Arena盲测总榜：超越Kimi-K2.6、DeepSeek-v4-pro、GLM-5.1，位列国产第一，与GPT/Claude最强模型接近。
性价比图（@jumperz实测）：Qwen3.7-Max blended cost仅$3.75，AA Index 56.6分，接近Opus却只需其40%成本。

Qwen3.7-Max 价格与性能对比图