479 字
1 分钟
千问3.7发布
千问3.7-Max:Agent时代国产最强旗舰,性能直逼国际顶尖
阿里巴巴通义千问团队于2026年5月20日前后正式发布Qwen3.7-Max,这是专为Agent时代打造的全能旗舰模型。不同于以往版本,它在编程智能体、办公自动化与长周期自主执行三大核心能力上实现全面突破。
核心亮点:
- 编程智能体:端到端完成前端原型、多文件重构与真实调试
- 长周期自主:单次任务连续运行35小时、调用超1000次工具零干预
- 框架无关:无缝适配Claude Code、OpenClaw、Qwen Code等多种智能体框架
基准对比(真实数据来自X实测):
在SWE-Pro、Terminal Bench 2.0-Terminus(69.7分)、SWE-Multilingual等评测中多项第一;SWE-Verified 80.4分与Claude Opus 4.6(80.8分)几乎持平;MCP-Atlas 76.4分反超Opus。
更惊艳的是实测对比:
- Voxel Pagoda Diorama基准:Qwen3.7-Max以2分2秒生成66455体素,全面胜过Gemini 3.5 Flash、Opus 4.7、GPT-5.5 Thinking Extended。
- Extended NYT Connections:从Qwen3.6的82.2分提升至89.8分。
- 全球Arena盲测总榜:超越Kimi-K2.6、DeepSeek-v4-pro、GLM-5.1,位列国产第一,与GPT/Claude最强模型接近。
- 性价比图(@jumperz实测):Qwen3.7-Max blended cost仅$3.75,AA Index 56.6分,接近Opus却只需其40%成本。




三款前沿模型的测试
如何使用:已上线阿里云百炼平台与Qwen Studio。
立即免费体验(无需登录):
👉 https://chat.qwen.ai/?models=qwen3.7-max
(已实测支持直接生图,适合快速验证Agent能力)
Qwen3.7-Max标志着国产模型在智能体能力上已真正站上世界舞台,强烈建议开发者立即体验!
分享
如果这篇文章对你有帮助,欢迎分享给更多人!
部分信息可能已经过时
相关文章 智能推荐
1
OpenAI 发布 GPT-5.5
Technology Now available in ChatGPT and Codex.
2
ChatGPT Images 2.0 震撼发布
Technology ChatGPT Images 2.0
3
Claude新模型Opus 4.8蒸馏DeepSeek千问
Technology Claude 新模型 Opus 4.8 被发现“蒸馏”DeepSeek 与千问
4
百度文心大模型 5.1 发布
Technology 文心 5.1 – 百度推出的旗舰大语言模型
5
GPT-5.5 Instant 发布:Instant 跟 Thinking 模型的区别
Technology 2026-05-06
