479 字
1 分钟
千问3.7发布
2026-05-24
2026-05-24

千问3.7-Max:Agent时代国产最强旗舰,性能直逼国际顶尖#

阿里巴巴通义千问团队于2026年5月20日前后正式发布Qwen3.7-Max,这是专为Agent时代打造的全能旗舰模型。不同于以往版本,它在编程智能体、办公自动化与长周期自主执行三大核心能力上实现全面突破。

核心亮点

  • 编程智能体:端到端完成前端原型、多文件重构与真实调试
  • 长周期自主:单次任务连续运行35小时、调用超1000次工具零干预
  • 框架无关:无缝适配Claude Code、OpenClaw、Qwen Code等多种智能体框架

基准对比(真实数据来自X实测)

在SWE-Pro、Terminal Bench 2.0-Terminus(69.7分)、SWE-Multilingual等评测中多项第一;SWE-Verified 80.4分与Claude Opus 4.6(80.8分)几乎持平;MCP-Atlas 76.4分反超Opus。

更惊艳的是实测对比:

  • Voxel Pagoda Diorama基准:Qwen3.7-Max以2分2秒生成66455体素,全面胜过Gemini 3.5 Flash、Opus 4.7、GPT-5.5 Thinking Extended。
  • Extended NYT Connections:从Qwen3.6的82.2分提升至89.8分。
  • 全球Arena盲测总榜:超越Kimi-K2.6、DeepSeek-v4-pro、GLM-5.1,位列国产第一,与GPT/Claude最强模型接近。
  • 性价比图(@jumperz实测):Qwen3.7-Max blended cost仅$3.75,AA Index 56.6分,接近Opus却只需其40%成本。

Qwen3.7-Max 价格与性能对比图

Qwen3.7-Max NYT Connections提升对比图

Qwen3.7-Max Arena顶尖模型对比

Qwen3.7-Max Arena全球排名与国产模型对比

三款前沿模型的测试#

点击观看视频

如何使用:已上线阿里云百炼平台与Qwen Studio。
立即免费体验(无需登录):
👉 https://chat.qwen.ai/?models=qwen3.7-max
(已实测支持直接生图,适合快速验证Agent能力)

Qwen3.7-Max标志着国产模型在智能体能力上已真正站上世界舞台,强烈建议开发者立即体验!

分享

如果这篇文章对你有帮助,欢迎分享给更多人!

部分信息可能已经过时

目录