Qwen3.6-Plus

阿里巴巴通义实验室发布的旗舰级大语言模型,以智能体编程为核心定位,编程能力接近Claude Opus 4.5水平

深度报告

  • Qwen3.6-Plus是阿里巴巴通义实验室于2026年4月2日发布的旗舰级大语言模型,是通义千问3.6系列的闭源旗舰版本。该模型以「智能体编程(Agentic Coding)」为核心定位,在100万token超长上下文、编程能力、智能体任务执行和原生多模态理解等方面实现了全面升级。根据官方评测数据,Qwen3.6-Plus在SWE-bench Verified基准测试中获得78.8分,编程能力已接近全球顶级模型Claude Opus 4.5水平,同时参数量仅为后者的1/2至1/3。在API定价方面,Qwen3.6-Plus输入价格为2元/百万tokens,输出价格为12元/百万tokens,性价比优势显著。Qwen3.6-Plus的发布标志着国产大模型在编程能力赛道正式跻身世界前列,成为2026年上半年最具竞争力的国产AI产品之一。

  • 通义千问(Qwen)是阿里巴巴集团于2023年推出的自研大语言模型品牌,由阿里云通义实验室主导研发。作为阿里巴巴在AI大模型领域的核心产品线,通义千问在过去两年间保持了高频迭代节奏,从Qwen1.0到Qwen3.6-Plus,历经数十次版本更新,形成了覆盖通用对话、代码生成、推理和多模态的完整产品矩阵。阿里巴巴对通义千问的投入力度在国内AI企业中处于第一梯队,仅2024年至2025年间就发布了Qwen2.0、Qwen2.5、Qwen3.0、Qwen3.5等多个重要版本,并在开源领域陆续放出了Qwen2.5-Instruct、Qwen2.5-Coder等系列模型。 2026年4月2日,通义千问团队正式发布Qwen3.6-Plus,这是继2026年2月发布Qwen3.5系列后仅过了约45天的新一代旗舰模型。从发布时间节点来看,阿里巴巴正在加速大模型的迭代节奏,以应对来自DeepSeek、智谱AI、MiniMax、月之暗面等竞争对手的激烈竞争。Qwen3.6-Plus的定位非常明确——打造国产最强编程智能体模型,在软件工程、代码生成、工具调用等场景对标全球顶尖产品。值得注意的是,与Qwen3.6-Plus同期发布的还有开源版MoE模型Qwen3.6-35B-A3B,以及后续于4月20日发布的Qwen3.6-Max-Preview预览版,形成了完整的闭源+开源产品组合。 从市场背景来看,2026年全球AI大模型竞争已进入白热化阶段。OpenAI的GPT-5系列、Anthropic的Claude 4系列、Google的Gemini系列构成了国际第一梯队;国内则有DeepSeek V3/R1、智谱GLM-5、MiniMax M2.7、月之暗面Kimi K2.5等强劲对手。在这一背景下,Qwen3.6-Plus的发布承载着阿里巴巴在国产大模型竞争中保持领先地位的战略意图,尤其是在编程和智能体这两个当前最热门、也是商业价值最高的应用场景中建立技术壁垒。

  • Qwen3.6-Plus采用了先进的混合稀疏MoE(Mixture of Experts)架构,这是一种在保持高性能的同时显著降低推理成本的技术方案。与传统稠密模型相比,MoE架构在处理每个输入token时只激活部分专家网络,从而实现了「大模型的能力,小模型的成本」。根据官方数据,Qwen3.6-Plus的参数量仅为Claude Opus 4.5的1/2至1/3,但性能表现却能达到后者的同等水平,这在技术上体现了阿里巴巴在大模型效率优化方面的深厚积累。 在协议兼容性方面,Qwen3.6-Plus同时支持OpenAI格式和Anthropic格式,这意味着开发者可以几乎无缝地将现有基于GPT或Claude的应用迁移到Qwen3.6-Plus上。此外,模型还支持一个特色功能——preserve_thinking,该功能可以保留前序轮次的思维内容,对于需要长程记忆的智能体任务尤为实用。 百万token超长上下文:Qwen3.6-Plus将上下文窗口从上一代的256K直接扩展至100万token,是目前国产大模型中最顶级的上下文规格。这一突破意味着模型可以一次性处理约8本长篇小说、完整的中等规模代码仓库、数十份行业研报或大型合同文档。在实际应用中,超长上下文解决了大模型领域长期存在的「长任务中断」痛点,用户无需分段处理即可完成复杂的长程任务。 顶尖编程能力:在编程能力方面,Qwen3.6-Plus实现了多项突破:支持全栈代码生成,覆盖前端、后端、移动端和数据库等主流开发场景;创新性地支持Vibe Coding模式,用户只需用自然语言描述需求,即可自动生成可交互的前端应用;具备精准的代码智能修复能力,能够识别并修复安全漏洞、自动优化代码性能;支持终端编程自动化,可直接操作命令行完成环境配置、脚本执行和项目部署;还支持视觉编程,用户上传设计稿或原型图后,模型可自动复刻为高保真前端页面。 强智能体(Agent)能力:Qwen3.6-Plus被官方明确定位为「智能体编程」模型,其智能体能力相比前代实现了质的飞跃。模型内置强制推理机制(Chain-of-Thought),在生成回答前必须完成完整的推理过程,这大大提升了复杂任务的分析质量;精准的工具调用能力使其能够稳定地调用各类API、数据库和文件系统;支持长程任务持久化,可实现任务断点续传和记忆保存;还支持多智能体协同工作,可与其他AI智能体联合完成复杂任务。 原生多模态能力:Qwen3.6-Plus基于原生多模态数据训练,在图像理解和视频分析方面表现突出。根据官方评测数据,模型在OmniDocBench 1.5文档理解测试中获得91.2分的高分,能够精准理解复杂排版的PDF文件、扫描件和表格;在视频理解方面,模型支持逐秒拆解,上传视频后可自动生成逐秒脚本、分镜和台词。此外,模型还支持文本、图片、视频的混合输入,实现了真正的多模态交互。 极低幻觉率:幻觉率(Hallucination Rate)是评估大模型可靠性的关键指标。Qwen3.6-Plus在事实核查和知识摘要场景中的幻觉抑制能力表现优异,内置多重事实校验机制,对于不确定的信息会主动标注而非强行生成。这一特性使Qwen3.6-Plus特别适合金融、法律、医疗、学术等对准确性要求极高的专业领域。 超高性价比:在保持顶级性能的同时,Qwen3.6-Plus实现了极高的性价比。模型参数量仅为Claude Opus 4.5的1/2至1/3,大幅降低了推理成本;API定价极具竞争力,限时优惠后输入价格仅为2元/百万tokens,输出价格为6元/百万tokens(Batch模式),这一定价仅为国际同类顶级模型的1/9左右。根据第三方测算,Qwen3.6-Plus的性价比指数是Claude的8.5倍。

  • 根据官方公布的评测数据,Qwen3.6-Plus在多个权威基准测试中取得了优异成绩:SWE-bench Verified得分78.8分,代表软件工程任务解决能力,超越Claude 3.7 Sonnet;Terminal-Bench 2.0得分61.6,代表终端命令理解与执行;HumanEval得分87.2%,代表代码生成能力;OmniDocBench得分91.2,代表复杂文档理解;Video-MME得分87.8,代表视频内容推理。

  • Qwen3.6-Plus提供多种使用渠道以满足不同用户的需求。官方渠道包括:阿里云百炼平台提供API调用服务,适合企业级应用和开发者集成;Qwen Chat网页端(chat.qwen.ai)提供直接对话服务,对普通用户更加友好;千问APP和悟空应用支持移动端使用,支持语音、图片和视频输入。第三方渠道包括:OpenRouter提供免费预览版,用户可在不付费的情况下体验模型基础能力;OpenCode等开源编程智能体已集成Qwen3.6-Plus;主流编程助手如OpenClaw、Qwen Code、Claude Code等均已适配Qwen3.6-Plus。

  • Qwen3.6-Plus采用闭源商业化模式,通过API调用进行变现。在阿里云百炼平台上的详细定价如下:标准输入2元/百万tokens,Batch File输入1元/百万tokens,Batch Chat输入1元/百万tokens(原价2元,5折优惠),标准输出12元/百万tokens,Batch File输出6元/百万tokens,Batch Chat输出6元/百万tokens(原价12元,5折优惠),显式缓存创建2.5元/百万tokens,显式缓存命中0.2元/百万tokens。新用户可免费领取7000万tokens用于体验。对于批量处理任务,Batch模式可享受5折优惠,这一定价策略显著降低了大规模应用的门槛。 与竞品对比,Qwen3.6-Plus的价格优势非常明显。以Claude Opus 4.6为参照,其输入价格约为18元/百万tokens,Qwen3.6-Plus的价格仅为其1/9;与GPT-5相比,Qwen3.6-Plus的性价比优势同样显著。这种「高性能+低价格」的组合策略,使Qwen3.6-Plus成为2026年上半年性价比最高的国产顶级模型之一。 在商业模式方面,Qwen3.6-Plus主要通过阿里云百炼平台变现,同时在OpenRouter等第三方平台提供免费预览版以扩大用户基础。这种「免费增值」(Freemium)模式兼顾了用户增长和商业变现的双重目标。

  • 正面评价:来自开发者社区和科技媒体的正面评价主要集中在以下几个方面:编程能力突出——众多开发者实测后表示,Qwen3.6-Plus的代码生成质量已接近Claude水平,尤其是在前端开发、Python脚本编写和代码修复场景中表现优异。有开发者分享使用Qwen3.6-Plus独立完成复杂项目的案例,证明其具备独立承担软件工程任务的能力。超长上下文实用性强——100万token的上下文窗口获得了广泛好评,开发者表示可以一次性上传完整代码仓库进行跨文件分析,大大提升了代码审查和技术债务清理的效率。性价比无可匹敌——相比动辄数十元/百万tokens的国际顶级模型,Qwen3.6-Plus的定价让中小开发者和初创企业也能负担得起高质量的AI编程服务。多模态能力实用——图像理解和视频分析功能在文档处理、UI设计稿转代码等场景中表现出色,被认为是「真正能干活的多模态模型」。 负面反馈:当然,Qwen3.6-Plus也存在一些需要改进的地方:知识时效性有限——训练数据存在截止日期,对于最新技术栈和2026年后的新知识覆盖不足,需要配合联网搜索获取最新信息。复杂推理偶有失误——在极少数高度复杂的数学推理和逻辑分析场景中,模型仍可能出现推理链断裂的情况。对比顶级模型仍有差距——虽然已接近Claude Opus 4.5水平,但在某些特定领域的深度推理能力与全球最强模型相比仍存在微小差距。

  • 媒体观点:国内科技媒体对Qwen3.6-Plus的评价整体积极。36氪等媒体认为,Qwen3.6-Plus的发布标志着国产大模型在编程能力这一最核心的赛道上实现了从「追赶」到「并跑」的跨越。IT之家、量子位等媒体也对模型的技术创新给予了高度评价,认为100万token上下文和强智能体能力是当前大模型应用落地的关键技术突破。 竞争格局:从竞争格局来看,Qwen3.6-Plus的主要竞争对手包括:国际竞品——Claude Opus 4.5/4.6、GPT-5系列、Google Gemini系列。在编程能力维度,Qwen3.6-Plus已接近Claude Opus 4.5水平,但在品牌认知度和全球开发者生态方面仍有差距。国内竞品——DeepSeek V3/R1、智谱GLM-5、MiniMax M2.7、月之暗面Kimi K2.5。Qwen3.6-Plus在编程基准测试中的表现优于GLM-5和Kimi K2.5,与DeepSeek R1形成直接竞争;在性价比方面则与DeepSeek形成双雄格局。差异化定位——相比DeepSeek的「极致性价比」路线和MiniMax的「自我进化」概念,Qwen3.6-Plus更强调「智能体编程」这一具体应用场景的深度优化,形成了差异化的产品定位。

  • 技术风险:长上下文幻觉问题——虽然Qwen3.6-Plus在短文本场景下的幻觉率控制良好,但在超长上下文(接近100万token)的边缘情况下,仍可能出现信息丢失或误解的情况。这一问题在处理大型代码仓库或长篇文档时需要特别关注。智能体自主性边界——Qwen3.6-Plus虽然具备较强的工具调用能力,但其「自主决策」仍建立在人类设定的框架内。在完全开放的环境中执行敏感操作时,需要人工监督以避免潜在风险。 商业风险:闭源策略的局限性——与DeepSeek的全面开源策略不同,Qwen3.6-Plus选择闭源商业模式。虽然这有助于保护技术机密和商业变现,但也限制了开发者社区的参与度,可能影响产品生态的长期发展。定价压力——国内大模型市场价格战愈演愈烈,DeepSeek的极低定价已对市场格局产生显著影响。Qwen3.6-Plus虽已具备价格优势,但面对竞争者的进一步降价,可能面临利润压缩的压力。迭代节奏挑战——从Qwen3.5到Qwen3.6-Plus仅间隔约45天,如此高频的迭代对研发团队的资源调配和质量管理提出了极高要求。长期保持这一节奏可能带来产品质量波动的风险。

  • 适合人群:软件开发者和工程师——Qwen3.6-Plus在编程代码生成、bug修复、代码审查等方面表现突出,是开发者的强力效率工具。尤其是需要处理复杂项目、进行跨文件分析的开发者,100万token上下文提供了极大便利。需要长文本处理的职业——如法律顾问、学术研究员、金融分析师等,需要处理大型文档、合同、研报的专业人士,Qwen3.6-Plus的超长上下文和低幻觉率特性非常实用。企业AI应用开发者——需要在自有产品中集成高质量AI能力的开发团队,Qwen3.6-Plus的高性价比和协议兼容性使其成为理想选择。追求性价比的用户——相比国际顶级模型,Qwen3.6-Plus以1/9的价格提供了接近同等的性能,适合预算有限但对质量有要求的用户。 不适合人群:对多模态生成有强需求的用户——Qwen3.6-Plus是多模态理解模型而非生成模型,如需图像生成能力,应考虑DALL-E、Midjourney、通义万相等产品。需要最新知识的场景——模型训练数据存在时效限制,对于需要实时最新信息的场景,建议配合联网搜索功能使用。对开源有硬性要求的项目——Qwen3.6-Plus为闭源模型,如项目必须使用开源模型,可考虑Qwen3.6-35B-A3B或其他开源替代品。 最佳实践建议:智能体任务——开启preserve_thinking: true选项,以保留推理过程,提升复杂任务的完成质量。代码开发场景——充分利用视觉编程功能,上传设计稿或截图可加速前端开发效率。长文档处理——直接上传完整文档或代码仓库,利用100万token上下文实现一次性整体分析。成本优化——对于非实时性任务,使用Batch模式可节省50%成本;利用缓存命中功能(仅0.2元/百万tokens)可进一步降低成本。

  • Qwen3.6-Plus是阿里巴巴通义实验室在2026年发布的一款具有里程碑意义的国产大模型产品。它以「智能体编程」为核心定位,在100万token超长上下文、编程能力、智能体任务执行和原生多模态理解等方面达到了国产最高水平。根据官方评测数据,Qwen3.6-Plus在SWE-bench Verified基准测试中获得78.8分,编程能力已接近全球顶级模型Claude Opus 4.5,同时参数量仅为后者的1/2至1/3,体现了阿里巴巴在大模型效率优化方面的深厚技术积累。 在市场定位上,Qwen3.6-Plus选择了「高性能+合理定价」的差异化路线。输入2元/百万tokens、输出12元/百万tokens的定价仅为国际顶级模型的1/9左右,使高质量AI编程能力不再是大公司的专利。配合阿里云百炼平台的成熟商业化基础设施和多种第三方接入渠道,Qwen3.6-Plus正在快速扩大其用户基础和生态影响力。 当然,作为一款新产品,Qwen3.6-Plus也存在一些需要持续改进的地方:知识时效性、复杂推理能力的进一步提升、以及在极端长上下文场景下的稳定性等。但总体而言,Qwen3.6-Plus的发布标志着国产大模型在编程能力这一核心赛道上正式跻身世界前列。对于国内开发者和企业用户而言,Qwen3.6-Plus提供了一个性能卓越、价格合理、接入便捷的优质选择。随着后续版本(如Qwen3.6-Max-Preview)的推出,通义千问系列有望在国产大模型竞争中保持领先地位。

用户评论

  • 头像
    1r6ya4m
    Qwen3.6-Plus编程能力确实强,之前用DeepSeek写Python,现在换成Qwen3.6-Plus,代码质量明显上一个档次。

  • 头像
    傅昊欣
    100万token上下文太香了,直接上传整个代码仓库让它分析,效率提升明显。

  • 头像
    李杰
    已对比Claude Opus 4.5,编程能力确实接近了,性价比却高出好几倍,这波支持国产。

  • 头像
    Christian_Ortiz_Plus475
    阿里云百炼平台调用很稳定,比之前用DeepSeek的高峰期502体验好很多。

  • 头像
    PFloresIII
    价格是真心便宜,输入2元/百万tokens,比Claude便宜太多了,学生党也能用得起。

  • 头像
    淡然_11
    Vibe Coding模式太牛了,只需用自然语言描述需求,前端代码直接生成,太省心了。

  • 头像
    JunoJet73
    智能体编程能力确实强,工具调用比之前版本稳定多了,基本不会出现幻觉调用。

  • 头像
    宋磊刚
    多模态能力很实用,上传设计稿直接生成代码,UI开发效率翻倍。

  • 头像
    Bitcoiner360
    preserve_thinking功能对长程任务太友好了,之前的思考过程可以保留。

  • 头像
    EllaJohansen
    支持OpenAI和Anthropic两种协议,迁移成本几乎为零,好评。

  • 头像
    Joseph.Reed
    和Qwen3.5对比,3.6版本的编程能力提升感知明显,代码更加规范了。

  • 头像
    R_yan619
    视频理解功能测试了一下,能准确提取视频内容并生成脚本,效果超出预期。

  • 头像
    AmyCampbell55
    BUG修复能力有提升,但复杂场景下偶尔还是会出现理解偏差,需要人工审核。

  • 头像
    云烟_18
    视觉编程功能很惊艳,给一张截图就能生成对应代码,前端开发者福音。

  • 头像
    Susan.HillX
    比GLM-5.1和Kimi K2.5的编程能力强不少,国产编程模型里目前最强。

  • 头像
    Elizabeth_Jenkins_X8
    知识时效性确实是短板,2026年后的新知识覆盖不足,需要配合联网搜索。

  • 头像
    Diana.Henderson_9911
    和新发布的Qwen3.6-Max-Preview对比过,Plus版在稳定性上更有优势。

  • 头像
    George.Harris
    复杂推理能力还有提升空间,偶尔会在数学推理场景出现小错误。

  • 头像
    f1x3sxrj
    终端编程自动化功能很实用,直接在命令行执行脚本,省去了复制粘贴的麻烦。

  • 头像
    Theresa.Stewart369
    Batch模式价格打5折,批量调用成本进一步降低,创业团队福音。

  • 头像
    Frank3332025
    显式缓存命中才0.2元/百万tokens,充分利用缓存能省不少钱。

  • 头像
    lazyostrich817
    文档理解能力很强,OmniDocBench得分91.2,处理PDF和扫描件不在话下。

  • 头像
    ScottScott
    和DeepSeek相比,Qwen3.6-Plus在品牌认知度和生态建设上还有差距。

  • 头像
    GraceHicks_7241
    新用户免费领7000万tokens,这波福利很实在,可以先体验再决定是否付费。

  • 头像
    DennisLeeJr798
    闭源策略有点遗憾,如果有开源版本会更受欢迎,不过商业化考虑也能理解。

  • 头像
    Anthony.Hicks_7
    建议官方出一些最佳实践教程,新手上手可能需要一点时间熟悉。

  • 头像
    Lawrence_AlvarezQ
    用了一周,整体满意,编程效率提升明显,会继续续费使用。

  • 头像
    枫叶_27
    幻觉率控制得很好,事实核查场景下基本不会出现乱编的情况。

  • 头像
    DianaKing168
    参数量只有Claude Opus的一半,性能却接近,这才是真正的技术实力。

  • 头像
    AshleyKim
    阿里云生态集成做得好,钉钉、飞书等都能直接调用,体验流畅。