更新时间:2026-02-16 23:27 来源:牛马见闻
千问 APP 与 PC 端千问 3 是在纯文本 Tokens 上进行为千问 3.
<p id="4AT7KAR2">除夕夜,阿里?官宣发?布并开源新一代千问大模型千问 3.5(Qwen3.5-Plus)。这是继 2025 年除夕发布 Qwen2.5-Max 后,阿里又一次在除夕带来新一代模型。</p> <p id="4AT7KAR3">现在,千问 APP 与 PC 端(qianwen.com)已经同步上线,用户可在页面顶部选择模型新一代模型,来体验千问 3.5 的能力。</p> <p id="4AT7KAR4">去年除夕更新的 Qwen2.5-Max 重点在规模和性能,而这次,千问 3.5 更像是一场从纯文本模型到原生多模态模型的底层架构层面重构。</p> <p class="f_center"><br>图丨现在打开千问,已经可调用新模型 Qwen3.5-Plus(来源:千问)<br></p> <p id="4AT7KAR7">与前几代的千问大语言模型相比,千问 3.5 这次带来哪些模型性能的提升呢?</p> <p id="4AT7KAR8">从预训练来看,千问 3 是在纯文本 Tokens 上进行,而千问 3.5 的预训练则基于视觉和文本混合 token。也就是说,视觉理解不再像从前那样以外挂模块形式存在,而是同语言能力共同在底层建模“作战”。</p> <p id="4AT7KAR9">此外,其还大幅新增了中英文、201 种语言与方语言、STEM 和推理等数据。这意味着,打破了以往的局限性,而是尝试让模型在更密集的世界知识和推理逻辑。</p> <p id="4AT7KARA">值得关注的是,千问 3.5 以少于 40% 的参数量实现了超万亿的 Qwen3-Max 基座模型的高性能。这背后反应的不是简单的堆参数,而是效率导向的架构优化。</p> <p class="f_center"><br>(来源:千问)<br></p> <p id="4AT7KARD">在推理、编程、Agent 智能体等全方位基准评估中均表现优异:</p> <p id="4AT7KARE">·在指令遵循 IFBench 上,以 76.5 分刷新所有模型纪录;</p> <p id="4AT7KARF">·在 MMLU-Pro 知识推理评测中超越 GPT-5.2,获得 87.8 分得分;</p> <p id="4AT7KARG">·在博士级难题 GPQA 测评中得分为 88.4 分,高于 Claude 4.5,但与 GPT-5.2 的 92.4 分和 Gemini 3 Pro 相比仍有进步的空间;</p> <p id="4AT7KARH">·在通用 Agent 评测 BFCL-V4、搜索 Agent 评测 Browsecomp 等基准中,千问 3.5 表现与 Gemini 3 Pro、GPT-5.2 相比性能更优。</p> <p class="f_center"><br>(来源:千问)<br></p> <p id="4AT7KARK">总体来看,这种原生多模态训练,为千问 3.5 的视觉能力带来了显著提升。千问 3.5 在多项权威测评中,均实现了最佳性能,包括多模态推理(MathVison)、通用视觉问答 VQA(RealWorldQA)、文本识别和文件理解(CC_OCR)、空间智能(RefCOCO-avg)、视频理解(MLVU)等。</p> <p id="4AT7KARL">可以看到的是,千问 3.5 不再是“语言强、视觉补”,而是在统一架构下形成了一种相对完整的能力矩阵。</p> <p class="f_center"><br>(来源:千问)<br></p> <p id="4AT7KARO">千问 3.5 之所以能实现性能的显著提升,离不开性对 Transformer 经典架构的突破。</p> <p id="4AT7KARP">此前,千问团队自研的门控技术成果“Gated Attention for Large Language Models: Non-linearity, Sparsity, and Attention-Sink-Free”,获得全球 AI 顶会 2025 NeurIPS 最佳论文。</p> <p class="f_center"><br>(来源:arXiv)<br></p> <p id="4AT7KARS">本次千问 3.5 创新的混合架构中已融合该技术,团队结合线性注意力机制和稀疏混合专家 MoE 模型架构,实现了“高参数、低激活”的结构:模型总参数规模达 397B,但每次推理仅激活 17B 参数。这种结构带来的好处可能是,模型在保持高性能能力的同时,推理效率大幅度提升。</p> <p class="f_center"><br>(来源:千问)<br></p> <p id="4AT7KARV">根据千问官网,千问 3.5 通过训练稳定优化以及多 token 预测等系列技术,实现了 Qwen3.5 性能比肩 Qwen3-Max 模型,并在此基础上对推理效率进一步提升:在 32K 上下文场景中,千问 3.5 推理吞吐量可提升 8.6 倍;而在 256K 超长上下文中,Qwen3.5 推理吞吐量最大能实现 19 倍的提升。</p> <p id="4AT7KAS0">这意味着,在长文本分析、复杂推理、Agent 调度等场景中,成本和延迟大幅下降。</p> <p class="f_center"><br>(来源:千问)<br></p> <p id="4AT7KAS3">基于优异的视觉能力,千问 3.5 还突破性地实现了从 Agent 框架到 Agent 应用,尤其是在提升操作效率方面。例如,能够自主操作手机与电脑,高效完成日常任务,在移动端支持更多主流 APP 与指令,在 PC 端可处理更复杂的多步骤操作,包括跨应用数据整理、自动化流程执行等。</p> <p id="4AT7KAS4">同时,千问团队还构建了一个可扩展的 Agent 异步强化学习框架,基于此端到端可加速 3 到 5 倍,并将插件式智能体 Agent 支持扩展至百万级规模。这也是标志千问从对话模型向行动模型过渡转化。</p> <p id="4AT7KAS5">千问透露,下一阶段的重点将从模型规模转向系统整合:构建具备跨会话持久记忆的智能体、面向真实世界交互的具身接口、自我改进机制。</p> <p id="4AT7KAS6">放眼全球全球的大模型竞争已然不再只是比拼“更大、更准”,而是“更高效、更可执行”。千问 3.5 不仅是一次模型的更新,一场关于模型的效率革命,已经开始了。</p> <p class="f_center"><br><br></p> <p id="4AT7KAS8">参考资料:</p> <p id="4AT7KAS9">https://qwen.ai/blog?id=qwen3.5</p> <p id="4AT7KASA">https://github.com/qiuzh20/gated_attention</p> <p id="4AT7KASB">排版:刘雅坤</p>
Copyright ® 版权 所有:吉林日报
违法和不良信息举报邮箱:dajilinwang@163.com 违法和不良信息举报: 0431-88600010
ICP备案号:吉ICP备18006035号 网络经营许可证号:吉B-2-4-20100020
地址:长春市高新技术产业开发区火炬路1518号 爆料电话:0431-88601901