无风扇迷你PC+集成显卡，竟能跑Qwen 3.5 35B？实测7天全天候AI代理

新手必读发表于 2026-05-23 20:10 阅读：0

数学推理能力薄弱：面对超过五六步的数学证明题，模型表现极差，尤其是复杂的四则运算、几何证明，几乎无法给出正确答案，适合简单的计算，不适合复杂数学任务；

长上下文处理能力有限：当输入内容超过 20K tokens 时，模型的处理能力会大幅下降，而且受 Hermes Agent 注入的 8K 系统提示限制，加上工具定义的内存占用，实际有效上下文进一步压缩，无法处理超长篇文档的摘要、分析任务；

大规模代码生成能力不足：当需要生成超过 150 行的代码时，模型的代码一致性会下降，容易出现语法错误、逻辑混乱的问题，适合简单的代码片段生成，不适合大规模代码重构、项目开发；

内存压力极大：模型运行时内存占用约 21GB，对比 Gemma 4 E4B 的 8GB 内存占用，差距明显，一旦同时运行其他程序，就会出现内存不足、卡顿的情况，只能专注于 AI 代理任务，无法兼顾多任务运行；

长上下文推理速度下降明显：随着上下文长度增加，推理速度会逐步降低 ——0-4K ctx 时 20-22 tok/s，4-8K ctx 时 19-21 tok/s，16K ctx 时约 17 tok/s，24K ctx 时仅 14 tok/s，而且提示处理受 CPU 限制，等待时间会大幅增加。

本站所有文章资讯、展示的图片素材等内容均为注册用户上传(部分报媒/平媒内容转载自网络合作媒体)，仅供学习参考。用户通过本站上传、发布的任何内容的知识产权归属用户或原始著作权人所有。如有侵犯您的版权，请联系我们反馈本站将在三个工作日内改正。

相关推荐