数学推理能力薄弱:面对超过五六步的数学证明题,模型表现极差,尤其是复杂的四则运算、 几何证明 ,几乎无法给出正确答案,适合简单的计算,不适合复杂数学任务;
长上下文处理能力有限:当输入内容超过 20K tokens 时,模型的处理能力会大幅下降,而且受 Hermes Agent 注入的 8K 系统提示限制,加上工具定义的内存占用,实际有效上下文进一步压缩,无法处理超长篇文档的摘要、分析任务;
大规模代码生成能力不足:当需要生成超过 150 行的代码时,模型的代码一致性会下降,容易出现语法错误、逻辑混乱的问题,适合简单的代码片段生成,不适合大规模代码重构、项目开发;
内存压力极大:模型运行时内存占用约 21GB,对比 Gemma 4 E4B 的 8GB 内存占用,差距明显,一旦同时运行其他程序,就会出现内存不足、卡顿的情况,只能专注于 AI 代理任务,无法兼顾多任务运行;
长上下文推理速度下降明显:随着上下文长度增加,推理速度会逐步降低 ——0-4K ctx 时 20-22 tok/s,4-8K ctx 时 19-21 tok/s,16K ctx 时约 17 tok/s,24K ctx 时仅 14 tok/s,而且提示处理受 CPU 限制,等待时间会大幅增加。
本站所有文章资讯、展示的图片素材等内容均为注册用户上传(部分报媒/平媒内容转载自网络合作媒体),仅供学习参考。
用户通过本站上传、发布的任何内容的知识产权归属用户或原始著作权人所有。如有侵犯您的版权,请联系我们反馈本站将在三个工作日内改正。
全部评论