澎峰科技DF系列一体机水冷版完成Qwen3.5系列模型适配

科创之家 2026-04-03 8400人围观

人工智能加速落地的当下,企业部署大模型仍面临成本高昂、性能瓶颈与数据安全等多重挑战。澎峰科技自推出 Deep Fusion 智算一体机水冷版 以来,持续深耕软硬件协同优化,致力于为中小企业打造高性价比、高稳定性的AI基础设施。

关于Qwen3.5系列模型

Qwen3.5-35B-A3B是阿里千问团队于2026年2月发布的中等规模MoE模型,凭借创新的混合注意力机制与高稀疏MoE架构,总参数达350亿,但每次推理仅激活约30亿参数,实现了“大模型质量、小模型成本”的突破。该模型在指令遵循、博士级推理、数学推理等多个权威榜单上表现超越前代更大尺寸的Qwen3-235B旗舰模型,并优于GPT-5 mini等竞品。同时,Qwen3.5-35B-A3B支持高达100万tokens的超长上下文,可通过量化部署于消费级显卡,对开发者极为友好。

近日,DF系列一体机水冷版已成功完成对Qwen3.5-35B-A3B模型的全面适配与性能调优。本次适配基于自研PerfXLM推理框架的新版本(V1.1),针对该模型在多个并发场景下的Token生成速度、首字延迟、显存及内存占用等关键指标进行了全面测试。

测试数据(模型:Qwen3.5-35B-A3B 浮点FP16版本,测试规模:2K输入、2K输出)如下:

ecc7523a-2d94-11f1-90a1-92fbcf53809c.png

DF系列一体机水冷版自发布以来,凭借软硬件深度协同的设计理念,实现了高性能与低成本的统一。此次Qwen3.5系列模型的成功适配,不仅是DF系列一体机水冷版产品能力的一次重要跃升,更是澎峰科技推动大模型私有化部署“标准化基础设施”进程中的又一关键里程碑。

未来,澎峰科技将持续深化模型适配与推理引擎优化,持续扩大 Deep Fusion 智算一体机水冷版 对主流大模型的支持范围,以更低门槛、更高效率,赋能千行百业加速迈入大模型私有化部署的新阶段。

  • 随机文章
  • 热门文章
  • 热评文章
不容错过
Powered By Z-BlogPHP