首页 业界 要闻 快讯 热点 推荐 聚焦 头条
 
站内搜索:

三星凭借5G技术打破了速度记录

内燃机气缸排列形式

您现在的位置:主页 > 头条 > 头条
豆包大模型提出稀疏模型架构,推理成本较MoE最高可降83%
更新时间:2025-02-12 16:00:56

  豆包大模型团队今日宣布,团队提出了全新的稀疏模型架构UltraMem,该架构有效解决了MoE推理时高额的访存问题,推理速度较MoE架构提升2~6倍,推理成本最高可降低83%。该研究还揭示了新架构的Scaling Law,证明其不仅具备优异的Scaling特性,更在性能上超越了MoE。