豆包大模子提议稀少模子架构,推理本钱较MoE最高可降83%
2025-02-16每经北京2月11日电(记者杨昕怡)豆包大模子团队当天晓谕,团队提议了全新的稀少模子架构UltraMem,该架构灵验管理了MoE(搀杂众人模子)推理时高额的访存问题,推理速率较MoE架构晋升2~6倍,推理本钱最高可裁汰83%。该琢磨还揭示了新架构的Scaling Law(范畴定律),解说其不仅具备优异的Scaling特点,更在性能上卓越了MoE。
TOPIC