DeepSeek推出MoE架构新模型,推理成本再降50%

深度求索公司最近推出了基于混合专家(MoE)架构的新一代模型DeepSeek-MoE-16B。该模型的总参数量达到160...

garts
2026-05-11