https://cloud.zol.com.cn/1015/10155849.html
cloud.zol.com.cn
true
中关村在线
https://cloud.zol.com.cn/1015/10155849.html
report
2569
近日,中国电信天翼公有云正式上线基于国产昇腾架构的大规模专家并行(简称大EP)推理集群。该集群创新性地应用了大EP与PD分离技术,成功推动国产算力实现单卡推理吞吐429TPS(Tokens Per Second),较传统双机部署模式提升超4倍。大EP推理是针对MoE大模型(混合专家模型...