【转载】LMDeploy全面升级,FP8、MXFP4一网打尽,推理性能再创新高!

9 月 9 日,上海人工智能实验室(上海AI实验室)大模型推理部署工具 LMDeploy 迎来重磅更新——v0.10.0 版本正式发布,进一步为社区提供更高效、更稳定、可扩展的推理部署方案。

今年以来,LMDeploy 已持续迭代多个版本,实现了多机扩展、推理加速、强化学习集成、国产化适配 等一系列关键突破。

https://mp.weixin.qq.com/s/u_qVeT298U-fqJozCv5fbQ

3 个赞