【转载】Qwen3-VL 4B/8B全面适配，BM1684X成边缘最佳部署平台！

baicha · 2025 年10 月 17 日 00:51

算能BM1684X上完成Qwen3-VL 4B/8B模型的适配，推理速度13.7/7.2 tokens/s，使其成为边缘部署多模态大模型的最佳选择。

近日，阿里千问正式开源Qwen3-VL系列的4B和8B版本模型，为边缘计算和端侧设备提供了更高效的多模态AI解决方案。算能BM1684X芯片已完成对该系列模型的适配，4B/8B模型在边缘端实现了13.7 /7.2 tokens/s 的推理性能。