围绕 Qwen 的相关文章与实践整理。
梳理 Qwen3 系列本地部署的显存需求、量化选择和 KV 缓存影响,帮助不同显卡配置选择模型。
通过三个实际场景测试Qwen3小模型,发现32B版本表现优异,适合本地部署,14B和8B版本也值得考虑。