Qwen3.6-35B-A3B GGUF 2位量化实测:13GB内存跑30+工具调用

Type: article
Author: 今日头条
Primary Topic: 本地大语言模型量化部署
Ingested: 2026-04-23

Summary

本文测试了Qwen3.6-35B-A3B模型经2位量化后的本地运行表现,该模型采用MoE架构,实际激活参数约3B,量化后内存占用约13GB。测试结果显示其工具调用能力优异,可在普通消费级硬件上通过llama.cpp或Ollama运行,适合工具调用密集型Agent场景。

Key Concepts

Entities

Source

Relations


Auto-generated on 2026-04-23

相关文章(自动整合)