Frankenmerge:Qwopus-GLM-18B,9.2GB打赢Qwen3.6-35B(22GB)
Type: article
Author: Jackrong
Primary Topic: 本地部署
Ingested: 2026-05-20
Summary
本文介绍Frankenmerge技术:将两个9B模型的64层首尾拼接成18B模型,通过1000步QLoRA缝合训练解决层边界特征不匹配问题。合并后的Qwopus-GLM-18B仅需9.2GB显存,在自建44项评测中以90.9%得分超越22GB的Qwen3.6-35B(86.4%)。文章揭示推理能力具有模块化特性,不同蒸馏方向的模型层叠后可协同工作。
Key Concepts
- Frankenmerge
- 模型合并
- QLoRA缝合训练
- 层叠加推理
- GGUF量化
- 知识蒸馏
- 本地推理
Entities
- Qwopus-GLM-18B
- Qwen3.5-9B
- Qwopus v3.5
- GLM5.1
- Jackrong
- llama.cpp
- RTX 5090
- RTX 3060
- RTX 4070
Source
Relations
- (none)
Auto-generated on 2026-05-20