Frankenmerge:Qwopus-GLM-18B,9.2GB打赢Qwen3.6-35B(22GB)

Type: article
Author: Jackrong
Primary Topic: 本地部署
Ingested: 2026-05-20

Summary

本文介绍Frankenmerge技术:将两个9B模型的64层首尾拼接成18B模型,通过1000步QLoRA缝合训练解决层边界特征不匹配问题。合并后的Qwopus-GLM-18B仅需9.2GB显存,在自建44项评测中以90.9%得分超越22GB的Qwen3.6-35B(86.4%)。文章揭示推理能力具有模块化特性,不同蒸馏方向的模型层叠后可协同工作。

Key Concepts

Entities

Source

Relations


Auto-generated on 2026-05-20