Frankenmerge：Qwopus-GLM-18B，9.2GB打赢Qwen3.6-35B（22GB）

Type: article
Author: Jackrong
Primary Topic: 本地部署
Ingested: 2026-05-20

Summary

本文介绍Frankenmerge技术：将两个9B模型的64层首尾拼接成18B模型，通过1000步QLoRA缝合训练解决层边界特征不匹配问题。合并后的Qwopus-GLM-18B仅需9.2GB显存，在自建44项评测中以90.9%得分超越22GB的Qwen3.6-35B（86.4%）。文章揭示推理能力具有模块化特性，不同蒸馏方向的模型层叠后可协同工作。

Key Concepts

Frankenmerge
模型合并
QLoRA缝合训练
层叠加推理
GGUF量化
知识蒸馏
本地推理

Entities

Qwopus-GLM-18B
Qwen3.5-9B
Qwopus v3.5
GLM5.1
Jackrong
llama.cpp
RTX 5090
RTX 3060
RTX 4070

Source

Raw: frankenmerge-qwopus-glm-18b-local-deployment.md

Relations

(none)

Auto-generated on 2026-05-20