长上下文模型新配方:从32K泛化512K(MMProLong,Qwen2.5-VL-7B)

Type: paper
Author: unknown
Primary Topic: 行业动态
Ingested: 2026-05-20

Summary

本文介绍MMProLong训练配方,通过调整mRoPE基频(1M→4M)和优化数据策略,将Qwen2.5-VL-7B从32K上下文扩展到128K,并零样本泛化到512K。核心发现包括:VQA训练信号优于OCR转录、池原生长度分布优于长偏置分布、提取与推理任务8:2比例最优。实验表明纯长上下文训练不会损害短上下文能力,模型学到的是广义检索策略而非特定长度模式。

Key Concepts

Entities

Source

Relations


Auto-generated on 2026-05-20