超越字节VeRL!小红书开源面向全模态Agentic的异步RL引擎Relax,Qwen3-Omni训练提速2倍
Type: article
Author: 智猩猩AI
Primary Topic: ai-foundations
Ingested: 2026-04-17
Summary
小红书 AI Platform 团队联合港大、中科大开源了 Relax(Reinforcement Engine Leveraging Agentic X-modality),一套面向全模态后训练的大规模异步强化学习引擎。采用全模态原生架构、角色隔离的服务化架构和基于 TransferQueue 的异步训练机制。实验显示,在 Qwen3-4B 上相较 veRL 实现 1.20× 端到端加速,fully async 模式在 Qwen3-Omni-30B 上达到 2.00× 提升。支持图像、音频、视频等全模态输入和多轮推理、工具调用等 agentic 任务。
Key Concepts
- 强化学习
- 全模态训练
- 异步RL
- Agentic任务
- 后训练
- TransferQueue
- 服务化架构
- MoE模型
Entities
- 小红书
- Relax
- VeRL
- Qwen3-Omni
- 港大
- 中科大
Source
- Raw:
20260417-relax-rl.md
Relations
- supports:大模型后训练
- related_to:多模态AI
- used_in:Qwen3-Omni训练
Auto-generated on 2026-04-17