超越字节VeRL！小红书开源面向全模态Agentic的异步RL引擎Relax，Qwen3-Omni训练提速2倍

Type: article
Author: 智猩猩AI
Primary Topic: ai-foundations
Ingested: 2026-04-17

Summary

小红书 AI Platform 团队联合港大、中科大开源了 Relax（Reinforcement Engine Leveraging Agentic X-modality），一套面向全模态后训练的大规模异步强化学习引擎。采用全模态原生架构、角色隔离的服务化架构和基于 TransferQueue 的异步训练机制。实验显示，在 Qwen3-4B 上相较 veRL 实现 1.20× 端到端加速，fully async 模式在 Qwen3-Omni-30B 上达到 2.00× 提升。支持图像、音频、视频等全模态输入和多轮推理、工具调用等 agentic 任务。

Key Concepts

强化学习
全模态训练
异步RL
Agentic任务
后训练
TransferQueue
服务化架构
MoE模型

Entities

小红书
Relax
VeRL
Qwen3-Omni
港大
中科大

Source

Raw: 20260417-relax-rl.md

Relations

supports:大模型后训练
related_to:多模态AI
used_in:Qwen3-Omni训练

Auto-generated on 2026-04-17