超越字节VeRL!小红书开源面向全模态Agentic的异步RL引擎Relax,Qwen3-Omni训练提速2倍

Type: article
Author: 智猩猩AI
Primary Topic: ai-foundations
Ingested: 2026-04-17

Summary

小红书 AI Platform 团队联合港大、中科大开源了 Relax(Reinforcement Engine Leveraging Agentic X-modality),一套面向全模态后训练的大规模异步强化学习引擎。采用全模态原生架构、角色隔离的服务化架构和基于 TransferQueue 的异步训练机制。实验显示,在 Qwen3-4B 上相较 veRL 实现 1.20× 端到端加速,fully async 模式在 Qwen3-Omni-30B 上达到 2.00× 提升。支持图像、音频、视频等全模态输入和多轮推理、工具调用等 agentic 任务。

Key Concepts

Entities

Source

Relations


Auto-generated on 2026-04-17