CudaForge:训练免费的多智能体CUDA Kernel生成工作流

Type: article
Author: OptimAI-Lab
Primary Topic: AI Agent
Ingested: 2026-05-12

Summary

CudaForge是一个基于多智能体协作的迭代式CUDA Kernel优化工作流,通过「生成→验证→分析→改进」闭环模拟人类专家的优化过程,无需强化学习训练。系统由规划、执行、验证三个Agent协同工作,利用ncu profiling提供硬件反馈驱动性能迭代。项目还开源了包含6000条样本的CUDA-Agent-Ops-6K数据集,适用于缺乏RL训练资源但希望复用SOTA方法的团队。

Key Concepts

Entities

Source

Relations


Auto-generated on 2026-05-12

相关文章(自动整合)