March 28, 2026 March 28, 2026 March 28, 2026 March 28, 2026 Cursor Real-time RL:编程 Agent 从离线模拟训练迈向真实用户在线学习的范式跃迁 Cursor 实时强化学习解读:编程 Agent 开始从“离线训模型”走向“在线从真实用户学” 核心解读 今天 Hacker News 上一个分数不高、但信息密度非常高的 AI 基础设施话题,是 Cursor 的这篇文章: Improving Composer through real time RL 。如果只看标题, coding-agentreinforcement-learningreal-time-rlcursorcomposer