ACL 2026 精选论文分享:美团履约团队前沿技术专场
美团履约团队在ACL 2026会议上分享了多项前沿AI技术研究,聚焦于强化学习优化、大语言模型推理增强及多模态交互系统构建。GeoRA方法针对基于可验证奖励的强化学习场景,通过几何感知的低秩适配避免谱塌缩,提升模型在数学和代码任务上的泛化能力。CoT-Flow框架将离散推理步骤建模为连续概率流,量化每一步的信息增益,实现高效解码和训练加速。UserLM-R1提出具备推理能力的用户模拟器,使用多奖励强化学习模拟人类策略性思维,优化Agent训练环境。Fine-Mem系统通过块级步骤奖励和证据奖励归因,精细管理长期任务中的记忆操作,提高任务成功率。DuplexOmni模型支持全双工多模态交互,实现听、看、说、想并行处理,增强人机交互的自然性与实时性。这些技术突破推动了AI基础研究,并为业务智能化应用提供支撑。