CoME: Empowering Channel-of-Mobile-Experts with Informative Hybrid-Capabilities Reasoning
本文提出了名为 CoME 的新型移动智能体架构,通过引入四个针对特定推理阶段的专家模块、分阶段渐进式训练策略以及基于信息增益的 Info-DPO 优化方法,有效解决了现有移动智能体在屏幕总结、子任务规划等混合能力推理中难以实现解耦增强与平衡协同的问题,并在 AITZ 和 AMEX 数据集上取得了优于密集模型及混合专家方法的表现。