HiconAgent: History Context-aware Policy Optimization for GUI Agents
本論文は、GUI エージェントが過去の履歴情報を効率的かつ効果的に活用できるよう、動的なコンテキストサンプリングとアンカーガイド付き履歴圧縮を備えた「History Context-aware Policy Optimization (HCPO)」を導入し、HiconAgent を開発することで、小型モデルでありながら既存の大型モデルを上回る性能と計算効率の向上を実現したことを報告しています。