Scaling Agentic Capabilities, Not Context: Efficient Reinforcement Finetuning for Large Toolspaces
L'article présente ATLAS, un cadre de finetuning par renforcement qui permet aux petits modèles de langage d'opérer efficacement dans de vastes écosystèmes d'outils en apprenant à contrôler le contexte et à structurer l'exécution, surpassant ainsi les approches génériques pour atteindre des performances proches de l'état de l'art avec des budgets limités.