KARL: Knowledge Agents via Reinforcement Learning
O artigo apresenta o KARL, um sistema de agentes de busca empresarial treinados por aprendizado por reforço que, combinando dados sintéticos diversificados e um pipeline de pós-treinamento iterativo, alcança desempenho superior e Pareto-ótimo em tarefas complexas de raciocínio fundamentado, superando modelos fechados de ponta.