KARL: Knowledge Agents via Reinforcement Learning
El artículo presenta KARL, un sistema de agentes de búsqueda empresarial entrenados mediante aprendizaje por refuerzo que, gracias a un nuevo paradigma de entrenamiento, datos sintéticos diversos y la evaluación en el nuevo benchmark KARLBench, logra un rendimiento superior y más eficiente en costo que los modelos comerciales más avanzados en tareas complejas de razonamiento y recuperación de conocimiento.