MERIT Feedback Elicits Better Bargaining in LLM Negotiators
El artículo presenta un marco centrado en la retroalimentación de utilidad que incluye el nuevo benchmark AgoraBench, métricas alineadas con la teoría económica y una metodología de aprendizaje basada en preferencias humanas, logrando mejorar significativamente la capacidad de negociación estratégica y la adaptación a factores humanos de los modelos de lenguaje grande.