Improving LLM Performance Through Black-Box Online Tuning: A Case for Adding System Specs to Factsheets for Trusted AI
Este artículo presenta un controlador en línea de caja negra que optimiza el rendimiento de los modelos de lenguaje mediante mediciones de extremo a extremo y, a partir de este ejemplo, aboga por la inclusión de métricas de rendimiento y sostenibilidad del sistema en las fichas técnicas para fomentar la confianza en la IA.