SwingArena: Competitive Programming Arena for Long-context GitHub Issue Solving
Le papier présente SwingArena, un cadre d'évaluation compétitif pour les modèles de langage qui simule les flux de travail réels de développement logiciel en associant des LLMs à des rôles de soumission et de revue dans des pipelines d'intégration continue, tout en intégrant un module de génération de code augmenté par la récupération pour gérer efficacement des contextes longs issus d'issues GitHub.
Wendong Xu, Jing Xiong, Chenyang Zhao, Qiujiang Chen, Haoran Wang, Hui Shen, Zhongwei Wan, Jianbo Dai, Taiqiang Wu, He Xiao, Chaofan Tao, Z. Morley Mao, Ying Sheng, Zhijiang Guo, Hongxia Yang, Bei Yu, Lingpeng Kong, Quanquan Gu, Ngai WongTue, 10 Ma💬 cs.CL