DIVE: Scaling Diversity in Agentic Task Synthesis for Generalizable Tool Use

Die Arbeit stellt DIVE vor, einen evidenzbasierten Ansatz, der durch die Umkehrung des Syntheseprozesses – beginnend mit der Ausführung realer Tools zur Ableitung von Aufgaben – die strukturelle Vielfalt in der Datengenerierung für Agenten-LLMs maximiert und so eine überlegene Generalisierungsfähigkeit bei Out-of-Distribution-Szenarien erreicht, die selbst mit deutlich weniger Daten als reine Mengenskaling übertrifft.

Aili Chen, Chi Zhang, Junteng Liu, Jiangjie Chen, Chengyu Du, Yunji Li, Ming Zhong, Qin Wang, Zhengmao Zhu, Jiayuan Song, Ke Ji, Junxian He, Pengyu Zhao, Yanghua XiaoFri, 13 Ma🤖 cs.AI

Social, Legal, Ethical, Empathetic and Cultural Norm Operationalisation for AI Agents

Die Arbeit schlägt einen systematischen Prozess zur Operationalisierung sozialer, rechtlicher, ethischer, empathischer und kultureller (SLEEC) Normen für KI-Agenten vor, um abstrakte Prinzipien in überprüfbare Anforderungen zu übersetzen und so eine Lücke zwischen theoretischen Rahmenwerken und der praktischen Implementierung in hochriskanten Domänen zu schließen.

Radu Calinescu, Ana Cavalcanti, Marsha Chechik, Lina Marsso, Beverley TownsendFri, 13 Ma🤖 cs.AI

Exploration of Evolving Quantum Key Distribution Network Architecture Using Model-Based Systems Engineering

Diese Studie nutzt modellbasierte Systems Engineering-Ansätze, insbesondere Orthogonal Variability Modelling und Systems Modelling Language, um die Evolution von Quantenschlüsselverteilungsnetzwerkarchitekturen zu modellieren und einen variabilitätsgetriebenen Rahmen für deren systematische Entwicklung zu schaffen.

Hayato Ishida, Amal Elsokary, Maria Aslam + 3 more2026-03-10⚛️ quant-ph

Automated TEE Adaptation with LLMs: Identifying, Transforming, and Porting Sensitive Functions in Programs

Die Arbeit stellt AUTOTEE vor, einen auf Large Language Models basierenden Ansatz, der automatisch sensible Funktionen in Programmen identifiziert, transformiert und in Trusted Execution Environments (TEEs) portiert, wodurch die bisher manuelle und komplexe Anpassung erheblich vereinfacht wird.

Ruidong Han, Zhou Yang, Chengyan Ma, Ye Liu, Yuqing Niu, Siqi Ma, Debin Gao, David Lo2026-03-06🔒 cs.CR

Assessing the Impact of Code Changes on the Fault Localizability of Large Language Models

Diese Studie stellt ein neuartiges, skalierbares Evaluierungsframework vor, das zeigt, dass die Fähigkeit von Large Language Models zur Fehlerlokalisation durch semantisch erhaltende Mutationen stark beeinträchtigt wird, was auf eine übermäßige Abhängigkeit von syntaktischen Merkmalen anstelle eines tiefen semantischen Verständnisses hinweist.

Sabaat Haroon, Ahmad Faraz Khan, Ahmad Humayun + 5 more2026-03-06💻 cs

RefAgent: A Multi-agent LLM-based Framework for Automatic Software Refactoring

Die Studie stellt RefAgent vor, ein Multi-Agenten-Framework auf Basis von Large Language Models, das durch spezialisierte Agenten für Planung, Ausführung und Testen Software-Refaktorierungen automatisiert und dabei im Vergleich zu Einzelagenten sowie traditionellen Tools signifikant höhere Erfolgsquoten bei der Code-Qualität und der Beseitigung von Code-Smells erzielt.

Khouloud Oueslati, Maxime Lamothe, Foutse Khomh2026-03-06💻 cs

Refactoring for Novices in Java: An Eye Tracking Study on the Extract vs. Inline Methods

Eine Eye-Tracking-Studie mit Java-Anfängern zeigt, dass die Extraktion von Methoden die Lesbarkeit und Leistung bei komplexen Aufgaben verbessert, bei einfachen Aufgaben jedoch durch erhöhten Navigationsaufwand und kognitive Last die Performance verschlechtert, was zu einer vorsichtigen Anwendung von Modularisierung im Anfängerunterricht raten lässt.

José Aldo Silva da Costa, Rohit Gheyi, José Júnior Silva da Costa + 5 more2026-03-06💻 cs