CodePercept: Code-Grounded Visual STEM Perception for MLLMs

Die Arbeit „CodePercept" identifiziert die Wahrnehmungsfähigkeit als den entscheidenden Engpass für MLLMs im visuellen STEM-Reasoning und schlägt einen Paradigmenwechsel vor, bei dem ausführbarer Code als präzises Wahrnehmungsmedium dient, was durch die Einführung des 1-Millionen-Einträge-Datensatzes ICC-1M und des Evaluierungsbenchmarks STEM2Code-Eval untermauert wird.

Tongkun Guan, Zhibo Yang, Jianqiang Wan, Mingkun Yang, Zhengtao Guo, Zijian Hu, Ruilin Luo, Ruize Chen, Songtao Jiang, Peng Wang, Wei Shen, Junyang Lin, Xiaokang Yang2026-03-12💻 cs

RAGPerf: An End-to-End Benchmarking Framework for Retrieval-Augmented Generation Systems

Das Paper stellt RAGPerf vor, ein Open-Source-Framework zur umfassenden End-to-End-Leistungsbewertung von Retrieval-Augmented-Generation-Systemen, das durch modulare Komponenten, flexible Konfiguration und automatisierte Metrikenerfassung detaillierte Analysen ermöglicht, ohne nennenswerten Overhead zu verursachen.

Shaobo Li, Yirui Zhou, Yuan Xu, Kevin Chen, Daniel Waddington, Swaminathan Sundararaman, Hubertus Franke, Jian Huang2026-03-12💻 cs

Aceso: Carbon-Aware and Cost-Effective Microservice Placement for Small and Medium-sized Enterprises

Die Arbeit stellt Aceso vor, ein adaptives System zur kohlenstoff- und kosteneffizienten Platzierung von Microservices für KMU in regional begrenzten Infrastrukturen, das durch dynamische Optimierung und Suchraumverkleinerung im Vergleich zu statischen Bereitstellungen die CO₂-Emissionen um 37,4 % und die Betriebskosten um 3,6 % senkt, ohne dabei Service-Level-Vereinbarungen zu verletzen.

Georgia Christofidi, Francisco Álvarez-Terribas, Ioannis Roumpos, Nicolas Kourtellis, Jesus Omaña Iglesias, Thaleia Dimitra Doudali2026-03-12💻 cs

AI-Generated Rubric Interfaces: K-12 Teachers' Perceptions and Practices

Die Studie zeigt, dass K-12-Lehrkräfte KI-generierte Bewertungsraster als hilfreiche Ausgangspunkte betrachten, die jedoch aufgrund von Anpassungsbedarf und mangelnder Flexibilität eine aktive menschliche Kontrolle und einfache Individualisierungsmöglichkeiten für eine sinnvolle Integration in den Unterrichtsalltag erfordern.

Bahare Riahi, Sayali Patukale, Joy Niranjan, Yogya Koneru, Tiffany Barnes, Veronica Cateté2026-03-12💻 cs

Incremental Federated Learning for Intrusion Detection in IoT Networks under Evolving Threat Landscape

Diese Studie analysiert die Leistungsfähigkeit inkrementeller Federated-Learning-Ansätze mit LSTM-Modellen auf dem CICIoMT2024-Datensatz, um ressourcenschonende und drift-resistente Intrusion-Detection-Systeme für IoT-Netzwerke zu entwickeln, wobei sich zeigt, dass kumulative und repräsentative Lernstrategien die stabilste Leistung bieten.

Muaan Ur Rehman, Hayretdin Bahs, Rajesh Kalakoti2026-03-12💻 cs

Phase-Interface Instance Segmentation as a Visual Sensor for Laboratory Process Monitoring

Die vorgestellte Arbeit stellt mit LGA-RCM-YOLO ein auf YOLO11m-basiertes Modell vor, das zusammen mit dem neuen CTG 2.0-Datensatz die instanzbasierte Segmentierung von Phasengrenzen in transparentem Labor-Glaswerk ermöglicht und so eine zuverlässige visuelle Überwachung chemischer Prozesse für die Laborautomatisierung realisiert.

Mingyue Li, Xin Yang, Shilin Yan, Jinye Ran, Morui Zhu, Zirui Peng, Huanqing Peng, Wei Peng, Guanghua Zhang, Shuo Li, Hao Zhang2026-03-12💻 cs

HanMoVLM: Large Vision-Language Models for Professional Artistic Painting Evaluation

Die Arbeit stellt HanMoVLM vor, ein auf Large Vision-Language Models basierendes System, das durch die Einführung des HanMo-Bench-Datensatzes und expertenvalidiertes Chain-of-Thought-Reasoning professionelle Bewertungen chinesischer Gemälde ermöglicht und als hochqualitativer Verifizierer die Testzeit-Skalierung für die Generierung künstlerisch überlegener Bilder unterstützt.

Hongji Yang, Yucheng Zhou, Wencheng Han, Songlian Li, Xiaotong Zhao, Jianbing Shen2026-03-12💻 cs

UltrasoundAgents: Hierarchical Multi-Agent Evidence-Chain Reasoning for Breast Ultrasound Diagnosis

Die Arbeit stellt UltrasoundAgents vor, ein hierarchisches Multi-Agenten-Framework, das durch einen entkoppelten progressiven Trainingsansatz und eine evidenzbasierte Schlussfolgerungskette die Brustultraschalldiagnose verbessert, indem es den klinischen Workflow nachahmt und transparente, nachvollziehbare BI-RADS-Klassifikationen liefert.

Yali Zhu, Kang Zhou, Dingbang Wu, Gaofeng Meng2026-03-12💻 cs