Safe RLHF Beyond Expectation: Stochastic Dominance for Universal Spectral Risk Control

Die Arbeit stellt RAD vor, ein neuartiges Framework für das sichere Reinforcement Learning aus menschlichem Feedback, das durch den Einsatz von First-Order Stochastic Dominance in Kombination mit Optimal Transport und quantilengewichteten Spektralrisikomaßen die Kontrolle über Verteilungsschwänze und seltene Katastrophenereignisse ermöglicht und so robustere, schädigungsärmere KI-Modelle liefert.

Yaswanth Chittepu, Ativ Joshi, Rajarshi Bhattacharjee, Scott Niekum2026-03-12🤖 cs.LG

GroundCount: Grounding Vision-Language Models with Object Detection for Mitigating Counting Hallucinations

Die Arbeit stellt GroundCount vor, ein Framework, das die Zählgenauigkeit von Vision-Language-Modellen durch die Integration expliziter räumlicher Verankerung aus Objekterkennungsmodellen verbessert und so Halluzinationen reduziert, wobei die Wirksamkeit stark von der Architekturkompatibilität und der Art der Eingabe (z. B. Positionscodierung) abhängt.

Boyuan Chen, Minghao Shao, Siddharth Garg, Ramesh Karri, Muhammad Shafique2026-03-12🤖 cs.AI

Artificial Intelligence as a Catalyst for Innovation in Software Engineering

Diese Studie zeigt, dass die Integration von Künstlicher Intelligenz, insbesondere durch maschinelles Lernen und natürliche Sprachverarbeitung, als Katalysator für Innovation in der Softwareentwicklung wirkt, indem sie repetitive Aufgaben automatisiert und bestehende Agile-Praktiken optimiert, um Qualität und Geschwindigkeit unter sich ständig wandelnden Anforderungen zu sichern.

Carlos Alberto Fernández-y-Fernández, Jorge R. Aguilar-Cisneros2026-03-12🤖 cs.AI

RCTs & Human Uplift Studies: Methodological Challenges and Practical Solutions for Frontier AI Evaluation

Dieses Papier analysiert auf Basis von Interviews mit 16 Experten die methodischen Herausforderungen, die sich aus der Anwendung von randomisierten kontrollierten Studien (RCTs) zur Bewertung von KI-gestützten menschlichen Leistungssteigerungen bei hochentwickelten KI-Systemen ergeben, und stellt praktische Lösungen für die Interpretation dieser Evidenz in hochriskanten Entscheidungsszenarien vor.

Patricia Paskov, Kevin Wei, Shen Zhou Hong, Dan Bateyko, Xavier Roberts-Gaal, Carson Ezell, Gailius Praninskas, Valerie Chen, Umang Bhatt, Ella Guest2026-03-12🤖 cs.AI

Does AI See like Art Historians? Interpreting How Vision Language Models Recognize Artistic Style

In einer interdisziplinären Zusammenarbeit zwischen Informatikern und Kunsthistorikern untersucht diese Studie, wie Vision-Language-Modelle künstlerische Stile erkennen, und zeigt durch quantitative Analysen und Expertenbewertungen, dass die meisten für die Stilvorhersage genutzten Konzepte von Kunsthistorikern als semantisch kohärent und relevant eingestuft werden.

Marvin Limpijankit, Milad Alshomary, Yassin Oulad Daoud, Amith Ananthram, Tim Trombley, Elias Stengel-Eskin, Mohit Bansal, Noam M. Elcott, Kathleen McKeown2026-03-12🤖 cs.AI

Neural Field Thermal Tomography: A Differentiable Physics Framework for Non-Destructive Evaluation

Die Arbeit stellt NeFTY vor, ein differenzierbares physikalisches Framework, das mithilfe eines neuronalen Feldes und eines rigorosen numerischen Löschers die quantitative 3D-Rekonstruktion von Materialeigenschaften und die Lokalisierung von Untergrundfehlern aus transienten Oberflächentemperaturmessungen ermöglicht.

Tao Zhong, Yixun Hu, Dongzhe Zheng, Aditya Sood, Christine Allen-Blanchette2026-03-12🔬 cond-mat.mtrl-sci

A Temporal-Spectral Fusion Transformer with Subject-Specific Adapter for Enhancing RSVP-BCI Decoding

Die vorgestellte Arbeit stellt einen Temporal-Spectral-Fusion-Transformer mit einem subjektspezifischen Adapter (TSformer-SA) vor, der durch die Fusion von zeitlichen und spektralen EEG-Informationen sowie die Nutzung von Vorwissen aus bestehenden Probanden die RSVP-BCI-Decodierungsgenauigkeit auch bei limitierten Trainingsdaten für neue Nutzer signifikant verbessert und die Systembereitstellung beschleunigt.

Xujin Li, Wei Wei, Shuang Qiu + 1 more2026-03-11🤖 cs.AI

PnLCalib: Sports Field Registration via Points and Lines Optimization

Der Artikel stellt PnLCalib vor, eine optimierungsbasierte Methode zur Kalibrierung von Sportkameras in Übertragungsvideos, die durch die Kombination eines 3D-Fußballfeldmodils mit einer nichtlinearen Verfeinerung mittels erkannten Feldlinien eine robustere und präzisere Registrierung unter schwierigen Bedingungen wie variierenden Kamerawinkeln und Verdeckungen ermöglicht.

Marc Gutiérrez-Pérez, Antonio Agudo2026-03-11🤖 cs.AI