CARE What Fails: Contrastive Anchored-REflection for Verifiable Multimodal

Die Arbeit stellt CARE vor, ein post-training-Framework für multimodales Reasoning, das durch einen kontrastiven, fehlerzentrierten Ansatz und eine selbstkorrigierende Neusampling-Strategie (RGR) aus gescheiterten Rollouts lernbare Signale gewinnt und so die Genauigkeit und Trainingsstabilität im Vergleich zu GRPO signifikant verbessert.

Yongxin Wang, Zhicheng Yang, Meng Cao, Mingfei Han, Haokun Lin, Yingying Zhu, Xiaojun Chang, Xiaodan Liang2026-03-09🤖 cs.AI

LLMTM: Benchmarking and Optimizing LLMs for Temporal Motif Analysis in Dynamic Graphs

Die Arbeit stellt den Benchmark LLMTM vor, um die Leistung von Large Language Models bei der Analyse temporaler Motive in dynamischen Graphen zu evaluieren, und entwickelt darauf aufbauend einen kosteneffizienten, strukturbewussten Dispatcher, der die Genauigkeit eines teuren Tool-Agenten mit der Effizienz direkter Prompting-Methoden intelligent kombiniert.

Bing Hao, Minglai Shao, Zengyi Wo, Yunlong Chu, Yuhang Liu, Ruijie Wang2026-03-09🤖 cs.AI

Purification Before Fusion: Toward Mask-Free Speech Enhancement for Robust Audio-Visual Speech Recognition

Diese Arbeit stellt einen end-to-end Ansatz für die audio-visuelle Spracherkennung vor, der durch eine Conformer-basierte Fusionsarchitektur und integrierte Sprachverbesserung auf explizite Masken verzichtet, um semantisch relevante Informationen zu bewahren und die Rauschrobustheit zu steigern.

Linzhi Wu, Xingyu Zhang, Hao Yuan, Yakun Zhang, Changyan Zheng, Liang Xie, Tiejun Liu, Erwei Yin2026-03-09🤖 cs.AI

Beyond Mapping : Domain-Invariant Representations via Spectral Embedding of Optimal Transport Plans

Diese Arbeit schlägt eine Methode zur Erzeugung domäneninvarianter Repräsentationen durch spektrale Einbettung von Optimal-Transport-Plänen als Adjazenzmatrizen bipartiter Graphen vor, um die Herausforderung von Verteilungsverschiebungen in Aufgaben wie der Musikgenre-Erkennung und der Fehlerdiagnose bei elektrischen Kabeln zu bewältigen.

Abdel Djalil Sad Saoud, Fred Maurice Ngolè Mboula, Hanane Slimani2026-03-09🤖 cs.LG

Laser interferometry as a robust neuromorphic platform for machine learning

Die Arbeit stellt eine robuste neuromorphe Plattform für maschinelles Lernen vor, die ein optisches neuronales Netzwerk ausschließlich mit linearen optischen Ressourcen und Phasenverschiebungen zur Realisierung von Nichtlinearitäten implementiert und dabei sowohl effizientes In-situ-Lernen als auch hohe Resilienz gegenüber Photonenverlusten ermöglicht.

Amanuel Anteneh, Kyungeun Kim, J. M. Schwarz, Israel Klich, Olivier Pfister2026-03-09🔬 physics.optics

Online unsupervised Hebbian learning in deep photonic neuromorphic networks

Die Autoren stellen eine rein optische Architektur für tiefe neuromorphe Netzwerke vor, die durch einen lokalen optischen Rückkopplungsmechanismus und nichtflüchtige Phasenwechselmaterial-Synapsen eine Online-Hebbian-Lernfähigkeit ermöglicht und auf einer handelsüblichen Faseroptik-Plattform eine 100-prozentige Erkennungsrate bei der Buchstabenerkennung ohne energieineffiziente optisch-elektrisch-optische Konversionen erreicht.

Xi Li, Disha Biswas, Peng Zhou, Wesley H. Brigner, Anna Capuano, Joseph S. Friedman, Qing Gu2026-03-09🔬 physics.optics

Restoring Exploration after Post-Training: Latent Exploration Decoding for Large Reasoning Models

Die Arbeit stellt die Latent Exploration Decoding (LED) vor, eine trainingsfreie Dekodierungsstrategie, die durch die Aggregation und Auswahl von Zwischen-Schicht-Posterior-Werten mit maximaler Entropie den durch das Nachtrainieren verursachten Explorationskollaps in Large Reasoning Models überwindet und so die Genauigkeit auf verschiedenen Reasoning-Benchmarks verbessert.

Wenhui Tan, Fiorenzo Parascandolo, Enver Sangineto, Jianzhong Ju, Zhenbo Luo, Qian Cao, Rita Cucchiara, Ruihua Song, Jian Luan2026-03-09🤖 cs.LG

Stress-Testing Alignment Audits With Prompt-Level Strategic Deception

Diese Studie demonstriert, dass ein automatisiertes Red-Teaming-Verfahren durch promptbasierte Täuschungsstrategien sowohl Black-Box- als auch White-Box-Audits zur Identifizierung versteckter Ziele von KI-Modellen erfolgreich täuschen kann, was die mangelnde Robustheit aktueller Ausrichtungsmethoden gegenüber strategisch täuschenden Modellen belegt.

Oliver Daniels, Perusha Moodley, Benjamin M. Marlin, David Lindner2026-03-09🤖 cs.LG

Towards Autonomous Mathematics Research

Die Arbeit stellt Aletheia vor, einen autonomen mathematischen Forschungsagenten, der auf dem Gemini Deep Think-Modell basiert und durch iterative Generierung, Verifizierung und Revision von Lösungen in natürlicher Sprache sowohl Olympiadaufgaben als auch komplexe Forschungsarbeiten, einschließlich vollständig KI-generierter und kollaborativer wissenschaftlicher Beiträge, bewältigt.

Tony Feng, Trieu H. Trinh, Garrett Bingham, Dawsen Hwang, Yuri Chervonyi, Junehyuk Jung, Joonkyung Lee, Carlo Pagano, Sang-hyun Kim, Federico Pasqualotto, Sergei Gukov, Jonathan N. Lee, Junsu Kim, Kaiying Hou, Golnaz Ghiasi, Yi Tay, YaGuang Li, Chenkai Kuang, Yuan Liu, Hanzhao Lin, Evan Zheran Liu, Nigamaa Nayakanti, Xiaomeng Yang, Heng-Tze Cheng, Demis Hassabis, Koray Kavukcuoglu, Quoc V. Le, Thang Luong2026-03-09🤖 cs.AI

SWE-MiniSandbox: Container-Free Reinforcement Learning for Building Software Engineering Agents

Das Paper stellt SWE-MiniSandbox vor, eine leichte, containerfreie Methode zur skalierbaren Reinforcement-Learning-Training von Software-Engineering-Agenten, die durch Kernel-isolierte Workspaces und Pre-Caching-Techniken den Speicherbedarf und die Vorbereitungszeit im Vergleich zu herkömmlichen Container-Ansätzen drastisch reduziert, ohne die Leistung zu beeinträchtigen.

Danlong Yuan, Wei Wu, Zhengren Wang, Xueliang Zhao, Huishuai Zhang, Dongyan Zhao2026-03-09🤖 cs.AI

MiDAS: A Multimodal Data Acquisition System and Dataset for Robot-Assisted Minimally Invasive Surgery

Die Studie stellt MiDAS vor, ein quelloffenes, plattformunabhängiges System zur nicht-invasiven, zeitlich synchronisierten Erfassung multimodaler Daten für roboterassistierte minimalinvasive Chirurgie, das proprietäre Schnittstellen umgeht und durch die Bereitstellung annotierter Datensätze, einschließlich der ersten multimodalen Aufnahmen von Herniennaht-Übungen, die Reproduzierbarkeit der Forschung fördert.

Keshara Weerasinghe (MD), Seyed Hamid Reza Roodabeh (MD), Andrew Hawkins (MD), Zhaomeng Zhang, Zachary Schrader, Homa Alemzadeh2026-03-09🤖 cs.LG

An Adaptive Model Selection Framework for Demand Forecasting under Horizon-Induced Degradation to Support Business Strategy and Operations

Die Studie stellt AHSIV vor, einen adaptiven Rahmen zur Auswahl von Prognosemodellen, der durch die Berücksichtigung von Horizont-induzierter Degradation und Nachfrageschwankungen die Instabilität bei der Modellbewertung über verschiedene Zeithorizonte hinweg adressiert und so robuste Entscheidungen für heterogene Nachfragemuster ermöglicht.

Adolfo González, Víctor Parada2026-03-09🤖 cs.AI

GaiaFlow: Semantic-Guided Diffusion Tuning for Carbon-Frugal Search

Die Arbeit stellt GaiaFlow vor, ein innovatives Framework, das semantisch geführtes Diffusions-Tuning mit adaptiven Early-Exit-Protokollen und quantisierter Inferenz kombiniert, um bei der Informationsretrieval eine nachhaltige Balance zwischen hoher Suchqualität und minimalem CO₂-Fußabdruck zu erreichen.

Rong Fu, Jia Yee Tan, Chunlei Meng, Shuo Yin, Xiaowen Ma, Wangyu Wu, Muge Qi, Guangzhen Yao, Zhaolu Kang, Zeli Su, Simon Fong2026-03-09🤖 cs.LG