cs.LG Arbeiten | Gist.Science

CARE What Fails: Contrastive Anchored-REflection for Verifiable Multimodal

Die Arbeit stellt CARE vor, ein post-training-Framework für multimodales Reasoning, das durch einen kontrastiven, fehlerzentrierten Ansatz und eine selbstkorrigierende Neusampling-Strategie (RGR) aus gescheiterten Rollouts lernbare Signale gewinnt und so die Genauigkeit und Trainingsstabilität im Vergleich zu GRPO signifikant verbessert.

Yongxin Wang, Zhicheng Yang, Meng Cao, Mingfei Han, Haokun Lin, Yingying Zhu, Xiaojun Chang, Xiaodan Liang2026-03-09🤖 cs.AI

LLMTM: Benchmarking and Optimizing LLMs for Temporal Motif Analysis in Dynamic Graphs

Die Arbeit stellt den Benchmark LLMTM vor, um die Leistung von Large Language Models bei der Analyse temporaler Motive in dynamischen Graphen zu evaluieren, und entwickelt darauf aufbauend einen kosteneffizienten, strukturbewussten Dispatcher, der die Genauigkeit eines teuren Tool-Agenten mit der Effizienz direkter Prompting-Methoden intelligent kombiniert.

Bing Hao, Minglai Shao, Zengyi Wo, Yunlong Chu, Yuhang Liu, Ruijie Wang2026-03-09🤖 cs.AI

Bayesian Monocular Depth Refinement via Neural Radiance Fields

Die Arbeit stellt MDENeRF vor, einen iterativen Rahmen, der mittels Bayes'scher Fusion monokulare Tiefenschätzungen mit unsicherheitsbasierten Details aus Neural Radiance Fields verfeinert, um globale Struktur und feine geometrische Details zu kombinieren.

Arun Muthukkumar2026-03-09🤖 cs.LG

Purification Before Fusion: Toward Mask-Free Speech Enhancement for Robust Audio-Visual Speech Recognition

Diese Arbeit stellt einen end-to-end Ansatz für die audio-visuelle Spracherkennung vor, der durch eine Conformer-basierte Fusionsarchitektur und integrierte Sprachverbesserung auf explizite Masken verzichtet, um semantisch relevante Informationen zu bewahren und die Rauschrobustheit zu steigern.

Linzhi Wu, Xingyu Zhang, Hao Yuan, Yakun Zhang, Changyan Zheng, Liang Xie, Tiejun Liu, Erwei Yin2026-03-09🤖 cs.AI

Beyond Mapping : Domain-Invariant Representations via Spectral Embedding of Optimal Transport Plans

Diese Arbeit schlägt eine Methode zur Erzeugung domäneninvarianter Repräsentationen durch spektrale Einbettung von Optimal-Transport-Plänen als Adjazenzmatrizen bipartiter Graphen vor, um die Herausforderung von Verteilungsverschiebungen in Aufgaben wie der Musikgenre-Erkennung und der Fehlerdiagnose bei elektrischen Kabeln zu bewältigen.

Abdel Djalil Sad Saoud, Fred Maurice Ngolè Mboula, Hanane Slimani2026-03-09🤖 cs.LG

Laser interferometry as a robust neuromorphic platform for machine learning

Die Arbeit stellt eine robuste neuromorphe Plattform für maschinelles Lernen vor, die ein optisches neuronales Netzwerk ausschließlich mit linearen optischen Ressourcen und Phasenverschiebungen zur Realisierung von Nichtlinearitäten implementiert und dabei sowohl effizientes In-situ-Lernen als auch hohe Resilienz gegenüber Photonenverlusten ermöglicht.

Amanuel Anteneh, Kyungeun Kim, J. M. Schwarz, Israel Klich, Olivier Pfister2026-03-09🔬 physics.optics

Neural Signals Generate Clinical Notes in the Wild

Die Autoren stellen CELM, das erste multimodale Grundlagenmodell, vor, das langfristige EEG-Aufzeichnungen direkt in klinische Berichte übersetzt und dabei durch die Integration von Patientenhistorie eine signifikante Verbesserung der Generierungsqualität erreicht.

Jathurshan Pradeepkumar, Zheng Chen, Jimeng Sun2026-03-09🤖 cs.AI

Online unsupervised Hebbian learning in deep photonic neuromorphic networks

Die Autoren stellen eine rein optische Architektur für tiefe neuromorphe Netzwerke vor, die durch einen lokalen optischen Rückkopplungsmechanismus und nichtflüchtige Phasenwechselmaterial-Synapsen eine Online-Hebbian-Lernfähigkeit ermöglicht und auf einer handelsüblichen Faseroptik-Plattform eine 100-prozentige Erkennungsrate bei der Buchstabenerkennung ohne energieineffiziente optisch-elektrisch-optische Konversionen erreicht.

Xi Li, Disha Biswas, Peng Zhou, Wesley H. Brigner, Anna Capuano, Joseph S. Friedman, Qing Gu2026-03-09🔬 physics.optics

ZK-HybridFL: Zero-Knowledge Proof-Enhanced Hybrid Ledger for Federated Learning

Die Arbeit stellt ZK-HybridFL vor, ein dezentrales Framework für Federated Learning, das durch die Integration von Zero-Knowledge-Beweisen, einer DAG-Ledger-Architektur mit Sidechains und einem Oracle-Mechanismus sowohl die Privatsphäre der Daten als auch die Sicherheit und Skalierbarkeit der Modellvalidierung gewährleistet.

Amirhossein Taherpour, Xiaodong Wang2026-03-09🤖 cs.LG

EDIS: Diagnosing LLM Reasoning via Entropy Dynamics

Die Arbeit stellt EDIS vor, eine Metrik zur Diagnose von LLM-Reasoning, die auf der Analyse der zeitlichen Dynamik der Entropie während der Generierung basiert und dadurch fehlerhafte Schlussfolgerungen durch instabile Muster zuverlässig erkennt, um die Genauigkeit von LLMs zu verbessern.

Chenghua Zhu, Siyan Wu, Xiangkang Zeng, Zishan Xu, Zhaolu Kang, Yifu Guo, Yuquan Lu, Junduan Huang, Guojing Zhou2026-03-09🤖 cs.LG

Restoring Exploration after Post-Training: Latent Exploration Decoding for Large Reasoning Models

Die Arbeit stellt die Latent Exploration Decoding (LED) vor, eine trainingsfreie Dekodierungsstrategie, die durch die Aggregation und Auswahl von Zwischen-Schicht-Posterior-Werten mit maximaler Entropie den durch das Nachtrainieren verursachten Explorationskollaps in Large Reasoning Models überwindet und so die Genauigkeit auf verschiedenen Reasoning-Benchmarks verbessert.

Wenhui Tan, Fiorenzo Parascandolo, Enver Sangineto, Jianzhong Ju, Zhenbo Luo, Qian Cao, Rita Cucchiara, Ruihua Song, Jian Luan2026-03-09🤖 cs.LG

Stress-Testing Alignment Audits With Prompt-Level Strategic Deception

Diese Studie demonstriert, dass ein automatisiertes Red-Teaming-Verfahren durch promptbasierte Täuschungsstrategien sowohl Black-Box- als auch White-Box-Audits zur Identifizierung versteckter Ziele von KI-Modellen erfolgreich täuschen kann, was die mangelnde Robustheit aktueller Ausrichtungsmethoden gegenüber strategisch täuschenden Modellen belegt.

Oliver Daniels, Perusha Moodley, Benjamin M. Marlin, David Lindner2026-03-09🤖 cs.LG

Latent Poincaré Shaping for Agentic Reinforcement Learning

Das Paper stellt LaPha vor, eine Methode, die AlphaZero-ähnliche LLM-Agenten in einem hyperbolischen Poincaré-Latenzraum trainiert, um durch die Nutzung der negativen Krümmung für eine exponentiell wachsende Kapazität und dichte Prozessbelohnungen auf MATH-500 und AIME-Benchmarks signifikante Genauigkeitssteigerungen zu erzielen.

Hanchen Xia, Baoyou Chen, Zelin Zang, Yutang Ge, Guojiang Zhao, Siyu Zhu2026-03-09🤖 cs.LG

Validating Interpretability in siRNA Efficacy Prediction: A Perturbation-Based, Dataset-Aware Protocol

Die Studie stellt ein neues Protokoll zur Validierung von Saliency-Maps in der siRNA-Wirksamkeitsvorhersage vor, das durch den Nachweis von Fehlern wie „inverser Saliency" und den Einsatz eines biologisch informierten Regularisierers (BioPrior) die Zuverlässigkeit erklärbarer Modelle für das therapeutische Design sicherstellt.

Zahra Khodagholi, Niloofar Yousefi2026-03-09🤖 cs.LG

Towards Autonomous Mathematics Research

Die Arbeit stellt Aletheia vor, einen autonomen mathematischen Forschungsagenten, der auf dem Gemini Deep Think-Modell basiert und durch iterative Generierung, Verifizierung und Revision von Lösungen in natürlicher Sprache sowohl Olympiadaufgaben als auch komplexe Forschungsarbeiten, einschließlich vollständig KI-generierter und kollaborativer wissenschaftlicher Beiträge, bewältigt.

Tony Feng, Trieu H. Trinh, Garrett Bingham, Dawsen Hwang, Yuri Chervonyi, Junehyuk Jung, Joonkyung Lee, Carlo Pagano, Sang-hyun Kim, Federico Pasqualotto, Sergei Gukov, Jonathan N. Lee, Junsu Kim, Kaiying Hou, Golnaz Ghiasi, Yi Tay, YaGuang Li, Chenkai Kuang, Yuan Liu, Hanzhao Lin, Evan Zheran Liu, Nigamaa Nayakanti, Xiaomeng Yang, Heng-Tze Cheng, Demis Hassabis, Koray Kavukcuoglu, Quoc V. Le, Thang Luong2026-03-09🤖 cs.AI

Stochastic Parroting in Temporal Attention -- Regulating the Diagonal Sink

Die Arbeit analysiert die Neigung von temporalen Aufmerksamkeitsmechanismen zu einem diagonalen „Attention Sink" und Informationsdegeneration, leitet theoretische Sensitivitätsgrenzen her und schlägt Regularisierungsmethoden vor, um dieses Phänomen zu regulieren.

Victoria Hankemeier, Malte Schilling2026-03-09🤖 cs.LG

SWE-MiniSandbox: Container-Free Reinforcement Learning for Building Software Engineering Agents

Das Paper stellt SWE-MiniSandbox vor, eine leichte, containerfreie Methode zur skalierbaren Reinforcement-Learning-Training von Software-Engineering-Agenten, die durch Kernel-isolierte Workspaces und Pre-Caching-Techniken den Speicherbedarf und die Vorbereitungszeit im Vergleich zu herkömmlichen Container-Ansätzen drastisch reduziert, ohne die Leistung zu beeinträchtigen.

Danlong Yuan, Wei Wu, Zhengren Wang, Xueliang Zhao, Huishuai Zhang, Dongyan Zhao2026-03-09🤖 cs.AI

MiDAS: A Multimodal Data Acquisition System and Dataset for Robot-Assisted Minimally Invasive Surgery

Die Studie stellt MiDAS vor, ein quelloffenes, plattformunabhängiges System zur nicht-invasiven, zeitlich synchronisierten Erfassung multimodaler Daten für roboterassistierte minimalinvasive Chirurgie, das proprietäre Schnittstellen umgeht und durch die Bereitstellung annotierter Datensätze, einschließlich der ersten multimodalen Aufnahmen von Herniennaht-Übungen, die Reproduzierbarkeit der Forschung fördert.

Keshara Weerasinghe (MD), Seyed Hamid Reza Roodabeh (MD), Andrew Hawkins (MD), Zhaomeng Zhang, Zachary Schrader, Homa Alemzadeh2026-03-09🤖 cs.LG

An Adaptive Model Selection Framework for Demand Forecasting under Horizon-Induced Degradation to Support Business Strategy and Operations

Die Studie stellt AHSIV vor, einen adaptiven Rahmen zur Auswahl von Prognosemodellen, der durch die Berücksichtigung von Horizont-induzierter Degradation und Nachfrageschwankungen die Instabilität bei der Modellbewertung über verschiedene Zeithorizonte hinweg adressiert und so robuste Entscheidungen für heterogene Nachfragemuster ermöglicht.

Adolfo González, Víctor Parada2026-03-09🤖 cs.AI

GaiaFlow: Semantic-Guided Diffusion Tuning for Carbon-Frugal Search

Die Arbeit stellt GaiaFlow vor, ein innovatives Framework, das semantisch geführtes Diffusions-Tuning mit adaptiven Early-Exit-Protokollen und quantisierter Inferenz kombiniert, um bei der Informationsretrieval eine nachhaltige Balance zwischen hoher Suchqualität und minimalem CO₂-Fußabdruck zu erreichen.

Rong Fu, Jia Yee Tan, Chunlei Meng, Shuo Yin, Xiaowen Ma, Wangyu Wu, Muge Qi, Guangzhen Yao, Zhaolu Kang, Zeli Su, Simon Fong2026-03-09🤖 cs.LG

← Zurück Weiter →