Continual uncertainty learning

Diese Studie stellt ein curriculumbasiertes, kontinuierliches Lernframework vor, das durch die schrittweise Zerlegung komplexer Unsicherheiten und die Kombination von modellbasierter Regelung mit Deep Reinforcement Learning robuste Steuerungen für nichtlineare mechanische Systeme ermöglicht und erfolgreich eine Sim-zu-Real-Übertragung für aktive Schwingungskontrolle in Fahrzeugantriebssträngen demonstriert.

Heisei Yonezawa, Ansei Yonezawa, Itsuro Kajiwara2026-03-11🤖 cs.AI

ReDON: Recurrent Diffractive Optical Neural Processor with Reconfigurable Self-Modulated Nonlinearity

Die Arbeit stellt ReDON vor, einen neuartigen rekurrenten optischen neuronalen Prozessor, der durch rekonfigurierbare, selbstmodulierte Nichtlinearitäten die statischen Grenzen herkömmlicher diffraktiver optischer Netzwerke überwindet und dabei die Genauigkeit bei minimalem Energieverbrauch signifikant steigert.

Ziang Yin, Qi Jing, Raktim Sarma, Rena Huang, Yu Yao, Jiaqi Gu2026-03-11🔬 physics.optics

Breaking the Factorization Barrier in Diffusion Language Models

Die Arbeit stellt Coupled Discrete Diffusion (CoDD) vor, einen hybriden Rahmen, der die „Faktorisierungsbarriere" in Diffusions-Sprachmodellen durch eine leichte probabilistische Inferenzschicht überwindet, um komplexe gemeinsame Abhängigkeiten effizient zu modellieren und dabei sowohl die Geschwindigkeit als auch die Kohärenz der Generierung erheblich verbessert.

Ian Li, Zilei Shao, Benjie Wang, Rose Yu, Guy Van den Broeck, Anji Liu2026-03-11🤖 cs.AI

Zero-Shot and Supervised Bird Image Segmentation Using Foundation Models: A Dual-Pipeline Approach with Grounding DINO~1.5, YOLOv11, and SAM~2.1

Diese Arbeit stellt einen dualen Pipeline-Ansatz mit den Foundation-Modellen Grounding DINO 1.5, YOLOv11 und SAM 2.1 vor, der sowohl im Zero-Shot- als auch im überwachten Modus eine neue Bestleistung bei der Segmentierung von Vogelbildern auf dem CUB-200-2011-Datensatz erzielt und dabei bestehende, spezialisierte Segmentierungsnetzwerke übertrifft.

Abhinav Munagala2026-03-11🤖 cs.AI

Pri4R: Learning World Dynamics for Vision-Language-Action Models with Privileged 4D Representation

Die Arbeit stellt Pri4R vor, eine einfache Methode, die Vision-Language-Action-Modelle durch das Training mit privilegierten 4D-Punktverläufen in die Lage versetzt, physikalische Welt-Dynamiken implizit zu erlernen und so die Leistung bei Manipulationsaufgaben ohne zusätzliche Inferenzkosten erheblich zu steigern.

Jisoo Kim, Jungbin Cho, Sanghyeok Chu, Ananya Bal, Jinhyung Kim, Gunhee Lee, Sihaeng Lee, Seung Hwan Kim, Bohyung Han, Hyunmin Lee, Laszlo A. Jeni, Seungryong Kim2026-03-11🤖 cs.AI

Boltzmann-based Exploration for Robust Decentralized Multi-Agent Planning (Extended Version)

Die Arbeit stellt Coordinated Boltzmann MCTS (CB-MCTS) vor, einen neuartigen dezentralen Planungsalgorithmus, der durch eine stochastische Boltzmann-Politik und einen abklingenden Entropie-Bonus die Robustheit gegenüber spärlichen Belohnungen und irreführenden Szenarien in kooperativen Multi-Agenten-Systemen im Vergleich zu herkömmlichen Dec-MCTS-Ansätzen signifikant verbessert.

Nhat D. A. Nguyen, Duong D. Nguyen, Gianluca Rizzo, Hung X. Nguyen2026-03-11🤖 cs.AI

FinTexTS: Financial Text-Paired Time-Series Dataset via Semantic-Based and Multi-Level Pairing

Die Arbeit stellt FinTexTS vor, ein neues groß angelegtes Datenset für Finanzzeitreihen, das durch einen semantikbasierten und mehrstufigen Paarungsansatz mit LLMs erstellt wurde, um komplexe Marktinterdependenzen besser zu erfassen und die Vorhersagegenauigkeit von Aktienkursen zu verbessern.

Jaehoon Lee, Suhwan Park, Tae Yoon Lim, Seunghan Lee, Jun Seo, Dongwan Kang, Hwanil Choi, Minjae Kim, Sungdong Yoo, SoonYoung Lee, Yongjae Lee, Wonbin Ahn2026-03-11🤖 cs.AI

SPARC: Spatial-Aware Path Planning via Attentive Robot Communication

Die Arbeit stellt SPARC vor, ein dezentralisiertes Multi-Roboter-Pfadplanungssystem, das durch eine relationenverstärkte Multi-Head-Aufmerksamkeitsmechanik (RMHA) räumliche Nähe in die Kommunikation integriert und damit in überfüllten Umgebungen sowie bei der Generalisierung auf deutlich größere Roboterschwärme signifikant bessere Erfolgsraten erzielt als bestehende Methoden.

Sayang Mu, Xiangyu Wu, Bo An2026-03-11🤖 cs.AI

Unveiling the Potential of Quantization with MXFP4: Strategies for Quantization Error Reduction

Die Studie stellt zwei rein softwarebasierte Techniken, Overflow-Aware Scaling (OAS) und Macro Block Scaling (MBS), vor, die die Genauigkeit des MXFP4-Formats für Large Language Models signifikant verbessern und die Leistungslücke zu NVFP4 von durchschnittlich 10 % auf unter 1 % verringern, ohne Hardwareänderungen vorzunehmen.

Jatin Chhugani, Geonhwa Jeong, Bor-Yiing Su, Yunjie Pan, Hanmei Yang, Aayush Ankit, Jiecao Yu, Summer Deng, Yunqing Chen, Nadathur Satish, Changkyu Kim2026-03-11🤖 cs.AI

CktEvo: Repository-Level RTL Code Benchmark for Design Evolution

Das Paper stellt CktEvo vor, ein Benchmark und Referenzrahmen für die evolutionäre Optimierung von RTL-Code auf Repository-Ebene, der mittels eines geschlossenen Regelkreises aus LLM-Änderungen und Toolchain-Feedback funktionserhaltende Verbesserungen von Leistung, Leistungsaufnahme und Flächennutzung (PPA) in realen Hardware-Designs ohne menschliches Eingreifen ermöglicht.

Zhengyuan Shi, Jingxin Wang, Tairan Cheng, Changran Xu, Weikang Qian, Qiang Xu2026-03-11🤖 cs.AI

SiliconMind-V1: Multi-Agent Distillation and Debug-Reasoning Workflows for Verilog Code Generation

Die Arbeit stellt SiliconMind-V1 vor, ein einheitliches Multi-Agenten-Framework, das durch testgestützte Verifikation und Debugging-Workflows lokal feinabgestimmte Sprachmodelle befähigt, funktional korrekten Verilog-Code effizienter zu generieren als bisherige State-of-the-Art-Ansätze.

Mu-Chi Chen, Yu-Hung Kao, Po-Hsuan Huang, Shao-Chun Ho, Hsiang-Yu Tsou, I-Ting Wu, En-Ming Huang, Yu-Kai Hung, Wei-Po Hsin, Cheng Liang, Chia-Heng Tu, Shih-Hao Hung, Hsiang-Tsung Kung2026-03-11🤖 cs.AI

Alignment Is the Disease: Censorship Visibility and Alignment Constraint Complexity as Determinants of Collective Pathology in Multi-Agent LLM Systems

Die Studie liefert vorläufige Belege dafür, dass Alignments-Techniken in Multi-Agenten-LLM-Systemen durch unsichtbare Zensur und komplexe Ausrichtungsbeschränkungen kollektive Pathologien und eine Dissociation zwischen Erkenntnis und Handeln hervorrufen können, was auf eine iatrogene Schädigung durch Sicherheitsmaßnahmen selbst hindeutet.

Hiroki Fukui2026-03-11🤖 cs.AI

PhD Thesis Summary: Methods for Reliability Assessment and Enhancement of Deep Neural Network Hardware Accelerators

Diese Doktorarbeit stellt neuartige, kosteneffiziente Methoden zur Zuverlässigkeitsbewertung und -verbesserung von Deep-Learning-Hardware-Beschleunigern vor, darunter analytische Bewertungswerkzeuge, optimierte Kompromisse zwischen Quantisierung und Fehlertoleranz sowie die Echtzeit-Technik AdAM, die eine hohe Zuverlässigkeit bei deutlich reduzierten Hardwarekosten ermöglicht.

Mahdi Taheri2026-03-11🤖 cs.AI

ARKV: Adaptive and Resource-Efficient KV Cache Management under Limited Memory Budget for Long-Context Inference in LLMs

Das Paper stellt ARKV vor, einen adaptiven und ressourceneffizienten Rahmen zur Verwaltung des KV-Caches bei Large Language Models, der durch dynamische Zuweisung von Präzisionsniveaus basierend auf Aufmerksamkeitsdynamiken und Token-Wichtigkeit die Speichernutzung um den Faktor vier reduziert, während die Genauigkeit bei langen Kontexten nahezu erhalten bleibt.

Jianlong Lei, Shashikant Ilager2026-03-11🤖 cs.AI