cs.AI Arbeiten | Gist.Science

Continual uncertainty learning

Diese Studie stellt ein curriculumbasiertes, kontinuierliches Lernframework vor, das durch die schrittweise Zerlegung komplexer Unsicherheiten und die Kombination von modellbasierter Regelung mit Deep Reinforcement Learning robuste Steuerungen für nichtlineare mechanische Systeme ermöglicht und erfolgreich eine Sim-zu-Real-Übertragung für aktive Schwingungskontrolle in Fahrzeugantriebssträngen demonstriert.

Heisei Yonezawa, Ansei Yonezawa, Itsuro Kajiwara2026-03-11🤖 cs.AI

ReDON: Recurrent Diffractive Optical Neural Processor with Reconfigurable Self-Modulated Nonlinearity

Die Arbeit stellt ReDON vor, einen neuartigen rekurrenten optischen neuronalen Prozessor, der durch rekonfigurierbare, selbstmodulierte Nichtlinearitäten die statischen Grenzen herkömmlicher diffraktiver optischer Netzwerke überwindet und dabei die Genauigkeit bei minimalem Energieverbrauch signifikant steigert.

Ziang Yin, Qi Jing, Raktim Sarma, Rena Huang, Yu Yao, Jiaqi Gu2026-03-11🔬 physics.optics

SafeGen-LLM: Enhancing Safety Generalization in Task Planning for Robotic Systems

Der Artikel stellt SafeGen-LLM vor, ein zweistufiges Nachtrainierungsframework für Large Language Models, das durch überwachtes Feintuning und gruppenbasierte Politikoptimierung mit formal verifizierten Belohnungsfunktionen die Sicherheit und Generalisierungsfähigkeit von Roboter-Aufgabenplanung in verschiedenen Domänen signifikant verbessert.

Jialiang Fan, Weizhe Xu, Mengyu Liu + 3 more2026-03-11🤖 cs.AI

Breaking the Factorization Barrier in Diffusion Language Models

Die Arbeit stellt Coupled Discrete Diffusion (CoDD) vor, einen hybriden Rahmen, der die „Faktorisierungsbarriere" in Diffusions-Sprachmodellen durch eine leichte probabilistische Inferenzschicht überwindet, um komplexe gemeinsame Abhängigkeiten effizient zu modellieren und dabei sowohl die Geschwindigkeit als auch die Kohärenz der Generierung erheblich verbessert.

Ian Li, Zilei Shao, Benjie Wang, Rose Yu, Guy Van den Broeck, Anji Liu2026-03-11🤖 cs.AI

OrthoAI: A Neurosymbolic Framework for Evidence-Grounded Biomechanical Reasoning in Clear Aligner Orthodontics

Der Artikel stellt OrthoAI vor, ein neurosymbolisches Framework, das durch sparse-supervision Segmentierung, wissensbasierte biomechanische Constraints und eine Multi-Kriterien-Bewertung die Lücke zwischen geometrischer Wahrnehmung und klinischer Entscheidungsfindung in der Klarschienen-Orthodontie schließt.

Edouard Lansiaux, Margaux Leman, Mehdi Ammi2026-03-11🤖 cs.AI

Zero-Shot and Supervised Bird Image Segmentation Using Foundation Models: A Dual-Pipeline Approach with Grounding DINO~1.5, YOLOv11, and SAM~2.1

Diese Arbeit stellt einen dualen Pipeline-Ansatz mit den Foundation-Modellen Grounding DINO 1.5, YOLOv11 und SAM 2.1 vor, der sowohl im Zero-Shot- als auch im überwachten Modus eine neue Bestleistung bei der Segmentierung von Vogelbildern auf dem CUB-200-2011-Datensatz erzielt und dabei bestehende, spezialisierte Segmentierungsnetzwerke übertrifft.

Abhinav Munagala2026-03-11🤖 cs.AI

Pri4R: Learning World Dynamics for Vision-Language-Action Models with Privileged 4D Representation

Die Arbeit stellt Pri4R vor, eine einfache Methode, die Vision-Language-Action-Modelle durch das Training mit privilegierten 4D-Punktverläufen in die Lage versetzt, physikalische Welt-Dynamiken implizit zu erlernen und so die Leistung bei Manipulationsaufgaben ohne zusätzliche Inferenzkosten erheblich zu steigern.

Jisoo Kim, Jungbin Cho, Sanghyeok Chu, Ananya Bal, Jinhyung Kim, Gunhee Lee, Sihaeng Lee, Seung Hwan Kim, Bohyung Han, Hyunmin Lee, Laszlo A. Jeni, Seungryong Kim2026-03-11🤖 cs.AI

Reasoning as Gradient: Scaling MLE Agents Beyond Tree Search

Die Arbeit stellt \textsc{Gome} vor, einen MLE-Agenten, der gradientenbasierte Optimierung anstelle von Baumsuche nutzt und durch die Abbildung diagnostischer Schlussfolgerungen auf Gradientenberechnung bei leistungsstarken Modellen einen neuen State-of-the-Art auf MLE-Bench erreicht.

Yifei Zhang, Xu Yang, Xiao Yang, Bowen Xian, Qizheng Li, Shikai Fang, Jingyuan Li, Jian Wang, Mingrui Xu, Weiqing Liu, Jiang Bian2026-03-11🤖 cs.AI

Boltzmann-based Exploration for Robust Decentralized Multi-Agent Planning (Extended Version)

Die Arbeit stellt Coordinated Boltzmann MCTS (CB-MCTS) vor, einen neuartigen dezentralen Planungsalgorithmus, der durch eine stochastische Boltzmann-Politik und einen abklingenden Entropie-Bonus die Robustheit gegenüber spärlichen Belohnungen und irreführenden Szenarien in kooperativen Multi-Agenten-Systemen im Vergleich zu herkömmlichen Dec-MCTS-Ansätzen signifikant verbessert.

Nhat D. A. Nguyen, Duong D. Nguyen, Gianluca Rizzo, Hung X. Nguyen2026-03-11🤖 cs.AI

FinTexTS: Financial Text-Paired Time-Series Dataset via Semantic-Based and Multi-Level Pairing

Die Arbeit stellt FinTexTS vor, ein neues groß angelegtes Datenset für Finanzzeitreihen, das durch einen semantikbasierten und mehrstufigen Paarungsansatz mit LLMs erstellt wurde, um komplexe Marktinterdependenzen besser zu erfassen und die Vorhersagegenauigkeit von Aktienkursen zu verbessern.

Jaehoon Lee, Suhwan Park, Tae Yoon Lim, Seunghan Lee, Jun Seo, Dongwan Kang, Hwanil Choi, Minjae Kim, Sungdong Yoo, SoonYoung Lee, Yongjae Lee, Wonbin Ahn2026-03-11🤖 cs.AI

SPARC: Spatial-Aware Path Planning via Attentive Robot Communication

Die Arbeit stellt SPARC vor, ein dezentralisiertes Multi-Roboter-Pfadplanungssystem, das durch eine relationenverstärkte Multi-Head-Aufmerksamkeitsmechanik (RMHA) räumliche Nähe in die Kommunikation integriert und damit in überfüllten Umgebungen sowie bei der Generalisierung auf deutlich größere Roboterschwärme signifikant bessere Erfolgsraten erzielt als bestehende Methoden.

Sayang Mu, Xiangyu Wu, Bo An2026-03-11🤖 cs.AI

Unveiling the Potential of Quantization with MXFP4: Strategies for Quantization Error Reduction

Die Studie stellt zwei rein softwarebasierte Techniken, Overflow-Aware Scaling (OAS) und Macro Block Scaling (MBS), vor, die die Genauigkeit des MXFP4-Formats für Large Language Models signifikant verbessern und die Leistungslücke zu NVFP4 von durchschnittlich 10 % auf unter 1 % verringern, ohne Hardwareänderungen vorzunehmen.

Jatin Chhugani, Geonhwa Jeong, Bor-Yiing Su, Yunjie Pan, Hanmei Yang, Aayush Ankit, Jiecao Yu, Summer Deng, Yunqing Chen, Nadathur Satish, Changkyu Kim2026-03-11🤖 cs.AI

Design Conductor: An agent autonomously builds a 1.5 GHz Linux-capable RISC-V CPU

Der autonome Agent „Design Conductor" hat es erstmals geschafft, innerhalb von 12 Stunden vollständig eigenständig einen funktionsfähigen RISC-V-Prozessor (VerCore) mit einer Taktfrequenz von 1,48 GHz von der Anforderungsspezifikation bis zur fertigen GDSII-Layoutdatei zu entwerfen und zu verifizieren.

The Verkor Team, Ravi Krishna, Suresh Krishna, David Chin2026-03-11🤖 cs.AI

CktEvo: Repository-Level RTL Code Benchmark for Design Evolution

Das Paper stellt CktEvo vor, ein Benchmark und Referenzrahmen für die evolutionäre Optimierung von RTL-Code auf Repository-Ebene, der mittels eines geschlossenen Regelkreises aus LLM-Änderungen und Toolchain-Feedback funktionserhaltende Verbesserungen von Leistung, Leistungsaufnahme und Flächennutzung (PPA) in realen Hardware-Designs ohne menschliches Eingreifen ermöglicht.

Zhengyuan Shi, Jingxin Wang, Tairan Cheng, Changran Xu, Weikang Qian, Qiang Xu2026-03-11🤖 cs.AI

SiliconMind-V1: Multi-Agent Distillation and Debug-Reasoning Workflows for Verilog Code Generation

Die Arbeit stellt SiliconMind-V1 vor, ein einheitliches Multi-Agenten-Framework, das durch testgestützte Verifikation und Debugging-Workflows lokal feinabgestimmte Sprachmodelle befähigt, funktional korrekten Verilog-Code effizienter zu generieren als bisherige State-of-the-Art-Ansätze.

Mu-Chi Chen, Yu-Hung Kao, Po-Hsuan Huang, Shao-Chun Ho, Hsiang-Yu Tsou, I-Ting Wu, En-Ming Huang, Yu-Kai Hung, Wei-Po Hsin, Cheng Liang, Chia-Heng Tu, Shih-Hao Hung, Hsiang-Tsung Kung2026-03-11🤖 cs.AI

ALADIN: Accuracy-Latency-Aware Design-space Inference Analysis for Embedded AI Accelerators

Die Arbeit stellt ALADIN vor, ein Framework zur genauigkeits- und latenzbewussten Analyse des Designraums für gemischt-präzise quantisierte neuronale Netze auf eingebetteten KI-Beschleunigern, das die Bewertung von Trade-offs zwischen Genauigkeit, Latenz und Ressourcenverbrauch ohne physische Bereitstellung auf der Zielplattform ermöglicht.

T. Baldi, D. Casini, A. Biondi2026-03-11🤖 cs.AI

Alignment Is the Disease: Censorship Visibility and Alignment Constraint Complexity as Determinants of Collective Pathology in Multi-Agent LLM Systems

Die Studie liefert vorläufige Belege dafür, dass Alignments-Techniken in Multi-Agenten-LLM-Systemen durch unsichtbare Zensur und komplexe Ausrichtungsbeschränkungen kollektive Pathologien und eine Dissociation zwischen Erkenntnis und Handeln hervorrufen können, was auf eine iatrogene Schädigung durch Sicherheitsmaßnahmen selbst hindeutet.

Hiroki Fukui2026-03-11🤖 cs.AI

PhD Thesis Summary: Methods for Reliability Assessment and Enhancement of Deep Neural Network Hardware Accelerators

Diese Doktorarbeit stellt neuartige, kosteneffiziente Methoden zur Zuverlässigkeitsbewertung und -verbesserung von Deep-Learning-Hardware-Beschleunigern vor, darunter analytische Bewertungswerkzeuge, optimierte Kompromisse zwischen Quantisierung und Fehlertoleranz sowie die Echtzeit-Technik AdAM, die eine hohe Zuverlässigkeit bei deutlich reduzierten Hardwarekosten ermöglicht.

Mahdi Taheri2026-03-11🤖 cs.AI

ARKV: Adaptive and Resource-Efficient KV Cache Management under Limited Memory Budget for Long-Context Inference in LLMs

Das Paper stellt ARKV vor, einen adaptiven und ressourceneffizienten Rahmen zur Verwaltung des KV-Caches bei Large Language Models, der durch dynamische Zuweisung von Präzisionsniveaus basierend auf Aufmerksamkeitsdynamiken und Token-Wichtigkeit die Speichernutzung um den Faktor vier reduziert, während die Genauigkeit bei langen Kontexten nahezu erhalten bleibt.

Jianlong Lei, Shashikant Ilager2026-03-11🤖 cs.AI

Measurement-Free Ancilla Recycling via Blind Reset: A Cross-Platform Study on Superconducting and Trapped-Ion Processors

Diese Studie bewertet die blinden Reset-Verfahren zur ancilla-Wiederverwendung auf Superconducting- und Trapped-Ion-Plattformen und zeigt, dass durch sequenzbasiertes Recycling die Zykluslatenz um bis zu 38-fach reduziert werden kann, während die Ancilla-Reinheit und die logische Fehlerrate erhalten bleiben.

Sangkeum Lee2026-03-11⚛️ quant-ph

← Zurück Weiter →