cs.AI Arbeiten | Gist.Science

BACE-RUL: A Bi-directional Adversarial Network with Covariate Encoding for Machine Remaining Useful Life Prediction

Dieser Beitrag stellt BACE-RUL vor, ein bi-direktionales adversariales Netzwerk mit Kovariatenkodierung, das den Restnutzungsdauer von Maschinen ausschließlich auf Basis aktueller Sensormessungen vorhersagt und dabei bestehende Methoden in Bezug auf Genauigkeit und Anwendbarkeit übertrifft.

Zekai Zhang, Dan Li, Shunyu Wu + 4 more2026-03-06💻 cs

Safety Mirage: How Spurious Correlations Undermine VLM Safety Fine-Tuning and Can Be Mitigated by Machine Unlearning

Die Arbeit zeigt, dass überwachtes Sicherheitstraining bei Vision-Language-Modellen durch irreführende oberflächliche Korrelationen anfällig für Umgehungsangriffe und übermäßige Zurückhaltung bleibt, und demonstriert, dass maschinelles Vergessen (Machine Unlearning) eine überlegene Alternative ist, um schädliches Wissen gezielt zu entfernen und gleichzeitig die Sicherheit sowie die Leistungsfähigkeit der Modelle zu verbessern.

Yiwei Chen, Yuguang Yao, Yihua Zhang + 3 more2026-03-06💻 cs

Advancing Problem-Based Learning in Biomedical Engineering in the Era of Generative AI

Diese Studie beschreibt eine dreijährige Fallstudie an der Georgia Tech und der Emory University, die zeigt, wie ein angepasster problembasiertes Lernrahmen (PBL) die Herausforderungen der Biomedizinischen KI-Ausbildung bewältigt und zu messbaren Verbesserungen bei den Lernergebnissen sowie zu 16 studentischen Publikationen führte.

Micky C. Nnamdi, J. Ben Tamo, Benoit Marteau + 2 more2026-03-06💻 cs

Assessing the Impact of Code Changes on the Fault Localizability of Large Language Models

Diese Studie stellt ein neuartiges, skalierbares Evaluierungsframework vor, das zeigt, dass die Fähigkeit von Large Language Models zur Fehlerlokalisation durch semantisch erhaltende Mutationen stark beeinträchtigt wird, was auf eine übermäßige Abhängigkeit von syntaktischen Merkmalen anstelle eines tiefen semantischen Verständnisses hinweist.

Sabaat Haroon, Ahmad Faraz Khan, Ahmad Humayun + 5 more2026-03-06💻 cs

ms-Mamba: Multi-scale Mamba for Time-Series Forecasting

Die Arbeit stellt ms-Mamba vor, eine neuartige Multi-Scale-Architektur auf Mamba-Basis, die durch die Verarbeitung von Zeitreihen auf mehreren zeitlichen Skalen den State-of-the-Art bei Prognoseaufgaben übertrifft und dabei effizienter ist als bestehende Transformer- und Mamba-Modelle.

Yusuf Meric Karadag, Ismail Talaz, Ipek Gursel Dino + 1 more2026-03-06💻 cs

Enhancing multimodal analogical reasoning with Logic Augmented Generation

Diese Arbeit stellt einen Logic-Augmented-Generation-Ansatz vor, der semantische Wissensgraphen mit Prompt-Heuristiken kombiniert, um implizite analoge Verbindungen in multimodalen Daten zu extrahieren und damit die metaphorische Erkennung und Erklärungsfähigkeit über den aktuellen Stand der Technik hinaus zu verbessern.

Anna Sofia Lippolis, Andrea Giovanni Nuzzolese, Aldo Gangemi2026-03-06💻 cs

Foam-Agent: Towards Automated Intelligent CFD Workflows

Das Paper stellt Foam-Agent vor, ein auf Large Language Models basierendes Multi-Agenten-System, das komplexe CFD-Arbeitsabläufe von der Netzgenerierung bis zur Visualisierung vollständig automatisiert und dabei eine Erfolgsrate von 88,2 % ohne menschliches Eingreifen erreicht.

Ling Yue, Nithin Somasekharan, Tingwen Zhang + 4 more2026-03-06💻 cs

ReactDance: Hierarchical Representation for High-Fidelity and Coherent Long-Form Reactive Dance Generation

Die Arbeit stellt ReactDance vor, ein Diffusionsframework, das durch die hierarchische Finite-Scalar-Quantisierung (HFSQ) für hochpräzise räumliche Kontrolle und die blockweise lokale Kontextstrategie (BLC) für kohärente lange Sequenzen hochwertige reaktive Tanzgeneration ermöglicht.

Jingzhong Lin, Xinru Li, Yuanyuan Qi + 8 more2026-03-06💻 cs

Balancing Progress and Safety: A Novel Risk-Aware Objective for RL in Autonomous Driving

Diese Arbeit stellt eine neuartige, risikobewusste Belohnungsfunktion für das Reinforcement Learning im autonomen Fahren vor, die durch eine hierarchische Strukturierung und die Erweiterung von Sicherheitskonzepten die Kollisionsrate um durchschnittlich 21 % senkt und gleichzeitig die Fahrleistung verbessert.

Ahmed Abouelazm, Jonas Michel, Helen Gremmelmaier + 3 more2026-03-06💻 cs

Boundary-Guided Trajectory Prediction for Road Aware and Physically Feasible Autonomous Driving

Diese Arbeit stellt ein neuartiges Framework für die Trajektorienvorhersage im autonomen Fahren vor, das durch die Begrenzung auf zulässige Fahrwege und die Einhaltung kinematischer Constraints sowohl die Vorhersage von Fahrten außerhalb der Straße als auch physikalisch nicht machbare Trajektorien effektiv verhindert und dabei eine robuste Generalisierungsfähigkeit aufweist.

Ahmed Abouelazm, Mianzhi Liu, Christian Hubschneider + 3 more2026-03-06💻 cs

Automatic Curriculum Learning for Driving Scenarios: Towards Robust and Efficient Reinforcement Learning

Diese Arbeit stellt ein automatisches Curriculum-Learning-Framework vor, das durch einen „Lehrer"-Agenten adaptive und auf die Lernfähigkeit des Fahragents abgestimmte Fahrszenarien generiert, um die Trainingseffizienz und Generalisierungsfähigkeit von Reinforcement-Learning-Modellen für autonomes Fahren im Vergleich zu festen Szenarien und Domänenrandomisierung signifikant zu verbessern.

Ahmed Abouelazm, Tim Weinstein, Tim Joseph + 2 more2026-03-06💻 cs

Ice Cream Doesn't Cause Drowning: Benchmarking LLMs Against Statistical Pitfalls in Causal Inference

Die Studie stellt mit „CausalPitfalls" ein umfassendes Benchmark vor, das die Fähigkeit von Large Language Models zur zuverlässigen kausalen Inferenz unter Berücksichtigung statistischer Fallstricke wie Simpson-Paradoxon und Selektionsverzerrung rigoros evaluiert und dabei erhebliche Defizite aktueller Modelle aufzeigt.

Jin Du, Li Chen, Xun Xian + 6 more2026-03-06💻 cs

ShIOEnv: A Command Evaluation Environment for Grammar-Constrained Synthesis and Execution Behavior Modeling

Das Paper stellt ShIOEnv vor, eine Gymnasium-kompatible Bash-Umgebung, die durch grammatikbasierte Einschränkung der Argumentkonstruktion und ein selbstüberwachtes Irreduzibilitätssignal 2,1 Millionen Eingabe-Ausgabe-Paare generiert, um Modelle zur Vorhersage von CLI-Ausführungsverhalten präziser zu trainieren.

Jarrod Ragsdale, Rajendra Boppana2026-03-06💻 cs

VTool-R1: VLMs Learn to Think with Images via Reinforcement Learning on Multimodal Tool Use

Die Arbeit stellt VTool-R1 vor, ein Framework, das Vision-Language-Modelle durch Reinforcement Learning mit Python-basierten Bildbearbeitungswerkzeugen trainiert, um strategisch multimodale Denkprozesse zu generieren, die Text und visuelle Zwischenschritte kombinieren, um die reasoning-Fähigkeiten bei visuellen Fragestellungen zu verbessern.

Mingyuan Wu, Jingcheng Yang, Jize Jiang + 6 more2026-03-06💻 cs

SealQA: Raising the Bar for Reasoning in Search-Augmented Language Models

Die Arbeit stellt SealQA vor, einen neuen Benchmark zur Bewertung von Suchmaschinen-gestützten Sprachmodellen bei faktischen Fragen mit widersprüchlichen oder unzuverlässigen Suchergebnissen, der zeigt, dass selbst fortschrittliche Modelle in der Lage sind, bei solchen Aufgaben nur sehr begrenzte Genauigkeit zu erreichen.

Thinh Pham, Nguyen Nguyen, Pratibha Zunjare + 3 more2026-03-06💻 cs

RoboPARA: Dual-Arm Robot Planning with Parallel Allocation and Recomposition Across Tasks

Das Paper stellt RoboPARA vor, ein von großen Sprachmodellen gesteuertes Framework für die parallele Aufgabenplanung bei Zweiarm-Robotern, das durch einen zweistufigen Prozess auf Basis von Abhängigkeitsgraphen die Effizienz und Zuverlässigkeit in komplexen Multitasking-Szenarien signifikant verbessert und dabei durch die Einführung des X-DAPT-Datensatzes erstmals eine umfassende Evaluierung ermöglicht.

Shiying Duan, Pei Ren, Nanxiang Jiang + 5 more2026-03-06💻 cs

A Signal Contract for Online Language Grounding and Discovery in Decision-Making

Das Paper stellt LUCIFER vor, ein Inferenz-basiertes Middleware-System, das durch einen Signal-Vertrag natürliche Sprachupdates in entkoppelte, entscheidungsrelevante Signale übersetzt, um die Diagnosefähigkeit zu verbessern und die Sicherheit sowie Effizienz autonomer Systeme in dynamischen Umgebungen wie der Suche und Rettung zu erhöhen.

Dimitris Panagopoulos, Adolfo Perrusquia, Weisi Guo2026-03-06💻 cs

HSG-12M: A Large-Scale Benchmark of Spatial Multigraphs from the Energy Spectra of Non-Hermitian Crystals

Die Studie stellt HSG-12M vor, einen umfassenden Datensatz mit über 16 Millionen räumlichen Multigraphen, der mithilfe des automatisierten Poly2Graph-Pipelines aus nicht-hermiteschen Kristallspektren generiert wurde, um als Benchmark für geometriebewusstes Graph-Learning und datengetriebene Entdeckungen in der kondensierten Materie zu dienen.

Xianquan Yan, Hakan Akgün, Kenji Kawaguchi + 2 more2026-03-06🔬 cond-mat.mes-hall

InterActHuman: Multi-Concept Human Animation with Layout-Aligned Audio Conditions

InterActHuman ist ein neuartiges Framework, das die hochwertige Animation mehrerer interagierender Personen und Objekte ermöglicht, indem es durch einen Masken-Prädiktor und lokale Audio-Bedingungen eine präzise, regionspezifische Verknüpfung multimodaler Eingaben mit den jeweiligen spatiotemporalen Fußabdrücken der Konzepte erzwingt.

Zhenzhi Wang, Jiaqi Yang, Jianwen Jiang + 7 more2026-03-06💻 cs

Bures-Wasserstein Flow Matching for Graph Generation

Diese Arbeit stellt BWFlow vor, ein neuartiges Flow-Matching-Framework für die Graphengenerierung, das durch die Modellierung der gemeinsamen Entwicklung von Knoten und Kanten mittels Markov-Zufallsfeldern und optimaler Transporttheorie auf der Bures-Wasserstein-Metrik einen glatten Wahrscheinlichkeitspfad schafft, der die Trainingskonvergenz verbessert und die Sampling-Effizienz steigert.

Keyue Jiang, Jiahao Cui, Xiaowen Dong + 1 more2026-03-06💻 cs

← Zurück Weiter →