cs.AI Arbeiten | Gist.Science

Gradient Flow Drifting: Generative Modeling via Wasserstein Gradient Flows of KDE-Approximated Divergences

Diese Arbeit stellt den theoretischen Rahmen „Gradient Flow Drifting" vor, der Drifting-Modelle als Wasserstein-Gradientenflüsse von KDE-approximierten Divergenzen identifiziert und durch eine gemischte Divergenzstrategie sowie eine Erweiterung auf Riemannsche Mannigfaltigkeiten sowohl Modenkollaps als auch -verwischung vermeidet.

Jiarui Cao, Zixuan Wei, Yuxin Liu2026-03-12🤖 cs.LG

Recover to Predict: Progressive Retrospective Learning for Variable-Length Trajectory Prediction

Die vorgestellte Arbeit stellt das Progressive Retrospective Framework (PRF) vor, das durch eine Kaskade von retrospektiven Einheiten und eine Rolling-Start-Trainingsstrategie die Herausforderung der Variablen-Trajektorienvorhersage bei unvollständigen Beobachtungen im autonomen Fahren effektiv löst.

Hao Zhou, Lu Qi, Jason Li, Jie Zhang, Yi Liu, Xu Yang, Mingyu Fan, Fei Luo2026-03-12🤖 cs.AI

Trajectory-Informed Memory Generation for Self-Improving Agent Systems

Die Arbeit stellt einen neuen Rahmen vor, der durch die semantische Analyse von Agenten-Executionspfaden und die Generierung kontextspezifischer Lernhinweise die Fähigkeit von LLM-Agenten zur Selbstverbesserung durch gezieltes Abrufen von Erfahrungswissen signifikant steigert.

Gaodan Fang, Vatche Isahagian, K. R. Jayaram, Ritesh Kumar, Vinod Muthusamy, Punleuk Oum, Gegi Thomas2026-03-12🤖 cs.AI

Reinforcement Learning with Conditional Expectation Reward

Die vorgestellte Arbeit stellt die Conditional Expectation Reward (CER) vor, eine Methode, die ein Large Language Model als impliziten Verifizierer nutzt, um durch weiche, graduierte Belohnungssignale das Reinforcement Learning für allgemeine Denkprozesse ohne externe Verifizierer zu ermöglichen.

Changyi Xiao, Caijun Xu, Yixin Cao2026-03-12🤖 cs.LG

Detecting and Eliminating Neural Network Backdoors Through Active Paths with Application to Intrusion Detection

Diese Arbeit stellt einen neuartigen, erklärbaren Ansatz vor, der auf aktiven Pfaden in neuronalen Netzen basiert, um Backdoor-Auslöser in Intrusion-Detection-Systemen zu erkennen und zu eliminieren.

Eirik Høyheim, Magnus Wiik Eckhoff, Gudmund Grov, Robert Flood, David Aspinall2026-03-12🤖 cs.AI

Interleaving Scheduling and Motion Planning with Incremental Learning of Symbolic Space-Time Motion Abstractions

Diese Arbeit stellt einen neuartigen Rahmen vor, der durch ein inkrementelles Lernverfahren Scheduler und Bewegungsplaner miteinander verzahnt, um in geteilten Arbeitsräumen zeitlich und räumlich konfliktfreie Ausführungspläne für die Multi-Objekt-Navigation zu generieren.

Elisa Tosello, Arthur Bit-Monnot, Davide Lusuardi, Alessandro Valentini, Andrea Micheli2026-03-12🤖 cs.AI

Are Video Reasoning Models Ready to Go Outside?

Die Arbeit stellt ROVA, ein Trainingsframework, und PVRBench, einen neuen Benchmark, vor, um die Robustheit von Video-Reasoning-Modellen gegenüber realen Störungen wie Wetter und Verdeckungen zu verbessern und dabei signifikante Genauigkeits- sowie Schlussfolgerungsgewinne zu erzielen.

Yangfan He, Changgyu Boo, Jaehong Yoon2026-03-12🤖 cs.AI

FAME: Formal Abstract Minimal Explanation for Neural Networks

Die Arbeit stellt FAME vor, eine neue Methode zur Erzeugung formaler abduktiver Minimalerklärungen für große neuronale Netze, die durch dedizierte Perturbationsdomänen und LiRPA-Bound-Techniken sowohl die Erklärungsgröße als auch die Laufzeit im Vergleich zu bestehenden Ansätzen wie VERIX+ signifikant verbessert.

Ryma Boumazouza, Raya Elsaleh, Melanie Ducoffe, Shahaf Bassan, Guy Katz2026-03-12🤖 cs.AI

Emulating Clinician Cognition via Self-Evolving Deep Clinical Research

Die Studie stellt DxEvolve vor, einen sich selbst weiterentwickelnden diagnostischen Agenten, der durch einen interaktiven klinischen Forschungsprozess die menschliche klinische Kognition nachahmt und die Diagnosegenauigkeit signifikant verbessert, indem er klinische Erfahrung in ein steuerbares Lernasset umwandelt.

Ruiyang Ren, Yuhao Wang, Yunsen Liang, Lan Luo, Jing Liu, Haifeng Wang, Cong Feng, Yinan Zhang, Chunyan Miao, Ji-Rong Wen, Wayne Xin Zhao2026-03-12🤖 cs.AI

A Platform-Agnostic Multimodal Digital Human Modelling Framework: Neurophysiological Sensing in Game-Based Interaction

Dieser Beitrag stellt ein plattformunabhängiges Framework für die digitale Menschmodellierung vor, das mithilfe des OpenBCI Galea-Headsets multimodale Neurophysiologiedaten in einer reproduzierbaren SuperTux-Spielumgebung erfasst und strukturiert bereitstellt, um zukünftige ethisch genehmigte KI-Forschung im Bereich Barrierefreiheit und Interaktionsdesign zu ermöglichen, ohne dabei eigene KI-Inferenzmodelle zu integrieren.

Daniel J. Buxton, Mufti Mahmud, Jordan J. Bird, Thomas Hughes-Roberts, David J. Brown2026-03-12🤖 cs.AI

Contract And Conquer: How to Provably Compute Adversarial Examples for a Black-Box Model?

Die Arbeit stellt „Contract And Conquer" (CAC) vor, eine Methode zur provablen Berechnung von adversariellen Beispielen für Black-Box-Modelle durch Wissensdistillation und Kontraktion des Suchraums, die nachweislich innerhalb einer festen Anzahl von Iterationen erfolgreich ist und auf dem ImageNet-Datensatz den aktuellen Stand der Technik übertrifft.

Anna Chistyakova, Mikhail Pautov2026-03-12🤖 cs.LG

Repurposing Backdoors for Good: Ephemeral Intrinsic Proofs for Verifiable Aggregation in Cross-silo Federated Learning

Diese Arbeit stellt einen leichten Ansatz vor, der Backdoor-Injektion nutzt, um flüchtige, intrinsische Beweise für die Verifizierung der Aggregation in Cross-Silo-Federated-Learning zu erzeugen, wodurch die Integrität ohne die hohen Rechenkosten kryptografischer Methoden gewährleistet wird.

Xian Qin, Xue Yang, Xiaohu Tang2026-03-12🤖 cs.AI

RandMark: On Random Watermarking of Visual Foundation Models

Die Arbeit stellt RandMark vor, eine Methode zur Verifizierung des Eigentums an visuellen Fundamentmodellen, die durch zufälliges Einbetten digitaler Wasserzeichen in interne Repräsentationen eine zuverlässige Erkennung von Funktionskopien bei gleichzeitig geringer Fehlerrate ermöglicht.

Anna Chistyakova, Mikhail Pautov2026-03-12🤖 cs.AI

EvoSchema: Towards Text-to-SQL Robustness Against Schema Evolution

Das Paper stellt EvoSchema vor, ein umfassendes Benchmark-Tool mit einer neuen Taxonomie von Schema-Änderungen, das die Robustheit von Text-to-SQL-Modellen gegenüber realen Datenbank-Evolutionen bewertet und zeigt, dass Modelle, die auf solchen vielfältigen Schemata trainiert werden, deutlich widerstandsfähiger gegen Leistungsabfall sind.

Tianshu Zhang, Kun Qian, Siddhartha Sahai, Yuan Tian, Shaddy Garg, Huan Sun, Yunyao Li2026-03-12💬 cs.CL

Structured Linked Data as a Memory Layer for Agent-Orchestrated Retrieval

Die Studie zeigt, dass die Integration von strukturierten Linked-Data-Elementen wie Schema.org-Markup und agentenoptimierten Entitätsseiten die Genauigkeit und Vollständigkeit von Retrieval-Augmented-Generation-Systemen im Vergleich zu reinem Fließtext erheblich verbessert.

Andrea Volpini, Elie Raad, Beatrice Gamba, David Riccitelli2026-03-12🤖 cs.AI

AlphaFlowTSE: One-Step Generative Target Speaker Extraction via Conditional AlphaFlow

Das Paper stellt AlphaFlowTSE vor, ein einstufiges generatives Modell für die Extraktion von Zielsprechern aus Mehrsprecher-Mischungen, das durch einen JVP-freien AlphaFlow-Zielwert und eine Lehrer-Schüler-Struktur Latenz reduziert und gleichzeitig die Ähnlichkeit zum Zielsprecher sowie die Robustheit für die automatische Spracherkennung verbessert.

Duojia Li, Shuhan Zhang, Zihan Qian, Wenxuan Wu, Shuai Wang, Qingyang Hong, Lin Li, Haizhou Li2026-03-12🤖 cs.AI

Probabilistic Verification of Voice Anti-Spoofing Models

Die Arbeit stellt PV-VASM vor, ein modellunabhängiges probabilistisches Framework zur Verifikation der Robustheit von Sprach-Anti-Spoofing-Modellen gegenüber Deepfakes und unbekannten Synthesetechniken durch die Schätzung von Fehlklassifikationswahrscheinlichkeiten und die Herleitung theoretischer Fehlerobergrenzen.

Evgeny Kushnir, Alexandr Kozodaev, Dmitrii Korzh, Mikhail Pautov, Oleg Kiriukhin, Oleg Y. Rogov2026-03-12🤖 cs.AI

UAV traffic scene understanding: A cross-spectral guided approach and a unified benchmark

Die Arbeit stellt CTCNet vor, ein neuartiges, cross-spektrales Netzwerk mit Wissens-Einbettung und spektraler Kompensation für eine robuste UAV-Verkehrsszenenanalyse unter schwierigen Lichtverhältnissen, und stellt gleichzeitig Traffic-VQA, den ersten großskaligen optisch-thermischen Benchmark für kognitive Verkehrsverständnis-Aufgaben, vor.

Yu Zhang, Zhicheng Zhao, Ze Luo, Chenglong Li, Jin Tang2026-03-12🤖 cs.AI

Towards Robust Speech Deepfake Detection via Human-Inspired Reasoning

Die Arbeit stellt HIR-SDD vor, ein neuartiges Framework zur Erkennung von Sprach-Deepfakes, das Large Audio Language Models mit menschenähnlichem Chain-of-Thought-Reasoning auf Basis eines neu annotierten Datensatzes kombiniert, um sowohl die Generalisierungsfähigkeit als auch die Interpretierbarkeit der Vorhersagen zu verbessern.

Artem Dvirniak, Evgeny Kushnir, Dmitrii Tarasov, Artem Iudin, Oleg Kiriukhin, Mikhail Pautov, Dmitrii Korzh, Oleg Y. Rogov2026-03-12🤖 cs.AI

CUPID: A Plug-in Framework for Joint Aleatoric and Epistemic Uncertainty Estimation with a Single Model

Das Paper stellt CUPID vor, ein modulares Plug-in-Framework, das ohne Retraining des Basismodells sowohl aleatorische als auch epistemische Unsicherheit in vortrainierten neuronalen Netzen gemeinsam schätzt und dabei interpretierbare Einblicke in die Unsicherheitsursachen auf Layerebene bietet.

Xinran Xu, Xiuyi Fan2026-03-12🤖 cs.LG

← Zurück Weiter →