cs.AI Arbeiten | Gist.Science

TA-GGAD: Testing-time Adaptive Graph Model for Generalist Graph Anomaly Detection

Die Arbeit stellt TA-GGAD vor, ein adaptives Graph-Modell, das durch die Identifizierung und Modellierung des „Anomaly Disassortativity"-Problems eine bahnbrechende, domänenübergreifende Generalisierung bei der Erkennung von Anomalien in Graphen ermöglicht.

Xiong Zhang, Hong Peng, Changlong Fu, Xin Jin, Yun Yang, Cheng Xie2026-03-11🤖 cs.AI

Democratising Clinical AI through Dataset Condensation for Classical Clinical Models

Diese Arbeit stellt einen differenziell privaten, nullten Ordnungs-Optimierungsrahmen vor, der die Datensatzkondensation auf nicht differenzierbare klinische Modelle wie Entscheidungsbäume und Cox-Regressionen erweitert, um eine sichere und modellunabhängige Datenteilung für klinische Vorhersageaufgaben zu ermöglichen.

Anshul Thakur, Soheila Molaei, Pafue Christy Nganjimi, Joshua Fieggen, Andrew A. S. Soltan, Danielle Belgrave, Lei Clifton, David A. Clifton2026-03-11🤖 cs.AI

M3GCLR: Multi-View Mini-Max Infinite Skeleton-Data Game Contrastive Learning For Skeleton-Based Action Recognition

Die Arbeit stellt M3GCLR vor, ein spieltheoretisches kontrastives Lernframework für die skelettbasierte Aktionserkennung, das durch die Modellierung einer unendlichen Skelettdaten-Spieltheorie, adversarische Multi-View-Augmentierung und einen dualen Verlust-Optimierer die Grenzen bestehender selbstüberwachter Methoden überwindet und state-of-the-art-Ergebnisse auf gängigen Datensätzen erzielt.

Yanshan Li, Ke Ma, Miaomiao Wei, Linhui Dai2026-03-11🤖 cs.AI

MIL-PF: Multiple Instance Learning on Precomputed Features for Mammography Classification

Das Paper stellt MIL-PF vor, ein skalierbares Framework, das vortrainierte Basis-Modelle mit einem leichten Multiple-Instance-Learning-Kopf kombiniert, um die Klassifizierung von Mammographien bei geringem Rechenaufwand und nur schwacher Bildbeschriftung effizient und mit state-of-the-art Genauigkeit durchzuführen.

Nikola Jovišic, Milica Škipina, Nicola Dall'Asen, Dubravko Culibrk2026-03-11🤖 cs.AI

SPAARS: Safer RL Policy Alignment through Abstract Exploration and Refined Exploitation of Action Space

Die Arbeit stellt SPAARS vor, ein Curriculum-Learning-Framework für das Offline-zu-Online-Reinforcement-Learning, das die Exploration zunächst sicher in einem latenten Raum einschränkt und dann nahtlos in den rohen Aktionsraum übergeht, um die durch Decoder-Rekonstruktionsverluste bedingte Leistungsgrenze zu überwinden und gleichzeitig die Sample-Effizienz sowie die Stabilität zu steigern.

Swaminathan S K, Aritra Hazra2026-03-11🤖 cs.AI

Physics-Informed Neural Engine Sound Modeling with Differentiable Pulse-Train Synthesis

Die Arbeit stellt das differentiable Pulse-Train-Resonator-Modell (PTR) vor, das Motorengeräusche durch die direkte physikalisch informierte Synthese von Druckimpulsen und deren Resonanzsimulation erzeugt und dabei eine signifikant bessere Klangrekonstruktion sowie interpretierbare physikalische Parameter bietet.

Robin Doerfler, Lonce Wyse2026-03-11🤖 cs.AI

ICDAR 2025 Competition on End-to-End Document Image Machine Translation Towards Complex Layouts

Dieser Bericht stellt den ICDAR-2025-Wettbewerb zur End-to-End-Übersetzung von Dokumentenbildern mit komplexen Layouts vor, bei dem 69 Teams zwei Tracks (OCR-frei und OCR-basiert) für kleine und große Modelle bestritten haben, wobei die Ergebnisse zeigen, dass große Modelle einen vielversprechenden neuen Paradigmenwechsel für diese Aufgabe darstellen.

Yaping Zhang, Yupu Liang, Zhiyang Zhang, Zhiyuan Chen, Lu Xiang, Yang Zhao, Yu Zhou, Chengqing Zong2026-03-11🤖 cs.AI

Reviving ConvNeXt for Efficient Convolutional Diffusion Models

Die Arbeit stellt den vollständig konvolutionalen Diffusionsmodell (FCDM) vor, der auf ConvNeXt basiert und durch seine überlegene Recheneffizienz sowie trainierbarkeit auf begrenzter Hardware eine wettbewerbsfähige Alternative zu Transformer-basierten Diffusionsmodellen darstellt.

Taesung Kwon, Lorenzo Bianchi, Lennart Wittke, Felix Watine, Fabio Carrara, Jong Chul Ye, Romann Weber, Vinicius Azevedo2026-03-11🤖 cs.AI

PromptDLA: A Domain-aware Prompt Document Layout Analysis Framework with Descriptive Knowledge as a Cue

Die Arbeit stellt PromptDLA vor, ein domainspezifisches Prompting-Framework für die Dokumentenlayoutanalyse, das deskriptives Wissen nutzt, um Domänenwissen effektiv zu integrieren und so durch maßgeschneiderte Prompts die Generalisierungsfähigkeit über verschiedene Datensätze hinweg zu verbessern und state-of-the-art-Ergebnisse zu erzielen.

Zirui Zhang, Yaping Zhang, Lu Xiang, Yang Zhao, Feifei Zhai, Yu Zhou, Chengqing Zong2026-03-11🤖 cs.AI

From Flow to One Step: Real-Time Multi-Modal Trajectory Policies via Implicit Maximum Likelihood Estimation-based Distribution Distillation

Die Autoren stellen einen Echtzeit-Rahmen vor, der durch Implizite Maximum-Likelihood-Schätzung und bidirektionale Chamfer-Distanz ein Conditional-Flow-Matching-Modell in einen schnellen, einstufigen Schüler-Algorithmus destilliert, um latenzfreie, multimodale Trajektorien für die robotische Manipulation zu ermöglichen.

Ju Dong, Liding Zhang, Lei Zhang, Yu Fu, Kaixin Bai, Zoltan-Csaba Marton, Zhenshan Bing, Zhaopeng Chen, Alois Christian Knoll, Jianwei Zhang2026-03-11🤖 cs.AI

Investigating Gender Stereotypes in Large Language Models via Social Determinants of Health

Diese Studie untersucht, wie Large Language Models in französischen Patientenakten geschlechtsspezifische Stereotype im Kontext sozialer Gesundheitsdeterminanten reproduzieren und schlägt vor, Wechselwirkungen zwischen diesen Faktoren in die Bias-Bewertung aufzunehmen.

Trung Hieu Ngo, Adrien Bazoge, Solen Quiniou, Pierre-Antoine Gourraud, Emmanuel Morin2026-03-11🤖 cs.AI

Open-World Motion Forecasting

Diese Arbeit stellt Open-World Motion Forecasting vor, ein neuartiges Szenario für autonomes Fahren, das durch ein end-to-end Framework mit Pseudo-Labeling und einem neuen Replay-Sampling-Verfahren die Herausforderung des katastrophalen Vergessens beim sequenziellen Erlernen neuer Objektklassen direkt aus Kamerabildern bewältigt.

Nicolas Schischka, Nikhil Gosala, B Ravi Kiran, Senthil Yogamani, Abhinav Valada2026-03-11🤖 cs.AI

CERES: A Probabilistic Early Warning System for Acute Food Insecurity

Das Papier stellt CERES vor, ein automatisiertes, probabilistisches Frühwarnsystem, das wöchentlich aktualisierte, öffentlich verifizierbare Wahrscheinlichkeitsprognosen für akute Nahrungsmittelunsicherheit in 43 Hochrisikoländern erstellt und dabei sechs Datenströme mittels eines logistischen Bewertungsmodells kombiniert.

Tom Danny S. Pedersen2026-03-11🤖 cs.AI

Common Sense vs. Morality: The Curious Case of Narrative Focus Bias in LLMs

Die Studie CoMoral zeigt, dass aktuelle Large Language Models moralisches Denken oft über das gesunden Menschenverstand stellen und dabei eine narrative Verzerrung aufweisen, bei der sie logische Widersprüche eher bei Nebenfiguren als bei der Hauptfigur erkennen.

Saugata Purkayastha, Pranav Kushare, Pragya Paramita Pal, Sukannya Purkayastha2026-03-11🤖 cs.AI

AI Act Evaluation Benchmark: An Open, Transparent, and Reproducible Evaluation Dataset for NLP and RAG Systems

Dieses Paper stellt einen offenen, transparenten und reproduzierbaren Datensatz vor, der mithilfe von Large Language Models und domänenspezifischem Wissen entwickelt wurde, um die Compliance von NLP- und RAG-Systemen mit der EU-KI-Verordnung durch Aufgaben wie Risikoklassifizierung und Artikelretrieval automatisiert zu evaluieren.

Athanasios Davvetas, Michael Papademas, Xenia Ziouvelou, Vangelis Karkaletsis2026-03-11🤖 cs.AI

A Guideline-Aware AI Agent for Zero-Shot Target Volume Auto-Delineation

Die Studie stellt OncoAgent vor, ein neuartiges, guideline-bewusstes KI-Framework, das klinische Leitlinien ohne Neutrainieren direkt in dreidimensionale Zielvolumen für die Strahlentherapie umwandelt und dabei in einer blinden klinischen Bewertung von Ärzten eine höhere Leitlinienkonformität sowie Akzeptanz als ein überwachtes nnU-Net-Modell erreicht.

Yoon Jo Kim, Wonyoung Cho, Jongmin Lee, Han Joo Chae, Hyunki Park, Sang Hoon Seo, Noh Jae Myung, Kyungmi Yang, Dongryul Oh, Jin Sung Kim2026-03-11🤖 cs.AI

Variational Routing: A Scalable Bayesian Framework for Calibrated Mixture-of-Experts Transformers

Die Arbeit stellt VMoER vor, einen skalierbaren bayesschen Ansatz, der die Unsicherheitsquantifizierung in Mixture-of-Experts-Transformern durch eine strukturierte Inferenz im Routing-Mechanismus ermöglicht und dabei die Kalibrierung sowie die Stabilität bei gleichzeitiger Minimierung des Rechenaufwards erheblich verbessert.

Albus Yizhuo Li, Matthew Wicker2026-03-11🤖 cs.AI

Declarative Scenario-based Testing with RoadLogic

Die Arbeit stellt RoadLogic vor, ein Open-Source-System, das deklarative OpenSCENARIO-Spezifikationen mithilfe von Answer Set Programming, Bewegungsplanung und Überwachung in ausführbare, realistische Simulationen für das systematische Testen autonomer Fahrzeuge übersetzt.

Ezio Bartocci, Alessio Gambi, Felix Gigler, Cristinel Mateis, Dejan Ničkovic2026-03-11🤖 cs.AI

An Empirical Study and Theoretical Explanation on Task-Level Model-Merging Collapse

Diese Studie identifiziert und erklärt das Phänomen des „Task-Level Model-Merging Collapse", bei dem bestimmte Aufgabenkombinationen zu katastrophalem Leistungsabfall führen, und zeigt durch empirische Analysen sowie eine theoretische Herleitung mittels Rate-Distortion-Theorie auf, dass diese Inkompatibilität primär auf Repräsentationskonflikte und nicht auf Parameterkonflikte zurückzuführen ist.

Yuan Cao, Dezhi Ran, Yuzhe Guo, Mengzhou Wu, Simin Chen, Linyi Li, Wei Yang, Tao Xie2026-03-11🤖 cs.AI

EvoDriveVLA: Evolving Autonomous Driving Vision-Language-Action Model via Collaborative Perception-Planning Distillation

Das Paper stellt EvoDriveVLA vor, ein neuartiges Framework zur kollaborativen Destillation von Wahrnehmung und Planung, das durch selbstverankerte visuelle Einschränkungen und oracle-gesteuerte Trajektorienoptimierung die Stabilität und Leistung von autonomen Fahrzeugen in Vision-Language-Action-Modellen verbessert.

Jiajun Cao, Xiaoan Zhang, Xiaobao Wei, Liyuqiu Huang, Wang Zijian, Hanzhen Zhang, Zhengyu Jia, Wei Mao, Hao Wang, Xianming Liu, Shuchang Zhou Liu, Yang Wang, Shanghang Zhang2026-03-11🤖 cs.AI

← Zurück Weiter →