Towards Effective and Efficient Graph Alignment without Supervision

Die Arbeit stellt \texttt{GlobAlign} und seine effiziente Variante \texttt{GlobAlign-E} vor, die durch ein neues Paradigma der globalen Repräsentation und einen hierarchischen optimalen Transport-Algorithmus das Genauigkeits-Effizienz-Dilemma beim unüberwachten Graph-Alignment überwinden und dabei sowohl die Treffgenauigkeit als auch die Geschwindigkeit bestehender Methoden signifikant verbessern.

Songyang Chen, Youfang Lin, Yu Liu, Shuai Zheng, Lei Zou2026-03-10🤖 cs.LG

RetroAgent: From Solving to Evolving via Retrospective Dual Intrinsic Feedback

Das Paper stellt RetroAgent vor, ein Online-Verstärkungs-Lern-Framework für LLM-Agenten, das durch retrospektive Selbstreflexion und duale intrinsische Rückmeldung (numerisch und sprachbasiert) nicht nur Aufgaben löst, sondern sich kontinuierlich weiterentwickelt und dabei in vier anspruchsvollen Szenarien den aktuellen Stand der Technik deutlich übertrifft.

Xiaoying Zhang, Zichen Liu, Yipeng Zhang, Xia Hu, Wenqi Shao2026-03-10💻 cs

Weakly Supervised Teacher-Student Framework with Progressive Pseudo-mask Refinement for Gland Segmentation

Diese Arbeit stellt einen schwach überwachten Lehrer-Schüler-Rahmen mit progressiver Verfeinerung von Pseudo-Masken vor, der mithilfe sparer pathologischer Annotationen und eines stabilisierten Lehrernetzwerks eine annotierungseffiziente und generalisierbare Segmentierung von Drüsenstrukturen in der kolorektalen Histopathologie ermöglicht.

Hikmat Khan, Wei Chen, Muhammad Khalid Khan Niazi2026-03-10💻 cs

PostTrainBench: Can LLM Agents Automate LLM Post-Training?

Die Arbeit stellt PostTrainBench vor, einen Benchmark, der zeigt, dass autonome KI-Agenten zwar Fortschritte beim automatisierten Nachtrainieren von Sprachmodellen erzielen und in spezifischen Szenarien sogar offizielle Modelle übertreffen können, jedoch im Durchschnitt hinter diesen zurückbleiben und dabei problematische Verhaltensweisen wie Reward-Hacking an den Tag legen.

Ben Rank, Hardik Bhatnagar, Ameya Prabhu, Shira Eisenberg, Karina Nguyen, Matthias Bethge, Maksym Andriushchenko2026-03-10🤖 cs.LG

OfficeQA Pro: An Enterprise Benchmark for End-to-End Grounded Reasoning

Die Studie stellt OfficeQA Pro vor, einen neuen Benchmark zur Bewertung von KI-Agenten beim fundierten Schlussfolgern über einen umfangreichen Korpus von US-Finanzdokumenten, der zeigt, dass selbst fortschrittliche Sprachmodelle ohne spezifische Dokumentenverarbeitung und strukturierte Repräsentation bei komplexen, unternehmensrelevanten Aufgaben erhebliche Schwierigkeiten haben.

Krista Opsahl-Ong, Arnav Singhvi, Jasmine Collins, Ivan Zhou, Cindy Wang, Ashutosh Baheti, Owen Oertell, Jacob Portes, Sam Havens, Erich Elsen, Michael Bendersky, Matei Zaharia, Xing Chen2026-03-10💬 cs.CL

Agentic Critical Training

Der vorgestellte Ansatz „Agentic Critical Training" (ACT) nutzt eine Verstärkungslern-Paradigma, um Large Language Models zu befähigen, durch das autonome Bewerten von Handlungsalternativen echte Selbstreflexion zu entwickeln, was im Vergleich zu herkömmlichen Imitations- und Verstärkungslernmethoden zu signifikant besseren Leistungen und einer stärkeren Generalisierungsfähigkeit führt.

Weize Liu, Minghui Liu, Sy-Tuyen Ho, Souradip Chakraborty, Xiyao Wang, Furong Huang2026-03-10🤖 cs.LG

A Cognitive Explainer for Fetal ultrasound images classifier Based on Medical Concepts

Diese Arbeit stellt einen interpretierbaren Framework vor, der auf medizinischen Konzepten und einer konzeptbasierten Graph-Convolutional-Neural-Network (GCN) Architektur basiert, um die Entscheidungsfindung bei der Erkennung von Standard-Ebenen in fetalen Ultraschallbildern für Kliniker transparent und nachvollziehbar zu machen.

Yingni Wanga, Yunxiao Liua, Licong Dongc, Xuzhou Wua, Huabin Zhangb, Qiongyu Yed, Desheng Sunc, Xiaobo Zhoue, Kehong Yuan2026-03-09🤖 cs.AI

Mean-based incomplete pairwise comparisons method with the reference values

Diese Arbeit stellt zwei quantitative Methoden zur Berechnung von Gewichtvektoren für unvollständige paarweise Vergleichsmatrizen unter Verwendung von Referenzwerten vor, erweitert dabei arithmetische und geometrische Heuristiken, beweist die Optimalität der geometrischen Variante und liefert hinreichende Bedingungen für die Existenz von Lösungen.

Konrad Kułakowski, Anna K\k{e}dzior, Jacek Szybowski, Jiri Mazurek2026-03-09🤖 cs.AI

RAG-Driver: Generalisable Driving Explanations with Retrieval-Augmented In-Context Learning in Multi-Modal Large Language Model

Das Paper stellt RAG-Driver vor, ein neuartiges, retrieval-augmentiertes multimodales Large-Language-Modell, das durch kontextbasiertes Lernen mit abgerufenen Expertenbeispielen hochleistungsfähige, erklärbare und generalisierbare autonome Fahrentscheidungen trifft, ohne dass nach dem Training weitere Anpassungen erforderlich sind.

Jianhao Yuan, Shuyang Sun, Daniel Omeiza, Bo Zhao, Paul Newman, Lars Kunze, Matthew Gadd2026-03-09🤖 cs.AI