PDD: Manifold-Prior Diverse Distillation for Medical Anomaly Detection

Die Arbeit stellt PDD (Manifold-Prior Diverse Distillation) vor, ein neuartiges Framework für die medizinische Anomalieerkennung, das durch die Vereinigung komplementärer Lehrer-Modelle in einem gemeinsamen Manifold und eine diverse Wissensdistillation in zwei Schüler-Netzwerke signifikant höhere Genauigkeiten als bestehende State-of-the-Art-Methoden auf verschiedenen medizinischen Datensätzen erzielt.

Xijun Lu, Hongying Liu, Fanhua Shang, Yanming Hui, Liang Wan2026-03-10💻 cs

Tutorial on Aided Inertial Navigation Systems: A Modern Treatment Using Lie-Group Theoretical Methods

Dieser Tutorial-Artikel bietet eine anwendungsorientierte Einführung in gestützte Inertialnavigationssysteme, indem er eine geometrische Formulierung auf Basis der verallgemeinerten Special-Euclidean-Gruppe SE₂(3) verwendet, um die Fusion von Inertialmessungen mit Hilfsdaten unter expliziter Berücksichtigung von Invarianz und Symmetrie zu erläutern und dabei moderne Erweiterungen wie äquivariante Filtermethoden vorzustellen.

Soulaimane Berkane2026-03-10💻 cs

CanoVerse: 3D Object Scalable Canonicalization and Dataset for Generation and Pose

Das Paper stellt CanoVerse vor, einen neuartigen, hochskalierbaren Datensatz mit 320.000 kanonisch ausgerichteten 3D-Objekten und einem effizienten Framework zur automatisierten Ausrichtung, der die Stabilität der 3D-Generierung verbessert und präzise, posekonsistente Semantik für verschiedene Anwendungen ermöglicht.

Li Jin, Yuchen Yang, Weikai Chen, Yujie Wang, Dehao Hao, Tanghui Jia, Yingda Yin, Zeyu Hu, Runze Zhang, Keyang Luo, Li Yuan, Long Quan, Xin Wang, Xueying Qin2026-03-10💻 cs

LiveWorld: Simulating Out-of-Sight Dynamics in Generative Video World Models

Die Arbeit stellt LiveWorld vor, ein neues Framework für generative Videoweltmodelle, das das Problem der „außerhalb des Sichtfelds liegenden Dynamik" löst, indem es einen persistenten globalen Zustand einführt, der es Objekten erlaubt, auch außerhalb des Kamerablickfelds weiterzuentwickeln und so eine konsistente 4D-Welt-Simulation zu ermöglichen.

Zicheng Duan, Jiatong Xia, Zeyu Zhang, Wenbo Zhang, Gengze Zhou, Chenhui Gou, Yefei He, Feng Chen, Xinyu Zhang, Lingqiao Liu2026-03-10💻 cs

NarrativeLoom: Enhancing Creative Storytelling through Multi-Persona Collaborative Improvisation

Die Studie stellt NarrativeLoom vor, ein von der Theorie der blinden Variation und selektiven Retention inspiriertes KI-System, das durch den Einsatz spezialisierter Personas und menschlicher Kuratierung die Kreativität, Vielfalt und Qualität von gemeinsam erdachten Geschichten signifikant steigert, wobei Anfänger besonders von der strukturierten Unterstützung profitieren.

Yuxi Ma, Yongqian Peng, Fengyuan Yang, Siyu Zha, Chi Zhang, Zixia Jia, Zilong Zheng, Yixin Zhu2026-03-10💻 cs

PromptGate Client Adaptive Vision Language Gating for Open Set Federated Active Learning

Das Paper stellt PromptGate vor, ein adaptives, auf Vision-Language-Modellen basierendes Framework für das offene Set im föderierten aktiven Lernen, das durch dynamische, kontextspezifische Prompts die Reinheit der Datenpools in ressourcenbeschränkten medizinischen Umgebungen sichert und so die Annotationseffizienz bei gleichzeitiger Wahrung der Patientendatenschutz erhöht.

Adea Nesturi, David Dueñas Gaviria, Jiajun Zeng, Shadi Albarqouni2026-03-10💻 cs

RoTri-Diff: A Spatial Robot-Object Triadic Interaction-Guided Diffusion Model for Bimanual Manipulation

Der Artikel stellt RoTri-Diff vor, ein diffusionsbasiertes Imitationslernframework, das durch die explizite Modellierung der räumlichen triadischen Interaktion zwischen zwei Roboterarmen und einem Objekt stabile und kollisionsfreie bimanuelle Manipulationsaufgaben in Simulation und Realität verbessert.

Zixuan Chen, Nga Teng Chan, Yiwen Hou, Chenrui Tie, Zixuan Liu, Haonan Chen, Junting Chen, Jieqi Shi, Yang Gao, Jing Huo, Lin Shao2026-03-10💻 cs

ACD-U: Asymmetric co-teaching with machine unlearning for robust learning with noisy labels

Die Arbeit stellt ACD-U vor, ein asymmetrisches Co-Teaching-Framework, das durch die Kombination eines CLIP-vorabtrainierten Vision-Transformers mit einem CNN sowie den Einsatz von Machine Unlearning zur aktiven Korrektur von Fehlerklassifizierungen einen neuen State-of-the-Art bei der robusten Verarbeitung von Daten mit verrauschten Labels erreicht.

Reo Fukunaga, Soh Yoshida, Mitsuji Muneyasu2026-03-10💻 cs

Class Visualizations and Activation Atlases for Enhancing Interpretability in Deep Learning-Based Computational Pathology

Diese Studie entwickelt und bewertet einen Visualisierungsrahmen für Transformer-Modelle in der computergestützten Pathologie, der zeigt, dass Klassenvisualisierungen und Aktivationsatlanten zwar morphologische Strukturen auf Gewebeebene gut abbilden, jedoch bei feineren Krebs-Subklassen eine mit der intrinsischen pathologischen Komplexität korrelierende reduzierte Trennschärfe und Experteneinigkeit aufweisen.

Marco Gustav, Fabian Wolf, Christina Glasner, Nic G. Reitsam, Stefan Schulz, Kira Aschenbroich, Bruno Märkl, Sebastian Foersch, Jakob Nikolas Kather2026-03-10💻 cs

Learning to Rank the Initial Branching Order of SAT Solvers

Diese Arbeit untersucht den Einsatz von Graph Neural Networks zur Vorhersage eines initialen Verzweigungsordnungs für SAT-Löser, wobei zwar signifikante Beschleunigungen bei zufälligen und pseudo-industriellen Instanzen erzielt werden, die Vorhersagen jedoch bei komplexen industriellen Problemen aufgrund der dynamischen Heuristiken der Solver und der Schwierigkeit der Instanzen versagen.

Arvid Eriksson (KTH Royal Institute of Technology), Gabriel Poesia (Kempner Institute at Harvard University), Roman Bresson (Mohamed Bin Zayed University of Artificial Intelligence), Karl Henrik Johansson (KTH Royal Institute of Technology), David Broman (KTH Royal Institute of Technology)2026-03-10💻 cs

Retrieving Minimal and Sufficient Reasoning Subgraphs with Graph Foundation Models for Path-aware GraphRAG

Die Arbeit stellt GFM-Retriever vor, einen neuen Ansatz für GraphRAG, der vortrainierte Graph-Foundation-Modelle und ein informationsbottleneck-basiertes Subgraph-Selektionsverfahren nutzt, um in kältestart-Szenarien minimalere und ausreichend informative Begründungsstrukturen für interpretierbares, mehrstufiges Schlussfolgern zu extrahieren.

Haonan Yuan, Qingyun Sun, Junhua Shi, Mingjun Liu, Jiaqi Yuan, Ziwei Zhang, Xingcheng Fu, Jianxin Li2026-03-10💻 cs

FreeFly-Thinking : Aligning Chain-of-Thought Reasoning with Continuous UAV Navigation

Der Artikel stellt FreeFly-Thinking vor, ein End-to-End-Framework für die autonom gesteuerte UAV-Navigation in komplexen Außenbereichen, das durch Chain-of-Thought-Reasoning und eine zweistufige Trainingsstrategie aus überwachtem Feinabstimmen und Reinforcement Learning die Interpretation natürlicher Sprachbefehle in kontinuierliche Flugmanöver verbessert.

Jiaxu Zhou, Shaobo Wang, Zhiyuan Yang, Zhenjun Yu, Tao Li2026-03-10💻 cs

Governance Architecture for Autonomous Agent Systems: Threats, Framework, and Engineering Practice

Diese Arbeit stellt die Layered Governance Architecture (LGA) vor, einen vierstufigen Rahmen zur Abwehr von Ausführungsschicht-Schwachstellen autonomer Agenten, der durch ein umfassendes Benchmark-Testing und experimentelle Ergebnisse belegt wird, dass eine Kombination aus Sandboxing, Intent-Verifikation und Zero-Trust-Autorisierung sowohl hohe Abfangquoten bei bösartigen Tool-Aufrufen als auch geringe Latenzzeiten ermöglicht.

Yuxu Ge2026-03-10💻 cs