cs Arbeiten | Gist.Science

PDD: Manifold-Prior Diverse Distillation for Medical Anomaly Detection

Die Arbeit stellt PDD (Manifold-Prior Diverse Distillation) vor, ein neuartiges Framework für die medizinische Anomalieerkennung, das durch die Vereinigung komplementärer Lehrer-Modelle in einem gemeinsamen Manifold und eine diverse Wissensdistillation in zwei Schüler-Netzwerke signifikant höhere Genauigkeiten als bestehende State-of-the-Art-Methoden auf verschiedenen medizinischen Datensätzen erzielt.

Xijun Lu, Hongying Liu, Fanhua Shang, Yanming Hui, Liang Wan2026-03-10💻 cs

Tutorial on Aided Inertial Navigation Systems: A Modern Treatment Using Lie-Group Theoretical Methods

Dieser Tutorial-Artikel bietet eine anwendungsorientierte Einführung in gestützte Inertialnavigationssysteme, indem er eine geometrische Formulierung auf Basis der verallgemeinerten Special-Euclidean-Gruppe SE₂(3) verwendet, um die Fusion von Inertialmessungen mit Hilfsdaten unter expliziter Berücksichtigung von Invarianz und Symmetrie zu erläutern und dabei moderne Erweiterungen wie äquivariante Filtermethoden vorzustellen.

Soulaimane Berkane2026-03-10💻 cs

CanoVerse: 3D Object Scalable Canonicalization and Dataset for Generation and Pose

Das Paper stellt CanoVerse vor, einen neuartigen, hochskalierbaren Datensatz mit 320.000 kanonisch ausgerichteten 3D-Objekten und einem effizienten Framework zur automatisierten Ausrichtung, der die Stabilität der 3D-Generierung verbessert und präzise, posekonsistente Semantik für verschiedene Anwendungen ermöglicht.

Li Jin, Yuchen Yang, Weikai Chen, Yujie Wang, Dehao Hao, Tanghui Jia, Yingda Yin, Zeyu Hu, Runze Zhang, Keyang Luo, Li Yuan, Long Quan, Xin Wang, Xueying Qin2026-03-10💻 cs

LiveWorld: Simulating Out-of-Sight Dynamics in Generative Video World Models

Die Arbeit stellt LiveWorld vor, ein neues Framework für generative Videoweltmodelle, das das Problem der „außerhalb des Sichtfelds liegenden Dynamik" löst, indem es einen persistenten globalen Zustand einführt, der es Objekten erlaubt, auch außerhalb des Kamerablickfelds weiterzuentwickeln und so eine konsistente 4D-Welt-Simulation zu ermöglichen.

Zicheng Duan, Jiatong Xia, Zeyu Zhang, Wenbo Zhang, Gengze Zhou, Chenhui Gou, Yefei He, Feng Chen, Xinyu Zhang, Lingqiao Liu2026-03-10💻 cs

Transition State Theory for Network Dynamics

Diese Arbeit stellt einen Rahmen vor, der die Transition State Theory mit der dynamischen Netzwerkanalyse verbindet, um diskrete strukturelle Veränderungen wie Fraktionsneuausrichtungen in kleinen Gruppen zu charakterisieren und unter bestimmten Annahmen sogar aus Querschnittsdaten vorherzusagen.

Carter T. Butts2026-03-10💻 cs

NarrativeLoom: Enhancing Creative Storytelling through Multi-Persona Collaborative Improvisation

Die Studie stellt NarrativeLoom vor, ein von der Theorie der blinden Variation und selektiven Retention inspiriertes KI-System, das durch den Einsatz spezialisierter Personas und menschlicher Kuratierung die Kreativität, Vielfalt und Qualität von gemeinsam erdachten Geschichten signifikant steigert, wobei Anfänger besonders von der strukturierten Unterstützung profitieren.

Yuxi Ma, Yongqian Peng, Fengyuan Yang, Siyu Zha, Chi Zhang, Zixia Jia, Zilong Zheng, Yixin Zhu2026-03-10💻 cs

Improving reasoning at inference time via uncertainty minimisation

Diese Arbeit stellt eine effiziente Inferenzzeit-Methode vor, die das logische Schlussfolgern von großen Sprachmodellen durch die Maximierung der internen Selbstgewissheit auf Ebene einzelner Gedankenschritte verbessert und dabei bestehende Ansätze wie Greedy Decoding oder Self-Consistency bei geringeren Token-Kosten übertrifft.

Nicolas Legrand, Kenneth Enevoldsen, Márton Kardos, Kristoffer Nielbo2026-03-10💻 cs

PromptGate Client Adaptive Vision Language Gating for Open Set Federated Active Learning

Das Paper stellt PromptGate vor, ein adaptives, auf Vision-Language-Modellen basierendes Framework für das offene Set im föderierten aktiven Lernen, das durch dynamische, kontextspezifische Prompts die Reinheit der Datenpools in ressourcenbeschränkten medizinischen Umgebungen sichert und so die Annotationseffizienz bei gleichzeitiger Wahrung der Patientendatenschutz erhöht.

Adea Nesturi, David Dueñas Gaviria, Jiajun Zeng, Shadi Albarqouni2026-03-10💻 cs

RoTri-Diff: A Spatial Robot-Object Triadic Interaction-Guided Diffusion Model for Bimanual Manipulation

Der Artikel stellt RoTri-Diff vor, ein diffusionsbasiertes Imitationslernframework, das durch die explizite Modellierung der räumlichen triadischen Interaktion zwischen zwei Roboterarmen und einem Objekt stabile und kollisionsfreie bimanuelle Manipulationsaufgaben in Simulation und Realität verbessert.

Zixuan Chen, Nga Teng Chan, Yiwen Hou, Chenrui Tie, Zixuan Liu, Haonan Chen, Junting Chen, Jieqi Shi, Yang Gao, Jing Huo, Lin Shao2026-03-10💻 cs

ACD-U: Asymmetric co-teaching with machine unlearning for robust learning with noisy labels

Die Arbeit stellt ACD-U vor, ein asymmetrisches Co-Teaching-Framework, das durch die Kombination eines CLIP-vorabtrainierten Vision-Transformers mit einem CNN sowie den Einsatz von Machine Unlearning zur aktiven Korrektur von Fehlerklassifizierungen einen neuen State-of-the-Art bei der robusten Verarbeitung von Daten mit verrauschten Labels erreicht.

Reo Fukunaga, Soh Yoshida, Mitsuji Muneyasu2026-03-10💻 cs

Class Visualizations and Activation Atlases for Enhancing Interpretability in Deep Learning-Based Computational Pathology

Diese Studie entwickelt und bewertet einen Visualisierungsrahmen für Transformer-Modelle in der computergestützten Pathologie, der zeigt, dass Klassenvisualisierungen und Aktivationsatlanten zwar morphologische Strukturen auf Gewebeebene gut abbilden, jedoch bei feineren Krebs-Subklassen eine mit der intrinsischen pathologischen Komplexität korrelierende reduzierte Trennschärfe und Experteneinigkeit aufweisen.

Marco Gustav, Fabian Wolf, Christina Glasner, Nic G. Reitsam, Stefan Schulz, Kira Aschenbroich, Bruno Märkl, Sebastian Foersch, Jakob Nikolas Kather2026-03-10💻 cs

Learning to Rank the Initial Branching Order of SAT Solvers

Diese Arbeit untersucht den Einsatz von Graph Neural Networks zur Vorhersage eines initialen Verzweigungsordnungs für SAT-Löser, wobei zwar signifikante Beschleunigungen bei zufälligen und pseudo-industriellen Instanzen erzielt werden, die Vorhersagen jedoch bei komplexen industriellen Problemen aufgrund der dynamischen Heuristiken der Solver und der Schwierigkeit der Instanzen versagen.

Arvid Eriksson (KTH Royal Institute of Technology), Gabriel Poesia (Kempner Institute at Harvard University), Roman Bresson (Mohamed Bin Zayed University of Artificial Intelligence), Karl Henrik Johansson (KTH Royal Institute of Technology), David Broman (KTH Royal Institute of Technology)2026-03-10💻 cs

Retrieving Minimal and Sufficient Reasoning Subgraphs with Graph Foundation Models for Path-aware GraphRAG

Die Arbeit stellt GFM-Retriever vor, einen neuen Ansatz für GraphRAG, der vortrainierte Graph-Foundation-Modelle und ein informationsbottleneck-basiertes Subgraph-Selektionsverfahren nutzt, um in kältestart-Szenarien minimalere und ausreichend informative Begründungsstrukturen für interpretierbares, mehrstufiges Schlussfolgern zu extrahieren.

Haonan Yuan, Qingyun Sun, Junhua Shi, Mingjun Liu, Jiaqi Yuan, Ziwei Zhang, Xingcheng Fu, Jianxin Li2026-03-10💻 cs

FreeFly-Thinking : Aligning Chain-of-Thought Reasoning with Continuous UAV Navigation

Der Artikel stellt FreeFly-Thinking vor, ein End-to-End-Framework für die autonom gesteuerte UAV-Navigation in komplexen Außenbereichen, das durch Chain-of-Thought-Reasoning und eine zweistufige Trainingsstrategie aus überwachtem Feinabstimmen und Reinforcement Learning die Interpretation natürlicher Sprachbefehle in kontinuierliche Flugmanöver verbessert.

Jiaxu Zhou, Shaobo Wang, Zhiyuan Yang, Zhenjun Yu, Tao Li2026-03-10💻 cs

From State Changes to Creative Decisions: Documenting and Interpreting Traces Across Creative Domains

Die Arbeit stellt drei komplementäre Ansätze vor, um in kreativen Domänen wie GenAI, Visualisierung und Programmierung nicht nur Zustandsänderungen zu erfassen, sondern auch die dahinterliegenden kreativen Absichten und Zusammenhänge zu bewahren und interpretierbar zu machen.

Xiaohan Peng, Sotiris Piliouras, Carl Abou Saada Nujaim2026-03-10💻 cs

Student Preferences for Online Interaction Platforms in Blended Learning: A Mixed-Methods Study

Diese Mixed-Methods-Studie an einer ghanaischen Universität zeigt, dass Studierende in hybriden Lernumgebungen Instant-Messaging-Plattformen wie WhatsApp und Telegram institutionellen Lernmanagementsystemen vorziehen, da sie diese als bequemer, benutzerfreundlicher und besser für die Echtzeitkommunikation geeignet empfinden.

Lois Fajuyigbe, Kaisu Mumuni, Felix Nti Koranteng2026-03-10💻 cs

Governance Architecture for Autonomous Agent Systems: Threats, Framework, and Engineering Practice

Diese Arbeit stellt die Layered Governance Architecture (LGA) vor, einen vierstufigen Rahmen zur Abwehr von Ausführungsschicht-Schwachstellen autonomer Agenten, der durch ein umfassendes Benchmark-Testing und experimentelle Ergebnisse belegt wird, dass eine Kombination aus Sandboxing, Intent-Verifikation und Zero-Trust-Autorisierung sowohl hohe Abfangquoten bei bösartigen Tool-Aufrufen als auch geringe Latenzzeiten ermöglicht.

Yuxu Ge2026-03-10💻 cs

FastSTAR: Spatiotemporal Token Pruning for Efficient Autoregressive Video Synthesis

Das Paper stellt FastSTAR vor, ein training-freies Beschleunigungsframework für die autoregressive Videosynthese, das durch spatiotemporales Token-Pruning und partielle Updates redundante Berechnungen eliminiert und so eine bis zu 2,01-fache Geschwindigkeitssteigerung bei minimaler Qualitätsverlust erreicht.

Sungwoong Yune, Suheon Jeong, Joo-Young Kim2026-03-10💻 cs

$\textbf{Re}^{2}$ : Unlocking LLM Reasoning via Reinforcement Learning with Re-solving

Die Arbeit stellt Re² vor, eine Reinforcement-Learning-Methode, die Large Language Models befähigt, unproduktive Denkpfade zu erkennen und durch Neustarts zu ersetzen, wodurch die Effizienz und Genauigkeit von Schlussfolgerungen im Vergleich zu herkömmlichen RLVR-Ansätzen erheblich gesteigert wird.

Pinzheng Wang, Shuli Xu, Juntao Li, Yu Luo, Dong Li, Jianye Hao, Min Zhang2026-03-10💻 cs

Vision-Guided MPPI for Agile Drone Racing: Navigating Arbitrary Gate Poses via Neural Signed Distance Fields

Die vorgestellte Arbeit stellt ein vollständig onboardes, visuell geführtes Regelungsframework vor, das mithilfe eines neuartigen neuronalen Signed-Distance-Fields (Gate-SDF) und eines MPPI-Controllers agile Drohnenflüge durch beliebig platzierte und orientierte Tore ohne vordefinierte Referenzpfade ermöglicht.

Fangguo Zhao, Hanbing Zhang, Zhouheng Li, Xin Guan, Shuo Li2026-03-10💻 cs

← Zurück Weiter →

cs