WikiCLIP: An Efficient Contrastive Baseline for Open-domain Visual Entity Recognition

Das Paper stellt WikiCLIP vor, einen effizienten kontrastiven Rahmen für die offene visuelle Entitätserkennung, der durch den Einsatz von LLM-Embeddings, einem Vision-Guided Knowledge Adaptor und einer Hard-Negative-Synthese eine signifikante Leistungssteigerung bei gleichzeitig drastisch reduzierter Inferenzlatenz im Vergleich zu generativen Modellen erzielt.

Shan Ning, Longtian Qiu, Jiaxuan Sun, Xuming He2026-03-11💻 cs

Unsupervised Domain Adaptation with Target-Only Margin Disparity Discrepancy

Die Arbeit stellt einen neuartigen Ansatz für das unüberwachte Domänen-Adaptionslernen vor, der auf einer reformulierten Margin-Disparity-Discrepancy-Methode basiert, um die Segmentierung der Leber in interventionalen CBCT-Bildern durch die Nutzung annotierter CT-Daten zu verbessern und dabei den Mangel an annotierten CBCT-Daten zu überwinden.

Gauthier Miralles, Loïc Le Folgoc, Vincent Jugnon, Pietro Gori2026-03-11💻 cs

Leveraging whole slide difficulty in Multiple Instance Learning to improve prostate cancer grading

Diese Arbeit führt das Konzept der „Whole Slide Difficulty" (WSD) ein, das auf der Meinungsverschiedenheit zwischen Experten und Nicht-Experten basiert, und zeigt, dass die Integration dieser Schwierigkeitsmetrik in Multi-Instance-Learning-Modelle die Genauigkeit der Prostatakrebs-Grading insbesondere bei höheren Gleason-Graden verbessert.

Marie Arrivat, Rémy Peyret, Elsa Angelini, Pietro Gori2026-03-11💻 cs

Kinodynamic Motion Retargeting for Humanoid Locomotion via Multi-Contact Whole-Body Trajectory Optimization

Die Arbeit stellt KDMR vor, ein neuartiges Framework für die kinodynamische Bewegungsnachbildung bei humanoiden Robotern, das durch die Formulierung als multi-kontaktbasierte Ganzkörper-Trajektorienoptimierung physikalisch konsistente und dynamisch machbare Bewegungsabläufe erzeugt, die rein kinematischen Methoden überlegen sind und die Effizienz sowie Stabilität nachgelagerter Lernstrategien signifikant verbessern.

Xiaoyu Zhang, Steven Haener, Varun Madabushi, Maegan Tucker2026-03-11💻 cs

TiPToP: A Modular Open-Vocabulary Planning System for Robotic Manipulation

Das Paper stellt TiPToP vor, ein modulares Open-Vocabulary-Planungssystem für Roboter, das vortrainierte Vision-Modelle mit einem Task-and-Motion-Planer kombiniert, um komplexe Manipulationsaufgaben allein aus RGB-Bildern und Sprachbefehlen zu lösen, ohne dass roboterspezifische Trainingsdaten erforderlich sind.

William Shen, Nishanth Kumar, Sahit Chintalapudi, Jie Wang, Christopher Watson, Edward Hu, Jing Cao, Dinesh Jayaraman, Leslie Pack Kaelbling, Tomás Lozano-Pérez2026-03-11💻 cs

A Robust Multi-Item Auction Design with Statistical Learning

Die Autoren stellen eine neuartige statistische Lernmethode für Multi-Item-Auktionen vor, die auf nichtparametrischer Dichteschätzung und Konfidenzintervallen basiert, um durch zwei effiziente Strategien die Implementierungskosten zu senken und gleichzeitig hohe Wahrscheinlichkeiten für Fairness, Anreizkompatibilität und individuelle Rationalität bei gleichzeitiger Umsatzmaximierung zu gewährleisten.

Jiale Han, Xiaowu Dai2026-03-10💻 cs

Class Overwhelms: Mutual Conditional Blended-Target Domain Adaptation

Die vorgestellte Arbeit schlägt einen mutual-conditional-Ansatz für die Blended-Target-Domain-Adaptation vor, der durch einen unsicherheitsgesteuerten Kategoriediskriminator und die Erweiterung von Low-Level-Features eine gegenseitige Ausrichtung der Verteilungen P(ZY)P(Z|Y) und P(YZ)P(Y|Z) erreicht, um die Leistung bei Label-Verteilungsverschiebungen ohne explizite Domänenlabels zu verbessern.

Pengcheng Xu, Boyu Wang, Charles Ling2026-03-10💻 cs