MobileFetalCLIP: Selective Repulsive Knowledge Distillation for Mobile Fetal Ultrasound Analysis

Die Arbeit stellt MobileFetalCLIP vor, einen effizienten 11,4-Millionen-Parameter-Studenten-Modell, das durch eine neuartige selektive repulsive Wissensdistillation trainiert wird und damit einen 304-Millionen-Parameter-Lehrer bei der Analyse fetaler Ultraschallbilder übertrifft, was eine Echtzeit-Anwendung auf mobilen Geräten in ressourcenarmen Umgebungen ermöglicht.

Numan Saeed, Fadillah Adamsyah Maani, Mohammad Yaqub2026-03-06🤖 cs.AI

SAIL: Similarity-Aware Guidance and Inter-Caption Augmentation-based Learning for Weakly-Supervised Dense Video Captioning

Die Arbeit stellt SAIL vor, einen neuartigen Ansatz für das schwach überwachte dichte Videocaptioning, der semantisch bewusste Masken durch cross-modale Ausrichtung und eine LLM-basierte Erweiterung mit synthetischen Untertiteln nutzt, um die zeitliche Lokalisierung und Beschreibung von Ereignissen in Videos signifikant zu verbessern.

Ye-Chan Kim, SeungJu Cha, Si-Woo Kim + 3 more2026-03-06🤖 cs.AI

NaiLIA: Multimodal Nail Design Retrieval Based on Dense Intent Descriptions and Palette Queries

Das Paper stellt NaiLIA vor, ein multimodales Suchverfahren für Nageldesigns, das dichte Absichtsbeschreibungen und Farbpaletten-Abfragen integriert, um die Herausforderungen bei der präzisen Bildsuche zu bewältigen, und durch ein neues Benchmark-Dataset sowie experimentelle Ergebnisse seine Überlegenheit gegenüber Standardmethoden nachweist.

Kanon Amemiya, Daichi Yashima, Kei Katsumata + 4 more2026-03-06💻 cs

Beyond Scattered Acceptance: Fast and Coherent Inference for DLMs via Longest Stable Prefixes

Die vorgestellte Arbeit stellt den Longest Stable Prefix (LSP)-Scheduler vor, eine trainingsfreie und modellunabhängige Methode, die durch die atomare Absorption zusammenhängender, stabiler Präfixe die Fragmentierung des KV-Caches vermeidet und die Inferenzgeschwindigkeit von Diffusionssprachmodellen um bis zu 3,4-fach steigert, ohne dabei die Ausgabequalität zu beeinträchtigen.

Pengxiang Li, Joey Tsai, Hongwei Xue + 2 more2026-03-06💻 cs

Volley Revolver: A Novel Matrix-Encoding Method for Privacy-Preserving Neural Networks (Inference)

Die Autoren stellen eine neuartige Matrix-Kodierungsmethode namens „Volley Revolver" vor, die es ermöglicht, eine convolutional Neural Network für die Klassifizierung handschriftlicher Bilder effizient und datenschutzkonform unter Verwendung von homomorpher Verschlüsselung durchzuführen, wobei 32 verschlüsselte MNIST-Bilder auf einer öffentlichen Cloud in etwa 287 Sekunden verarbeitet werden.

John Chiang2026-03-05💻 cs