LightMedSeg: Lightweight 3D Medical Image Segmentation with Learned Spatial Anchors

Het paper introduceert LightMedSeg, een lichtgewicht 3D-medische beeldsegmentatiearchitectuur die anatomische prioren en adaptieve contextmodelling combineert om met slechts 0,48 miljoen parameters een nauwkeurigheid te bereiken die vergelijkbaar is met zware transformer-modellen, terwijl het tegelijkertijd de rekenkosten en geheugeneisen drastisch verlaagt.

Kavyansh Tyagi, Vishwas Rathi, Puneet Goyal2026-03-10🤖 cs.LG

LEPA: Learning Geometric Equivariance in Satellite Remote Sensing Data with a Predictive Architecture

Het paper introduceert LEPA, een architectuur die de onbetrouwbare latent-space interpolatie vervangt door het direct voorspellen van getransformeerde embeddings op basis van geometrische augmentaties, waardoor de nauwkeurigheid van geometrische aanpassingen in satellietremote sensing-data aanzienlijk wordt verbeterd.

Erik Scheurer, Rocco Sedona, Stefan Kesselheim, Gabriele Cavallaro2026-03-10💻 cs

MAviS: A Multimodal Conversational Assistant For Avian Species

Dit paper introduceert MAviS, een multimodaal conversatie-assistent voor vogelsoorten dat bestaat uit een uitgebreide dataset, een chat-model en een benchmark, en waarmee state-of-the-art resultaten worden behaald voor gedetailleerd begrip en vragenbeantwoording over vogelsoorten in ecologische toepassingen.

Yevheniia Kryklyvets, Mohammed Irfan Kurpath, Sahal Shaji Mullappilly, Jinxing Zhou, Fahad Shabzan Khan, Rao Anwer, Salman Khan, Hisham Cholakkal2026-03-10💻 cs

StructSAM: Structure- and Spectrum-Preserving Token Merging for Segment Anything Models

Het paper introduceert StructSAM, een nieuw token-merging-framework dat de structuur en het spectrum behoudt om de Segment Anything Model (SAM) efficiënter te maken zonder de precisie van randen of prompt-informatie te verliezen.

Duy M. H. Nguyen, Tuan A. Tran, Duong Nguyen, Siwei Xie, Trung Q. Nguyen, Mai T. N. Truong, Daniel Palenicek, An T. Le, Michael Barz, TrungTin Nguyen, Tuan Dam, Ngan Le, Minh Vu, Khoa Doan, Vien Ngo, Pengtao Xie, James Zou, Daniel Sonntag, Jan Peters, Mathias Niepert2026-03-10🤖 cs.LG

Faster-HEAL: An Efficient and Privacy-Preserving Collaborative Perception Framework for Heterogeneous Autonomous Vehicles

Deze paper introduceert Faster-HEAL, een lichtgewicht en privacy-bewust raamwerk dat door middel van low-rank visuele prompts en pyramidale fusie heterogene autonome voertuigen efficiënt aanpast aan een gedeelde perceptie-ruimte, waardoor de detectieprestaties worden verbeterd zonder de privacy te schaden of grote modellen opnieuw te hoeven trainen.

Armin Maleki, Hayder Radha2026-03-10💻 cs

AgrI Challenge: A Data-Centric AI Competition for Cross-Team Validation in Agricultural Vision

De AgrI Challenge introduceert een data-centric AI-framework met Cross-Team Validatie om de generalisatiekloof in landbouwhoogtevisie te overbruggen, waarbij wordt aangetoond dat gezamenlijk trainen op door meerdere teams verzamelde datasets de robuustheid aanzienlijk verbetert ten opzichte van enkelvoudige brontraining.

Mohammed Brahimi, Karim Laabassi, Mohamed Seghir Hadj Ameur, Aicha Boutorh, Badia Siab-Farsi, Amin Khouani, Omar Farouk Zouak, Seif Eddine Bouziane, Kheira Lakhdari, Abdelkader Nabil Benghanem2026-03-10🤖 cs.LG

Prompt-Based Caption Generation for Single-Tooth Dental Images Using Vision-Language Models

Dit artikel presenteert een methode om met Vision-Language Models en gestuurde prompts betekenisvolle bijschriften voor afbeeldingen van individuele tanden te genereren, waarmee een hiaat in bestaande datasets wordt gedicht die vaak beperkt zijn tot het volledige gebit of specifieke aandoeningen.

Anastasiia Sukhanova, Aiden Taylor, Julian Myers, Zichun Wang, Kartha Veerya Jammuladinne, Satya Sri Rajiteswari Nimmagadda, Aniruddha Maiti, Ananya Jana2026-03-10💻 cs