Adaptive Prototype-based Interpretable Grading of Prostate Cancer

Dit artikel presenteert een nieuw, interpreteerbaar, op prototypes gebaseerd zwak-toezichtend framework voor het automatisch graden van prostaatkanker uit histopathologische beelden, dat door het nabootsen van het pathologisch vergelijkingsproces en het gebruik van dynamische aandachtmechanismen zowel hoge prestaties als vertrouwen biedt voor klinische toepassingen.

Riddhasree Bhattacharyya, Pallabi Dutta, Sushmita Mitra2026-03-06💻 cs

Location-Aware Pretraining for Medical Difference Visual Question Answering

Deze paper introduceert een locatiebewust pretrainingsframework met specifieke taken zoals automatisch verwijzende expressies en grounded captioning, dat een verbeterde visuele encoder leert om subtiele verschillen in medische beelden te detecteren en zo state-of-the-art prestaties bereikt voor differentiële visuele vraag-antwoordtaken op thoraxröntgenfoto's.

Denis Musinguzi, Caren Han, Prasenjit Mitra2026-03-06🤖 cs.AI

VisionPangu: A Compact and Fine-Grained Multimodal Assistant with 1.7B Parameters

VisionPangu is een compact multimodaal model van 1,7 miljard parameters dat, door gebruik te maken van een InternVL-visionencoder, de OpenPangu-taalbackbone en gedetailleerde menselijke beschrijvingen uit het DOCCI-dataset, concurrerende prestaties levert bij het genereren van gestructureerde en rijke afbeeldingsbeschrijvingen zonder afhankelijk te zijn van agressieve schaalvergroting.

Jiaxin Fan, Wenpo Song2026-03-06💬 cs.CL

TAPFormer: Robust Arbitrary Point Tracking via Transient Asynchronous Fusion of Frames and Events

TAPFormer is een transformer-gebaseerd framework dat door middel van een innovatieve mechanisme voor transiënte asynchrone fusie en cross-modale lokaal gewogen fusie robuuste en nauwkeurige tracking van willekeurige punten realiseert door RGB-beelden en event-stromen adaptief te combineren, zelfs onder uitdagende omstandigheden zoals bewegingsonscherpte en slechte verlichting.

Jiaxiong Liu, Zhen Tan, Jinpu Zhang + 4 more2026-03-06💻 cs

Physics-consistent deep learning for blind aberration recovery in mobile optics

Deze paper introduceert Lens2Zernike, een deep learning-framework dat fysiek consistente optische parameters blind herstelt uit enkele wazige mobiele foto's door supervisie te combineren over Zernike-coëfficiënten, golfvoorde-afgeleiden en ruimtelijke kaarten, wat leidt tot een aanzienlijk verbeterde en stabielere herstelkwaliteit vergeleken met bestaande methoden.

Kartik Jhawar, Tamo Sancho Miguel Tandoc, Khoo Jun Xuan + 1 more2026-03-06💻 cs

How far have we gone in Generative Image Restoration? A study on its capability, limitations and evaluation practices

Dit artikel presenteert een uitgebreide studie over Generatieve Beeldherstel die, via een nieuwe multidimensionale evaluatie, aantoont dat het veld is verschoven van het oplossen van detailtekort naar het beheersen van overgeneratie en semantische controle, terwijl het ook een nieuwe IQA-model introduceert die beter aansluit bij menselijke perceptie.

Xiang Yin, Jinfan Hu, Zhiyuan You + 4 more2026-03-06💻 cs

Exploiting Intermediate Reconstructions in Optical Coherence Tomography for Test-Time Adaption of Medical Image Segmentation

Deze paper introduceert IRTTA, een methode die tijdens de testtijd de informatieve tussenstappen van iteratieve reconstructie in optische coherentietomografie benut om de segmentatieprestaties van een bevroren model te verbeteren en onzekerheid te schatten zonder de reconstructie of het oorspronkelijke model aan te passen.

Thomas Pinetz, Veit Hucke, Hrvoje Bogunovic2026-03-06💻 cs