Layer-wise Instance Binding for Regional and Occlusion Control in Text-to-Image Diffusion Transformers

Het paper introduceert LayerBind, een trainingsvrije methode voor Diffusion Transformers die door het modelleren van regionale generatie als distincte lagen en het binden daarvan tijdens het generatieproces, nauwkeurige controle biedt over de lay-out en het occlusie-ordening van afbeeldingen zonder kwaliteitsverlies.

Ruidong Chen, Yancheng Bai, Xuanpu Zhang, Jianhao Zeng, Lanjun Wang, Dan Song, Lei Sun, Xiangxiang Chu, Anan Liu2026-03-09💻 cs

Training-free Latent Inter-Frame Pruning with Attention Recovery

Dit paper introduceert LIPAR, een trainingsvrij kader dat de rekentijd voor videogeneratie verlaagt door tijdsredundantie in latente patches te omzeilen en een nieuwe Attention Recovery-mechanisme te gebruiken om visuele artefacten te voorkomen, waardoor de doorvoer met 1,45 keer toeneemt zonder kwaliteitsverlies.

Dennis Menn, Yuedong Yang, Bokun Wang, Xiwen Wei, Mustafa Munir, Feng Liang, Radu Marculescu, Chenfeng Xu, Diana Marculescu2026-03-09💻 cs

Architectural Unification for Polarimetric Imaging Across Multiple Degradations

Dit artikel introduceert een unificerend architecturaal raamwerk dat door middel van enkelvoudige, fysisch consistente beeld-Stokes-verwerking state-of-the-art prestaties bereikt bij het herstellen van gepolariseerde beelden die lijden aan diverse degradaties zoals ruis, bewegingsonscherpte en mosaïekartefacten.

Chu Zhou, Yufei Han, Junda Liao, Linrui Dai, Wangze Xu, Art Subpa-Asa, Heng Guo, Boxin Shi, Imari Sato2026-03-09💻 cs

Evolving Medical Imaging Agents via Experience-driven Self-skill Discovery

Dit paper introduceert MACRO, een zelfevoluerend medisch agent dat door ervaring gedreven zelfontdekking dynamisch nieuwe samengestelde hulpmiddelen creëert uit succesvolle uitvoeringstrajecten, waardoor de robuustheid en generalisatie van medische beeldinterpretatie aanzienlijk verbetert ten opzichte van statische systemen.

Lin Fan, Pengyu Dai, Zhipeng Deng, Haolin Wang, Xun Gong, Yefeng Zheng, Yafei Ou2026-03-09🤖 cs.AI

TumorChain: Interleaved Multimodal Chain-of-Thought Reasoning for Traceable Clinical Tumor Analysis

Deze paper introduceert TumorChain, een multimodaal raamwerk met verweven redenering en een groot dataset genaamd TumorCoT, dat stap-voor-stap klinische tumoranalyse op basis van 3D CT-scans mogelijk maakt om de traceerbaarheid te vergroten en diagnostische fouten te verminderen.

Sijing Li, Zhongwei Qiu, Jiang Liu, Wenqiao Zhang, Tianwei Lin, Yihan Xie, Jianxiang An, Boxiang Yun, Chenglin Yang, Jun Xiao, Guangyu Guo, Jiawen Yao, Wei Liu, Yuan Gao, Ke Yan, Weiwei Cao, Zhilin Zheng, Tony C. W. Mok, Kai Cao, Yu Shi, Jiuyu Zhang, Jian Zhou, Beng Chin Ooi, Yingda Xia, Ling Zhang2026-03-09💻 cs

Shifting Adaptation from Weight Space to Memory Space: A Memory-Augmented Agent for Medical Image Segmentation

Dit paper introduceert MemSeg-Agent, een nieuw paradigma voor medische beeldsegmentatie dat adaptatie verschuift van gewichtsruimte naar geheugenruimte om via een geïntegreerde architectuur met dynamisch samengestelde geheugeneenheden few-shot learning, federated learning en test-tijd aanpassing mogelijk te maken zonder zware communicatiekosten of fine-tuning.

Bowen Chen, Qiaohui Gao, Shaowen Wan, Shanhui Sun, Wei Liu, Xiang Li, Tianming Liu, Lin Zhao2026-03-09💻 cs