WS-Net: Weak-Signal Representation Learning and Gated Abundance Reconstruction for Hyperspectral Unmixing via State-Space and Weak Signal Attention Fusion

Dit paper introduceert WS-Net, een diep leerframework dat state-space-modelling en een zwak-signaal-attentie-mechanisme combineert om de nauwkeurigheid van hyperspectrale ontbinding te verbeteren door zwakke signaalresponsen effectief te isoleren van dominante eindleden en ruis.

Zekun Long, Ali Zia, Guanyiman Fu, Vivien Rolland, Jun Zhou2026-03-11🤖 cs.AI

Reading, Not Thinking: Understanding and Bridging the Modality Gap When Text Becomes Pixels in Multimodal LLMs

Dit onderzoek analyseert de prestatieverschillen tussen tekst en afbeeldingen in multimodale taalmodellen, identificeert de oorzaken van deze 'modale kloof' en stelt een zelfdistillatiemethode voor die de nauwkeurigheid bij het lezen van tekst in afbeeldingen aanzienlijk verbetert zonder kennisverlies.

Kaiser Sun, Xiaochuang Yuan, Hongjun Liu, Chen Zhao, Cheng Zhang, Mark Dredze, Fan Bai2026-03-11💬 cs.CL

Training-free Motion Factorization for Compositional Video Generation

Deze paper introduceert een trainingsvrij raamwerk voor compositievideo-generatie dat complexe beweging ontbindt in statische, rigide en niet-rigide categorieën via een 'planning-voor-generatie'-paradigma, waardoor diverse objecten met gecontroleerde bewegingen en uiterlijk kunnen worden gegenereerd zonder bestaande diffusion-modellen te hoeven hertrainen.

Zixuan Wang, Ziqin Zhou, Feng Chen, Duo Peng, Yixin Hu, Changsheng Li, Yinjie Lei2026-03-11💻 cs

Composed Vision-Language Retrieval for Skin Cancer Case Search via Joint Alignment of Global and Local Representations

Dit artikel introduceert een transformer-gebaseerd raamwerk voor het zoeken naar huidkankergevallen via samengestelde visueel-taalqueries, dat door middel van gezamenlijke globale en lokale uitlijning klinisch relevante case-gegevens efficiënter en nauwkeuriger identificeert dan bestaande methoden.

Yuheng Wang, Yuji Lin, Dongrun Zhu, Jiayue Cai, Sunil Kalia, Harvey Lui, Chunqi Chang, Z. Jane Wang, Tim K. Lee2026-03-11🤖 cs.AI

VIVID-Med: LLM-Supervised Structured Pretraining for Deployable Medical ViTs

VIVID-Med introduceert een efficiënt kader voor het vooraf trainen van medische vision transformers met behulp van een bevroren groot taalmodel als gestructureerde leraar, wat resulteert in een lichtgewicht, alleen-vision model dat aanzienlijk betere prestaties levert dan bestaande methoden met minder data en zonder de zware taalmodelcomponent tijdens het gebruik.

Xiyao Wang, Xiaoyu Tan, Yang Dai, Yuxuan Fu, Shuo Li, Xihe Qiu2026-03-11🤖 cs.AI

Transformer-Based Multi-Region Segmentation and Radiomic Analysis of HR-pQCT Imaging

Deze studie introduceert een volledig geautomatiseerd framework dat gebruikmaakt van een transformer-gebaseerd SegFormer-model voor multi-regionale segmentatie van HR-pQCT-beelden, waarmee radiomische kenmerken uit zachte weefsels worden ontleend die de prestaties van osteoporosedetectie significant verbeteren ten opzichte van traditionele botgebaseerde methoden.

Mohseu Rashid Subah, Mohammed Abdul Gani Zilani, Thomas L. Nickolas, Matthew R. Allen, Stuart J. Warden, Rachel K. Surowiec2026-03-11💻 cs

Agentic AI as a Network Control-Plane Intelligence Layer for Federated Learning over 6G

Dit paper introduceert een Agentic AI-systeem dat als intelligente besturingslaag fungeert voor federatief leren in 6G-netwerken, waarbij gespecialiseerde agenten dynamisch taken zoals cliëntselectie en hulpbronnenallocatie optimaliseren op basis van netwerkomstandigheden en apparaatcapaciteiten.

Loc X. Nguyen, Ji Su Yoon, Huy Q. Le, Yu Qiao, Avi Deb Raha, Eui-Nam Huh, Nguyen H. Tran, Choong Seon Hong2026-03-11💻 cs

RubiCap: Rubric-Guided Reinforcement Learning for Dense Image Captioning

RubiCap is een nieuw reinforcement learning-framework dat de uitdagingen van dichte beeldbeschrijving oplost door gebruik te maken van door LLM's geschreven rubrieken voor gestructureerde, veelzijdige beloningssignalen, waardoor het superieure resultaten bereikt ten opzichte van bestaande methoden en zelfs modellen die zijn getraind op data van propriëtaire modellen.

Tzu-Heng Huang, Sirajul Salekin, Javier Movellan, Frederic Sala, Manjot Bilkhu2026-03-11🤖 cs.AI

POLISH'ing the Sky: Wide-Field and High-Dynamic Range Interferometric Image Reconstruction with Application to Strong Lens Discovery

Dit artikel introduceert een verbeterde deep-learning-methode, POLISH, voor radio-interferometrische beeldreconstructie die door middel van patch-wise training en een niet-lineaire intensiteitstransformatie robuust is voor realistische omstandigheden en de ontdekking van sterke gravitationele lenzen aanzienlijk verbetert.

Zihui Wu, Liam Connor, Samuel McCarty, Katherine L. Bouman2026-03-11🔭 astro-ph