MedQ-Engine: A Closed-Loop Data Engine for Evolving MLLMs in Medical Image Quality Assessment

Il paper presenta MedQ-Engine, un motore di dati a ciclo chiuso che, attraverso un processo iterativo di clustering, annotazione guidata dall'entropia e affinamento, permette a un modello linguistico multimodale di 8 miliardi di parametri di superare GPT-4o e ridurre il divario con gli esperti umani nella valutazione della qualità delle immagini mediche utilizzando solo 10.000 annotazioni.

Jiyao Liu, Junzhi Ning, Wanying Qu, Lihao Liu, Chenglong Ma, Junjun He, Ningsheng Xu2026-03-23💻 cs

SIMPLER: Efficient Foundation Model Adaptation via Similarity-Guided Layer Pruning for Earth Observation

Il paper introduce SIMPLER, un metodo efficiente che riduce i costi computazionali di adattamento dei modelli foundation per l'osservazione terrestre identificando e rimuovendo automaticamente gli strati ridondanti prima del fine-tuning, ottenendo significativi miglioramenti nella velocità di addestramento e inferenza senza compromettere le prestazioni.

Víctor Barreiro, Johannes Jakubik, Francisco Argüello, Dora B. Heras2026-03-23💻 cs

ReconMIL: Synergizing Latent Space Reconstruction with Bi-Stream Mamba for Whole Slide Image Analysis

Il paper presenta ReconMIL, un nuovo framework per l'analisi delle immagini di vetrini interi che combina un modulo di ricostruzione nello spazio latente e un'architettura a doppio flusso basata su Mamba e CNN per colmare il divario di dominio e bilanciare efficacemente l'aggregazione globale e locale delle caratteristiche, superando così gli attuali metodi dello stato dell'arte.

Lubin Gan, Jing Zhang, Heng Zhang, Xin Di, Zhifeng Wang, Wenke Huang, Xiaoyan Sun2026-03-23⚡ eess

RAM: Recover Any 3D Human Motion in-the-Wild

Il paper presenta RAM, un sistema innovativo che combina un tracciatore semantico sensibile al movimento, un modulo HMR temporale potenziato da memoria e un predittore di pose future per ottenere una ricostruzione robusta e coerente del movimento umano 3D in scenari reali complessi, superando lo stato dell'arte in termini di stabilità di tracciamento e accuratezza.

Sen Jia, Ning Zhu, Jinqin Zhong, Jiale Zhou, Huaping Zhang, Jenq-Neng Hwang, Lei Li2026-03-23🤖 cs.AI

HiPath: Hierarchical Vision-Language Alignment for Structured Pathology Report Prediction

Il paper presenta HiPath, un framework leggero di visione-linguaggio che, sfruttando backbones congelati e moduli addestrabili specifici, supera gli approcci esistenti nella generazione di rapporti di patologia strutturati e multi-granulari, ottenendo elevate prestazioni di accuratezza e sicurezza su un vasto dataset clinico reale.

Ruicheng Yuan, Zhenxuan Zhang, Anbang Wang, Liwei Hu, Xiangqian Hua, Yaya Peng, Jiawei Luo, Guang Yang2026-03-23🤖 cs.AI