EfficientPosterGen: Semantic-aware Efficient Poster Generation via Token Compression and Accurate Violation Detection

Il paper presenta EfficientPosterGen, un framework end-to-end che ottimizza la generazione automatica di poster accademici attraverso il recupero semantico delle informazioni chiave, la compressione del contesto visivo per ridurre i token e un algoritmo deterministico per il rilevamento delle violazioni del layout, garantendo così maggiore efficienza e affidabilità rispetto ai modelli esistenti.

Wenxin Tang, Jingyu Xiao, Yanpei Gong + 6 more2026-03-03🤖 cs.AI

BiCLIP: Bidirectional and Consistent Language-Image Processing for Robust Medical Image Segmentation

Il paper introduce BiCLIP, un framework innovativo per la segmentazione delle immagini mediche che, grazie a un meccanismo di fusione multimodale bidirezionale e a un obiettivo di coerenza di augmentazione, garantisce prestazioni superiori e una maggiore robustezza in scenari clinici reali caratterizzati da scarse annotazioni e degrado delle immagini.

Saivan Talaei, Fatemeh Daneshfar, Abdulhady Abas Abdullah + 1 more2026-03-03💻 cs

GazeXPErT: An Expert Eye-tracking Dataset for Interpretable and Explainable AI in Oncologic FDG-PET/CT Scans

Il paper presenta GazeXPErT, un dataset 4D di tracciamento oculare di esperti su scansioni FDG-PET/CT oncologiche che, sincronizzando i pattern di ricerca umana con le immagini, mira a migliorare l'interpretabilità, l'accuratezza e l'integrazione nel flusso di lavoro dei modelli di intelligenza artificiale per la segmentazione e la localizzazione delle lesioni tumorali.

Joy T Wu, Daniel Beckmann, Sarah Miller + 15 more2026-03-03⚡ eess

A Boundary-Metric Evaluation Protocol for Whiteboard Stroke Segmentation Under Extreme Imbalance

Questo lavoro propone un protocollo di valutazione basato su metriche di confine e analisi di equità tra sottoinsiemi per affrontare lo squilibrio estremo nella segmentazione di tratti alla lavagna, dimostrando che le funzioni di perdita basate sulla sovrapposizione e l'addestramento ad alta risoluzione migliorano significativamente le prestazioni rispetto ai metodi classici, offrendo al contempo una maggiore affidabilità nei casi peggiori.

Nicholas Korcynski2026-03-03🤖 cs.LG

ConFoThinking: Consolidated Focused Attention Driven Thinking for Visual Question Answering

Il paper propone ConFoThinking, un framework per il Visual Question Answering che migliora la percezione visiva aggregando i segnali di attenzione in uno strato intermedio e utilizzando cue semantici concisi per identificare e ingrandire le regioni di interesse, superando così le limitazioni dei metodi basati su grounding o su estrazione di attenzione frammentata.

Zhaodong Wu, Haochen Xue, Qi Cao + 5 more2026-03-03💻 cs

Efficient Long-Horizon GUI Agents via Training-Free KV Cache Compression

Il paper propone ST-Lite, un framework di compressione della cache KV senza addestramento che, sfruttando la sparsità uniforme dell'attenzione nelle interfacce grafiche attraverso un'analisi combinata di salienza spaziale e semantica della traiettoria, riduce drasticamente l'uso di memoria e accelera l'elaborazione degli agenti GUI a lungo termine mantenendo alte prestazioni.

Bowen Zhou, Zhou Xu, Wanli Li + 2 more2026-03-03🤖 cs.LG

Task-Driven Subspace Decomposition for Knowledge Sharing and Isolation in LoRA-based Continual Learning

Il paper propone LoDA, un metodo per l'apprendimento continuo basato su LoRA che migliora la condivisione e l'isolamento delle conoscenze attraverso una decomposizione dei sottospazi guidata dal task e un'ottimizzazione allineata al gradiente, superando i limiti delle tecniche esistenti che trascurano le direzioni condivise e le direzioni specifiche efficaci.

Lingfeng He, De Cheng, Huaijie Wang + 3 more2026-03-03🤖 cs.LG