SAPNet++: Evolving Point-Prompted Instance Segmentation with Semantic and Spatial Awareness

Il paper propone SAPNet++, un'architettura che risolve le ambiguità di granularità e l'incertezza dei confini nella segmentazione istanziale guidata da punti singoli integrando guida basata sulla distanza, mining di box, una strategia di selezione delle proposte arricchita da punteggi di completezza spaziale (S-MIL) e affinamento multi-livello dell'affinità.

Zhaoyang Wei, Xumeng Han, Xuehui Yu + 4 more2026-02-26💻 cs

Meta-FC: Meta-Learning with Feature Consistency for Robust and Generalizable Watermarking

Il paper propone Meta-FC, un nuovo approccio di meta-apprendimento con coerenza delle caratteristiche che supera i limiti della strategia SRD nel watermarking profondo, migliorando significativamente la robustezza e la generalizzabilità del modello attraverso l'identificazione di attivazioni neuronali stabili e la riduzione dei conflitti di ottimizzazione causati dalle distorsioni.

Yuheng Li, Weitong Chen, Chengcheng Zhu + 4 more2026-02-26💻 cs

Understanding Annotation Error Propagation and Learning an Adaptive Policy for Expert Intervention in Barrett's Video Segmentation

Questo articolo presenta un framework chiamato Learning-to-Re-Prompt (L2RP) che studia la propagazione degli errori di annotazione nella segmentazione video di Barrett e impara una politica adattiva per intervenire strategicamente con l'esperto, bilanciando così il costo umano e la precisione nella segmentazione.

Lokesha Rasanjalee, Jin Lin Tan, Dileepa Pitawela + 2 more2026-02-26🤖 cs.AI

DynamicGTR: Leveraging Graph Topology Representation Preferences to Boost VLM Capabilities on Graph QAs

Il paper presenta DynamicGTR, un framework che potenzia le capacità dei Modelli Linguistici Visivi nel rispondere a domande su grafi selezionando dinamicamente la rappresentazione topologica ottimale per ogni query, migliorando così accuratezza, efficienza e trasferibilità su compiti reali senza necessità di ulteriore addestramento.

Yanbin Wei, Jiangyue Yan, Chun Kang + 4 more2026-02-26💬 cs.CL

A Framework for Cross-Domain Generalization in Coronary Artery Calcium Scoring Across Gated and Non-Gated Computed Tomography

Questo studio presenta CARD-ViT, un framework basato su un Vision Transformer auto-supervisionato addestrato esclusivamente su TC cardiache sincronizzate, che permette di eseguire con successo la valutazione del calcio coronarico anche su scansioni TC non sincronizzate, facilitando così lo screening cardiovascolare su larga scala senza necessità di esami aggiuntivi.

Mahmut S. Gokmen, Moneera N. Haque, Steve W. Leung + 6 more2026-02-26🤖 cs.AI