Slice-wise quality assessment of high b-value breast DWI via deep learning-based artifact detection

Questo studio dimostra che l'uso di reti neurali convoluzionali, in particolare DenseNet121, è promettente per il rilevamento automatico e la classificazione delle artefatti iper- e ipointensi nelle immagini di risonanza magnetica mammaria con diffusione ad alto valore b (b=1500 s/mm²), sebbene siano necessarie ulteriori validazioni.

Ameya Markale, Luise Brock, Ihor Horishnyi + 10 more2026-03-05💻 cs

Structural Action Transformer for 3D Dexterous Manipulation

Questo articolo propone il Structural Action Transformer (SAT), un nuovo approccio basato su un Transformer strutturale e su un codice articolato incorporato che, trattando le azioni come sequenze non ordinate di traiettorie articolari, supera i limiti delle rappresentazioni temporali tradizionali per abilitare un trasferimento efficace delle abilità tra diversi robot con mani ad alta libertà di movimento.

Xiaohan Lei, Min Wang, Bohong Weng + 2 more2026-03-05💻 cs

ProFound: A moderate-sized vision foundation model for multi-task prostate imaging

Il paper presenta ProFound, un modello di visione fondazionale specializzato nel dominio, pre-addestrato su un vasto dataset multi-istituzionale di risonanze magnetiche multiparametriche della prostata, che dimostra prestazioni superiori o competitive rispetto agli stati dell'arte su 11 diversi compiti clinici di rilevamento, classificazione e segmentazione.

Yipei Wang, Yinsong Xu, Weixi Yi + 11 more2026-03-05💻 cs

UniRain: Unified Image Deraining with RAG-based Dataset Distillation and Multi-objective Reweighted Optimization

Il paper propone UniRain, un quadro unificato per la rimozione della pioggia dalle immagini che combina una pipeline di distillazione dei dataset basata su RAG per la selezione dei campioni di addestramento e una strategia di ottimizzazione multi-obiettivo con pesi variabili all'interno di un'architettura asimmetrica a esperti misti, ottenendo prestazioni superiori su scene diurne e notturne con diverse degradazioni da pioggia.

Qianfeng Yang, Qiyuan Guan, Xiang Chen + 3 more2026-03-05💻 cs

Scaling Dense Event-Stream Pretraining from Visual Foundation Models

Questo paper introduce un nuovo metodo di preaddestramento auto-supervisionato che distilla modelli visivi fondazionali per apprendere rappresentazioni dense e scalabili da flussi di eventi, superando le limitazioni delle tecniche esistenti grazie a una funzione di perdita di distillazione consapevole della struttura che garantisce un allineamento semantico più robusto tra immagini ed eventi.

Zhiwen Chen, Junhui Hou, Zhiyu Zhu + 2 more2026-03-05💻 cs

Phi-4-reasoning-vision-15B Technical Report

Il rapporto tecnico presenta Phi-4-reasoning-vision-15B, un modello multimodale di ragionamento open-weight e compatto che, grazie a scelte architetturali mirate, una rigorosa curatela dei dati e un mix ibrido di modalità di risposta, eccelle nel ragionamento scientifico e matematico e nella comprensione delle interfacce utente, dimostrando come la qualità dei dati sia il fattore determinante per le prestazioni.

Jyoti Aneja, Michael Harrison, Neel Joshi + 3 more2026-03-05🤖 cs.AI

When Visual Evidence is Ambiguous: Pareidolia as a Diagnostic Probe for Vision Models

Questo studio introduce un quadro diagnostico basato sulla pareidolia facciale per analizzare come diversi modelli di visione interpretano evidenze visive ambigue, rivelando che le scelte rappresentazionali, piuttosto che le soglie di punteggio, determinano se i modelli tendono a un'iperattivazione semantica (come nei VLM) o a un'astensione prudente (come nei rilevatori).

Qianpu Chen, Derya Soydaner, Rob Saunders2026-03-05🤖 cs.AI

Weakly Supervised Patch Annotation for Improved Screening of Diabetic Retinopathy

Il paper presenta SAFE, un framework a due stadi che combina apprendimento debole supervisionato, apprendimento contrastivo e inferenza di embedding per espandere sistematicamente le annotazioni sparse delle lesioni nella retinopatia diabetica, migliorando significativamente l'accuratezza della classificazione e la rilevanza clinica rispetto ai metodi esistenti.

Shramana Dey, Abhirup Banerjee, B. Uma Shankar + 2 more2026-03-05💻 cs

Rethinking the Efficiency and Effectiveness of Reinforcement Learning for Radiology Report Generation

Questo studio propone un nuovo approccio all'apprendimento per rinforzo per la generazione di referti radiologici che, combinando una strategia di campionamento basata sulla diversità diagnostica e un'ottimizzazione della politica ponderata sui token diagnostici (DiTPO), raggiunge prestazioni all'avanguardia con una frazione significativa dei dati di addestramento rispetto ai metodi esistenti.

Zilin Lu, Ruifeng Yuan, Weiwei Cao + 6 more2026-03-05💻 cs

Volumetric Directional Diffusion: Anchoring Uncertainty Quantification in Anatomical Consensus for Ambiguous Medical Image Segmentation

Il paper propone la Volumetric Directional Diffusion (VDD), un modello che risolve il compromesso tra fedeltà e diversità nella segmentazione di lesioni mediche ambigue ancorando il processo generativo a un consenso anatomico deterministico, permettendo così di quantificare l'incertezza in modo sicuro senza compromettere la coerenza strutturale.

Chao Wu, Kangxian Xie, Mingchen Gao2026-03-05🤖 cs.AI