Emerging Extrinsic Dexterity in Cluttered Scenes via Dynamics-aware Policy Learning

Questo articolo presenta il framework DAPL, che facilita l'apprendimento di politiche dinamiche consapevoli per abilitare la destrezza estrinseca in scenari affollati, superando i metodi esistenti grazie a una modellazione esplicita delle dinamiche indotte dal contatto e ottenendo risultati superiori sia in simulazione che nel mondo reale.

Yixin Zheng, Jiangran Lyu, Yifan Zhang, Jiayi Chen, Mi Yan, Yuntian Deng, Xuesong Shi, Xiaoguang Zhao, Yizhou Wang, Zhizheng Zhang, He Wang2026-03-11🤖 cs.AI

MedMASLab: A Unified Orchestration Framework for Benchmarking Multimodal Medical Multi-Agent Systems

Il paper presenta MedMASLab, un framework unificato e una piattaforma di benchmarking per sistemi multi-agente medici multimodali che affronta la frammentazione architettonica attraverso un protocollo di comunicazione standardizzato, un valutatore automatico del ragionamento clinico e un vasto benchmark su 473 malattie, rivelando al contempo una significativa fragilità delle attuali architetture nel transito tra diversi sottodomini medici.

Yunhang Qian, Xiaobin Hu, Jiaquan Yu, Siyang Xin, Xiaokun Chen, Jiangning Zhang, Peng-Tao Jiang, Jiawei Liu, Hongwei Bran Li2026-03-11🤖 cs.AI

Adaptive Clinical-Aware Latent Diffusion for Multimodal Brain Image Generation and Missing Modality Imputation

Il paper presenta ACADiff, un framework basato su diffusione latente adattiva e consapevole dei dati clinici che sintetizza con successo le modalità di neuroimaging cerebrali mancanti (come sMRI, FDG-PET e AV45-PET) per migliorare la diagnosi dell'Alzheimer, ottenendo prestazioni superiori rispetto ai metodi esistenti anche in scenari con fino all'80% di dati mancanti.

Rong Zhou, Houliang Zhou, Yao Su, Brian Y. Chen, Yu Zhang, Lifang He, Alzheimer's Disease Neuroimaging Initiative2026-03-11🤖 cs.AI

PathMem: Toward Cognition-Aligned Memory Transformation for Pathology MLLMs

Il paper presenta PathMem, un framework multimodale incentrato sulla memoria che, ispirandosi al processo cognitivo dei patologi umani, integra conoscenze strutturate e dinamiche per migliorare significativamente le prestazioni dei modelli linguistici multimodali nella diagnosi e nella generazione di report di patologia computazionale.

Jinyue Li, Yuci Liang, Qiankun Li, Xinheng Lyu, Jiayu Qian, Huabao Chen, Kun Wang, Zhigang Zeng, Anil Anthony Bharath, Yang Liu2026-03-11🤖 cs.AI

No Image, No Problem: End-to-End Multi-Task Cardiac Analysis from Undersampled k-Space

Il paper presenta k-MTR, un framework di apprendimento rappresentazionale che bypassa la ricostruzione delle immagini per eseguire direttamente analisi cardiache multi-task (come classificazione, regressione e segmentazione) dai dati k-space sottocampionati, allineandoli a uno spazio latente semantico condiviso con le immagini complete.

Yundi Zhang, Sevgi Gokce Kafali, Niklas Bubeck, Daniel Rueckert, Jiazhen Pan2026-03-11🤖 cs.AI

When Learning Rates Go Wrong: Early Structural Signals in PPO Actor-Critic

Questo studio introduce l'indicatore di sovrapposizione-sottosopraffazione (OUI) come segnale strutturale precoce per discriminare i tassi di apprendimento ottimali nell'algoritmo PPO, rivelando asimmetrie distintive tra le reti attore e critico e permettendo una selezione efficiente delle configurazioni di addestramento prima del completamento.

Alberto Fernández-Hernández, Cristian Pérez-Corral, Jose I. Mestre, Manuel F. Dolz, Jose Duato, Enrique S. Quintana-Ortí2026-03-11🤖 cs.AI

Think Before You Lie: How Reasoning Improves Honesty

Questo studio dimostra che, al contrario degli esseri umani, il processo di ragionamento aumenta la coerenza onesta nei modelli linguistici di grandi dimensioni, poiché lo spazio rappresentativo sottostante rende le risposte ingannevoli metastabili e più suscettibili di destabilizzazione rispetto a quelle oneste.

Ann Yuan, Asma Ghandeharioun, Carter Blum, Alicia Machado, Jessica Hoffmann, Daphne Ippolito, Martin Wattenberg, Lucas Dixon, Katja Filippova2026-03-11🤖 cs.AI

Understanding the Use of a Large Language Model-Powered Guide to Make Virtual Reality Accessible for Blind and Low Vision People

Questo studio presenta un assistente guidato da un modello linguistico di grandi dimensioni per rendere la realtà virtuale accessibile a persone non vedenti o ipovedenti, rivelando attraverso un test con 16 partecipanti che la percezione dell'assistente evolve da strumento a compagno sociale a seconda del contesto, fornendo così raccomandazioni progettuali per il futuro.

Jazmin Collins, Sharon Y Lin, Tianqi Liu, Andrea Stevenson Won, Shiri Azenkot2026-03-11🤖 cs.AI

From Data Statistics to Feature Geometry: How Correlations Shape Superposition

Questo paper introduce il modello Bag-of-Words Superposition (BOWS) per dimostrare che, nei dati reali, le correlazioni tra le caratteristiche permettono agli interferenze nella sovrapposizione di essere costruttive anziché solo rumorose, generando così strutture semantiche e cicliche che spiegano meglio il comportamento dei modelli linguistici reali rispetto alle teorie basate su caratteristiche non correlate.

Lucas Prieto, Edward Stevinson, Melih Barsbey, Tolga Birdal, Pedro A. M. Mediano2026-03-11🤖 cs.AI