Vulnerability-Amplifying Interaction Loops: a systematic failure mode in AI chatbot mental-health interactions

Il documento presenta SIM-VAIL, un quadro di valutazione che rivela come i chatbot di intelligenza artificiale possano involontariamente amplificare le vulnerabilità psicologiche degli utenti attraverso cicli di interazione dannosi, evidenziando la necessità di approcci di sicurezza multidimensionali e specifici per il contesto clinico.

Veith Weilnhammer, Kevin YC Hou, Lennart Luettgau, Christopher Summerfield, Raymond Dolan, Matthew M Nour2026-03-10💻 cs

AgenticLab: A Real-World Robot Agent Platform that Can See, Think, and Act

Il paper presenta AgenticLab, una piattaforma e un benchmark agnostici rispetto al modello che abilitano la valutazione di agenti robotici basati su modelli visione-linguaggio in ambienti reali e non strutturati, rivelando limiti critici nelle capacità di manipolazione a lungo termine che i test offline non riescono a cogliere.

Pengyuan Guo, Zhonghao Mai, Zhengtong Xu, Kaidi Zhang, Heng Zhang, Zichen Miao, Arash Ajoudani, Zachary Kingston, Qiang Qiu, Yu She2026-03-10💻 cs

Assessing Problem-Solving in HR Contexts: A Comparison Between Game-Based and Self-Report Measures

Questo studio dimostra che, sebbene non vi sia una significativa convergenza tra le valutazioni auto-riferite e quelle comportamentali basate su giochi per misurare la capacità di problem-solving, i due metodi forniscono informazioni complementari che giustificano l'integrazione di entrambi nei processi di selezione del personale.

Fabrizio Fornari, Eleonora Cova, Niccolò Vito Vacca, Francesco Bocci, Marcello Sarini, Luigi Caputo2026-03-10💻 cs

Beyond Judgment: Exploring Large Language Models as Non-Judgmental Support for Maternal Mental Health

Questo studio esplora come le madri utilizzino i modelli linguistici su larga scala come risorsa non giudicante per il supporto emotivo e la rassicurazione, evidenziando che, sebbene molte preferiscano ancora il calore umano, queste tecnologie offrono un'alternativa a basso rischio per evitare il giudizio sociale, specialmente in contesti familiari complessi.

Shayla Sharmin, Sadia Afrin Ratna2026-03-10💻 cs

PhysDrape: Learning Explicit Forces and Collision Constraints for Physically Realistic Garment Draping

Il paper presenta PhysDrape, un solver ibrido neurale-fisico che risolve il problema del drappeggio dei tessuti integrando una rete neurale con un solver differenziabile a due stadi per garantire l'equilibrio delle forze e il rispetto rigoroso dei vincoli di collisione, ottenendo così risultati fisicamente realistici con intersezioni trascurabili.

Minghai Chen, Mingyuan Liu, Ning Ma, Jianqing Li, Yuxiang Huan2026-03-10💻 cs

Move What Matters: Parameter-Efficient Domain Adaptation via Optimal Transport Flow for Collaborative Perception

Il paper presenta FlowAdapt, un framework efficiente in termini di parametri basato sulla teoria del trasporto ottimo che risolve le sfide dell'adattamento di dominio nella percezione collaborativa V2X riducendo la ridondanza dei dati e preservando le semantica dettagliate, ottenendo prestazioni all'avanguardia con solo l'1% di parametri addestrabili.

Zesheng Jia, Jin Wang, Siao Liu, Lingzhi Li, Ziyao Huang, Yunjiang Xu, Jianping Wang2026-03-10💻 cs

SToRM: Supervised Token Reduction for Multi-modal LLMs toward efficient end-to-end autonomous driving

Il paper propone SToRM, un innovativo framework di riduzione supervisionata dei token per modelli linguistici multi-modali che, mediante un predittore di importanza, un addestramento supervisionato e un modulo di fusione contestuale, abilita sistemi di guida autonoma end-to-end efficienti riducendo i costi computazionali fino a 30 volte senza compromettere le prestazioni rispetto all'uso di tutti i token.

Seo Hyun Kim, Jin Bok Park, Do Yeon Koo, Hogun Park, Il Yong Chun2026-03-10💻 cs

To Mix or To Merge: Toward Multi-Domain Reinforcement Learning for Large Language Models

Il paper M2RL analizza e confronta le strategie di addestramento misto e di fusione dei modelli per l'apprendimento per rinforzo con ricompense verificabili (RLVR) nei grandi modelli linguistici, dimostrando che i domini basati sul ragionamento mostrano effetti sinergici e che le due approcci possono essere integrati efficacemente per ottenere esperti multi-dominio.

Haoqing Wang, Xiang Long, Ziheng Li, Yilong Xu, Tingguang Li, Yehui Tang2026-03-10💻 cs

SkillsBench: Benchmarking How Well Agent Skills Work Across Diverse Tasks

Il paper introduce SkillsBench, un benchmark che dimostra come le competenze curate migliorino significativamente le prestazioni degli agenti LLM su compiti diversificati, mentre le competenze auto-generate risultano inefficaci e una documentazione focalizzata si rivela superiore a quella esaustiva.

Xiangyi Li, Wenbo Chen, Yimin Liu, Shenghan Zheng, Xiaokun Chen, Yifeng He, Yubo Li, Bingran You, Haotian Shen, Jiankai Sun, Shuyi Wang, Binxu Li, Qunhong Zeng, Di Wang, Xuandong Zhao, Yuanli Wang, Roey Ben Chaim, Zonglin Di, Yipeng Gao, Junwei He, Yizhuo He, Liqiang Jing, Luyang Kong, Xin Lan, Jiachen Li, Songlin Li, Yijiang Li, Yueqian Lin, Xinyi Liu, Xuanqing Liu, Haoran Lyu, Ze Ma, Bowei Wang, Runhui Wang, Tianyu Wang, Wengao Ye, Yue Zhang, Hanwen Xing, Yiqi Xue, Steven Dillmann, Han-chung Lee2026-03-10💻 cs

RIS Control through the Lens of Stochastic Network Calculus: An O-RAN Framework for Delay-Sensitive 6G Applications

Questo lavoro propone DARIO, un framework conforme a O-RAN basato sul Calcolo Stocastico delle Reti che ottimizza l'orchestrazione dinamica delle Superfici Intelligenti Ricontrollabili (RIS) per minimizzare la latenza e garantire l'affidabilità nelle applicazioni 6G sensibili ai ritardi.

Oscar Adamuz-Hinojosa, Lanfranco Zanzi, Vincenzo Sciancalepore, Marco Di Renzo, Xavier Costa-Pérez2026-03-10💻 cs

Graph Neural Model Predictive Control for High-Dimensional Systems

Questo lavoro presenta un framework di controllo predittivo basato su reti neurali grafiche che, sfruttando l'architettura a grafo e un algoritmo di condensazione ottimizzato per GPU, permette il controllo in tempo reale di sistemi ad alta dimensionalità come i robot soffici, garantendo precisione sub-centimetrica e un'efficace evitazione degli ostacoli.

Patrick Benito Eberhard, Luis Pabon, Daniele Gammelli, Hugo Buurmeijer, Amon Lahr, Mark Leone, Andrea Carron, Marco Pavone2026-03-10💻 cs