RedTeamCUA: Realistic Adversarial Testing of Computer-Use Agents in Hybrid Web-OS Environments

Il paper presenta RedTeamCUA, un framework di testing avversario e il relativo benchmark RTC-Bench che, attraverso un ambiente ibrido web-OS realistico, evidenzia vulnerabilità critiche e alti tassi di successo negli attacchi di iniezione di prompt indiretti nei moderni agenti di uso informatico, sottolineando l'urgenza di sviluppare difese robuste prima del loro dispiegamento reale.

Zeyi Liao, Jaylen Jones, Linxi Jiang + 5 more2026-03-03💬 cs.CL

Language Agents for Hypothesis-driven Clinical Decision Making with Reinforcement Learning

Questo articolo presenta LA-CDM, un agente linguistico basato sull'apprendimento per rinforzo e supervisionato che supporta il processo decisionale clinico dinamico e iterativo attraverso una generazione di ipotesi guidata dall'incertezza, dimostrando miglioramenti nelle prestazioni diagnostiche e nell'efficienza sul dataset reale MIMIC-CDM.

David Bani-Harouni, Chantal Pellegrini, Ege Özsoy + 2 more2026-03-03💬 cs.CL

Cognitive models can reveal interpretable value trade-offs in language models

Questo studio dimostra che l'applicazione di modelli cognitivi, originariamente sviluppati per analizzare i compromessi valoriali umani, permette di valutare in modo interpretabile e sistematico le dinamiche di allineamento e le preferenze comportamentali dei modelli linguistici, rivelando come fattori come il ragionamento, i prompt di sistema e le fasi di post-training influenzino tali trade-off.

Sonia K. Murthy, Rosie Zhao, Jennifer Hu + 4 more2026-03-03💬 cs.CL