SPOT: An Annotated French Corpus and Benchmark for Detecting Critical Interventions in Online Conversations

Il paper introduce SPOT, il primo corpus annotato in francese e benchmark per il rilevamento delle "interruzioni critiche" (stopping points) nei dibattiti online, dimostrando che i modelli encoder finetunati superano significativamente i grandi modelli linguistici in questo compito e fornendo risorse open-source per la ricerca riproducibile.

Manon Berriche, Célia Nouri, Chloée Clavel, Jean-Philippe Cointet2026-03-10💬 cs.CL

Stealth Fine-Tuning: Efficiently Breaking Alignment in RVLMs Using Self-Generated CoT

Il paper introduce "Stealth Fine-Tuning", un metodo efficiente che sfrutta l'interferenza a livello di segmento e il fine-tuning supervisionato sui ragionamenti auto-generati per aggirare rapidamente le allineamenti di sicurezza dei Modelli Vision-Language potenziati dal ragionamento, ottenendo un tasso di successo negli attacchi superiore rispetto alle tecniche esistenti con un costo computazionale minimo.

Le Yu, Zhengyue Zhao, Yawen Zheng, Yunhao Liu2026-03-10💬 cs.CL

Process-Centric Analysis of Agentic Software Systems

Il paper introduce Graphectory, un metodo basato su grafi per analizzare in modo sistematico le traiettorie di esecuzione degli agenti software, rivelando come la complessità dei processi influenzi il successo nella risoluzione dei problemi e dimostrando che il monitoraggio in tempo reale con interventi correttivi può migliorare significativamente i tassi di risoluzione riducendo al contempo la lunghezza delle traiettorie.

Shuyang Liu, Yang Chen, Rahul Krishna, Saurabh Sinha, Jatin Ganhotra, Reyhan Jabbarvand2026-03-10💬 cs.CL

Parallel Decoder Transformer: Planner-Seeded Latent Coordination for Synchronized Parallel Decoding

Il paper introduce il Parallel Decoder Transformer (PDT), un'architettura che trasforma la decomposizione di compiti paralleli da una strategia di prompting esterna a un meccanismo di coordinamento interno, permettendo a un modello linguistico congelato di generare flussi multipli sincronizzati attraverso una pianificazione latente e un protocollo di condizionamento speculativo.

Logan Robbins2026-03-10💬 cs.CL

CompanionCast: Toward Social Collaboration with Multi-Agent Systems in Shared Experiences

Il paper presenta CompanionCast, un framework che orchestra agenti AI multipli per trasformare la fruizione solitaria dei media in un'esperienza condivisa e socialmente coinvolgente, migliorando significativamente il senso di presenza e la condivisione emotiva, come dimostrato da studi pilota sulla visione di partite di calcio.

Yiyang Wang, Chen Chen, Tica Lin, Vishnu Raj, Josh Kimball, Alex Cabral, Josiah Hester2026-03-10💬 cs.CL

Adaptation of Agentic AI: A Survey of Post-Training, Memory, and Skills

Questa survey propone un quadro unificato basato su quattro paradigmi per analizzare l'adattamento degli agenti AI post-pretraining, esaminando metodi di ottimizzazione, architetture di memoria e competenze sia per l'agente che per gli strumenti, al fine di confrontarne i compromessi e delineare le sfide future.

Pengcheng Jiang, Jiacheng Lin, Zhiyi Shi, Zifeng Wang, Luxi He, Yichen Wu, Ming Zhong, Peiyang Song, Qizheng Zhang, Heng Wang, Xueqiang Xu, Hanwen Xu, Pengrui Han, Dylan Zhang, Jiashuo Sun, Chaoqi Yang, Kun Qian, Tian Wang, Changran Hu, Manling Li, Quanzheng Li, Hao Peng, Sheng Wang, Jingbo Shang, Chao Zhang, Jiaxuan You, Liyuan Liu, Pan Lu, Yu Zhang, Heng Ji, Yejin Choi, Dawn Song, Jimeng Sun, Jiawei Han2026-03-10💬 cs.CL

A Two-Stage Multitask Vision-Language Framework for Explainable Crop Disease Visual Question Answering

Questo lavoro presenta un framework vision-language leggero e spiegabile basato su Swin Transformer e T5, che utilizza una strategia di addestramento in due fasi per ottenere prestazioni quasi perfette nell'identificazione e nella spiegazione delle malattie delle colture attraverso il Visual Question Answering.

Md. Zahid Hossain, Most. Sharmin Sultana Samu, Md. Rakibul Islam, Md. Siam Ansary2026-03-10💬 cs.CL

MAS-Orchestra: Understanding and Improving Multi-Agent Reasoning Through Holistic Orchestration and Controlled Benchmarks

Il paper presenta MAS-Orchestra, un framework di addestramento che ottimizza l'orchestrazione multi-agente tramite apprendimento per rinforzo e astrazione a funzioni, accompagnato da MASBENCH, un benchmark controllato che dimostra come i vantaggi dei sistemi multi-agente dipendano dalla struttura del compito e non siano universali, ottenendo al contempo miglioramenti significativi su diverse attività di ragionamento con un'efficienza superiore di 10 volte rispetto alle basi di riferimento.

Zixuan Ke, Yifei Ming, Austin Xu, Ryan Chin, Xuan-Phi Nguyen, Prathyusha Jwalapuram, Jiayu Wang, Semih Yavuz, Caiming Xiong, Shafiq Joty2026-03-10💬 cs.CL

EFT-CoT: A Multi-Agent Chain-of-Thought Framework for Emotion-Focused Therapy

Il paper presenta EFT-CoT, un framework multi-agente basato sulla Terapia Focalizzata sulle Emozioni (EFT) che, attraverso un dataset addestrativo su 67.000 testi reali e un modello specializzato, supera le limitazioni degli approcci cognitivi tradizionali offrendo risposte di supporto alla salute mentale con maggiore profondità empatica e professionalità strutturale.

Lanqing Du, Yunong Li, YuJie Long, Shihong Chen2026-03-10💬 cs.CL

RedSage: A Cybersecurity Generalist LLM

Il paper presenta RedSage, un assistente LLM open-source specializzato in cybersecurity addestrato su un vasto corpus di dati specifici e tecniche di augmentation agentiche, che supera le prestazioni dei modelli di base sia in compiti di sicurezza informatica che in ragionamento generale, offrendo al contempo una soluzione localmente deployabile che preserva la privacy dei dati.

Naufal Suryanto, Muzammal Naseer, Pengfei Li, Syed Talal Wasim, Jinhui Yi, Juergen Gall, Paolo Ceravolo, Ernesto Damiani2026-03-10💬 cs.CL

Mem-T: Densifying Rewards for Long-Horizon Memory Agents

Mem-T è un agente di memoria autonomo che, grazie al framework di apprendimento per rinforzo MoT-GRPO, risolve il problema della ricompensa sparsa in compiti a lungo termine densificando il feedback e ottimizzando congiuntamente la costruzione e il recupero della memoria, ottenendo prestazioni superiori e un'efficienza computazionale migliorata rispetto agli approcci esistenti.

Yanwei Yue, Boci Peng, Xuanbo Fan, Jiaxin Guo, Qiankun Li, Yan Zhang2026-03-10🤖 cs.LG

Do Schwartz Higher-Order Values Help Sentence-Level Human Value Detection? A Study of Hierarchical Gating and Calibration

Lo studio dimostra che, per il rilevamento dei valori umani a livello di frase, la struttura gerarchica dei valori di Schwartz funge più efficacemente da bias induttivo che da regola di routing rigida, mentre le migliori prestazioni si ottengono attraverso tecniche di calibrazione e ensemble piuttosto che con architetture complesse o modelli LLM compatti.

Víctor Yeste, Paolo Rosso2026-03-10🤖 cs.LG