cs.CL articoli | Gist.Science

HatePrototypes: Interpretable and Transferable Representations for Implicit and Explicit Hate Speech Detection

Il paper "HatePrototypes" propone un metodo efficiente e interpretabile che utilizza rappresentazioni vettoriali di classe derivate da pochi esempi per rilevare e trasferire la capacità di identificare sia l'odio esplicito che quello implicito senza necessità di un continuo ri-addestramento dei modelli.

Irina Proskurina, Marc-Antoine Carpentier, Julien Velcin2026-03-10💬 cs.CL

SPOT: An Annotated French Corpus and Benchmark for Detecting Critical Interventions in Online Conversations

Il paper introduce SPOT, il primo corpus annotato in francese e benchmark per il rilevamento delle "interruzioni critiche" (stopping points) nei dibattiti online, dimostrando che i modelli encoder finetunati superano significativamente i grandi modelli linguistici in questo compito e fornendo risorse open-source per la ricerca riproducibile.

Manon Berriche, Célia Nouri, Chloée Clavel, Jean-Philippe Cointet2026-03-10💬 cs.CL

Multimodal LLMs Do Not Compose Skills Optimally Across Modalities

Lo studio rivela che i modelli linguistici multimodali attuali presentano un significativo divario nella composizione ottimale delle competenze tra diverse modalità, un problema che né il prompting avanzato né il fine-tuning specifico riescono a risolvere completamente.

Paula Ontalvilla, Aitor Ormazabal, Gorka Azkune2026-03-10💬 cs.CL

Stealth Fine-Tuning: Efficiently Breaking Alignment in RVLMs Using Self-Generated CoT

Il paper introduce "Stealth Fine-Tuning", un metodo efficiente che sfrutta l'interferenza a livello di segmento e il fine-tuning supervisionato sui ragionamenti auto-generati per aggirare rapidamente le allineamenti di sicurezza dei Modelli Vision-Language potenziati dal ragionamento, ottenendo un tasso di successo negli attacchi superiore rispetto alle tecniche esistenti con un costo computazionale minimo.

Le Yu, Zhengyue Zhao, Yawen Zheng, Yunhao Liu2026-03-10💬 cs.CL

Process-Centric Analysis of Agentic Software Systems

Il paper introduce Graphectory, un metodo basato su grafi per analizzare in modo sistematico le traiettorie di esecuzione degli agenti software, rivelando come la complessità dei processi influenzi il successo nella risoluzione dei problemi e dimostrando che il monitoraggio in tempo reale con interventi correttivi può migliorare significativamente i tassi di risoluzione riducendo al contempo la lunghezza delle traiettorie.

Shuyang Liu, Yang Chen, Rahul Krishna, Saurabh Sinha, Jatin Ganhotra, Reyhan Jabbarvand2026-03-10💬 cs.CL

SETUP: Sentence-level English-To-Uniform Meaning Representation Parser

Il paper introduce SETUP, un parser che trasforma automaticamente frasi inglesi in rappresentazioni semantiche uniformi (UMR) ottenendo risultati significativi attraverso due metodi basati sul fine-tuning di parser AMR e sulla conversione da Universal Dependencies.

Emma Markle, Javier Gutierrez Bach, Shira Wein2026-03-10💬 cs.CL

Parallel Decoder Transformer: Planner-Seeded Latent Coordination for Synchronized Parallel Decoding

Il paper introduce il Parallel Decoder Transformer (PDT), un'architettura che trasforma la decomposizione di compiti paralleli da una strategia di prompting esterna a un meccanismo di coordinamento interno, permettendo a un modello linguistico congelato di generare flussi multipli sincronizzati attraverso una pianificazione latente e un protocollo di condizionamento speculativo.

Logan Robbins2026-03-10💬 cs.CL

CompanionCast: Toward Social Collaboration with Multi-Agent Systems in Shared Experiences

Il paper presenta CompanionCast, un framework che orchestra agenti AI multipli per trasformare la fruizione solitaria dei media in un'esperienza condivisa e socialmente coinvolgente, migliorando significativamente il senso di presenza e la condivisione emotiva, come dimostrato da studi pilota sulla visione di partite di calcio.

Yiyang Wang, Chen Chen, Tica Lin, Vishnu Raj, Josh Kimball, Alex Cabral, Josiah Hester2026-03-10💬 cs.CL

Adaptation of Agentic AI: A Survey of Post-Training, Memory, and Skills

Questa survey propone un quadro unificato basato su quattro paradigmi per analizzare l'adattamento degli agenti AI post-pretraining, esaminando metodi di ottimizzazione, architetture di memoria e competenze sia per l'agente che per gli strumenti, al fine di confrontarne i compromessi e delineare le sfide future.

Pengcheng Jiang, Jiacheng Lin, Zhiyi Shi, Zifeng Wang, Luxi He, Yichen Wu, Ming Zhong, Peiyang Song, Qizheng Zhang, Heng Wang, Xueqiang Xu, Hanwen Xu, Pengrui Han, Dylan Zhang, Jiashuo Sun, Chaoqi Yang, Kun Qian, Tian Wang, Changran Hu, Manling Li, Quanzheng Li, Hao Peng, Sheng Wang, Jingbo Shang, Chao Zhang, Jiaxuan You, Liyuan Liu, Pan Lu, Yu Zhang, Heng Ji, Yejin Choi, Dawn Song, Jimeng Sun, Jiawei Han2026-03-10💬 cs.CL

A Two-Stage Multitask Vision-Language Framework for Explainable Crop Disease Visual Question Answering

Questo lavoro presenta un framework vision-language leggero e spiegabile basato su Swin Transformer e T5, che utilizza una strategia di addestramento in due fasi per ottenere prestazioni quasi perfette nell'identificazione e nella spiegazione delle malattie delle colture attraverso il Visual Question Answering.

Md. Zahid Hossain, Most. Sharmin Sultana Samu, Md. Rakibul Islam, Md. Siam Ansary2026-03-10💬 cs.CL

NC-Bench: An LLM Benchmark for Evaluating Conversational Competence

Il documento presenta NC-Bench, un nuovo benchmark teorico basato sul Framework di Conversazione Naturale dell'IBM che valuta la competenza conversazionale dei modelli linguistici su tre livelli (di base, con RAG e complesso) concentrandosi sulla struttura e sul flusso dell'interazione piuttosto che sui contenuti specifici.

Robert J. Moore, Sungeun An, Farhan Ahmed, Jay Pankaj Gala2026-03-10💬 cs.CL

A Component-Based Survey of Interactions between Large Language Models and Multi-Armed Bandits

Questo lavoro è il primo sondaggio che esamina sistematicamente le interazioni bidirezionali tra i grandi modelli linguistici e gli algoritmi di multi-armed bandit a livello di componente, evidenziando come questi due campi si rafforzino reciprocamente per migliorare sia il processo decisionale adattivo che le capacità dei modelli linguistici.

Siguang Chen, Chunli Lv, Miao Xie2026-03-10🤖 cs.LG

MAS-Orchestra: Understanding and Improving Multi-Agent Reasoning Through Holistic Orchestration and Controlled Benchmarks

Il paper presenta MAS-Orchestra, un framework di addestramento che ottimizza l'orchestrazione multi-agente tramite apprendimento per rinforzo e astrazione a funzioni, accompagnato da MASBENCH, un benchmark controllato che dimostra come i vantaggi dei sistemi multi-agente dipendano dalla struttura del compito e non siano universali, ottenendo al contempo miglioramenti significativi su diverse attività di ragionamento con un'efficienza superiore di 10 volte rispetto alle basi di riferimento.

Zixuan Ke, Yifei Ming, Austin Xu, Ryan Chin, Xuan-Phi Nguyen, Prathyusha Jwalapuram, Jiayu Wang, Semih Yavuz, Caiming Xiong, Shafiq Joty2026-03-10💬 cs.CL

Replayable Financial Agents: A Determinism-Faithfulness Assurance Harness for Tool-Using LLM Agents

Il paper introduce il Determinism-Faithfulness Assurance Harness (DFAH), un framework open-source per valutare l'indipendenza tra determinismo e accuratezza negli agenti LLM finanziari, dimostrando che nessun modello attuale garantisce simultaneamente entrambe le proprietà e fornendo benchmark specifici per soddisfare i requisiti di audit regolamentare.

Raffi Khatchadourian2026-03-10💬 cs.CL

EFT-CoT: A Multi-Agent Chain-of-Thought Framework for Emotion-Focused Therapy

Il paper presenta EFT-CoT, un framework multi-agente basato sulla Terapia Focalizzata sulle Emozioni (EFT) che, attraverso un dataset addestrativo su 67.000 testi reali e un modello specializzato, supera le limitazioni degli approcci cognitivi tradizionali offrendo risposte di supporto alla salute mentale con maggiore profondità empatica e professionalità strutturale.

Lanqing Du, Yunong Li, YuJie Long, Shihong Chen2026-03-10💬 cs.CL

Improving X-Codec-2.0 for Multi-Lingual Speech: 25 Hz Latent Rate and 24 kHz Sampling

Questo lavoro presenta una versione ottimizzata di X-Codec-2.0 che, riducendo il tasso latente a 25 Hz e aumentando la frequenza di campionamento a 24 kHz tramite modifiche semplici alla struttura, migliora l'efficienza e la qualità percettiva della sintesi vocale multilingue rispetto alla configurazione originale.

Husein Zolkepli2026-03-10💬 cs.CL

RedSage: A Cybersecurity Generalist LLM

Il paper presenta RedSage, un assistente LLM open-source specializzato in cybersecurity addestrato su un vasto corpus di dati specifici e tecniche di augmentation agentiche, che supera le prestazioni dei modelli di base sia in compiti di sicurezza informatica che in ragionamento generale, offrendo al contempo una soluzione localmente deployabile che preserva la privacy dei dati.

Naufal Suryanto, Muzammal Naseer, Pengfei Li, Syed Talal Wasim, Jinhui Yi, Juergen Gall, Paolo Ceravolo, Ernesto Damiani2026-03-10💬 cs.CL

Mem-T: Densifying Rewards for Long-Horizon Memory Agents

Mem-T è un agente di memoria autonomo che, grazie al framework di apprendimento per rinforzo MoT-GRPO, risolve il problema della ricompensa sparsa in compiti a lungo termine densificando il feedback e ottimizzando congiuntamente la costruzione e il recupero della memoria, ottenendo prestazioni superiori e un'efficienza computazionale migliorata rispetto agli approcci esistenti.

Yanwei Yue, Boci Peng, Xuanbo Fan, Jiaxin Guo, Qiankun Li, Yan Zhang2026-03-10🤖 cs.LG

Do Schwartz Higher-Order Values Help Sentence-Level Human Value Detection? A Study of Hierarchical Gating and Calibration

Lo studio dimostra che, per il rilevamento dei valori umani a livello di frase, la struttura gerarchica dei valori di Schwartz funge più efficacemente da bias induttivo che da regola di routing rigida, mentre le migliori prestazioni si ottengono attraverso tecniche di calibrazione e ensemble piuttosto che con architetture complesse o modelli LLM compatti.

Víctor Yeste, Paolo Rosso2026-03-10🤖 cs.LG

LatentMem: Customizing Latent Memory for Multi-Agent Systems

Il paper presenta LatentMem, un framework di memoria multi-agente apprendibile che risolve i problemi di omogeneizzazione e sovraccarico informativo attraverso la sintesi di memorie latenti compatte e specifiche per ruolo, ottimizzate tramite una nuova strategia di apprendimento chiamata LMPO.

Muxin Fu, Xiangyuan Xue, Yafu Li, Zefeng He, Siyuan Huang, Xiaoye Qu, Yu Cheng, Yang Yang2026-03-10🤖 cs.LG

← Precedente Successivo →