Evaluating LLM-Based Grant Proposal Review via Structured Perturbations

Questo studio valuta l'efficacia delle revisioni di proposte di sovvenzione basate su LLM attraverso perturbazioni strutturate, rivelando che l'approccio sezione per sezione supera le alternative ma che i sistemi attuali mostrano variabilità e priorità di valutazione disallineate, risultando più adatti al controllo di conformità che alla valutazione olistica.

William Thorne, Joseph James, Yang Wang, Chenghua Lin, Diana Maynard2026-03-10💬 cs.CL

Using Multimodal and Language-Agnostic Sentence Embeddings for Abstractive Summarization

Il paper presenta SBARThez, un nuovo framework che combina embedding di frasi multimodali e multilingue con un meccanismo di iniezione di entità nominate in un modello BART modificato per produrre riassunti astrattivi più concisi, fedeli ai fatti e capaci di gestire input testuali o vocali anche per lingue a risorse limitate.

Chaimae Chellaf, Salima Mdhaffar, Yannick Estève, Stéphane Huet2026-03-10💬 cs.CL

SPD-RAG: Sub-Agent Per Document Retrieval-Augmented Generation

Il paper introduce SPD-RAG, un framework gerarchico multi-agente che migliora la qualità e la scalabilità della risposta a domande complesse su documenti multipli delegando l'elaborazione a agenti dedicati per documento e sintetizzando i risultati tramite un coordinatore, ottenendo prestazioni superiori rispetto ai metodi RAG tradizionali con costi API ridotti.

Yagiz Can Akay, Muhammed Yusuf Kartal, Esra Alparslan, Faruk Ortakoyluoglu, Arda Akpinar2026-03-10💬 cs.CL

Computational modeling of early language learning from acoustic speech and audiovisual input without linguistic priors

Questo capitolo esamina i recenti progressi nei modelli computazionali che, attraverso l'apprendimento auto-supervisionato e la fondazione visiva, spiegano come gli infanti acquisiscano il linguaggio da input acustici e audiovisivi senza ricorrere a precondizioni linguistiche, dimostrando come principi di apprendimento condivisi possano unificare diverse teorie sullo sviluppo cognitivo.

Okko Räsänen2026-03-10💬 cs.CL

COACH meets QUORUM: A Framework and Pipeline for Aligning User, Expert and Developer Perspectives in LLM-generated Health Counselling

Il paper presenta QUORUM, un framework di valutazione che unisce le prospettive di sviluppatori, esperti e utenti, e COACH, una pipeline basata su LLM per generare consigli sullo stile di vita personalizzati per pazienti oncologici, dimostrando come un approccio multi-stakeholder sia essenziale per sviluppare sistemi di linguaggio sanitario affidabili e centrati sul paziente.

Yee Man Ng, Bram van Dijk, Pieter Beynen, Otto Boekesteijn, Joris Jansen, Gerard van Oortmerssen, Max van Duijn, Marco Spruit2026-03-10💬 cs.CL

Revealing Behavioral Plasticity in Large Language Models: A Token-Conditional Perspective

Il paper presenta ToCoRL, un framework che sfrutta la plasticità comportamentale intrinseca dei modelli linguistici di grandi dimensioni, rivelata attraverso la generazione condizionata ai token, per internalizzare tramite apprendimento per rinforzo adattamenti comportamentali stabili che permettono un controllo preciso delle modalità di risposta (come passare dal ragionamento passo-passo alla risposta diretta) senza degradare le capacità del modello.

Liyuan Mao, Le Yu, Jing Zhou, Chujie Zheng, Bowen Yu, Chang Gao, Shixuan Liu, An Yang, Weinan Zhang, JunYang Lin2026-03-10🤖 cs.LG

Sandpiper: Orchestrated AI-Annotation for Educational Discourse at Scale

Il paper presenta Sandpiper, un sistema misto che integra dashboard interattive e motori LLM per scalare l'analisi qualitativa dei discorsi educativi digitali, garantendo al contempo privacy, rigore metodologico e affidabilità attraverso l'orchestrazione vincolata e la de-identificazione automatica.

Daryl Hedley, Doug Pietrzak, Jorge Dias, Ian Burden, Bakhtawar Ahtisham, Zhuqian Zhou, Kirk Vanacore, Josh Marland, Rachel Slama, Justin Reich, Kenneth Koedinger, René Kizilcec2026-03-10💬 cs.CL

A prospective clinical feasibility study of a conversational diagnostic AI in an ambulatory primary care clinic

Questo studio prospettico di fattibilità dimostra che un'intelligenza artificiale conversazionale basata su modelli linguistici (AMIE) può condurre in sicurezza colloqui clinici e formulare diagnosi differenziali in un contesto di cure primarie reale, ottenendo un'alta soddisfazione dei pazienti e una qualità delle diagnosi paragonabile a quella dei medici, sebbene i medici superino l'AI nella praticità e nel costo delle terapie proposte.

Peter Brodeur, Jacob M. Koshy, Anil Palepu, Khaled Saab, Ava Homiar, Roma Ruparel, Charles Wu, Ryutaro Tanno, Joseph Xu, Amy Wang, David Stutz, Hannah M. Ferrera, David Barrett, Lindsey Crowley, Jihyeon Lee, Spencer E. Rittner, Ellery Wulczyn, Selena K. Zhang, Elahe Vedadi, Christine G. Kohn, Kavita Kulkarni, Vinay Kadiyala, Sara Mahdavi, Wendy Du, Jessica Williams, David Feinbloom, Renee Wong, Tao Tu, Petar Sirkovic, Alessio Orlandi, Christopher Semturs, Yun Liu, Juraj Gottweis, Dale R. Webster, Joëlle Barral, Katherine Chou, Pushmeet Kohli, Avinatan Hassidim, Yossi Matias, James Manyika, Rob Fields, Jonathan X. Li, Marc L. Cohen, Vivek Natarajan, Mike Schaekermann, Alan Karthikesalingam, Adam Rodman2026-03-10🤖 cs.LG

LycheeCluster: Efficient Long-Context Inference with Structure-Aware Chunking and Hierarchical KV Indexing

LycheeCluster è un metodo innovativo per la gestione efficiente della cache KV nei modelli linguistici su contesti lunghi, che combina un'analisi semantica dei blocchi e un indicizzazione gerarchica per ridurre la complessità di ricerca da lineare a logaritmica, ottenendo un'accelerazione fino a 3,6 volte rispetto agli stati dell'arte.

Dongfang Li, Zixuan Liu, Gang Lin, Baotian Hu, Min Zhang2026-03-10🤖 cs.LG

Fanar-Sadiq: A Multi-Agent Architecture for Grounded Islamic QA

Il paper presenta Fanar-Sadiq, un assistente islamico bilingue basato su un'architettura multi-agente che combina recupero di informazioni, calcolo deterministico e verifica delle fonti per fornire risposte precise e radicate nei testi canonici su zakat, eredità e giurisprudenza, superando le limitazioni degli attuali modelli linguistici.

Ummar Abbas, Mourad Ouzzani, Mohamed Y. Eltabakh, Omar Sinan, Gagan Bhatia, Hamdy Mubarak, Majd Hawasly, Mohammed Qusay Hashim, Kareem Darwish, Firoj Alam2026-03-10💬 cs.CL