cs.CL articoli | Gist.Science

Stochastic Self-Organization in Multi-Agent Systems

Il paper presenta SelfOrg, un framework di auto-organizzazione per sistemi multi-agente basati su LLM che ottimizza dinamicamente la struttura di comunicazione utilizzando valori di Shapley approssimati per costruire un grafo aciclico diretto, permettendo agli agenti di adattarsi autonomamente senza supervisione esterna e migliorando significativamente le prestazioni, specialmente con modelli più deboli.

Nurbek Tastan, Samuel Horvath, Karthik NandakumarTue, 10 Ma🤖 cs.LG

FOR-Prompting: From Objection to Revision via an Asymmetric Prompting Protocol

Il paper introduce FOR-Prompting, un protocollo di prompting asimmetrico che, attraverso il ruolo di un "Debater" che solleva obiezioni senza fornire soluzioni dirette, migliora l'accuratezza e la qualità delle risposte dei modelli linguistici, rendendoli particolarmente efficaci anche su modelli open-source di piccole dimensioni e in scenari di ragionamento complesso senza richiedere addestramento.

He Zhang, Anzhou Zhang, Jian DaiTue, 10 Ma💬 cs.CL

Tree-based Dialogue Reinforced Policy Optimization for Red-Teaming Attacks

Il paper presenta DialTree, un framework di ottimizzazione della politica basato su alberi di dialogo e apprendimento per rinforzo che supera i limiti degli attacchi a turno singolo, scoprendo autonomamente strategie multi-turno innovative e ottenendo un tasso di successo significativamente superiore rispetto agli approcci esistenti.

Ruohao Guo, Afshin Oroojlooy, Roshan Sridhar, Miguel Ballesteros, Alan Ritter, Dan RothTue, 10 Ma🤖 cs.LG

Idiom Understanding as a Tool to Measure the Dialect Gap

Questo studio introduce nuovi dataset di benchmark per le espressioni idiomatiche del francese del Québec e metropolitano, dimostrando attraverso test su 111 modelli linguistici che la competenza nella varietà standard non garantisce la comprensione dei dialetti regionali e rivelando un significativo divario dialettale.

David Beauchemin, Yan Tremblay, Mohamed Amine Youssef, Richard KhouryTue, 10 Ma💬 cs.CL

Tiny but Mighty: A Software-Hardware Co-Design Approach for Efficient Multimodal Inference on Battery-Powered Small Devices

Il paper presenta NANOMIND, un framework di co-progettazione hardware-software che ottimizza l'inferenza di modelli multimodali su dispositivi portatili alimentati a batteria suddividendo i modelli in moduli eseguiti su acceleratori eterogenei, ottenendo così un'efficienza energetica superiore e un funzionamento completamente offline.

Yilong Li, Shuai Zhang, Yijing Zeng, Hao Zhang, Xinmiao Xiong, Jingyu Liu, Pan Hu, Suman BanerjeeTue, 10 Ma💬 cs.CL

ACE: Attribution-Controlled Knowledge Editing for Multi-hop Factual Recall

Il paper propone ACE, un framework di editing della conoscenza basato sull'attribuzione neuronale che risolve il decadimento delle prestazioni nei ragionamenti multi-step identificando e modificando i percorsi critici query-value, superando significativamente gli stati dell'arte su modelli come GPT-J e Qwen3-8B.

Jiayu Yang, Yuxuan Fan, Songning Lai, Shengen Wu, Jiaqi Tang, Chun Kang, Zhijiang Guo, Yutao YueTue, 10 Ma💬 cs.CL

R-WoM: Retrieval-augmented World Model For Computer-use Agents

Il paper propone R-WoM, un modello di mondo potenziato dal recupero di informazioni esterne che supera le limitazioni degli LLM nella simulazione a lungo termine degli ambienti digitali, migliorando significativamente le prestazioni degli agenti informatici grazie a conoscenze fattuali e aggiornate.

Kai Mei, Jiang Guo, Shuaichen Chang, Mingwen Dong, Dongkyu Lee, Xing Niu, Jiarong JiangTue, 10 Ma💬 cs.CL

HypoSpace: Evaluating LLM Creativity as Set-Valued Hypothesis Generators under Underdetermination

Il paper introduce HypoSpace, una suite diagnostica che valuta la creatività dei modelli linguistici come generatori di insiemi di ipotesi in contesti sottodeterminati, misurando validità, unicità e recupero per rivelare il collasso modale spesso nascosto dalle metriche di correttezza tradizionali.

Tingting Chen, Beibei Lin, Zifeng Yuan, Qiran Zou, Hongyu He, Anirudh Goyal, Yew-Soon Ong, Dianbo LiuTue, 10 Ma💬 cs.CL

KrishokBondhu: A Retrieval-Augmented Voice-Based Agricultural Advisory Call Center for Bengali Farmers

Il documento presenta KrishokBondhu, un sistema di consulenza agricola basato su voce e integrato con un centro chiamate per gli agricoltori bengalesi, che utilizza un framework di generazione aumentata dal recupero (RAG) per fornire risposte esperte e contestualizzate in tempo reale, dimostrando un miglioramento significativo nella qualità e completezza delle risposte rispetto ai benchmark esistenti.

Mohd Ruhul Ameen, Akif Islam, Farjana Aktar, M. Saifuzzaman RafatTue, 10 Ma💬 cs.CL

SwiftEmbed: Ultra-Fast Text Embeddings via Static Token Lookup for Real-Time Applications

SwiftEmbed è un sistema di serving in Rust che offre embedding testuali ultra-veloci con latenza di 1,12 ms attraverso una ricerca statica di token, garantendo prestazioni elevate per applicazioni in tempo reale come il rilevamento di duplicati e la similarità semantica, sebbene con risultati variabili rispetto ai modelli transformer completi a seconda del compito.

Edouard Lansiaux, Antoine Simonet, Eric WielTue, 10 Ma💬 cs.CL

Jr. AI Scientist and Its Risk Report: Autonomous Scientific Exploration from a Baseline Paper

Il paper presenta Jr. AI Scientist, un sistema autonomo che emula il flusso di lavoro di un ricercatore junior per generare contributi scientifici validi partendo da lavori esistenti, valutandone al contempo le prestazioni e i rischi attraverso revisioni automatizzate e umane.

Atsuyuki Miyai, Mashiro Toyooka, Takashi Otonari, Zaiying Zhao, Kiyoharu AizawaTue, 10 Ma🤖 cs.LG

HatePrototypes: Interpretable and Transferable Representations for Implicit and Explicit Hate Speech Detection

Il paper "HatePrototypes" propone un metodo efficiente e interpretabile che utilizza rappresentazioni vettoriali di classe derivate da pochi esempi per rilevare e trasferire la capacità di identificare sia l'odio esplicito che quello implicito senza necessità di un continuo ri-addestramento dei modelli.

Irina Proskurina, Marc-Antoine Carpentier, Julien VelcinTue, 10 Ma💬 cs.CL

SPOT: An Annotated French Corpus and Benchmark for Detecting Critical Interventions in Online Conversations

Il paper introduce SPOT, il primo corpus annotato in francese e benchmark per il rilevamento delle "interruzioni critiche" (stopping points) nei dibattiti online, dimostrando che i modelli encoder finetunati superano significativamente i grandi modelli linguistici in questo compito e fornendo risorse open-source per la ricerca riproducibile.

Manon Berriche, Célia Nouri, Chloée Clavel, Jean-Philippe CointetTue, 10 Ma💬 cs.CL

Multimodal LLMs Do Not Compose Skills Optimally Across Modalities

Lo studio rivela che i modelli linguistici multimodali attuali presentano un significativo divario nella composizione ottimale delle competenze tra diverse modalità, un problema che né il prompting avanzato né il fine-tuning specifico riescono a risolvere completamente.

Paula Ontalvilla, Aitor Ormazabal, Gorka AzkuneTue, 10 Ma💬 cs.CL

Stealth Fine-Tuning: Efficiently Breaking Alignment in RVLMs Using Self-Generated CoT

Il paper introduce "Stealth Fine-Tuning", un metodo efficiente che sfrutta l'interferenza a livello di segmento e il fine-tuning supervisionato sui ragionamenti auto-generati per aggirare rapidamente le allineamenti di sicurezza dei Modelli Vision-Language potenziati dal ragionamento, ottenendo un tasso di successo negli attacchi superiore rispetto alle tecniche esistenti con un costo computazionale minimo.

Le Yu, Zhengyue Zhao, Yawen Zheng, Yunhao LiuTue, 10 Ma💬 cs.CL

Process-Centric Analysis of Agentic Software Systems

Il paper introduce Graphectory, un metodo basato su grafi per analizzare in modo sistematico le traiettorie di esecuzione degli agenti software, rivelando come la complessità dei processi influenzi il successo nella risoluzione dei problemi e dimostrando che il monitoraggio in tempo reale con interventi correttivi può migliorare significativamente i tassi di risoluzione riducendo al contempo la lunghezza delle traiettorie.

Shuyang Liu, Yang Chen, Rahul Krishna, Saurabh Sinha, Jatin Ganhotra, Reyhan JabbarvandTue, 10 Ma💬 cs.CL

SETUP: Sentence-level English-To-Uniform Meaning Representation Parser

Il paper introduce SETUP, un parser che trasforma automaticamente frasi inglesi in rappresentazioni semantiche uniformi (UMR) ottenendo risultati significativi attraverso due metodi basati sul fine-tuning di parser AMR e sulla conversione da Universal Dependencies.

Emma Markle, Javier Gutierrez Bach, Shira WeinTue, 10 Ma💬 cs.CL

Parallel Decoder Transformer: Planner-Seeded Latent Coordination for Synchronized Parallel Decoding

Il paper introduce il Parallel Decoder Transformer (PDT), un'architettura che trasforma la decomposizione di compiti paralleli da una strategia di prompting esterna a un meccanismo di coordinamento interno, permettendo a un modello linguistico congelato di generare flussi multipli sincronizzati attraverso una pianificazione latente e un protocollo di condizionamento speculativo.

Logan RobbinsTue, 10 Ma💬 cs.CL

CompanionCast: Toward Social Collaboration with Multi-Agent Systems in Shared Experiences

Il paper presenta CompanionCast, un framework che orchestra agenti AI multipli per trasformare la fruizione solitaria dei media in un'esperienza condivisa e socialmente coinvolgente, migliorando significativamente il senso di presenza e la condivisione emotiva, come dimostrato da studi pilota sulla visione di partite di calcio.

Yiyang Wang, Chen Chen, Tica Lin, Vishnu Raj, Josh Kimball, Alex Cabral, Josiah HesterTue, 10 Ma💬 cs.CL

Adaptation of Agentic AI: A Survey of Post-Training, Memory, and Skills

Questa survey propone un quadro unificato basato su quattro paradigmi per analizzare l'adattamento degli agenti AI post-pretraining, esaminando metodi di ottimizzazione, architetture di memoria e competenze sia per l'agente che per gli strumenti, al fine di confrontarne i compromessi e delineare le sfide future.

Pengcheng Jiang, Jiacheng Lin, Zhiyi Shi, Zifeng Wang, Luxi He, Yichen Wu, Ming Zhong, Peiyang Song, Qizheng Zhang, Heng Wang, Xueqiang Xu, Hanwen Xu, Pengrui Han, Dylan Zhang, Jiashuo Sun, Chaoqi Yang, Kun Qian, Tian Wang, Changran Hu, Manling Li, Quanzheng Li, Hao Peng, Sheng Wang, Jingbo Shang, Chao Zhang, Jiaxuan You, Liyuan Liu, Pan Lu, Yu Zhang, Heng Ji, Yejin Choi, Dawn Song, Jimeng Sun, Jiawei HanTue, 10 Ma💬 cs.CL

← Precedente Successivo →