cs.AI articoli | Gist.Science

Information Capacity: Evaluating the Efficiency of Large Language Models via Text Compression

Questo lavoro introduce la "capacità informativa", una nuova metrica che valuta l'efficienza inferenziale dei grandi modelli linguistici basandosi sulle prestazioni di compressione del testo e sull'efficienza del tokenizer, rivelando al contempo bias linguistici e fornendo uno strumento per prevedere le prestazioni e ottimizzare lo scaling futuro.

Cheng Yuan, Jiawei Shao, Xuelong Li2026-03-11💬 cs.CL

Lightweight Time Series Data Valuation on Time Series Foundation Models via In-Context Finetuning

Il paper propone LTSV, un metodo leggero per la valutazione dei dati nelle serie temporali basato sui modelli fondazionali, che utilizza il fine-tuning in contesto e l'aggregazione di blocchi temporali per stimare in modo efficiente e preciso il contributo dei singoli campioni preservando le dipendenze temporali.

Shunyu Wu, Tianyue Li, Yixuan Leng, Jingyi Suo, Jian Lou, Dan Li, See-Kiong Ng2026-03-11🤖 cs.AI

MediRound: Multi-Round Entity-Level Reasoning Segmentation in Medical Images

Il paper introduce MediRound, un modello e un nuovo dataset (MR-MedSeg) per la segmentazione medica basata su ragionamento multi-round a livello di entità, che supera i limiti dei metodi tradizionali a dialogo singolo attraverso un meccanismo di giudizio e correzione per mitigare la propagazione degli errori.

Qinyue Tong, Ziqian Lu, Jun Liu, Rui Zuo, Zheming Lu2026-03-11🤖 cs.AI

TSFM in-context learning for time-series classification of bearing-health status

Il paper presenta un metodo di classificazione basato sull'apprendimento in contesto con modelli fondazione per serie temporali (TSFM) che, senza necessità di riaddestramento, valuta lo stato di salute dei cuscinetti analizzando dati vibrazionali, aprendo la strada a sistemi di manutenzione predittiva scalabili e forniti come servizio.

Michel Tokic, Slobodan Djukanovic, Anja von Beuningen, Cheng Feng2026-03-11🤖 cs.AI

Research and Prototyping Study of an LLM-Based Chatbot for Electromagnetic Simulations

Questo studio presenta un chatbot basato sul modello linguistico Google Gemini 2.0 Flash che automatizza la generazione e la risoluzione di modelli di simulazione elettromagnetica bidimensionali tramite Gmsh e GetDP, riducendo significativamente i tempi di configurazione e offrendo funzionalità avanzate per la definizione di geometrie e post-processing.

Albert Piwonski, Mirsad Hadžiefendic2026-03-11🤖 cs.AI

Mitigating Long-Tail Bias in HOI Detection via Adaptive Diversity Cache

Il paper propone l'Adaptive Diversity Cache (ADC), un modulo plug-and-play privo di addestramento che mitiga il bias a lunga coda nella rilevazione delle interazioni uomo-oggetto (HOI) accumulando rappresentazioni di feature diversificate e adattando dinamicamente la capacità di archiviazione per migliorare la rilevazione delle categorie rare senza richiedere ulteriore ottimizzazione.

Yuqiu Jiang, Xiaozhen Qiao, Yifan Chen, Ye Zheng, Zhe Sun, Xuelong Li2026-03-11🤖 cs.AI

Periodic Asynchrony: An On-Policy Approach for Accelerating LLM Reinforcement Learning

Il paper propone un framework di apprendimento per rinforzo asincrono periodico che, separando l'inferenza dall'addestramento in un pipeline produttore-consumatore, accelera l'addestramento dei LLM mantenendo la correttezza on-policy e ottenendo un miglioramento del throughput fino a cinque volte rispetto ai framework esistenti.

Jian Lu2026-03-11🤖 cs.AI

When Robots Obey the Patch: Universal Transferable Patch Attacks on Vision-Language-Action Models

Il paper presenta UPA-RFAS, un framework unificato che genera patch fisiche universali e trasferibili per attaccare modelli Vision-Language-Action in scenari black-box, sfruttando obiettivi nello spazio delle feature, un processo min-max robusto e perdite specifiche per il dominio VLA per garantire il successo dell'attacco su diverse architetture e compiti.

Hui Lu, Yi Yu, Yiming Yang, Chenyu Yi, Qixin Zhang, Bingquan Shen, Alex C. Kot, Xudong Jiang2026-03-11🤖 cs.AI

Multi-Agent Reinforcement Learning with Communication-Constrained Priors

Il paper propone un nuovo framework di apprendimento per rinforzo multi-agente che utilizza un modello generalizzato vincolato alle comunicazioni come prior di apprendimento per distinguere tra messaggi persi e integri, disaccoppiandone l'impatto decisionale e quantificandolo nella ricompensa globale per migliorare la cooperazione in scenari reali complessi.

Guang Yang, Tianpei Yang, Jingwen Qiao, Yanqing Wu, Jing Huo, Xingguo Chen, Yang Gao2026-03-11🤖 cs.AI

Enhancing Retrieval-Augmented Generation with Entity Linking for Educational Platforms

Il paper presenta ELERAG, un'architettura RAG potenziata dal Linking di Entità e da una strategia di riordinamento ibrida, che dimostra come l'integrazione di segnali fattuali basati su Wikidata migliori significativamente l'accuratezza nei sistemi di domanda-risposta educativi in italiano, superando i metodi tradizionali nei contesti specifici di dominio pur mantenendo prestazioni competitive su dataset generali.

Francesco Granata, Francesco Poggi, Misael Mongiovì2026-03-11🤖 cs.AI

EMFusion: Conditional Diffusion Framework for Trustworthy Frequency Selective EMF Forecasting in Wireless Networks

Il documento presenta EMFusion, un framework di previsione probabilistica basato sulla diffusione condizionale che, integrando fattori contestuali e strategie di imputazione, supera le prestazioni dei modelli esistenti nella previsione selettiva in frequenza dei campi elettromagnetici, fornendo stime affidabili con quantificazione esplicita dell'incertezza per la pianificazione delle reti wireless.

Zijiang Yan, Yixiang Huang, Jianhua Pei, Hina Tabassum, Luca Chiaraviglio2026-03-11🤖 cs.AI

Small Language Models for Efficient Agentic Tool Calling: Outperforming Large Models with Targeted Fine-tuning

Questo studio dimostra che un piccolo modello linguistico (SLM) come l'OPT-350M, opportunamente affinato tramite tecniche di Supervised Fine-Tuning, può superare le prestazioni dei grandi modelli (LLM) nel richiamo degli strumenti con un tasso di successo del 77,55%, offrendo una soluzione più economica ed efficiente per l'integrazione dell'IA generativa nei sistemi aziendali.

Polaris Jhandi, Owais Kazi, Shreyas Subramanian, Neel Sendas2026-03-11🤖 cs.AI

Reinforcement Learning for Self-Improving Agent with Skill Library

Il paper presenta SAGE, un nuovo framework di Reinforcement Learning che potenzia l'auto-miglioramento degli agenti basati su LLM integrando una libreria di competenze attraverso un meccanismo di rollout sequenziale e una ricompensa specifica, ottenendo risultati superiori in termini di accuratezza ed efficienza rispetto agli approcci esistenti.

Jiongxiao Wang, Qiaojing Yan, Yawei Wang, Yijun Tian, Soumya Smruti Mishra, Zhichao Xu, Megha Gandhi, Panpan Xu, Lin Lee Cheong2026-03-11🤖 cs.AI

MCGI: Manifold-Consistent Graph Indexing for Billion-Scale Disk-Resident Vector Search

Il paper presenta MCGI, un metodo di indicizzazione basato su grafi che risolve il problema della discrepanza tra metriche euclidee e geodetiche nei dati ad alta dimensionalità sfruttando la dimensionalità intrinseca locale per adattarsi dinamicamente alla geometria dei dati, ottenendo prestazioni superiori e scalabilità fino al miliardo di record su dischi.

Dongfang Zhao2026-03-11🤖 cs.AI

CRANE: Causal Relevance Analysis of Language-Specific Neurons in Multilingual Large Language Models

Il paper introduce CRANE, un framework di analisi basato sulla rilevanza funzionale che, attraverso interventi mirati sui neuroni, identifica componenti specifiche delle lingue nei modelli multilingue con maggiore precisione rispetto ai metodi basati sull'attivazione, rivelando una specializzazione selettiva ma non esclusiva.

Yifan Le, Yunliang Li2026-03-11🤖 cs.AI

An AI-powered Bayesian Generative Modeling Approach for Arbitrary Conditional Inference

Il documento presenta la Modellazione Generativa Bayesiana (BGM), un quadro unificato basato sull'aggiornamento bayesiano stocastico iterativo che permette di inferire qualsiasi distribuzione condizionale arbitraria da un unico modello addestrato, garantendo al contempo stime di incertezza rigorose e solide basi teoriche.

Qiao Liu, Wing Hung Wong2026-03-11🤖 cs.AI

Empowering All-in-Loop Health Management of Spacecraft Power System in the Mega-Constellation Era via Human-AI Collaboration

Questo lavoro propone SpaceHMchat, un framework open-source di collaborazione uomo-intelligenza artificiale basato sul principio di allineamento delle capacità sottostanti, per gestire in modo olistico la salute dei sistemi di alimentazione spaziale nell'era delle mega-costellazioni, validato attraverso una piattaforma sperimentale realistica e un nuovo dataset pubblico che dimostra prestazioni eccellenti in compiti di riconoscimento, rilevamento, localizzazione e decisione.

Yi Di, Zhibin Zhao, Fujin Wang, Xue Liu, Jiafeng Tang, Jiaxin Ren, Zhi Zhai, Xuefeng Chen2026-03-11🤖 cs.AI

CLEAR-Mamba:Towards Accurate, Adaptive and Trustworthy Multi-Sequence Ophthalmic Angiography Classification

Il paper presenta CLEAR-Mamba, un framework avanzato basato su MedMamba che integra un layer di condizionamento adattivo (HaC) e un meccanismo di previsione affidabile (RaP) per migliorare l'accuratezza, l'adattabilità e l'affidabilità nella classificazione multi-sequenza di angiografie oftalmiche FFA e ICGA, superando le limitazioni delle metodologie esistenti grazie a un nuovo dataset su larga scala.

Zhuonan Wang, Wenjie Yan, Wenqiao Zhang, Xiaohui Song, Jian Ma, Ke Yao, Yibo Yu, Beng Chin Ooi2026-03-11🤖 cs.AI

Automating Forecasting Question Generation and Resolution for AI Evaluation

Questo lavoro presenta un sistema automatizzato basato su agenti di ricerca web potenziati da LLM per generare e risolvere su larga scala domande di previsione diversificate e verificabili, dimostrando un'efficacia superiore rispetto alle piattaforme umane e migliorando le prestazioni degli agenti di previsione attraverso strategie di decomposizione delle domande.

Nikos I. Bosse, Peter Mühlbacher, Jack Wildman, Lawrence Phillips, Dan Schwarz2026-03-11🤖 cs.AI

From Self-Evolving Synthetic Data to Verifiable-Reward RL: Post-Training Multi-turn Interactive Tool-Using Agents

Il paper presenta EigenData, un framework unificato che combina un agente di dati auto-evolutivo con un'apprendimento per rinforzo basato su verificatori per generare dati sintetici di alta qualità e addestrare agenti interattivi multi-turno in grado di utilizzare strumenti complessi, ottenendo prestazioni all'avanguardia su benchmark specifici senza costose annotazioni umane.

Jiaxuan Gao, Jiaao Chen, Chuyi He, Shusheng Xu, Di Jin, Yi Wu2026-03-11🤖 cs.AI

← Precedente Successivo →