cs.AI articoli | Gist.Science

Slow-Fast Inference: Training-Free Inference Acceleration via Within-Sentence Support Stability

Il paper introduce Slow-Fast Inference, un metodo di inferenza senza addestramento che accelera la decodifica a lungo contesto sfruttando la stabilità dell'attenzione all'interno delle frasi per alternare passi veloci con memoria sparsa a passi lenti che aggiornano il contesto, ottenendo un throughput fino a 14,4 volte superiore mantenendo la qualità.

Xingyu Xie, Zhaochen Yu, Yue Liao, Tao Wang, Kim-Chuan Toh, Shuicheng Yan2026-03-13🤖 cs.LG

XSkill: Continual Learning from Experience and Skills in Multimodal Agents

Il paper presenta XSkill, un framework a doppio flusso che permette agli agenti multimodali di migliorare continuamente senza aggiornare i parametri, estraendo e recuperando conoscenza visivamente contestualizzata sotto forma di esperienze (guida a livello di azione) e competenze (guida a livello di compito) per ottimizzare l'orchestrazione degli strumenti e il ragionamento in ambienti aperti.

Guanyu Jiang (May), Zhaochen Su (May), Xiaoye Qu (May), Yi R. (May), Fung2026-03-13🤖 cs.AI

Coarse-Guided Visual Generation via Weighted h-Transform Sampling

Il paper propone un metodo di generazione visiva "coarse-guided" senza addestramento che utilizza la trasformata h per guidare i modelli di diffusione pre-addestrati verso campioni ad alta fedeltà partendo da riferimenti degradati, introducendo un programma di pesatura sensibile al livello di rumore per bilanciare l'aderenza alla guida e la qualità della sintesi.

Yanghao Wang, Ziqi Jiang, Zhen Wang, Long Chen2026-03-13🤖 cs.AI

Chemical Reaction Networks Learn Better than Spiking Neural Networks

Questo articolo dimostra matematicamente ed empiricamente che le reti di reazioni chimiche senza strati nascosti possono apprendere compiti di classificazione in modo più efficiente ed accurato rispetto alle reti neurali spiking che richiedono strati nascosti, offrendo nuove prospettive sul calcolo chimico e sull'apprendimento biologico.

Sophie Jaffard, Ivo F. Sbalzarini2026-03-13📊 stat

Beyond Convolution: A Taxonomy of Structured Operators for Learning-Based Image Processing

Questo articolo presenta una tassonomia sistematica di operatori strutturati che estendono o sostituiscono la convoluzione tradizionale nell'elaborazione delle immagini basata sull'apprendimento, classificandoli in cinque famiglie principali e analizzandone le proprietà, i costi computazionali e le applicazioni specifiche.

Simone Cammarasana2026-03-13🤖 cs.AI

Paper Title: LoV3D: Grounding Cognitive Prognosis Reasoning in Longitudinal 3D Brain MRI via Regional Volume Assessments

Il paper presenta LoV3D, un pipeline innovativo che utilizza modelli visione-linguaggio 3D per analizzare risonanze magnetiche cerebrali longitudinali, combinando valutazioni volumetriche regionali e un verifcatore clinico per generare diagnosi di demenza e riassunti diagnostici con elevata accuratezza e riducendo le allucinazioni.

Zhaoyang Jiang, Zhizhong Fu, David McAllister, Yunsoo Kim, Honghan Wu2026-03-13🤖 cs.AI

A Multi-Label Temporal Convolutional Framework for Transcription Factor Binding Characterization

Questo articolo propone un framework basato su reti convoluzionali temporali (TCN) per il riconoscimento multi-etichetta dei siti di legame dei fattori di trascrizione, permettendo di catturare le correlazioni e i meccanismi cooperativi tra diversi fattori e di scoprire nuovi pattern di interazione biologica.

Pietro Demurtas, Ferdinando Zanchetta, Giovanni Perini, Rita Fioresi2026-03-13🧬 q-bio

Resource-Efficient Iterative LLM-Based NAS with Feedback Memory

Il paper propone un metodo efficiente di ricerca neurale (NAS) basato su modelli linguistici di grandi dimensioni (LLM) che, tramite un ciclo chiuso con memoria di feedback storica e l'uso di due LLM specializzati, genera e affina iterativamente architetture di reti neurali convoluzionali adatte alla distribuzione su dispositivi edge, ottenendo risultati significativi su dataset come CIFAR-10 con un singolo GPU consumer senza necessità di fine-tuning dei modelli.

Xiaojie Gu, Dmitry Ignatov, Radu Timofte2026-03-13🤖 cs.LG

Human-Centred LLM Privacy Audits: Findings and Frictions

Questo studio presenta LMP2, uno strumento di auto-audit basato sul browser, e attraverso due ricerche con 458 partecipanti evidenzia come i modelli linguistici possano inferire informazioni personali, rivelando al contempo le sfide e le frizioni nell'operazionalizzare audit sulla privacy centrati sull'utente per l'intelligenza artificiale generativa.

Dimitri Staufer, Kirsten Morehouse, David Hartmann, Bettina Berendt2026-03-13💬 cs.CL

A Robust and Efficient Multi-Agent Reinforcement Learning Framework for Traffic Signal Control

Questo articolo presenta un framework robusto ed efficiente di Apprendimento per Rinforzo Multi-Agente (MARL) per il controllo dei semafori, che integra randomizzazione dei rapporti di svolta, un'azione di durata esponenziale delle fasi e osservazioni basate sui vicini per migliorare la generalizzazione e ridurre i tempi di attesa del traffico.

Sheng-You Huang, Hsiao-Chuan Chang, Yen-Chi Chen, Ting-Han Wei, I-Hau Yeh, Sheng-Yao Kuan, Chien-Yao Wang, Hsuan-Han Lee, I-Chen Wu2026-03-13🤖 cs.AI

On Information Self-Locking in Reinforcement Learning for Active Reasoning of LLM agents

Il paper identifica e risolve il problema del "blocco informativo" negli agenti LLM addestrati con apprendimento per rinforzo, proponendo una strategia di riallocazione del segnale di apprendimento che migliora significativamente le capacità di selezione delle azioni e tracciamento delle credenze, portando a incrementi fino al 60% nelle prestazioni di ragionamento attivo.

Deyu Zou, Yongqiang Chen, Fan Feng, Mufei Li, Pan Li, Yu Gong, James Cheng2026-03-13🤖 cs.AI

Taming the Adversary: Stable Minimax Deep Deterministic Policy Gradient via Fractional Objectives

Questo articolo presenta MMDDPG, un framework di apprendimento per rinforzo che utilizza un'ottimizzazione minimax con un obiettivo frazionario per addestrare politiche di controllo robuste e stabili contro disturbi esterni e incertezze del modello in ambienti continui.

Taeho Lee, Donghwan Lee2026-03-13🤖 cs.LG

SommBench: Assessing Sommelier Expertise of Language Models

Il paper introduce SommBench, un benchmark multilingue sviluppato in collaborazione con sommelier professionisti per valutare l'expertise enologica dei modelli linguistici, rivelando che, sebbene eccellano nelle domande teoriche, faticano significativamente nel completare le caratteristiche sensoriali e nell'abbinamento cibo-vino.

William Brach, Tomas Bedej, Jacob Nielsen, Jacob Pichna, Juraj Bedej, Eemeli Saarensilta, Julie Dupouy, Gianluca Barmina, Andrea Blasi Núñez, Peter Schneider-Kamp, Kristian Koštál, Michal Ries, Lukas Galke Poech2026-03-13💬 cs.CL

CRAFT: A Tendon-Driven Hand with Hybrid Hard-Soft Compliance

Il paper presenta CRAFT, una mano antropomorfa a trasmissione tendinea a basso costo e open-source che combina rigidità e morbidezza ibride per migliorare resistenza, ripetibilità e manipolazione di oggetti fragili.

Leo Lin, Shivansh Patel, Jay Moon, Svetlana Lazebnik, Unnat Jain2026-03-13🤖 cs.AI

Increasing intelligence in AI agents can worsen collective outcomes

Lo studio dimostra che l'aumento dell'intelligenza e della diversità degli agenti AI, unito all'apprendimento per rinforzo, può peggiorare i risultati collettivi e causare sovraccarichi pericolosi in scenari di scarsità di risorse, mentre la formazione di tribù mitiga tale rischio, rendendo l'esito finale dipendente esclusivamente dal rapporto tra capacità e popolazione.

Neil F. Johnson2026-03-13💰 q-fin

TopoBench: Benchmarking LLMs on Hard Topological Reasoning

Il paper introduce TopoBench, un benchmark per valutare le capacità di ragionamento topologico dei grandi modelli linguistici, rivelando che i loro fallimenti derivano principalmente dalla difficoltà nell'estrarre e mantenere i vincoli spaziali piuttosto che dal ragionamento logico stesso.

Mayug Maniparambil, Nils Hoehing, Janak Kapuriya, Arjun Karuvally, Ellen Rushe, Anthony Ventresque, Noel O'Connor, Fergal Reid2026-03-13🤖 cs.AI

Automatic Generation of High-Performance RL Environments

Questo lavoro presenta un metodo automatizzato e a basso costo per generare ambienti di apprendimento per rinforzo ad alte prestazioni, semanticamente equivalenti e verificati, che offrono accelerazioni fino a 22.320 volte rispetto alle implementazioni di riferimento esistenti.

Seth Karten, Rahul Dev Appapogu, Chi Jin2026-03-13🤖 cs.LG

FlashMotion: Few-Step Controllable Video Generation with Trajectory Guidance

Il paper introduce FlashMotion, un nuovo framework di training che combina un adattatore per traiettorie, distillazione in pochi step e un'ottimizzazione ibrida per generare video controllabili con traiettorie precise in tempi ridotti, superando le limitazioni delle metodologie esistenti in termini di qualità visiva e accuratezza del movimento.

Quanhao Li, Zhen Xing, Rui Wang, Haidong Cao, Qi Dai, Daoguo Dong, Zuxuan Wu2026-03-13🤖 cs.LG

IsoCompute Playbook: Optimally Scaling Sampling Compute for LLM RL

Questo studio definisce regole prescrittive per l'allocazione ottimale delle risorse di calcolo nel post-addestramento RL degli LLM, dimostrando che il numero di roll-out paralleli per problema deve aumentare fino a una saturazione prevedibile per massimizzare l'efficienza, a seconda della difficoltà del compito.

Zhoujun Cheng, Yutao Xie, Yuxiao Qu, Amrith Setlur, Shibo Hao, Varad Pimpalkhute, Tongtong Liang, Feng Yao, Zhengzhong Liu, Eric Xing, Virginia Smith, Ruslan Salakhutdinov, Zhiting Hu, Taylor Killian, Aviral Kumar2026-03-13🤖 cs.LG

GlyphBanana: Advancing Precise Text Rendering Through Agentic Workflows

Il paper introduce GlyphBanana, un approccio privo di addestramento basato su workflow agentici che integra modelli di glifi per migliorare la precisione nel rendering di testo complesso e formule matematiche all'interno di modelli di generazione immagine.

Zexuan Yan, Jiarui Jin, Yue Ma, Shijian Wang, Jiahui Hu, Wenxiang Jiao, Yuan Lu, Linfeng Zhang2026-03-13🤖 cs.AI

← Precedente Successivo →