cs.AI articoli | Gist.Science

Towards Cold-Start Drafting and Continual Refining: A Value-Driven Memory Approach with Application to NPU Kernel Synthesis

Il paper presenta EvoKernel, un framework agenziale auto-evolutivo basato su un approccio di memoria guidata dal valore che supera la scarsità di dati nella sintesi di kernel per architetture NPU, migliorando drasticamente la correttezza e le prestazioni attraverso un processo di stesura iniziale e raffinamento continuo.

Yujie Zheng, Zhuo Li, Shengtao Zhang, Hanjing Wang, Junjie Sheng, Jiaqian Wang, Junchi Yan, Weinan Zhang, Ying Wen, Bo Tang, Muning Wen2026-03-12🤖 cs.LG

Semantic Landmark Particle Filter for Robot Localisation in Vineyards

Il paper presenta un Filtro a Particelle con Punti di Riferimento Semantici (SLPF) che integra la rilevazione di tronchi e pali con dati LiDAR e GNSS per risolvere il problema dell'aliasing percettivo e garantire una localizzazione robotica robusta nelle vigne, superando significativamente le prestazioni dei sistemi basati solo sulla geometria o sulla visione.

Rajitha de Silva, Jonathan Cox, James R. Heselden, Marija Popovic, Cesar Cadena, Riccardo Polvara2026-03-12🤖 cs.AI

$V_{0.5}$ : Generalist Value Model as a Prior for Sparse RL Rollouts

Il paper propone $V_{0.5}$ , un modello di valore generalista che fonde adattivamente una previsione a priori con medie empiriche da rollouts sparsi tramite test statistici in tempo reale, ottenendo una stima del baseline a bassa varianza che supera significativamente GRPO e DAPO su sei benchmark di ragionamento matematico.

Yi-Kai Zhang, Yueqing Sun, Hongyan Hao, Qi Gu, Xunliang Cai, De-Chuan Zhan, Han-Jia Ye2026-03-12🤖 cs.LG

GRACE: A Unified 2D Multi-Robot Path Planning Simulator & Benchmark for Grid, Roadmap, And Continuous Environments

Il paper presenta GRACE, un simulatore e benchmark unificato per la pianificazione di percorsi multi-robot che consente confronti trasparenti e riproducibili tra diversi livelli di astrazione (griglia, roadmap e continuo) per valutare i compromessi tra fedeltà del modello e scalabilità.

Chuanlong Zang, Anna Mannucci, Isabelle Barz, Philipp Schillinger, Florian Lier, Wolfgang Hönig2026-03-12🤖 cs.AI

An Extreme Multi-label Text Classification (XMTC) Library Dataset: What if we took "Use of Practical AI in Digital Libraries" seriously?

Il paper presenta un nuovo corpus bilingue (inglese/tedesco) di record bibliografici annotati con l'Integrated Authority File (GND) e una tassonomia machine-actionable, progettato per abilitare la classificazione multi-etichetta consapevole dell'ontologia e supportare catalogatori umani tramite assistenti AI trasparenti e valutabili.

Jennifer D'Souza, Sameer Sadruddin, Maximilian Kähler, Andrea Salfinger, Luca Zaccagna, Francesca Incitti, Lauro Snidaro, Osma Suominen2026-03-12💬 cs.CL

Continuous Diffusion Transformers for Designing Synthetic Regulatory Elements

Il paper presenta un Diffusion Transformer (DiT) efficiente in termini di parametri, dotato di un codificatore CNN 2D e ottimizzato tramite DDPO con Enformer, in grado di generare sequenze di DNA regolatorio sintetico specifiche per il tipo cellulare con una convergenza più rapida, una minore memorizzazione dei dati e un'attività regolatoria predetta significativamente superiore rispetto ai modelli precedenti.

Jonathan Liu, Kia Ghods2026-03-12🧬 q-bio

Dynamics-Predictive Sampling for Active RL Finetuning of Large Reasoning Models

Il lavoro propone il campionamento predittivo dinamico (DPS), un metodo che accelera il fine-tuning con apprendimento per rinforzo dei grandi modelli di ragionamento prevedendo online la dinamica di apprendimento dei prompt tramite inferenza bayesiana, riducendo così i costosi rollouts e migliorando le prestazioni senza compromettere l'efficienza.

Yixiu Mao, Yun Qu, Qi Wang, Heming Zou, Xiangyang Ji2026-03-12🤖 cs.LG

A Hybrid Knowledge-Grounded Framework for Safety and Traceability in Prescription Verification

Il paper presenta PharmGraph-Auditor, un sistema ibrido che combina un Knowledge Base farmaceutico unificato e una nuova catena di verifica basata su conoscenze per potenziare la sicurezza e la tracciabilità nella verifica delle prescrizioni, trasformando i modelli linguistici da generatori inaffidabili a motori di ragionamento trasparenti.

Yichi Zhu, Kan Ling, Xu Liu, Hengrun Zhang, Huiqun Yu, Guisheng Fan2026-03-12🤖 cs.AI

LookaheadKV: Fast and Accurate KV Cache Eviction by Glimpsing into the Future without Generation

LookaheadKV è un framework di evizione della cache KV leggero e preciso che, evitando la costosa generazione di bozze, utilizza moduli efficienti per prevedere l'importanza futura dei token, garantendo prestazioni superiori e una riduzione dei costi di evizione fino a 14,5 volte rispetto ai metodi esistenti.

Jinwoo Ahn, Ingyu Seong, Akhil Kedia, Junhan Kim, Hyemi Jang, Kangwook Lee, Yongkweon Jeon2026-03-12🤖 cs.LG

When Fine-Tuning Fails and when it Generalises: Role of Data Diversity and Mixed Training in LLM-based TTS

Lo studio dimostra che il fine-tuning LoRA del backbone LLM Qwen-0.5B, se supportato da dati di addestramento sufficientemente diversificati, migliora significativamente la coerenza vocale, la fedeltà del parlante e il rapporto segnale-rumore nei sistemi TTS rispetto ai modelli congelati.

Anupam Purwar, Aditya Choudhary2026-03-12🤖 cs.AI

Historical Consensus: Preventing Posterior Collapse via Iterative Selection of Gaussian Mixture Priors

Questo paper introduce il "Historical Consensus Training", un metodo iterativo che seleziona prior a miscela gaussiana per eliminare definitivamente il collasso posteriore nei VAE, garantendo rappresentazioni informative senza richiedere condizioni di stabilità esplicite o vincoli architetturali.

Zegu Zhang, Jian Zhang2026-03-12🤖 cs.LG

Safe RLHF Beyond Expectation: Stochastic Dominance for Universal Spectral Risk Control

Il paper propone RAD, un nuovo framework di allineamento per l'apprendimento per rinforzo sicuro che sostituisce i vincoli di costo atteso con vincoli di dominanza stocastica di primo ordine, permettendo un controllo universale dei rischi di coda e delle prestazioni su distribuzioni fuori dal dominio attraverso un'ottimizzazione differenziabile basata sul trasporto ottimo.

Yaswanth Chittepu, Ativ Joshi, Rajarshi Bhattacharjee, Scott Niekum2026-03-12🤖 cs.LG

Contact Coverage-Guided Exploration for General-Purpose Dexterous Manipulation

Il paper propone CCGE, un metodo di esplorazione guidato dalla copertura dei contatti che, incentivando la scoperta di nuovi pattern di interazione tra dita e oggetti, migliora significativamente l'efficienza dell'addestramento e il successo nei compiti di manipolazione destriosa, permettendo un trasferimento efficace verso sistemi robotici reali.

Zixuan Liu, Ruoyi Qiao, Chenrui Tie, Xuanwei Liu, Yunfan Lou, Chongkai Gao, Zhixuan Xu, Lin Shao2026-03-12🤖 cs.AI

GroundCount: Grounding Vision-Language Models with Object Detection for Mitigating Counting Hallucinations

Il paper presenta GroundCount, un framework che integra modelli di rilevamento oggetti (ODM) con modelli visione-linguaggio (VLM) per fornire un ancoraggio spaziale esplicito, riducendo significativamente le allucinazioni nel conteggio e migliorando l'accuratezza attraverso strategie di prompting che superano la fusione implicita delle feature.

Boyuan Chen, Minghao Shao, Siddharth Garg, Ramesh Karri, Muhammad Shafique2026-03-12🤖 cs.AI

Artificial Intelligence as a Catalyst for Innovation in Software Engineering

Questo articolo esamina come l'intelligenza artificiale, in particolare attraverso l'apprendimento automatico e l'elaborazione del linguaggio naturale, agisca da catalizzatore per l'innovazione nell'ingegneria del software, ottimizzando le pratiche Agile e automatizzando compiti ripetitivi per migliorare qualità, velocità e adattabilità.

Carlos Alberto Fernández-y-Fernández, Jorge R. Aguilar-Cisneros2026-03-12🤖 cs.AI

RCTs & Human Uplift Studies: Methodological Challenges and Practical Solutions for Frontier AI Evaluation

Questo articolo analizza le sfide metodologiche e le soluzioni pratiche per gli studi di miglioramento umano condotti con l'IA di frontiera, evidenziando come la rapida evoluzione di questi sistemi comprometta le assunzioni di validità degli studi controllati randomizzati (RCT) e offra indicazioni per un utilizzo appropriato di tali evidenze nelle decisioni ad alto rischio.

Patricia Paskov, Kevin Wei, Shen Zhou Hong, Dan Bateyko, Xavier Roberts-Gaal, Carson Ezell, Gailius Praninskas, Valerie Chen, Umang Bhatt, Ella Guest2026-03-12🤖 cs.AI

Does AI See like Art Historians? Interpreting How Vision Language Models Recognize Artistic Style

Attraverso una collaborazione interdisciplinare tra informatici e storici dell'arte, questo studio analizza i meccanismi con cui i modelli linguistici-visivi riconoscono lo stile artistico, rivelando che la maggior parte dei concetti da essi utilizzati per le previsioni è considerata coerente e rilevante dagli esperti umani.

Marvin Limpijankit, Milad Alshomary, Yassin Oulad Daoud, Amith Ananthram, Tim Trombley, Elias Stengel-Eskin, Mohit Bansal, Noam M. Elcott, Kathleen McKeown2026-03-12🤖 cs.AI

Instruction set for the representation of graphs

Il paper presenta IsalGraph, un metodo che codifica la struttura di qualsiasi grafo finito e semplice in una stringa compatta e isomorfismo-invariante tramite un alfabeto di nove istruzioni, dimostrando che la distanza di Levenshtein tra queste stringhe si correla fortemente con la distanza di modifica dei grafi (GED) e rendendole adatte a ricerche di similarità, generazione e modellazione linguistica.

Ezequiel Lopez-Rubio, Mario Pascual-Gonzalez2026-03-12💬 cs.CL

V2M-Zero: Zero-Pair Time-Aligned Video-to-Music Generation

Il paper presenta V2M-Zero, un approccio di generazione zero-shot che allinea temporalmente la musica al video sfruttando le curve di eventi temporali calcolate indipendentemente per ciascuna modalità, ottenendo risultati superiori rispetto ai metodi basati su dati accoppiati senza richiedere training incrociato.

Yan-Bo Lin, Jonah Casebeer, Long Mai, Aniruddha Mahapatra, Gedas Bertasius, Nicholas J. Bryan2026-03-12🤖 cs.AI

Neural Field Thermal Tomography: A Differentiable Physics Framework for Non-Destructive Evaluation

Il paper presenta NeFTY, un framework di fisica differenziabile che utilizza campi neurali per ricostruire con precisione le proprietà materiali 3D e localizzare difetti sotterranei analizzando misurazioni termiche superficiali transitorie, superando i limiti dei metodi tradizionali e delle PINN a vincoli morbidi.

Tao Zhong, Yixun Hu, Dongzhe Zheng, Aditya Sood, Christine Allen-Blanchette2026-03-12🔬 cond-mat.mtrl-sci

← Precedente Successivo →

cs.AI