cs.AI articoli | Gist.Science

Hybrid Quantum-Classical Encoding for Accurate Residue-Level pKa Prediction

Questo lavoro introduce un framework ibrido quantistico-classico riproducibile che, integrando una mappatura di feature ispirata alla meccanica quantistica con descrittori strutturali classici in una Deep Quantum Neural Network, migliora significativamente l'accuratezza e la generalizzazione nella previsione dei valori pKa a livello di residuo rispetto ai modelli puramente classici.

Van Le, Tan Le2026-03-13🔬 physics

Exploring Collatz Dynamics with Human-LLM Collaboration

Questo articolo esplora le proprietà strutturali dell'iterazione di Collatz attraverso la collaborazione tra umani e modelli linguistici, dimostrando risultati teorici su fenomeni di "scrambling" modulare e decomposizione burst-gap che suggeriscono un quadro condizionale per la convergenza, pur lasciando aperte le ipotesi fondamentali.

Edward Y. Chang2026-03-13🔢 math

Summarize Before You Speak with ARACH: A Training-Free Inference-Time Plug-In for Enhancing LLMs via Global Attention Reallocation

Il paper presenta ARACH, un plug-in di inferenza senza addestramento che migliora le prestazioni dei grandi modelli linguistici aggregando il contesto e riallocando l'attenzione interna per mitigare il fenomeno dell'attention sink, offrendo un approccio alternativo sia ai metodi basati sui prompt che a quelli che richiedono aggiornamenti dei pesi.

Jingtao Wang, Yucong Wang, Jun Ding, Rui Cai, Xun Wang2026-03-13💬 cs.CL

From Phase Prediction to Phase Design: A ReAct Agent Framework for High-Entropy Alloy Discovery

Questo lavoro presenta un agente LLM basato sul framework ReAct che, integrando un modello surrogato XGBoost addestrato su dati sperimentali, risolve in modo autonomo e iterativo il problema inverso di progettazione delle leghe ad alta entropia, superando le tecniche di ottimizzazione tradizionali e guidando la scoperta di composizioni chimiche innovative e diversificate.

Iman Peivaste, Salim Belouettar2026-03-13🔬 cond-mat.mtrl-sci

OA-NBV: Occlusion-Aware Next-Best-View Planning for Human-Centered Active Perception on Mobile Robots

Il paper presenta OA-NBV, un sistema di pianificazione della prossima vista migliore che, integrando percezione e pianificazione del movimento, permette ai robot mobili di selezionare autonomamente punti di vista ottimali per osservare persone parzialmente occluse, superando significativamente le prestazioni dei metodi esistenti in termini di successo e qualità dell'osservazione.

Boxun Hu, Chang Chang, Jiawei Ge, Man Namgung, Xiaomin Lin, Axel Krieger, Tinoosh Mohsenin2026-03-13🤖 cs.AI

Unifying Logical and Physical Layout Representations via Heterogeneous Graphs for Circuit Congestion Prediction

Il paper presenta VeriHGN, un framework di verifica basato su grafi eterogenei che unifica la rappresentazione logica e fisica dei circuiti VLSI per migliorare l'accuratezza della previsione della congestione nelle fasi preliminari del flusso di progettazione.

Runbang Hu, Bo Fang, Bingzhe Li, Yuede Ji2026-03-13🤖 cs.AI

DIVE: Scaling Diversity in Agentic Task Synthesis for Generalizable Tool Use

Il paper presenta DIVE, un metodo che inverte l'ordine di sintesi dei compiti agenziali eseguendo prima strumenti reali per garantire diversità strutturale, ottenendo così un miglioramento significativo nella generalizzazione fuori distribuzione rispetto ai metodi basati sulla semplice quantità di dati.

Aili Chen, Chi Zhang, Junteng Liu, Jiangjie Chen, Chengyu Du, Yunji Li, Ming Zhong, Qin Wang, Zhengmao Zhu, Jiayuan Song, Ke Ji, Junxian He, Pengyu Zhao, Yanghua Xiao2026-03-13🤖 cs.AI

CR-Bench: Evaluating the Real-World Utility of AI Code Review Agents

Il documento introduce CR-Bench e CR-Evaluator, un dataset e una pipeline di valutazione dettagliata per analizzare l'utilità reale degli agenti di revisione del codice basati su LLM, evidenziando il compromesso critico tra la risoluzione delle problematiche e la generazione di falsi positivi.

Kristen Pereira, Neelabh Sinha, Rajat Ghosh, Debojyoti Dutta2026-03-13💬 cs.CL

Quality-Driven Agentic Reasoning for LLM-Assisted Software Design: Questions-of-Thoughts (QoT) as a Time-Series Self-QA Chain

Questo articolo presenta Questions-of-Thoughts (QoT), un nuovo metodo di ragionamento agente guidato dalla qualità che trasforma gli obiettivi utente in sequenze di passi ingegneristici e auto-verifiche per migliorare la progettazione software assistita da LLM, dimostrando guadagni significativi in termini di scalabilità, completezza, modularità e sicurezza, specialmente nei modelli più grandi e nei domini complessi.

Yen-Ku Liu, Yun-Cheng Tsai2026-03-13🤖 cs.AI

The Attack and Defense Landscape of Agentic AI: A Comprehensive Survey

Questo articolo presenta il primo sondaggio sistematico sulla sicurezza degli agenti AI, offrendo un quadro completo del panorama delle minacce, delle strategie di difesa e delle sfide aperte per questi sistemi emergenti.

Juhee Kim, Xiaoyuan Liu, Zhun Wang, Shi Qiu, Bo Li, Wenbo Guo, Dawn Song2026-03-13🤖 cs.AI

A Survey of Reasoning in Autonomous Driving Systems: Open Challenges and Emerging Paradigms

Questo articolo propone un quadro sistematico per integrare modelli cognitivi avanzati nei sistemi di guida autonoma, identificando le sfide chiave nel passaggio da un approccio basato sulla percezione a uno fondato sul ragionamento e delineando la necessità di architetture neuro-simboliche per colmare il divario tra la deliberazione dei grandi modelli linguistici e i requisiti di sicurezza in tempo reale.

Kejin Yu, Yuhan Sun, Taiqiang Wu, Ruixu Zhang, Zhiqiang Lin, Yuxin Meng, Junjie Wang, Yujiu Yang2026-03-13🤖 cs.AI

Graph Tokenization for Bridging Graphs and Transformers

Questo lavoro introduce un framework di tokenizzazione per grafi che combina serializzazione reversibile e Byte Pair Encoding per convertire i dati strutturati in grafi in rappresentazioni sequenziali, permettendo ai Transformer di ottenere risultati all'avanguardia su 14 benchmark senza modifiche architetturali.

Zeyuan Guo, Enmao Diao, Cheng Yang, Chuan Shi2026-03-13🤖 cs.LG

Thousand-GPU Large-Scale Training and Optimization Recipe for AI-Native Cloud Embodied Intelligence Infrastructure

Questo lavoro presenta la prima piattaforma di addestramento distribuito su cloud basata su mille GPU per l'intelligenza incarnata, che ottimizza l'intera pipeline dai dati all'infrastruttura per ridurre i tempi di addestramento del modello GR00T-N1.5 di 40 volte e creare un sistema di valutazione end-to-end che accelera lo sviluppo di robot autonomi.

Chen Zhou, Haoran Sun, Hedan Yang, Jing Long, Junwu Xiong, Luqiao Wang, Mingxi Luo, Qiming Yang, Shuai Di, Song Wang, Tianyun Zhao, Wanting Xu, Wen Huang, Xiaodong Bai, Xiaomeng Tian, Xiaolong Xiang, Yicheng Gong, Yongjian Guo, Yucheng Guo, Yunxuan Ma, Yu Wei, Zhong Guan, Zhen Sun2026-03-13🤖 cs.AI

ResWM: Residual-Action World Model for Visual RL

Il paper introduce ResWM, un modello del mondo basato su azioni residue che, riformulando il controllo come aggiustamenti incrementali e utilizzando un codificatore delle differenze di osservazione, migliora significativamente l'efficienza dei campioni, la stabilità e la fluidità del controllo rispetto ai metodi tradizionali nell'apprendimento per rinforzo visivo.

Jseen Zhang, Gabriel Adineera, Jinzhou Tan, Jinoh Kim2026-03-13🤖 cs.AI

Task-Conditioned Routing Signatures in Sparse Mixture-of-Experts Transformers

Questo lavoro introduce le "routing signatures" per dimostrare che i meccanismi di routing nelle architetture Sparse Mixture-of-Experts non sono semplici bilanciamenti, ma catturano una struttura sensibile al compito, permettendo una classificazione accurata dei task basata esclusivamente sui pattern di attivazione degli esperti.

Mynampati Sri Ranganadha Avinash2026-03-13🤖 cs.LG

WebWeaver: Breaking Topology Confidentiality in LLM Multi-Agent Systems with Stealthy Context-Based Inference

Il paper presenta WebWeaver, un framework di attacco che infere in modo stealthy la topologia completa dei sistemi multi-agente basati su LLM compromettendo un singolo agente arbitrario e sfruttando contesti e meccanismi di diffusione, superando così i limiti delle metodologie precedenti che dipendono da assunzioni irrealistiche.

Zixun Xiong, Gaoyi Wu, Lingfeng Yao, Miao Pan, Xiaojiang Du, Hao Wang2026-03-13🤖 cs.AI

Procedural Fairness via Group Counterfactual Explanation

Questo lavoro introduce GCIG, un framework di regolarizzazione che promuove l'equità procedurale nei modelli di machine learning garantendo la stabilità delle spiegazioni tra diversi gruppi protetti, riducendo così le disparità nelle attribuzioni senza compromettere le prestazioni predittive.

Gideon Popoola, John Sheppard2026-03-13🤖 cs.LG

Attention Gathers, MLPs Compose: A Causal Analysis of an Action-Outcome Circuit in VideoViT

Il paper utilizza tecniche di interpretabilità meccanica per dimostrare che i modelli VideoViT sviluppano un circuito causale ridondante e sofisticato, in cui le attention heads raccolgono evidenze e i blocchi MLP compongono concetti, rivelando una "conoscenza nascosta" sulle conseguenze delle azioni umane che va oltre il semplice compito di classificazione.

Sai V R Chereddy2026-03-13🤖 cs.LG

PACED: Distillation at the Frontier of Student Competence

Il paper introduce Paced, un framework di distillazione che ottimizza l'efficienza computazionale concentrando l'addestramento sulla "zona di sviluppo prossimale" del modello studente, dove il rapporto segnale-rumore dei gradienti è massimo, utilizzando una funzione di ponderazione basata sulla distribuzione Beta per massimizzare i guadagni nelle prestazioni senza dimenticare le conoscenze pregresse.

Yuanda Xu, Hejian Sang, Zhengze Zhou, Ran He, Zhipeng Wang2026-03-13🤖 cs.AI

Representation Finetuning for Continual Learning

Il paper introduce CoRe, un nuovo framework per l'apprendimento continuo che sposta il paradigma di affinamento dallo spazio dei pesi a quello delle rappresentazioni, intervenendo in un sottospazio lineare a basso rango per garantire stabilità e plasticità con maggiore efficienza e interpretabilità rispetto ai metodi esistenti.

Haihua Luo, Xuming Ran, Tommi Kärkkäinen, Huiyan Xue, Zhonghua Chen, Qi Xu, Fengyu Cong2026-03-13🤖 cs.LG

← Precedente Successivo →