cs.AI articoli | Gist.Science

LBM: Hierarchical Large Auto-Bidding Model via Reasoning and Acting

Il paper presenta LBM, un modello gerarchico di auto-offerta pubblicitaria che combina un modulo di ragionamento (LBM-Think) e uno di azione (LBM-Act) potenziati da un meccanismo di embedding duale e da un fine-tuning offline (GQPO) per migliorare le prestazioni e la generalizzazione nelle aste competitive.

Yewen Li, Zhiyi Lyu, Peng Jiang + 4 more2026-03-06🤖 cs.AI

Particle-Guided Diffusion for Gas-Phase Reaction Kinetics

Questo studio applica modelli di diffusione guidati da principi fisici per generare campi di concentrazione coerenti e prevedere accuratamente le concentrazioni di uscita in reazioni chimiche in fase gassosa, dimostrando il potenziale di questi modelli per l'inferenza in sistemi di trasporto reattivo.

Andrew Millard, Henrik Pedersen2026-03-06🔬 physics

Recurrent Graph Neural Networks and Arithmetic Circuits

Questo lavoro stabilisce una corrispondenza esatta tra la potenza espressiva delle reti neurali su grafi ricorrenti e quella dei circuiti aritmetici ricorrenti operanti sui numeri reali, dimostrando che i due modelli sono computazionalmente equivalenti.

Timon Barlag, Vivian Holzapfel, Laura Strieker + 2 more2026-03-06🤖 cs.AI

Federated Causal Discovery Across Heterogeneous Datasets under Latent Confounding

Il paper introduce fedCI e fedCI-IOD, un framework federato che permette di scoprire relazioni causali in dataset eterogenei e distribuiti sotto vincoli di confondimento latente, preservando la privacy e migliorando la potenza statistica senza centralizzare i dati.

Maximilian Hahn, Alina Zajak, Dominik Heider + 1 more2026-03-06🤖 cs.AI

SSR-GS: Separating Specular Reflection in Gaussian Splatting for Glossy Surface Reconstruction

Il paper propone SSR-GS, un nuovo framework che migliora la ricostruzione di superfici lucide nel Gaussian Splatting modellando le riflessioni speculari dirette e indirette e integrando prior geometriche e visivi per mitigare gli errori causati dalle riflessioni.

Ningjing Fan, Yiqun Wang2026-03-06🤖 cs.AI

Lifelong Language-Conditioned Robotic Manipulation Learning

Il paper propone SkillsCrafter, un nuovo framework per l'apprendimento robotico continuo che mitiga l'oblio catastrofico e migliora la generalizzazione attraverso l'adattamento delle abilità di manipolazione e l'aggregazione specializzata basata su sottospazi semantici comuni.

Xudong Wang, Zebin Han, Zhiyu Liu + 5 more2026-03-06🤖 cs.AI

C2-Faith: Benchmarking LLM Judges for Causal and Coverage Faithfulness in Chain-of-Thought Reasoning

Il paper introduce C2-Faith, un benchmark basato su PRM800K che valuta l'affidabilità dei giudici LLM nel misurare la fedeltà causale e la completezza del ragionamento a catena di pensiero, rivelando che le prestazioni dipendono fortemente dal compito specifico e che esistono significative lacune nella capacità di localizzare errori o valutare ragionamenti incompleti.

Avni Mittal, Rauno Arike2026-03-06🤖 cs.AI

Guidelines for the Annotation and Visualization of Legal Argumentation Structures in Chinese Judicial Decisions

Questa guida propone un quadro sistematico per l'annotazione e la visualizzazione della struttura degli argomenti giuridici nelle decisioni giudiziarie cinesi, definendo tipi di proposizioni, relazioni argomentative e flussi di lavoro standardizzati per supportare l'analisi computazionale del ragionamento giuridico.

Kun Chen, Xianglei Liao, Kaixue Fei + 2 more2026-03-06🤖 cs.AI

Logi-PAR: Logic-Infused Patient Activity Recognition via Differentiable Rule

Il paper presenta Logi-PAR, il primo framework di riconoscimento delle attività dei pazienti che integra regole differenziabili e logica simbolica per inferire esplicitamente le cause dei rischi clinici, fornendo spiegazioni verificabili e superando le prestazioni degli attuali modelli basati su visione e linguaggio.

Muhammad Zarar, MingZheng Zhang, Xiaowang Zhang + 3 more2026-03-06🤖 cs.AI

Escaping the Hydrolysis Trap: An Agentic Workflow for Inverse Design of Durable Photocatalytic Covalent Organic Frameworks

Il lavoro presenta "Ara", un agente basato su modelli linguistici che accelera la scoperta di fotocatalizzatori COF stabili e attivi per la produzione di idrogeno solare, superando significativamente i metodi di ricerca tradizionali grazie all'integrazione di conoscenze chimiche pre-addestrate e a una logica di ragionamento interpretabile.

Iman Peivaste, Nicolas D. Boscher, Ahmed Makradi + 1 more2026-03-06🔬 cond-mat.mtrl-sci

Stable-LoRA: Stabilizing Feature Learning of Low-Rank Adaptation

Il paper presenta Stable-LoRA, una strategia di ottimizzazione che risolve l'instabilità intrinseca dell'inizializzazione non nulla di LoRA riducendo dinamicamente la matrice A nelle fasi iniziali, garantendo così un apprendimento delle caratteristiche stabile e prestazioni superiori senza costi computazionali aggiuntivi.

Yize Wu, Ke Gao, Ling Li + 1 more2026-03-06🤖 cs.AI

Balancing Coverage and Draft Latency in Vocabulary Trimming for Faster Speculative Decoding

Questo articolo propone un metodo di ottimizzazione per la selezione del vocabolario nei modelli di bozza dello speculative decoding, che bilancia copertura e latenza riducendo fino al 97% la dimensione del vocabolario e migliorando il throughput fino al 20% su compiti specifici di dominio.

Ofir Ben Shoham2026-03-06🤖 cs.AI

Early Warning of Intraoperative Adverse Events via Transformer-Driven Multi-Label Learning

Questo studio presenta IAENet, un innovativo framework di apprendimento multi-etichetta basato su Transformer che, integrando un dataset specifico (MuAE) e una nuova funzione di perdita, supera le limitazioni degli approcci esistenti nel prevedere tempestivamente eventi avversi intraoperatori multipli, migliorando significativamente la sicurezza del paziente.

Xueyao Wang, Xiuding Cai, Honglin Shang + 2 more2026-03-06🤖 cs.AI

KARL: Knowledge Agents via Reinforcement Learning

Il paper presenta KARL, un sistema di agenti di ricerca aziendale addestrati tramite apprendimento per rinforzo che, grazie a un nuovo benchmark (KARLBench), dati sintetici e un paradigma di post-addestramento iterativo, raggiunge prestazioni all'avanguardia e supera i modelli chiusi più potenti in compiti complessi di ragionamento e ricerca.

Jonathan D. Chang, Andrew Drozdov, Shubham Toshniwal + 23 more2026-03-06🤖 cs.AI

SPyCer: Semi-Supervised Physics-Guided Contextual Attention for Near-Surface Air Temperature Estimation from Satellite Imagery

Il paper presenta SPyCer, una rete semi-supervisionata guidata dalla fisica che utilizza l'attenzione contestuale su immagini satellitari per stimare con precisione e coerenza fisica la temperatura dell'aria vicino alla superficie, superando i limiti delle misurazioni dei sensori terrestri.

Sofiane Bouaziz, Adel Hafiane, Raphael Canals + 1 more2026-03-06🤖 cs.AI

AI+HW 2035: Shaping the Next Decade

Questo documento presenta una roadmap decennale per la co-progettazione integrata di intelligenza artificiale e hardware, mirata a superare la frammentazione attuale attraverso l'ottimizzazione trasversale e l'efficienza energetica per realizzare sistemi intelligenti sostenibili, adattivi e accessibili entro il 2035.

Deming Chen, Jason Cong, Azalia Mirhoseini + 27 more2026-03-06🤖 cs.AI

The Geometric Inductive Bias of Grokking: Bypassing Phase Transitions via Architectural Topology

Lo studio dimostra che l'adozione di una topologia sferica vincolata e l'ablazione del routing attentivo adattivo nei Transformer eliminano la fase di memorizzazione nel fenomeno del "grokking" sull'addizione modulare, suggerendo che l'allineamento tra le priorità architetturali e le simmetrie intrinseche del compito è cruciale per accelerare la generalizzazione.

Alper Yıldırım2026-03-06🤖 cs.AI

Not All Trust is the Same: Effects of Decision Workflow and Explanations in Human-AI Decision Making

Lo studio dimostra che il flusso decisionale e le spiegazioni influenzano in modo complesso la fiducia e l'affidamento comportamentale nell'AI, confermando che questi due costrutti sono distinti e che non esiste una soluzione universale per prevenire la sovrastima o la sottostima dell'AI.

Laura Spillner, Rachel Ringe, Robert Porzel + 1 more2026-03-06🤖 cs.AI

Boosting ASR Robustness via Test-Time Reinforcement Learning with Audio-Text Semantic Rewards

Il paper presenta ASR-TRA, un nuovo framework di adattamento test-time basato sull'apprendimento per rinforzo che utilizza ricompense semantiche audio-testo per migliorare la robustezza e l'accuratezza dei sistemi di riconoscimento vocale in condizioni reali difficili, superando i limiti dei metodi basati sulla minimizzazione dell'entropia.

Linghan Fang, Tianxin Xie, Li Liu2026-03-06🤖 cs.AI

Recursive Inference Machines for Neural Reasoning

Il paper introduce le Recursive Inference Machines (RIMs), un nuovo framework di ragionamento neurale che integra meccanismi ricorsivi ispirati ai motori di inferenza classici per migliorare le prestazioni dei modelli esistenti su compiti complessi come il ragionamento logico e la classificazione di dati tabellari.

Mieszko Komisarczyk, Saurabh Mathur, Maurice Kraus + 2 more2026-03-06🤖 cs.AI

← Precedente Successivo →