cs.AI articoli | Gist.Science

SSR-GS: Separating Specular Reflection in Gaussian Splatting for Glossy Surface Reconstruction

Il paper propone SSR-GS, un nuovo framework che migliora la ricostruzione di superfici lucide nel Gaussian Splatting modellando le riflessioni speculari dirette e indirette e integrando prior geometriche e visivi per mitigare gli errori causati dalle riflessioni.

Ningjing Fan, Yiqun Wang2026-03-06🤖 cs.AI

Lifelong Language-Conditioned Robotic Manipulation Learning

Il paper propone SkillsCrafter, un nuovo framework per l'apprendimento robotico continuo che mitiga l'oblio catastrofico e migliora la generalizzazione attraverso l'adattamento delle abilità di manipolazione e l'aggregazione specializzata basata su sottospazi semantici comuni.

Xudong Wang, Zebin Han, Zhiyu Liu + 5 more2026-03-06🤖 cs.AI

C2-Faith: Benchmarking LLM Judges for Causal and Coverage Faithfulness in Chain-of-Thought Reasoning

Il paper introduce C2-Faith, un benchmark basato su PRM800K che valuta l'affidabilità dei giudici LLM nel misurare la fedeltà causale e la completezza del ragionamento a catena di pensiero, rivelando che le prestazioni dipendono fortemente dal compito specifico e che esistono significative lacune nella capacità di localizzare errori o valutare ragionamenti incompleti.

Avni Mittal, Rauno Arike2026-03-06🤖 cs.AI

Guidelines for the Annotation and Visualization of Legal Argumentation Structures in Chinese Judicial Decisions

Questa guida propone un quadro sistematico per l'annotazione e la visualizzazione della struttura degli argomenti giuridici nelle decisioni giudiziarie cinesi, definendo tipi di proposizioni, relazioni argomentative e flussi di lavoro standardizzati per supportare l'analisi computazionale del ragionamento giuridico.

Kun Chen, Xianglei Liao, Kaixue Fei + 2 more2026-03-06🤖 cs.AI

Logi-PAR: Logic-Infused Patient Activity Recognition via Differentiable Rule

Il paper presenta Logi-PAR, il primo framework di riconoscimento delle attività dei pazienti che integra regole differenziabili e logica simbolica per inferire esplicitamente le cause dei rischi clinici, fornendo spiegazioni verificabili e superando le prestazioni degli attuali modelli basati su visione e linguaggio.

Muhammad Zarar, MingZheng Zhang, Xiaowang Zhang + 3 more2026-03-06🤖 cs.AI

Escaping the Hydrolysis Trap: An Agentic Workflow for Inverse Design of Durable Photocatalytic Covalent Organic Frameworks

Il lavoro presenta "Ara", un agente basato su modelli linguistici che accelera la scoperta di fotocatalizzatori COF stabili e attivi per la produzione di idrogeno solare, superando significativamente i metodi di ricerca tradizionali grazie all'integrazione di conoscenze chimiche pre-addestrate e a una logica di ragionamento interpretabile.

Iman Peivaste, Nicolas D. Boscher, Ahmed Makradi + 1 more2026-03-06🔬 cond-mat.mtrl-sci

Stable-LoRA: Stabilizing Feature Learning of Low-Rank Adaptation

Il paper presenta Stable-LoRA, una strategia di ottimizzazione che risolve l'instabilità intrinseca dell'inizializzazione non nulla di LoRA riducendo dinamicamente la matrice A nelle fasi iniziali, garantendo così un apprendimento delle caratteristiche stabile e prestazioni superiori senza costi computazionali aggiuntivi.

Yize Wu, Ke Gao, Ling Li + 1 more2026-03-06🤖 cs.AI

Balancing Coverage and Draft Latency in Vocabulary Trimming for Faster Speculative Decoding

Questo articolo propone un metodo di ottimizzazione per la selezione del vocabolario nei modelli di bozza dello speculative decoding, che bilancia copertura e latenza riducendo fino al 97% la dimensione del vocabolario e migliorando il throughput fino al 20% su compiti specifici di dominio.

Ofir Ben Shoham2026-03-06🤖 cs.AI

Early Warning of Intraoperative Adverse Events via Transformer-Driven Multi-Label Learning

Questo studio presenta IAENet, un innovativo framework di apprendimento multi-etichetta basato su Transformer che, integrando un dataset specifico (MuAE) e una nuova funzione di perdita, supera le limitazioni degli approcci esistenti nel prevedere tempestivamente eventi avversi intraoperatori multipli, migliorando significativamente la sicurezza del paziente.

Xueyao Wang, Xiuding Cai, Honglin Shang + 2 more2026-03-06🤖 cs.AI

KARL: Knowledge Agents via Reinforcement Learning

Il paper presenta KARL, un sistema di agenti di ricerca aziendale addestrati tramite apprendimento per rinforzo che, grazie a un nuovo benchmark (KARLBench), dati sintetici e un paradigma di post-addestramento iterativo, raggiunge prestazioni all'avanguardia e supera i modelli chiusi più potenti in compiti complessi di ragionamento e ricerca.

Jonathan D. Chang, Andrew Drozdov, Shubham Toshniwal + 23 more2026-03-06🤖 cs.AI

SPyCer: Semi-Supervised Physics-Guided Contextual Attention for Near-Surface Air Temperature Estimation from Satellite Imagery

Il paper presenta SPyCer, una rete semi-supervisionata guidata dalla fisica che utilizza l'attenzione contestuale su immagini satellitari per stimare con precisione e coerenza fisica la temperatura dell'aria vicino alla superficie, superando i limiti delle misurazioni dei sensori terrestri.

Sofiane Bouaziz, Adel Hafiane, Raphael Canals + 1 more2026-03-06🤖 cs.AI

AI+HW 2035: Shaping the Next Decade

Questo documento presenta una roadmap decennale per la co-progettazione integrata di intelligenza artificiale e hardware, mirata a superare la frammentazione attuale attraverso l'ottimizzazione trasversale e l'efficienza energetica per realizzare sistemi intelligenti sostenibili, adattivi e accessibili entro il 2035.

Deming Chen, Jason Cong, Azalia Mirhoseini + 27 more2026-03-06🤖 cs.AI

The Geometric Inductive Bias of Grokking: Bypassing Phase Transitions via Architectural Topology

Lo studio dimostra che l'adozione di una topologia sferica vincolata e l'ablazione del routing attentivo adattivo nei Transformer eliminano la fase di memorizzazione nel fenomeno del "grokking" sull'addizione modulare, suggerendo che l'allineamento tra le priorità architetturali e le simmetrie intrinseche del compito è cruciale per accelerare la generalizzazione.

Alper Yıldırım2026-03-06🤖 cs.AI

Not All Trust is the Same: Effects of Decision Workflow and Explanations in Human-AI Decision Making

Lo studio dimostra che il flusso decisionale e le spiegazioni influenzano in modo complesso la fiducia e l'affidamento comportamentale nell'AI, confermando che questi due costrutti sono distinti e che non esiste una soluzione universale per prevenire la sovrastima o la sottostima dell'AI.

Laura Spillner, Rachel Ringe, Robert Porzel + 1 more2026-03-06🤖 cs.AI

Boosting ASR Robustness via Test-Time Reinforcement Learning with Audio-Text Semantic Rewards

Il paper presenta ASR-TRA, un nuovo framework di adattamento test-time basato sull'apprendimento per rinforzo che utilizza ricompense semantiche audio-testo per migliorare la robustezza e l'accuratezza dei sistemi di riconoscimento vocale in condizioni reali difficili, superando i limiti dei metodi basati sulla minimizzazione dell'entropia.

Linghan Fang, Tianxin Xie, Li Liu2026-03-06🤖 cs.AI

Recursive Inference Machines for Neural Reasoning

Il paper introduce le Recursive Inference Machines (RIMs), un nuovo framework di ragionamento neurale che integra meccanismi ricorsivi ispirati ai motori di inferenza classici per migliorare le prestazioni dei modelli esistenti su compiti complessi come il ragionamento logico e la classificazione di dati tabellari.

Mieszko Komisarczyk, Saurabh Mathur, Maurice Kraus + 2 more2026-03-06🤖 cs.AI

Reclaiming Lost Text Layers for Source-Free Cross-Domain Few-Shot Learning

Questo paper propone un metodo per riutilizzare le informazioni delle "strati perduti" dell'encoder testuale di CLIP, invece di rimuoverli, al fine di migliorare l'apprendimento few-shot cross-dominio senza sorgente guidando il riadattamento del ramo visivo.

Zhenyu Zhang, Guangyao Chen, Yixiong Zou + 2 more2026-03-06🤖 cs.AI

GCAgent: Enhancing Group Chat Communication through Dialogue Agents System

Il paper presenta GCAgent, un sistema basato su modelli linguistici di grandi dimensioni che migliora la comunicazione nei gruppi di chat tramite agenti dialogici personalizzati, dimostrando attraverso esperimenti e un deployment reale di 350 giorni un aumento significativo dell'attività e dell'engagement degli utenti.

Zijie Meng, Zheyong Xie, Zheyu Ye + 5 more2026-03-06🤖 cs.AI

Visual-Informed Speech Enhancement Using Attention-Based Beamforming

Il paper propone la VI-NBFNet, una rete neurale di beamforming che integra segnali audio da array di microfoni e informazioni visive estratte dai movimenti delle labbra per migliorare l'enhancement del parlato e la robustezza in scenari complessi e dinamici.

Chihyun Liu, Jiaxuan Fan, Mingtung Sun + 3 more2026-03-06🤖 cs.AI

Whispering to a Blackbox: Bootstrapping Frozen OCR with Visual Prompts

Questo articolo presenta il "Whisperer", un innovativo framework di prompting visivo che utilizza un curriculum di apprendimento per imitazione comportamentale di miglioramenti stocastici trovati da un modello di diffusione, permettendo di ridurre significativamente l'errore di riconoscimento dei caratteri su immagini degradate adattando gli input pixel per pixel senza modificare i pesi dei modelli OCR pre-addestrati e congelati.

Samandar Samandarov, Nazirjon Ismoiljonov, Abdullah Sattorov + 1 more2026-03-06🤖 cs.AI

← Precedente Successivo →