cs.AI articoli | Gist.Science

Guiding Diffusion-based Reconstruction with Contrastive Signals for Balanced Visual Representation

Il paper propone la Ricostruzione Contrastiva Diffusiva (DCR), un metodo che integra segnali contrastivi derivati dalle immagini ricostruite nel processo di diffusione per bilanciare la capacità discriminativa e la percezione dei dettagli, superando così i limiti degli encoder visivi CLIP.

Boyu Han, Qianqian Xu, Shilong Bao + 4 more2026-03-06💻 cs

Attention's Gravitational Field:A Power-Law Interpretation of Positional Correlation

Questo articolo introduce il concetto di Campo Gravitazionale dell'Attenzione (AGF) per decodificare le relazioni posizionali nei modelli linguistici di grandi dimensioni, dimostrando come la separazione tra codifiche posizionali e incorporamenti semantici, allineata alla legge di gravitazione universale, ottimizzi l'architettura del modello e ne migliori l'interpretabilità.

Edward Zhang2026-03-06💻 cs

Meta-D: Metadata-Aware Architectures for Brain Tumor Analysis and Missing-Modality Segmentation

Il paper presenta Meta-D, un'architettura che sfrutta i metadati categorici degli scanner per guidare l'estrazione delle caratteristiche, migliorando significativamente sia la rilevazione dei tumori cerebrali che la segmentazione in presenza di modalità mancanti.

SangHyuk Kim, Daniel Haehn, Sumientra Rampersad2026-03-06💻 cs

EchoGuard: An Agentic Framework with Knowledge-Graph Memory for Detecting Manipulative Communication in Longitudinal Dialogue

Il paper presenta EchoGuard, un framework agentic che utilizza una Knowledge Graph come memoria episodica e semantica per analizzare dialoghi longitudinali, rilevare pattern manipolatori e guidare gli utenti verso l'autoriconoscimento tramite prompt socratici.

Ratna Kandala, Niva Manchanda, Akshata Kishore Moharir + 1 more2026-03-06🤖 cs.AI

LLM-Grounded Explainability for Port Congestion Prediction via Temporal Graph Attention Networks

Questo paper presenta AIS-TGNN, un framework che combina una rete di attenzione temporale su grafi con un modello linguistico su larga scala per prevedere e spiegare in modo affidabile le congestioni portuali, garantendo un'alta coerenza tra le previsioni statistiche e le narrazioni generate.

Zhiming Xue, Yujue Wang2026-03-06🤖 cs.AI

On the Strengths and Weaknesses of Data for Open-set Embodied Assistance

Questo studio analizza i punti di forza e le debolezze dei dati per l'assistenza incorporata in scenari open-set, dimostrando che la generazione di dataset sintetici diversificati e multimodali è fondamentale per addestrare modelli in grado di generalizzare a nuovi comportamenti utente e configurazioni di compiti.

Pradyumna Tambwekar, Andrew Silva, Deepak Gopinath + 3 more2026-03-06🤖 cs.AI

VISA: Value Injection via Shielded Adaptation for Personalized LLM Alignment

Il paper propone VISA, un framework a ciclo chiuso che utilizza l'ottimizzazione della politica relativa di gruppo (GRPO) per iniettare valori umani specifici negli LLM senza comprometterne la coerenza semantica o le capacità generali, superando così i limiti delle tecniche di allineamento tradizionali.

Jiawei Chen, Tianzhuo Yang, Guoxi Zhang + 3 more2026-03-06🤖 cs.AI

Multilevel Training for Kolmogorov Arnold Networks

Questo articolo propone un approccio di addestramento multilivello per le reti Kolmogorov-Arnold (KAN) che, sfruttando la loro struttura basata su funzioni spline e una mappatura equivalente alle MLP, ottiene accelerazioni nell'addestramento e miglioramenti significativi della precisione, specialmente nelle reti neurali per la fisica informata.

Ben S. Southworth, Jonas A. Actor, Graham Harper + 1 more2026-03-06🔢 math

SCoUT: Scalable Communication via Utility-Guided Temporal Grouping in Multi-Agent Reinforcement Learning

Il paper introduce SCoUT, un metodo per l'apprendimento multi-agente che risolve le sfide della comunicazione scalabile e della selezione dei destinatari attraverso l'aggregazione temporale degli agenti, l'uso di vantaggi controfattuali per un'assegnazione precisa del credito e un'architettura che garantisce l'esecuzione decentralizzata.

Manav Vora, Gokul Puthumanaillam, Hiroyasu Tsukamoto + 1 more2026-03-06🤖 cs.AI

Design Behaviour Codes (DBCs): A Taxonomy-Driven Layered Governance Benchmark for Large Language Models

Il paper introduce il benchmark DBC, un framework empirico che valuta un nuovo strato di governance comportamentale applicato all'inferenza, dimostrando come questo sistema riduca significativamente i rischi e migliori la conformità normativa rispetto ai metodi di moderazione tradizionali.

G. Madan Mohan, Veena Kiran Nambiar, Kiranmayee Janardhan2026-03-06🤖 cs.AI

An Approach to Simultaneous Acquisition of Real-Time MRI Video, EEG, and Surface EMG for Articulatory, Brain, and Muscle Activity During Speech Production

Il documento presenta il primo approccio per l'acquisizione simultanea di risonanza magnetica in tempo reale, EEG e EMG di superficie, integrando un pipeline di soppressione degli artefatti per studiare in modo completo i processi neurali, muscolari e articolatori alla base della produzione del parlato.

Jihwan Lee, Parsa Razmara, Kevin Huang + 16 more2026-03-06🤖 cs.AI

On Multi-Step Theorem Prediction via Non-Parametric Structural Priors

Questo lavoro propone un metodo di previsione dei teoremi privo di addestramento che, superando il collo di bottiglia della "deriva strutturale" nell'apprendimento contestuale tramite l'uso di Grafi di Precedenza dei Teoremi e vincoli topologici espliciti, raggiunge prestazioni competitive con i modelli supervisionati sul benchmark FormalGeo7k.

Junbo Zhao, Ting Zhang, Can Li + 3 more2026-03-06🤖 cs.AI

Causally Robust Reward Learning from Reason-Augmented Preference Feedback

Il paper presenta ReCouPLe, un framework leggero che utilizza rationales in linguaggio naturale per guidare l'apprendimento delle ricompense basato sulle preferenze, mitigando la confusione causale e migliorando significativamente la generalizzazione e le prestazioni delle politiche in nuovi compiti senza richiedere ulteriori dati o fine-tuning del modello linguistico.

Minjune Hwang, Yigit Korkmaz, Daniel Seita + 1 more2026-03-06🤖 cs.AI

K-Gen: A Multimodal Language-Conditioned Approach for Interpretable Keypoint-Guided Trajectory Generation

Il paper presenta K-Gen, un approccio multimodale basato su modelli linguistici che genera traiettorie interpretabili per la guida autonoma combinando mappe rasterizzate e descrizioni testuali, migliorando le prestazioni attraverso la previsione di punti chiave e un algoritmo di ottimizzazione per rinforzo.

Mingxuan Mu, Guo Yang, Lei Chen + 2 more2026-03-06🤖 cs.AI

SEA-TS: Self-Evolving Agent for Autonomous Code Generation of Time Series Forecasting Algorithms

Il paper presenta SEA-TS, un agente autonomo in grado di generare, validare e ottimizzare algoritmi di previsione delle serie temporali attraverso un ciclo di auto-evoluzione che combina ricerca MCTS, revisione del codice e ragionamento globale, ottenendo risultati superiori rispetto ai metodi esistenti e scoprendo nuovi pattern architetturali innovativi.

Longkun Xu, Xiaochun Zhang, Qiantu Tuo + 1 more2026-03-06🤖 cs.AI

Interpretable Pre-Release Baseball Pitch Type Anticipation from Broadcast 3D Kinematics

Questo studio dimostra che è possibile prevedere con un'accuratezza dell'80,4% il tipo di lancio di baseball analizzando esclusivamente la cinematica 3D del corpo del lanciatore, rivelando che la meccanica del busto e la posizione del polso sono i fattori più determinanti, mentre le varianti di presa non sono distinguibili dal movimento corporeo.

Jerrin Bright, Michelle Lu, John Zelek2026-03-06🤖 cs.AI

DeformTrace: A Deformable State Space Model with Relay Tokens for Temporal Forgery Localization

Il paper presenta DeformTrace, un modello innovativo basato su stati spaziali deformabili e token di relay che supera le limitazioni delle tecniche attuali per la localizzazione temporale delle falsificazioni, offrendo prestazioni all'avanguardia con maggiore efficienza e robustezza.

Xiaodong Zhu, Suting Wang, Yuanming Zheng + 5 more2026-03-06🤖 cs.AI

Bounded State in an Infinite Horizon: Proactive Hierarchical Memory for Ad-Hoc Recall over Streaming Dialogues

Il paper introduce STEM-Bench, il primo benchmark per valutare la memoria nei dialoghi in streaming, e propone ProStream, un framework di memoria gerarchica proattiva che risolve il dilemma tra fedeltà ed efficienza permettendo un richiamo ad hoc e uno stato di conoscenza limitato senza sacrificare la precisione.

Bingbing Wang, Jing Li, Ruifeng Xu2026-03-06🤖 cs.AI

FedAFD: Multimodal Federated Learning via Adversarial Fusion and Distillation

Il paper propone FedAFD, un quadro unificato per l'apprendimento federato multimodale che, attraverso allineamento avversariale, fusione adattiva e distillazione guidata dalla similarità, risolve le sfide dell'eterogeneità dei dati e dei modelli per migliorare le prestazioni sia lato client che server.

Min Tan, Junchao Ma, Yinfu Feng + 6 more2026-03-06🤖 cs.AI

Free Lunch for Pass@ $k$ ? Low Cost Diverse Sampling for Diffusion Language Models

Gli autori propongono un metodo di campionamento privo di addestramento e a basso costo che migliora la diversità e le prestazioni Pass@ $k$ dei Modelli Linguistici Diffusivi penalizzando attivamente la ridondanza tra i campioni generati, ottenendo risultati superiori su benchmark come HumanEval e GSM8K.

Sean Lamont, Christian Walder, Paul Montague + 2 more2026-03-06🤖 cs.AI

← Precedente Successivo →

cs.AI