cs.LG articoli | Gist.Science

Reasoning on Time-Series for Financial Technical Analysis

Il documento presenta Verbal Technical Analysis (VTA), un nuovo framework che combina annotazioni testuali e ragionamento latente per generare previsioni azionarie accurate e interpretabili, superando le limitazioni dei modelli linguistici attuali che non analizzano adeguatamente i dati storici dei prezzi.

Kelvin J. L. Koa, Jan Chen, Yunshan Ma + 2 more2026-03-03💰 q-fin

Distributional Shrinkage I: Universal Denoiser Beyond Tweedie's Formula

Il paper propone denoiser universali basati sulla contrazione distribuzionale che, ignorando la distribuzione specifica del segnale e del rumore, offrono miglioramenti significativi rispetto alla formula di Tweedie nel ripristinare l'intera distribuzione del segnale sottostante, raggiungendo un'accuratezza superiore attraverso tecniche ispirate al trasporto ottimo e allo score matching.

Tengyuan Liang2026-03-03📊 stat

Generative Models for Crystalline Materials

Questa rassegna analizza lo stato attuale dei modelli generativi per la previsione e la generazione *de novo* di strutture cristalline, esaminando rappresentazioni, modelli, limiti, considerazioni sperimentali e temi emergenti per guidare sia gli scienziati sperimentali che gli specialisti di machine learning nella progettazione inversa dei materiali.

Houssam Metni, Laura Ruple, Lauren N. Walters + 13 more2026-03-03🔬 cond-mat.mtrl-sci

Nonstabilizerness Estimation using Graph Neural Networks

Questo articolo propone un approccio basato su Graph Neural Networks per stimare l'entropia di Rényi di stabilizzatore come misura di nonstabilizerness nei circuiti quantistici, dimostrando una robusta capacità di generalizzazione e di previsione sia su dati simulati che su hardware quantistico rumoroso.

Vincenzo Lipardi, Domenica Dibenedetto, Georgios Stamoulis + 2 more2026-03-03⚛️ quant-ph

InnoGym: Benchmarking the Innovation Potential of AI Agents

Il paper presenta InnoGym, il primo benchmark e framework progettato per valutare sistematicamente il potenziale innovativo degli agenti AI attraverso metriche di guadagno prestazionale e novità, rivelando un divario critico tra creatività e robustezza nelle soluzioni generate.

Jintian Zhang, Kewei Xu, Jingsheng Zheng + 10 more2026-03-03💬 cs.CL

Cache What Lasts: Token Retention for Memory-Bounded KV Cache in LLMs

Il paper presenta TRIM-KV, un metodo innovativo che utilizza un gate di retention appreso per selezionare dinamicamente i token più importanti nel cache KV, migliorando l'efficienza e le prestazioni dei modelli linguistici su lunghi contesti senza sovraccarichi computazionali significativi.

Ngoc Bui, Shubham Sharma, Simran Lamba + 2 more2026-03-03🤖 cs.AI

AdaptVision: Efficient Vision-Language Models via Adaptive Visual Acquisition

AdaptVision è un paradigma efficiente per i modelli visione-linguaggio che, ispirandosi alla visione attiva umana e utilizzando un framework di apprendimento per rinforzo con ottimizzazione della politica disaccoppiata (DTPO), determina autonomamente il numero minimo di token visivi necessari per ogni campione attraverso un approccio a grana grossa-fine che combina token compressi e l'acquisizione selettiva di regioni chiave.

Zichuan Lin, Yicheng Liu, Yang Yang + 2 more2026-03-03💬 cs.CL

Learning to Orchestrate Agents in Natural Language with the Conductor

Il paper presenta il "Conductor", un modello addestrato con reinforcement learning che coordina dinamicamente agenti LLM eterogenei, ottimizzando sia le topologie di comunicazione che le istruzioni per raggiungere risultati all'avanguardia in benchmark di ragionamento complessi.

Stefan Nielsen, Edoardo Cetin, Peter Schwendeman + 3 more2026-03-03🤖 cs.LG

TRINITY: An Evolved LLM Coordinator

Il paper presenta Trinity, un coordinatore leggero basato su una strategia evolutiva che orchestra la collaborazione dinamica tra diversi modelli linguistici assegnando loro ruoli specifici (pensatore, operatore o verificatore), ottenendo così prestazioni superiori e una robusta generalizzazione su compiti complessi senza richiedere la fusione dei pesi o l'accesso a API chiuse.

Jinglue Xu, Qi Sun, Peter Schwendeman + 3 more2026-03-03🤖 cs.LG

Distributional Shrinkage II: Higher-Order Scores Encode Brenier Map

Questo lavoro introduce una gerarchia di denoiser agnostici basati sulle funzioni di punteggio di ordine superiore della distribuzione rumorosa, che attraverso ricorsioni di polinomi di Bell codificano progressivamente la mappa di trasporto ottimale di Brenier per il recupero del segnale, con analisi delle strategie di stima e dei relativi tassi di convergenza.

Tengyuan Liang2026-03-03📊 stat

Brain-Semantoks: Learning Semantic Tokens of Brain Dynamics with a Self-Distilled Foundation Model

Il paper presenta Brain-Semantoks, un modello fondazionale auto-distillato che apprende token semantici robusti dalle dinamiche cerebrali fMRI per migliorare le prestazioni su compiti downstream e la generalizzazione fuori distribuzione.

Sam Gijsen, Marc-Andre Schulz, Kerstin Ritter2026-03-03🧬 q-bio

Goal Reaching with Eikonal-Constrained Hierarchical Quasimetric Reinforcement Learning

Il paper propone Eik-HiQRL, un approccio di apprendimento per rinforzo gerarchico basato su un'equazione di Eikonal che supera i limiti dei metodi quasimetrici tradizionali offrendo generalizzazione fuori distribuzione e prestazioni all'avanguardia in compiti di navigazione e manipolazione.

Vittorio Giammarino, Ahmed H. Qureshi2026-03-03⚡ eess

EUBRL: Epistemic Uncertainty Directed Bayesian Reinforcement Learning

Il paper propone EUBRL, un algoritmo di apprendimento per rinforzo bayesiano che utilizza l'incertezza epistemica per guidare l'esplorazione, garantendo ottimalità teorica e prestazioni superiori in termini di efficienza dei campioni su MDP a orizzonte infinito con ricompense sparse.

Jianfei Ma, Wee Sun Lee2026-03-03🤖 cs.LG

SoFlow: Solution Flow Models for One-Step Generative Modeling

Il paper presenta SoFlow, un framework per la generazione in un singolo passo che, grazie a una nuova funzione di perdita di coerenza della soluzione che evita il calcolo del prodotto vettore-Jacobiano, supera le prestazioni dei modelli MeanFlow su ImageNet 256x256.

Tianze Luo, Haotian Yuan, Zhuang Liu2026-03-03🤖 cs.LG

Dynamic Tool Dependency Retrieval for Efficient Function Calling

Il documento presenta DTDR, un metodo di recupero dinamico delle dipendenze degli strumenti che, condizionandosi sia alla query iniziale che al contesto di esecuzione in evoluzione, supera i limiti dei recuperatori statici migliorando significativamente l'accuratezza e l'efficienza degli agenti di chiamata di funzioni.

Bhrij Patel, Davide Belli, Amir Jalalirad + 3 more2026-03-03🤖 cs.LG

RMAAT: Astrocyte-Inspired Memory Compression and Replay for Efficient Long-Context Transformers

Il documento presenta RMAAT, un'architettura Transformer ispirata alle funzioni degli astrociti che combina compressione della memoria adattiva e ricorsione segmentata per superare la complessità quadratica dell'attenzione e abilitare l'elaborazione efficiente di contesti lunghi.

Md Zesun Ahmed Mia, Malyaban Bal, Abhronil Sengupta2026-03-03🤖 cs.AI

Aligned explanations in neural networks

Il paper introduce i PiNets, un framework di deep learning basato sul principio di leggibilità del modello, che garantisce allineamento esplicativo assicurando che le spiegazioni riflettano direttamente il processo decisionale del modello piuttosto che fungere da razionalizzazioni, ottenendo al contempo fedeltà in termini di significatività, robustezza e sufficienza.

Corentin Lobet, Francesca Chiaromonte2026-03-03📊 stat

AgentOCR: Reimagining Agent History via Optical Self-Compression

Il paper introduce AgentOCR, un framework che ottimizza l'efficienza dei token e della memoria negli agenti LLM trasformando la cronologia delle interazioni in immagini compatte, implementando una cache ottica segmentata per evitare ridondanze e un meccanismo di auto-compressione adattiva che mantiene oltre il 95% delle prestazioni riducendo il consumo di token del 50%.

Lang Feng, Fuchao Yang, Feng Chen + 5 more2026-03-03🤖 cs.AI

TP-Blend: Textual-Prompt Attention Pairing for Precise Object-Style Blending in Diffusion Models

Il paper presenta TP-Blend, un framework leggero e senza addestramento che combina due prompt testuali distinti per fondere con precisione un nuovo oggetto e uno stile in modelli di diffusione, utilizzando i moduli CAOF e SASF per preservare la coerenza geometrica e la texture dettagliata.

Xin Jin, Yichuan Zhong, Yapeng Tian2026-03-03🤖 cs.AI

Silence the Judge: Reinforcement Learning with Self-Verifier via Latent Geometric Clustering

Il paper presenta Latent-GRPO, un framework che sfrutta le proprietà geometriche dello spazio latente per generare ricompense intrinseche continue tramite l'algoritmo IRCE, eliminando la dipendenza da verificatori esterni costosi e raddoppiando la velocità di addestramento rispetto ai metodi basati su GRPO.

Nonghai Zhang, Weitao Ma, Zhanyu Ma + 5 more2026-03-03💬 cs.CL

← Precedente Successivo →