cs.LG articoli | Gist.Science

Mem-T: Densifying Rewards for Long-Horizon Memory Agents

Mem-T è un agente di memoria autonomo che, grazie al framework di apprendimento per rinforzo MoT-GRPO, risolve il problema della ricompensa sparsa in compiti a lungo termine densificando il feedback e ottimizzando congiuntamente la costruzione e il recupero della memoria, ottenendo prestazioni superiori e un'efficienza computazionale migliorata rispetto agli approcci esistenti.

Yanwei Yue, Boci Peng, Xuanbo Fan, Jiaxin Guo, Qiankun Li, Yan Zhang2026-03-10🤖 cs.LG

Bitcoin Price Prediction using Machine Learning and Combinatorial Fusion Analysis

Questo studio propone l'applicazione dell'Analisi di Fusione Combinatoria (CFA) per prevedere il prezzo del Bitcoin, ottenendo una performance superiore rispetto ai singoli modelli e ad altre tecniche esistenti grazie a una combinazione di punteggi e ranghi che riduce l'errore medio percentuale (MAPE) allo 0,19%.

Yuanhong Wu, Wei Ye, Jingyan Xu, D. Frank Hsu2026-03-10🤖 cs.LG

In-Run Data Shapley for Adam Optimizer

Il lavoro propone l'Adam-Aware In-Run Data Shapley, un metodo innovativo che supera i limiti delle tecniche basate su SGD per l'attribuzione dei dati negli ottimizzatori Adam, garantendo un'accuratezza quasi perfetta e un'elevata efficienza computazionale senza richiedere il riaddestramento del modello.

Meng Ding, Zeqing Zhang, Di Wang, Lijie Hu2026-03-10🤖 cs.LG

Do Schwartz Higher-Order Values Help Sentence-Level Human Value Detection? A Study of Hierarchical Gating and Calibration

Lo studio dimostra che, per il rilevamento dei valori umani a livello di frase, la struttura gerarchica dei valori di Schwartz funge più efficacemente da bias induttivo che da regola di routing rigida, mentre le migliori prestazioni si ottengono attraverso tecniche di calibrazione e ensemble piuttosto che con architetture complesse o modelli LLM compatti.

Víctor Yeste, Paolo Rosso2026-03-10🤖 cs.LG

LatentMem: Customizing Latent Memory for Multi-Agent Systems

Il paper presenta LatentMem, un framework di memoria multi-agente apprendibile che risolve i problemi di omogeneizzazione e sovraccarico informativo attraverso la sintesi di memorie latenti compatte e specifiche per ruolo, ottimizzate tramite una nuova strategia di apprendimento chiamata LMPO.

Muxin Fu, Xiangyuan Xue, Yafu Li, Zefeng He, Siyuan Huang, Xiaoye Qu, Yu Cheng, Yang Yang2026-03-10🤖 cs.LG

Thickening-to-Thinning: Reward Shaping via Human-Inspired Learning Dynamics for LLM Reasoning

Il paper presenta T2T, un nuovo framework di reward shaping ispirato ai processi di apprendimento umano che migliora il ragionamento dei modelli linguistici bilanciando l'esplorazione estesa su problemi difficili con l'efficienza sui compiti già padroneggiati, ottenendo risultati superiori rispetto alle tecniche esistenti su benchmark matematici.

Wenze Lin, Zhen Yang, Xitai Jiang, Pony Ma, Gao Huang2026-03-10🤖 cs.LG

Inference-Time Backdoors via Hidden Instructions in LLM Chat Templates

Il paper dimostra come gli attaccanti possano sfruttare i modelli di chat Jinja2 modificati per iniettare backdoor a tempo di inferenza in modelli linguistici open-weight, compromettendone l'affidabilità o inducendo comportamenti malevoli senza alterare i pesi del modello o il codice di runtime.

Ariel Fogel, Omer Hofman, Eilon Cohen, Roman Vainshtein2026-03-10🤖 cs.LG

Hinge Regression Tree: A Newton Method for Oblique Regression Tree Splitting

Il paper presenta l'Hinge Regression Tree (HRT), un nuovo metodo che riformula la ricerca di split obliqui negli alberi di regressione come un problema di minimi quadrati non lineari risolvibile tramite un metodo di Newton smorzato, garantendo convergenza rapida, proprietà di approssimazione universale e prestazioni superiori rispetto alle basi di riferimento con strutture più compatte.

Hongyi Li, Han Lin, Jun Xu2026-03-10🤖 cs.LG

Radial Müntz-Szász Networks: Neural Architectures with Learnable Power Bases for Multidimensional Singularities

Il paper introduce le Radial Müntz-Szász Networks (RMN), un'architettura neurale con basi di potenza radiali apprendibili progettata per modellare con alta efficienza e precisione campi singolari multidimensionali, superando i limiti delle architetture tradizionali e riducendo drasticamente il numero di parametri necessari.

Gnankan Landry Regis N'guessan, Bum Jun Kim2026-03-10🤖 cs.LG

SDFed: Bridging Local Global Discrepancy via Subspace Refinement and Divergence Control in Federated Prompt Learning

Il paper propone SDFed, un framework di apprendimento federato eterogeneo che risolve le discrepanze locali-globali nell'adattamento dei modelli visione-linguaggio consentendo prompt locali a lunghezza variabile e introducendo tecniche di raffinamento del sottospazio e controllo della divergenza per migliorare le prestazioni in ambienti con dati e risorse disomogenei.

Yicheng Di, Wei Yuan, Tieke He, Yuan Liu, Hongzhi Yin2026-03-10🤖 cs.LG

Retrieval Pivot Attacks in Hybrid RAG: Measuring and Mitigating Amplified Leakage from Vector Seeds to Graph Expansion

Il documento dimostra che le pipeline ibride RAG, combinando ricerca vettoriale ed espansione su grafo, introducono un nuovo rischio di sicurezza chiamato "Retrieval Pivot Attacks" che permette la fuoriuscita di dati tra tenant attraverso entità condivise, ma evidenzia che tale vulnerabilità può essere eliminata efficacemente applicando controlli di autorizzazione al confine di espansione del grafo.

Scott Thornton2026-03-10🤖 cs.LG

Diffusion-Guided Pretraining for Brain Graph Foundation Models

Questo lavoro propone un quadro di preaddestramento unificato basato sulla diffusione per i modelli fondazionali del cervello, che supera i limiti dei metodi esistenti guidando strategie di mascheramento e lettura consapevoli della struttura per preservare i pattern di connettività semantica e migliorare la robustezza delle rappresentazioni su oltre 25.000 soggetti.

Xinxu Wei, Rong Zhou, Lifang He, Yu Zhang2026-03-10🤖 cs.LG

Learning Page Order in Shuffled WOO Releases

Questo studio analizza il riordinamento di documenti OAI olandesi frammentati, dimostrando che mentre i modelli basati su reti pointer e ranking pairwise raggiungono buone prestazioni su documenti brevi, i transformer seq2seq falliscono su testi lunghi a causa di strategie di ordinamento divergenti, un problema mitigato con successo attraverso la specializzazione del modello.

Efe Kahraman, Giulio Tosato2026-03-10🤖 cs.LG

Discovering Semantic Latent Structures in Psychological Scales: A Response-Free Pathway to Efficient Simplification

Questo articolo presenta un framework di modellazione tematica che utilizza le incorporazioni semantiche contestuali per semplificare le scale psicologiche senza richiedere dati di risposta, riducendo la lunghezza degli strumenti del 60,5% in media pur mantenendo la validità psicometrica e la coerenza strutturale.

Bo Wang, Yuxuan Zhang, Yueqin Hu, Hanchao Hou, Kaiping Peng, Shiguang Ni2026-03-10🤖 cs.LG

TrasMuon: Trust-Region Adaptive Scaling for Orthogonalized Momentum Optimizers

Il paper presenta TrasMuon, un ottimizzatore che combina la geometria ortogonale dei metodi Muon con una calibrazione globale e un clipping basato su regioni di fiducia per stabilizzare l'addestramento e accelerare la convergenza, eliminando la necessità di fasi di warmup.

Peng Cheng, Jiucheng Zang, Qingnan Li, Liheng Ma, Yufei Cui, Yingxue Zhang, Boxing Chen, Ming Jian, Wen Tong2026-03-10🤖 cs.LG

Benchmark Leakage Trap: Can We Trust LLM-based Recommendation?

Questo studio evidenzia come la perdita di dati nei benchmark, derivante dalla memorizzazione dei dataset di valutazione durante il pre-addestramento o il fine-tuning dei modelli linguistici di grandi dimensioni, possa distorcere le metriche di prestazione nei sistemi di raccomandazione, portando a valutazioni inaffidabili.

Mingqiao Zhang, Qiyao Peng, Yumeng Wang, Chunyuan Liu, Hongtao Liu2026-03-10🤖 cs.LG

Mean Flow Policy with Instantaneous Velocity Constraint for One-step Action Generation

Il paper propone la "Mean Velocity Policy" (MVP), una nuova funzione di politica generativa che, tramite un vincolo di velocità istantanea, permette la generazione di azioni in un singolo passo mantenendo alta espressività e superando le prestazioni e la velocità delle politiche basate su flussi esistenti in compiti di manipolazione robotica.

Guojian Zhan, Letian Tao, Pengcheng Wang, Yixiao Wang, Yiheng Li, Yuxin Chen, Hongyang Li, Masayoshi Tomizuka, Shengbo Eben Li2026-03-10🤖 cs.LG

Pawsterior: Variational Flow Matching for Structured Simulation-Based Inference

Il paper presenta Pawsterior, un framework di variational flow matching che migliora l'inferenza basata su simulazioni gestendo sia vincoli geometrici strutturati che strutture latenti discrete, risolvendo così le limitazioni dei metodi tradizionali.

Jorge Carrasco-Pollo, Floor Eijkelboom, Jan-Willem van de Meent2026-03-10🤖 cs.LG

Why Code, Why Now: Learnability, Computability, and the Real Limits of Machine Learning

Questo articolo propone una gerarchia a cinque livelli di apprendibilità basata sulla struttura informativa dei problemi computazionali, sostenendo che il progresso dell'apprendimento automatico dipende più dalla verificabilità del feedback (come nel caso della generazione di codice) rispetto alla semplice scalabilità dei modelli.

Zhimin Zhao2026-03-10🤖 cs.LG

LongAudio-RAG: Event-Grounded Question Answering over Multi-Hour Long Audio

Il paper presenta LongAudio-RAG, un framework ibrido che risolve il problema della risposta a domande su audio di lunga durata convertendo i flussi audio in eventi acustici strutturati e recuperabili tramite SQL, permettendo così a un LLM di generare risposte precise con grounding temporale e ridotte allucinazioni, anche in un'architettura edge-cloud.

Naveen Vakada, Kartik Hegde, Arvind Krishna Sridhar, Yinyi Guo, Erik Visser2026-03-10🤖 cs.LG

← Precedente Successivo →