cs.LG articoli | Gist.Science

Thickening-to-Thinning: Reward Shaping via Human-Inspired Learning Dynamics for LLM Reasoning

Il paper presenta T2T, un nuovo framework di reward shaping ispirato ai processi di apprendimento umano che migliora il ragionamento dei modelli linguistici bilanciando l'esplorazione estesa su problemi difficili con l'efficienza sui compiti già padroneggiati, ottenendo risultati superiori rispetto alle tecniche esistenti su benchmark matematici.

Wenze Lin, Zhen Yang, Xitai Jiang, Pony Ma, Gao Huang2026-03-10🤖 cs.LG

Inference-Time Backdoors via Hidden Instructions in LLM Chat Templates

Il paper dimostra come gli attaccanti possano sfruttare i modelli di chat Jinja2 modificati per iniettare backdoor a tempo di inferenza in modelli linguistici open-weight, compromettendone l'affidabilità o inducendo comportamenti malevoli senza alterare i pesi del modello o il codice di runtime.

Ariel Fogel, Omer Hofman, Eilon Cohen, Roman Vainshtein2026-03-10🤖 cs.LG

Hinge Regression Tree: A Newton Method for Oblique Regression Tree Splitting

Il paper presenta l'Hinge Regression Tree (HRT), un nuovo metodo che riformula la ricerca di split obliqui negli alberi di regressione come un problema di minimi quadrati non lineari risolvibile tramite un metodo di Newton smorzato, garantendo convergenza rapida, proprietà di approssimazione universale e prestazioni superiori rispetto alle basi di riferimento con strutture più compatte.

Hongyi Li, Han Lin, Jun Xu2026-03-10🤖 cs.LG

Radial Müntz-Szász Networks: Neural Architectures with Learnable Power Bases for Multidimensional Singularities

Il paper introduce le Radial Müntz-Szász Networks (RMN), un'architettura neurale con basi di potenza radiali apprendibili progettata per modellare con alta efficienza e precisione campi singolari multidimensionali, superando i limiti delle architetture tradizionali e riducendo drasticamente il numero di parametri necessari.

Gnankan Landry Regis N'guessan, Bum Jun Kim2026-03-10🤖 cs.LG

SDFed: Bridging Local Global Discrepancy via Subspace Refinement and Divergence Control in Federated Prompt Learning

Il paper propone SDFed, un framework di apprendimento federato eterogeneo che risolve le discrepanze locali-globali nell'adattamento dei modelli visione-linguaggio consentendo prompt locali a lunghezza variabile e introducendo tecniche di raffinamento del sottospazio e controllo della divergenza per migliorare le prestazioni in ambienti con dati e risorse disomogenei.

Yicheng Di, Wei Yuan, Tieke He, Yuan Liu, Hongzhi Yin2026-03-10🤖 cs.LG

Retrieval Pivot Attacks in Hybrid RAG: Measuring and Mitigating Amplified Leakage from Vector Seeds to Graph Expansion

Il documento dimostra che le pipeline ibride RAG, combinando ricerca vettoriale ed espansione su grafo, introducono un nuovo rischio di sicurezza chiamato "Retrieval Pivot Attacks" che permette la fuoriuscita di dati tra tenant attraverso entità condivise, ma evidenzia che tale vulnerabilità può essere eliminata efficacemente applicando controlli di autorizzazione al confine di espansione del grafo.

Scott Thornton2026-03-10🤖 cs.LG

Diffusion-Guided Pretraining for Brain Graph Foundation Models

Questo lavoro propone un quadro di preaddestramento unificato basato sulla diffusione per i modelli fondazionali del cervello, che supera i limiti dei metodi esistenti guidando strategie di mascheramento e lettura consapevoli della struttura per preservare i pattern di connettività semantica e migliorare la robustezza delle rappresentazioni su oltre 25.000 soggetti.

Xinxu Wei, Rong Zhou, Lifang He, Yu Zhang2026-03-10🤖 cs.LG

Learning Page Order in Shuffled WOO Releases

Questo studio analizza il riordinamento di documenti OAI olandesi frammentati, dimostrando che mentre i modelli basati su reti pointer e ranking pairwise raggiungono buone prestazioni su documenti brevi, i transformer seq2seq falliscono su testi lunghi a causa di strategie di ordinamento divergenti, un problema mitigato con successo attraverso la specializzazione del modello.

Efe Kahraman, Giulio Tosato2026-03-10🤖 cs.LG

Discovering Semantic Latent Structures in Psychological Scales: A Response-Free Pathway to Efficient Simplification

Questo articolo presenta un framework di modellazione tematica che utilizza le incorporazioni semantiche contestuali per semplificare le scale psicologiche senza richiedere dati di risposta, riducendo la lunghezza degli strumenti del 60,5% in media pur mantenendo la validità psicometrica e la coerenza strutturale.

Bo Wang, Yuxuan Zhang, Yueqin Hu, Hanchao Hou, Kaiping Peng, Shiguang Ni2026-03-10🤖 cs.LG

TrasMuon: Trust-Region Adaptive Scaling for Orthogonalized Momentum Optimizers

Il paper presenta TrasMuon, un ottimizzatore che combina la geometria ortogonale dei metodi Muon con una calibrazione globale e un clipping basato su regioni di fiducia per stabilizzare l'addestramento e accelerare la convergenza, eliminando la necessità di fasi di warmup.

Peng Cheng, Jiucheng Zang, Qingnan Li, Liheng Ma, Yufei Cui, Yingxue Zhang, Boxing Chen, Ming Jian, Wen Tong2026-03-10🤖 cs.LG

Benchmark Leakage Trap: Can We Trust LLM-based Recommendation?

Questo studio evidenzia come la perdita di dati nei benchmark, derivante dalla memorizzazione dei dataset di valutazione durante il pre-addestramento o il fine-tuning dei modelli linguistici di grandi dimensioni, possa distorcere le metriche di prestazione nei sistemi di raccomandazione, portando a valutazioni inaffidabili.

Mingqiao Zhang, Qiyao Peng, Yumeng Wang, Chunyuan Liu, Hongtao Liu2026-03-10🤖 cs.LG

Mean Flow Policy with Instantaneous Velocity Constraint for One-step Action Generation

Il paper propone la "Mean Velocity Policy" (MVP), una nuova funzione di politica generativa che, tramite un vincolo di velocità istantanea, permette la generazione di azioni in un singolo passo mantenendo alta espressività e superando le prestazioni e la velocità delle politiche basate su flussi esistenti in compiti di manipolazione robotica.

Guojian Zhan, Letian Tao, Pengcheng Wang, Yixiao Wang, Yiheng Li, Yuxin Chen, Hongyang Li, Masayoshi Tomizuka, Shengbo Eben Li2026-03-10🤖 cs.LG

Pawsterior: Variational Flow Matching for Structured Simulation-Based Inference

Il paper presenta Pawsterior, un framework di variational flow matching che migliora l'inferenza basata su simulazioni gestendo sia vincoli geometrici strutturati che strutture latenti discrete, risolvendo così le limitazioni dei metodi tradizionali.

Jorge Carrasco-Pollo, Floor Eijkelboom, Jan-Willem van de Meent2026-03-10🤖 cs.LG

Why Code, Why Now: Learnability, Computability, and the Real Limits of Machine Learning

Questo articolo propone una gerarchia a cinque livelli di apprendibilità basata sulla struttura informativa dei problemi computazionali, sostenendo che il progresso dell'apprendimento automatico dipende più dalla verificabilità del feedback (come nel caso della generazione di codice) rispetto alla semplice scalabilità dei modelli.

Zhimin Zhao2026-03-10🤖 cs.LG

LongAudio-RAG: Event-Grounded Question Answering over Multi-Hour Long Audio

Il paper presenta LongAudio-RAG, un framework ibrido che risolve il problema della risposta a domande su audio di lunga durata convertendo i flussi audio in eventi acustici strutturati e recuperabili tramite SQL, permettendo così a un LLM di generare risposte precise con grounding temporale e ridotte allucinazioni, anche in un'architettura edge-cloud.

Naveen Vakada, Kartik Hegde, Arvind Krishna Sridhar, Yinyi Guo, Erik Visser2026-03-10🤖 cs.LG

Accelerated Predictive Coding Networks via Direct Kolen-Pollack Feedback Alignment

Il paper propone la Direct Kolen-Pollack Predictive Coding (DKP-PC), un algoritmo che risolve i problemi di ritardo e decadimento esponenziale del segnale di errore nelle reti di predictive coding introducendo connessioni di feedback apprese direttamente dall'output a tutti i livelli nascosti, riducendo così la complessità temporale di propagazione da O(L) a O(1) e migliorando le prestazioni computazionali mantenendo la località degli aggiornamenti.

Davide Casnici, Martin Lefebvre, Justin Dauwels, Charlotte Frenkel2026-03-10🤖 cs.LG

On the Power of Source Screening for Learning Shared Feature Extractors

Questo articolo dimostra che, nell'apprendimento di estrattori di caratteristiche condivise in contesti lineari, la selezione accurata di un sottoinsieme di fonti informative è sufficiente per raggiungere l'ottimalità minimax, superando la necessità di utilizzare tutti i dati disponibili.

Leo Muxing Wang, Connor Mclaughlin, Lili Su2026-03-10🤖 cs.LG

Emotion Collider: Dual Hyperbolic Mirror Manifolds for Sentiment Recovery via Anti Emotion Reflection

Il paper presenta EC-Net, un framework iperbolico basato su ipergrafi che utilizza embedding nello spazio di Poincaré e apprendimento contrastivo per migliorare la robustezza e l'accuratezza del riconoscimento delle emozioni multimodali, specialmente in presenza di rumore o dati mancanti.

Rong Fu, Ziming Wang, Shuo Yin, Haiyun Wei, Kun Liu, Xianda Li, Zeli Su, Simon Fong2026-03-10🤖 cs.LG

ModalImmune: Immunity Driven Unlearning via Self Destructive Training

Il paper presenta ModalImmune, un framework di addestramento che garantisce la resilienza dei sistemi multimodali alla perdita o corruzione dei canali di input, insegnando al modello a sviluppare rappresentazioni congiunte robuste attraverso un processo controllato di collasso delle informazioni modali.

Rong Fu, Jia Yee Tan, Zijian Zhang, Ziming Wang, Zhaolu Kang, Muge Qi, Shuning Zhang, Simon Fong2026-03-10🤖 cs.LG

Whole-Brain Connectomic Graph Model Enables Whole-Body Locomotion Control in Fruit Fly

Questo studio introduce il FlyGM, un modello grafico basato sul connettoma cerebrale completo di una mosca della frutta che, integrato con un modello biomeccanico, permette il controllo efficace e generalizzabile della locomozione corporea tramite apprendimento per rinforzo senza necessità di adattamento architetturale specifico.

Zehao Jin, Yaoye Zhu, Chen Zhang, Yanan Sui2026-03-10🤖 cs.LG

← Precedente Successivo →