cs.LG articoli | Gist.Science

Bridging Domains through Subspace-Aware Model Merging

Il paper propone SCORE, un metodo di fusione di modelli che risolve i conflitti tra sottospazi causati da distribuzioni diverse proiettando le matrici dei task su una base ortogonale condivisa, migliorando così la generalizzazione di dominio rispetto alle tecniche esistenti.

Levy Chaves, Chao Zhou, Rebekka Burkholz, Eduardo Valle, Sandra Avila2026-03-09🤖 cs.AI

Knowing without Acting: The Disentangled Geometry of Safety Mechanisms in Large Language Models

Il paper propone l'ipotesi di sicurezza disaccoppiata (DSH), dimostrando che i meccanismi di sicurezza nei grandi modelli linguistici operano su due assi geometrici distinti (riconoscimento ed esecuzione) e sfruttando questa separazione per sviluppare un attacco di rimozione del rifiuto che raggiunge prestazioni all'avanguardia.

Jinman Wu, Yi Xie, Shen Lin, Shiqian Zhao, Xiaofeng Chen2026-03-09🤖 cs.AI

First-Order Softmax Weighted Switching Gradient Method for Distributed Stochastic Minimax Optimization with Stochastic Constraints

Questo articolo propone un nuovo metodo di gradiente commutante con pesi softmax per l'ottimizzazione minimax stocastica distribuita con vincoli stocastici, dimostrando teoricamente una complessità di $\mathcal{O}(\epsilon^{-4})$ e una convergenza ad alta probabilità in scenari di apprendimento federato con partecipazione parziale, senza richiedere assunzioni di limitatezza standard.

Zhankun Luo, Antesh Upadhyay, Sang Bin Moon, Abolfazl Hashemi2026-03-09🤖 cs.LG

The Coordination Gap: Alternation Metrics for Temporal Dynamics in Multi-Agent Battle of the Exes

Questo studio introduce nuove metriche di alternanza temporale per rivelare come, nel gioco "Battle of the Exes" multi-agente, le tradizionali misure di efficienza e equità possano nascondere gravi carenze di coordinamento temporale, portando le politiche apprese a performare significativamente peggio rispetto a baseline casuali nonostante alti punteggi aggregati.

Nikolaos Al. Papadopoulos, Konstantinos Psannis2026-03-09🤖 cs.LG

Sparse Crosscoders for diffing MoEs and Dense models

Il paper presenta un confronto sistematico tra modelli MoE e densi utilizzando crosscoders, rivelando che i primi sviluppano rappresentazioni più specializzate con meno feature uniche rispetto alla distribuzione più ampia e generale delle feature nei secondi.

Marmik Chaudhari, Nishkal Hundia, Idhant Gulati2026-03-09🤖 cs.LG

MoE Lens -- An Expert Is All You Need

Il paper "MoE Lens" dimostra che i modelli Mixture of Experts presentano una specializzazione degli esperti altamente concentrata, rivelando che un singolo esperto dominante può spesso sostituire l'intero ensemble con un impatto minimo sulle prestazioni, aprendo così nuove opportunità per l'ottimizzazione dell'inferenza e il pruning mirato.

Marmik Chaudhari, Idhant Gulati, Nishkal Hundia, Pranav Karra, Shivam Raval2026-03-09🤖 cs.LG

Margin and Consistency Supervision for Calibrated and Robust Vision Models

Il paper presenta MaCS, un semplice framework di regolarizzazione che migliora la calibrazione e la robustezza dei modelli di visione artificiale imponendo un margine tra le classi e la coerenza delle previsioni su input perturbati, senza richiedere modifiche architetturali o dati aggiuntivi.

Salim Khazem2026-03-09🤖 cs.AI

Self-Auditing Parameter-Efficient Fine-Tuning for Few-Shot 3D Medical Image Segmentation

Il paper presenta SEA-PEFT, un metodo di fine-tuning efficiente nei parametri che automatizza la configurazione degli adapter tramite un ciclo di ricerca, audit e allocazione per migliorare la segmentazione 3D di immagini mediche in scenari few-shot, superando le prestazioni delle tecniche a topologia fissa senza richiedere ingegneri AI specializzati.

Son Thai Ly, Hien V. Nguyen2026-03-09🤖 cs.LG

Test-Time Adaptation via Many-Shot Prompting: Benefits, Limits, and Pitfalls

Questo studio empirico analizza l'efficacia e i limiti del prompting many-shot come strategia di adattamento a tempo di test per i modelli linguistici, rivelando che mentre funziona bene per compiti strutturati ad alto guadagno informativo, è spesso sensibile alla selezione degli esempi e poco vantaggioso per la generazione aperta.

Shubhangi Upasani, Chen Wu, Jay Rainton, Bo Li, Changran Hu, Qizheng Zhang, Urmish Thakker2026-03-09🤖 cs.LG

ReflexiCoder: Teaching Large Language Models to Self-Reflect on Generated Code and Self-Correct It via Reinforcement Learning

Il paper introduce ReflexiCoder, un nuovo framework di apprendimento per rinforzo che addestra i modelli linguistici a internalizzare capacità autonome di auto-riflessione e auto-correzione del codice, ottenendo risultati all'avanguardia su diversi benchmark senza dipendere da oracoli esterni o feedback di esecuzione durante l'inferenza.

Juyong Jiang, Jiasi Shen, Sunghun Kim, Kang Min Yoo, Jeonghoon Kim, Sungju Kim2026-03-09🤖 cs.LG

Stochastic Event Prediction via Temporal Motif Transitions

Il paper introduce STEP, un framework che riformula la previsione di link temporali come un problema di previsione sequenziale in tempo continuo basato su transizioni di motivi temporali e processi di Poisson, ottenendo significativi miglioramenti di precisione rispetto agli stati dell'arte su diversi dataset reali.

\.Ibrahim Bahadır Altun, Ahmet Erdem Sarıyüce2026-03-09🤖 cs.LG

ROSE: Reordered SparseGPT for More Accurate One-Shot Large Language Models Pruning

Il paper ROSE propone un metodo di pruning one-shot per grandi modelli linguistici che riordina le pesi in base alla perdita stimata, migliorando significativamente l'accuratezza rispetto a SparseGPT e ad altri metodi esistenti su modelli come LLaMA e Mistral.

Mingluo Su, Huan Wang2026-03-09🤖 cs.LG

PixARMesh: Autoregressive Mesh-Native Single-View Scene Reconstruction

Il paper presenta PixARMesh, un metodo autoregressivo che ricostruisce mesh 3D complete di scene interne direttamente da una singola immagine RGB, generando layout e geometria in un unico passaggio per produrre mesh coerenti e pronte per l'uso.

Xiang Zhang, Sohyun Yoo, Hongrui Wu, Chuan Li, Jianwen Xie, Zhuowen Tu2026-03-09🤖 cs.LG

Mitigating Bias in Concept Bottleneck Models for Fair and Interpretable Image Classification

Il paper propone tre tecniche di mitigazione del bias per migliorare l'equità nei Concept Bottleneck Models, ottenendo risultati superiori nel compromesso tra equità e prestazioni rispetto ai lavori precedenti.

Schrasing Tong, Antoine Salaun, Vincent Yuan, Annabel Adeyeri, Lalana Kagal2026-03-09🤖 cs.LG

Reference-guided Policy Optimization for Molecular Optimization via LLM Reasoning

Il paper introduce RePO, un nuovo approccio di ottimizzazione che combina l'esplorazione tramite apprendimento per rinforzo con reward verificabili e la guida di riferimento tramite addestramento supervisionato, superando i limiti delle tecniche attuali nell'ottimizzazione molecolare basata su LLM in assenza di dati di traiettoria.

Xuan Li, Zhanke Zhou, Zongze Li, Jiangchao Yao, Yu Rong, Lu Zhang, Bo Han2026-03-09🤖 cs.AI

Stock Market Prediction Using Node Transformer Architecture Integrated with BERT Sentiment Analysis

Questo studio presenta un framework integrato che combina un'architettura Node Transformer con l'analisi del sentiment basata su BERT per la previsione dei prezzi azionari, ottenendo risultati superiori rispetto ai modelli tradizionali grazie alla capacità di catturare le dipendenze cross-settoriali e l'impatto delle notizie, come dimostrato su 20 titoli S&P 500 con un errore medio assoluto percentuale (MAPE) dell'0,80%.

Mohammad Al Ridhawi, Mahtab Haj Ali, Hussein Al Osman2026-03-09🤖 cs.AI

Design Experiments to Compare Multi-armed Bandit Algorithms

Il paper propone "Artificial Replay", un nuovo disegno sperimentale che permette di confrontare algoritmi a bandito multi-braccio riutilizzando le traiettorie registrate per ridurre drasticamente i costi di interazione e la varianza dell' stimatore rispetto ai metodi tradizionali.

Huiling Meng, Ningyuan Chen, Xuefeng Gao2026-03-09🤖 cs.LG

Weak-SIGReg: Covariance Regularization for Stable Deep Learning

Questo lavoro introduce Weak-SIGReg, una variante computazionalmente efficiente della regolarizzazione SIGReg che stabilizza l'addestramento di architetture deep learning prive di prior architetturali, come i Vision Transformers, prevenendo il collasso delle rappresentazioni tramite sketching casuale della matrice di covarianza.

Habibullah Akbar2026-03-09🤖 cs.LG

Addressing the Ecological Fallacy in Larger LMs with Human Context

Questo studio dimostra che modellare il contesto linguistico dell'autore, affrontando la fallacia ecologica tramite tecniche come HuLM e HuFT, migliora significativamente le prestazioni di un modello Llama da 8 miliardi di parametri rispetto ai metodi di addestramento standard.

Nikita Soni, Dhruv Vijay Kunjadiya, Pratham Piyush Shah, Dikshya Mohanty, H. Andrew Schwartz, Niranjan Balasubramanian2026-03-09🤖 cs.AI

A Persistent-State Dataflow Accelerator for Memory-Bound Linear Attention Decode on FPGA

Il paper presenta un acceleratore FPGA che risolve il collo di bottiglia di memoria nella decodifica di Gated DeltaNet mantenendo lo stato ricorrente persistente nella memoria on-chip, ottenendo così una velocità 4,5 volte superiore e un'efficienza energetica fino a 60 volte migliore rispetto alle GPU.

Neelesh Gupta, Peter Wang, Rajgopal Kannan, Viktor K. Prasanna2026-03-09🤖 cs.LG

← Precedente Successivo →