cs.LG articoli | Gist.Science

Concept Drift Guided LayerNorm Tuning for Efficient Multimodal Metaphor Identification

Il paper introduce CDGLT, un framework efficiente e all'avanguardia per l'identificazione di metafore multimodali che combina l'adattamento del LayerNorm con una strategia di "Concept Drift" basata su SLERP per colmare il divario tra significati letterali e figurativi riducendo drasticamente i costi computazionali.

Wenhao Qian, Zhenzhen Hu, Zijie Song, Jia Li2026-03-11🤖 cs.LG

Stepwise Guided Policy Optimization: Coloring your Incorrect Reasoning in GRPO

Il paper introduce SGPO, un framework che risolve il limite di GRPO di non aggiornare la politica quando tutti i campioni di un gruppo sono errati, migliorando l'apprendimento per rinforzo nei modelli linguistici attraverso una diversificazione guidata da un modello giudice passo-passo che permette di apprendere anche dagli errori senza richiedere soluzioni corrette.

Peter Chen, Xiaopeng Li, Ziniu Li, Xi Chen, Tianyi Lin2026-03-11🤖 cs.AI

The Gaussian-Multinoulli Restricted Boltzmann Machine: A Potts Model Extension of the GRBM

Il documento introduce la GM-RBM, un modello generativo che estende l'RBG a unità nascoste categoriche q-ali (Potts) per migliorare la rappresentazione di concetti multivalore e le prestazioni di inferenza discreta rispetto alle controparti binarie a capacità equivalente.

Nikhil Kapasi, Mohamed Elfouly, William Whitehead, Luke Theogarajan2026-03-11🤖 cs.LG

JULI: Jailbreak Large Language Models by Self-Introspection

Il paper propone JULI, un nuovo metodo che sfrutta l'introspezione delle probabilità dei token tramite un piccolo blocco BiasNet per aggirare le misure di sicurezza dei modelli linguistici di grandi dimensioni in un contesto black-box, superando le tecniche esistenti senza richiedere l'accesso ai pesi del modello.

Jesson Wang, Zhanhao Hu, David Wagner2026-03-11🤖 cs.LG

Discovering Symbolic Differential Equations with Symmetry Invariants

Questo lavoro introduce un metodo innovativo per la scoperta di equazioni differenziali simboliche che utilizza invarianti di simmetria come entità atomiche, garantendo che le leggi dinamiche identificate rispettino i principi fisici e migliorando l'efficienza e l'accuratezza delle tecniche esistenti.

Jianke Yang, Manu Bhat, Bryan Hu, Yadi Cao, Nima Dehmamy, Robin Walters, Rose Yu2026-03-11🤖 cs.LG

UltraEdit: Training-, Subject-, and Memory-Free Lifelong Editing in Language Models

Il paper presenta UltraEdit, un metodo innovativo per l'editing continuo dei modelli linguistici che, eliminando la necessità di addestramento, soggetti specifici o memoria esterna, raggiunge velocità e efficienza superiori rispetto agli stati dell'arte, permettendo di eseguire fino a 2 milioni di modifiche su modelli da 7B con risorse hardware limitate.

Xiaojie Gu, Ziying Huang, Jia-Chen Gu, Kai Zhang2026-03-11🤖 cs.AI

A Systematic Evaluation of On-Device LLMs: Quantization, Performance, and Resources

Questo studio presenta una metodologia sistematica per valutare i modelli linguistici su dispositivi edge, dimostrando che i modelli grandi fortemente quantizzati superano quelli più piccoli ad alta precisione al di sotto di una soglia di circa 3,5 bit per peso, fornendo linee guida per ottimizzare capacità ed efficienza in ambienti con risorse limitate.

Qingyu Song, Rui Liu, Wei Lin, Peiyu Liao, Wenqian Zhao, Yiwen Wang, Shoubo Hu, Yining Jiang, Mochun Long, Hui-Ling Zhen, Ning Jiang, Mingxuan Yuan, Qiao Xiang, Hong Xu2026-03-11🤖 cs.LG

SATURN: SAT-based Reinforcement Learning to Unleash LLMs Reasoning

Il paper presenta SATURN, un framework di apprendimento per rinforzo basato su problemi di soddisfacibilità booleana (SAT) che supera le limitazioni di scalabilità, verificabilità e controllo della difficoltà delle attività esistenti, permettendo di potenziare significativamente le capacità di ragionamento dei modelli linguistici su compiti matematici e di programmazione attraverso un curriculum learning progressivo.

Huanyu Liu, Ge Li, Jia Li, Hao Zhu, Kechi Zhang, Yihong Dong2026-03-11🤖 cs.AI

FrontierCO: Real-World and Large-Scale Evaluation of Machine Learning Solvers for Combinatorial Optimization

Il paper presenta FrontierCO, un benchmark su larga scala che valuta le prestazioni dei solver di ottimizzazione combinatoria basati su machine learning su dati reali e di dimensioni estreme, rivelando un divario significativo rispetto ai solver classici ma anche casi di superiorità in scenari specifici.

Shengyu Feng, Weiwei Sun, Shanda Li, Ameet Talwalkar, Yiming Yang2026-03-11🤖 cs.LG

Embodied AI with Foundation Models for Mobile Service Robots: A Systematic Review

Questo articolo presenta la prima revisione sistematica sull'integrazione dei modelli fondazionali nell'intelligenza artificiale incarnata per i robot di servizio mobili, analizzando come tali tecnologie affrontino le sfide tecniche e abilitino applicazioni pratiche in ambiti domestici e sanitari, pur sollevando questioni etiche e prospettando direzioni future per un deployment sicuro e affidabile.

Matthew Lisondra, Beno Benhabib, Goldie Nejat2026-03-11💬 cs.CL

Semi-Supervised Conformal Prediction With Unlabeled Nonconformity Score

Il paper propone SemiCP, un nuovo paradigma di previsione conformale semi-supervisionato che utilizza un punteggio di non-conformità basato sull'abbinamento dei vicini più prossimi (NNM) per sfruttare dati non etichettati durante la calibrazione, riducendo significativamente il divario di copertura rispetto ai metodi tradizionali quando i dati etichettati sono scarsi.

Xuanning Zhou, Zihao Shi, Hao Zeng, Xiaobo Xia, Bingyi Jing, Hongxin Wei2026-03-11🤖 cs.LG

Pure Exploration with Infinite Answers

Questo articolo affronta i problemi di esplorazione pura con risposte infinite, derivando un limite inferiore dipendente dall'istanza, spiegando il fallimento dei metodi esistenti per l'ottimalità asintotica e proponendo un nuovo quadro generale, "Sticky-Sequence Track-and-Stop", che garantisce tale ottimalità.

Riccardo Poiani, Martino Bernasconi, Andrea Celli2026-03-11🤖 cs.LG

Rating Quality of Diverse Time Series Data by Meta-learning from LLM Judgment

Il paper propone TSRating, un framework unificato che sfrutta il giudizio dei modelli linguistici su larga scala (LLM) e l'apprendimento meta per valutare in modo efficiente e adattabile la qualità di serie temporali provenienti da domini diversi, superando i limiti delle metodologie esistenti.

Shunyu Wu, Dan Li, Wenjie Feng, Haozheng Ye, Jian Lou, See-Kiong Ng2026-03-11🤖 cs.AI

Cooperative Game-Theoretic Credit Assignment for Multi-Agent Policy Gradients via the Core

Il lavoro propone CORA, un metodo di assegnazione del credito per l'apprendimento per rinforzo multi-agente cooperativo che utilizza il nucleo della teoria dei giochi cooperativi e il campionamento casuale delle coalizioni per allocare in modo più efficace i vantaggi globali e promuovere comportamenti coordinati ottimali.

Mengda Ji, Genjiu Xu, Keke Jia, Zekun Duan, Yong Qiu, Jianjun Ge, Mingqiang Li2026-03-11🤖 cs.AI

Regret-Optimal Q-Learning with Low Cost for Single-Agent and Federated Reinforcement Learning

Questo lavoro propone due nuovi algoritmi di apprendimento per rinforzo privi di modello, Q-EarlySettled-LowCost e FedQ-EarlySettled-LowCost, che per la prima volta raggiungono simultaneamente un rimpianto quasi ottimale, costi di avvio lineari rispetto agli stati e alle azioni e costi di commutazione o comunicazione logaritmici, sia per agenti singoli che in contesti federati.

Haochen Zhang, Zhong Zheng, Lingzhou Xue2026-03-11🤖 cs.LG

Towards Robust Real-World Multivariate Time Series Forecasting: A Unified Framework for Dependency, Asynchrony, and Missingness

Il paper presenta ChannelTokenFormer, un framework basato su Transformer che affronta simultaneamente le sfide della dipendenza tra canali, del campionamento asincrono e dei valori mancanti per migliorare l'accuratezza e la robustezza delle previsioni di serie temporali multivariate in scenari reali.

Jinkwan Jang, Hyungjin Park, Jinmyeong Choi, Taesup Kim2026-03-11🤖 cs.AI

Wavelet Scattering Transform and Fourier Representation for Offline Detection of Malicious Clients in Federated Learning

Il paper presenta WAFFLE, un algoritmo di rilevamento pre-addestramento per l'Apprendimento Federato che identifica i client dannosi utilizzando rappresentazioni compresse basate sulla Trasformata Scattering Wavelet o sulla Trasformata di Fourier, garantendo privacy e riducendo l'overhead computazionale.

Alessandro Licciardi, Davide Leo, Davide Carbone2026-03-11🤖 cs.LG

Uncovering Social Network Activity Using Joint User and Topic Interaction

Questo articolo presenta il modello MIC (Mixture of Interacting Cascades), basato su processi di Hawkes multidimensionali, che supera i metodi esistenti nel modellare congiuntamente le interazioni tra utenti e cascata informative, offrendo al contempo visualizzazioni approfondite dell'attività delle reti sociali.

Gaspard Abel, Argyris Kalogeratos, Jean-Pierre Nadal, Julien Randon-Furling2026-03-11🤖 cs.LG

ConLID: Supervised Contrastive Learning for Low-Resource Language Identification

Il paper presenta ConLID, un approccio di apprendimento contrastivo supervisionato che migliora l'identificazione delle lingue a risorse limitate su dati fuori dominio ottenendo un incremento di 3,2 punti percentuali senza compromettere le prestazioni delle lingue ad alta risorsa.

Negar Foroutan, Jakhongir Saydaliev, Ye Eun Kim, Antoine Bosselut2026-03-11🤖 cs.AI

Global Convergence of Iteratively Reweighted Least Squares for Robust Subspace Recovery

Questo articolo stabilisce le prime garanzie di convergenza globale per un variante dell'algoritmo IRLS con regolarizzazione dinamica, dimostrando che esso converge linearmente al sottospazio sottostante da qualsiasi inizializzazione nel contesto del recupero robusto dei sottospazi e dell'estimazione affine, estendendo inoltre i risultati teorici all'addestramento di reti neurali a bassa dimensionalità.

Gilad Lerman, Kang Li, Tyler Maunu, Teng Zhang2026-03-11🤖 cs.LG

← Precedente Successivo →