cs.LG articoli | Gist.Science

Boosting deep Reinforcement Learning using pretraining with Logical Options

Il paper propone H²RL, un approccio ibrido che utilizza un preaddestramento basato su opzioni logiche per allineare gli agenti di apprendimento per rinforzo profondo, migliorando le decisioni a lungo termine e superando le prestazioni di baselines neurali, simboliche e neuro-simboliche.

Zihan Ye, Phil Chau, Raban Emunds, Jannis Blüml, Cedric Derstroff, Quentin Delfosse, Oleg Arenz, Kristian Kersting2026-03-09🤖 cs.AI

A recipe for scalable attention-based MLIPs: unlocking long-range accuracy with all-to-all node attention

Il paper presenta AllScAIP, un potenziale interatomico basato su machine learning che utilizza un meccanismo di attenzione "all-to-all" per catturare in modo efficiente e preciso le interazioni a lungo raggio in sistemi su larga scala, superando i limiti dei modelli basati su bias fisici quando si dispone di grandi quantità di dati.

Eric Qu, Brandon M. Wood, Aditi S. Krishnapriyan, Zachary W. Ulissi2026-03-09🔬 cond-mat.mtrl-sci

SCOPE: Scene-Contextualized Incremental Few-Shot 3D Segmentation

SCOPE è un framework plug-and-play per la segmentazione 3D few-shot incrementale che migliora le prestazioni delle nuove categorie recuperando e fondendo prototipi da regioni di sfondo non etichettate, ottenendo risultati all'avanguardia su ScanNet e S3DIS senza dimenticare le conoscenze precedenti.

Vishal Thengane, Zhaochong An, Tianjin Huang, Son Lam Phung, Abdesselam Bouzerdoum, Lu Yin, Na Zhao, Xiatian Zhu2026-03-09🤖 cs.LG

BEVLM: Distilling Semantic Knowledge from LLMs into Bird's-Eye View Representations

Il paper presenta BEVLM, un framework che colma il divario tra la ricchezza semantica dei Large Language Models e la coerenza spaziale delle rappresentazioni Bird's-Eye View, migliorando significativamente sia il ragionamento nelle scene di guida che le prestazioni di guida autonoma end-to-end in scenari critici per la sicurezza.

Thomas Monninger, Shaoyuan Xie, Qi Alfred Chen, Sihao Ding2026-03-09🤖 cs.AI

Linear Multidimensional Regression with Interactive Fixed-Effects

Questo articolo propone un metodo di regressione lineare multidimensionale con effetti fissi interattivi non osservati, basato su un approccio ortogonale di Neyman che combina la stima preliminare dei fattori con una trasformazione "weighted-within" per ottenere stime coerenti e asintoticamente normali, applicando poi la metodologia per stimare l'elasticità della domanda della birra.

Hugo Freeman2026-03-06💻 cs

Zeroth-Order primal-dual Alternating Projection Gradient Algorithms for Nonconvex Minimax Problems with Coupled linear Constraints

Questo articolo propone due algoritmi di discesa del gradiente alternato proiettato di ordine zero, denominati ZO-PDAPG e ZO-RMPDPG, che risolvono problemi minimax non convessi con vincoli lineari accoppiati in contesti deterministici e stocastici, garantendo complessità iterativa e stabilendo un nuovo stato dell'arte per la classe non convessa-concava.

Huiling Zhang, Zi Xu, Yuhong Dai2026-03-06🔢 math

Data Collaboration Analysis with Orthonormal Basis Selection and Alignment

Il paper introduce Orthonormal Data Collaboration (ODC), un metodo che impone basi ortonormali per trasformare l'allineamento in un problema di Procruste ortogonale risolvibile in forma chiusa, garantendo così una maggiore velocità computazionale, stabilità numerica e prestazioni invarianti rispetto alla scelta della base target senza compromettere la privacy.

Keiyu Nosaka, Yamato Suetake, Yuichi Takano + 1 more2026-03-06🔢 math

Localized Distributional Robustness in Submodular Multi-Task Subset Selection

Questo lavoro propone un metodo di ottimizzazione submodulare per la selezione di sottoinsiemi multi-task che, introducendo una regolarizzazione basata sull'entropia relativa, garantisce una robustezza distribuzionale locale e un'efficienza computazionale superiore rispetto alle strategie esistenti, come dimostrato attraverso applicazioni nella selezione di satelliti e nel riassunto di immagini.

Ege C. Kaya, Abolfazl Hashemi2026-03-06🔢 math

Distilling Privileged Information for Dubins Traveling Salesman Problems with Neighborhoods

Questo articolo presenta un approccio di apprendimento innovativo per il Problema del Commesso Viaggiatore con Vicinanze di Dubins (DTSPN) che, combinando l'inizializzazione dei parametri, l'apprendimento per rinforzo con informazioni privilegiate e un addestramento supervisionato, genera soluzioni circa 50 volte più velocemente dell'algoritmo LKH superando le prestazioni di altri metodi esistenti.

Min Kyu Shin, Su-Jeong Park, Seung-Keol Ryu + 2 more2026-03-06💻 cs

HEroBM: a deep equivariant graph neural network for universal backmapping from coarse-grained to all-atom representations

Il paper presenta HEroBM, un metodo scalabile basato su reti neurali grafiche equivarianti che supera i limiti delle tecniche attuali permettendo un backmapping universale, preciso e trasferibile da rappresentazioni a grana grossa a strutture atomiche complete per qualsiasi sistema chimico.

Daniele Angioletti, Stefano Raniolo, Vittorio Limongelli2026-03-06🔬 physics

Learning to Cover: Online Learning and Optimization with Irreversible Decisions

Il paper propone un algoritmo asintoticamente ottimale per un problema di apprendimento online con decisioni irreversibili e target di copertura, dimostrando che una strategia che bilancia esplorazione iniziale e sfruttamento rapido riduce il rimpianto a un tasso sub-lineare, validando l'efficacia di programmi pilota prima di un'espansione completa.

Alexandre Jacquillat, Michael Lingzhi Li2026-03-06🔢 math

Parallel Split Learning with Global Sampling

Il paper presenta GPSL, un metodo server-driven per l'apprendimento diviso parallelo che, campionando globalmente i dati, risolve i problemi di dimensione del batch e distribuzione non-IID, garantendo stabilità, precisione e scalabilità con overhead trascurabile.

Mohammad Kohankhaki, Ahmad Ayad, Mahdi Barhoush + 1 more2026-03-06💻 cs

Towards a Fairer Non-negative Matrix Factorization

Questo lavoro propone un approccio di fattorizzazione di matrice non negativa (NMF) equo basato su una formulazione min-max, presentando algoritmi di ottimizzazione e dimostrando attraverso esperimenti che tale metodo può migliorare l'equità tra i gruppi, sebbene a volte a scapito dell'accuratezza individuale e richiedendo una scelta metodologica adattata al contesto applicativo.

Lara Kassab, Erin George, Deanna Needell + 3 more2026-03-06💻 cs

An Experimental Study on Fairness-aware Machine Learning for Credit Scoring Problems

Questo studio sperimentale dimostra che i modelli di machine learning consapevoli dell'equità offrono un miglior compromesso tra accuratezza predittiva e imparzialità rispetto ai modelli tradizionali nell'ambito della valutazione del credito.

Huyen Giang Thi Thu, Thang Viet Doan, Ha-Bang Ban + 1 more2026-03-06💻 cs

Path Planning for Masked Diffusion Model Sampling

Questo articolo introduce Path Planning (P2), una strategia di inferenza innovativa che generalizza i modelli di diffusione mascherati (MDM) consentendo il raffinamento iterativo dei token, migliorando così significativamente le prestazioni generative in ambiti come la biologia, la matematica e la programmazione.

Fred Zhangzhi Peng, Zachary Bezemek, Sawan Patel + 5 more2026-03-06💻 cs

Curse of Dimensionality in Neural Network Optimization

Questo articolo dimostra l'esistenza della maledizione della dimensionalità nell'ottimizzazione delle reti neurali, stabilendo che il rischio di popolazione non può decadere più velocemente di un tasso specifico dipendente dalla dimensionalità e dalla regolarità della funzione target, sia nel caso di funzioni di attivazione Lipschitziane che di quelle localmente Lipschitziane.

Sanghoon Na, Haizhao Yang2026-03-06🔢 math

Generalization Bounds for Markov Algorithms through Entropy Flow Computations

Questo lavoro estende il metodo del flusso di entropia, precedentemente limitato a specifiche dinamiche stocastiche, a tutti gli algoritmi di apprendimento governati da processi di Markov omogenei nel tempo, stabilendo nuovi legami tra l'errore di generalizzazione e le proprietà ergodiche attraverso una formula esatta e disuguaglianze di Sobolev logaritmiche modificate.

Benjamin Dupuis, Maxime Haddouche, George Deligiannidis + 1 more2026-03-06💻 cs

Sink equilibria and the attractors of learning in games

Questo lavoro confuta la congettura secondo cui gli attrattori della dinamica replicatrice corrispondono biunivocamente agli equilibri di bacino, dimostrando che tale relazione è falsa attraverso controesempi basati su "fonti locali" e fornendo una condizione sufficiente basata sulla pseudocavità per garantire la corrispondenza nei giochi a due giocatori.

Oliver Biggar, Christos Papadimitriou2026-03-06💻 cs

FBFL: A Field-Based Coordination Approach for Data Heterogeneity in Federated Learning

Il paper propone FBFL, un approccio innovativo per l'apprendimento federato che utilizza la coordinazione basata su campi e macroprogrammazione per superare le sfide dell'eterogeneità dei dati non-IID e dell'architettura centralizzata, dimostrando prestazioni superiori rispetto agli stati dell'arte in scenari non uniformi e una maggiore resilienza ai guasti dei server.

Davide Domini, Gianluca Aguzzi, Lukas Esterle + 1 more2026-03-06💻 cs

Double Momentum and Error Feedback for Clipping with Fast Rates and Differential Privacy

Il paper propone e analizza Clip21-SGD2M, un nuovo metodo per l'apprendimento federato che combina clipping, momentum e feedback dell'errore per garantire simultaneamente ottimali tassi di convergenza e privacy differenziale anche in presenza di dati eterogenei e non convessi.

Rustem Islamov, Samuel Horvath, Aurelien Lucchi + 2 more2026-03-06🔢 math

← Precedente Successivo →