cs.LG articoli | Gist.Science

Semantic Parallelism: Redefining Efficient MoE Inference via Model-Data Co-Scheduling

Il paper presenta "Semantic Parallelism", un nuovo paradigma implementato nel framework Sem-MoE che ottimizza l'inferenza dei modelli MoE su larga scala collocando proattivamente esperti e token attivanti sullo stesso dispositivo tramite una schedulazione collaborativa modello-dati, riducendo così drasticamente i costi di comunicazione e migliorando il throughput rispetto alle soluzioni esistenti.

Yan Li, Zhenyu Zhang, Zhengang Wang + 2 more2026-03-02🤖 cs.AI

Probabilistic Neural Networks (PNNs) with t-Distributed Outputs: Adaptive Prediction Intervals Beyond Gaussian Assumptions

Questo articolo propone le TDistNN, una variante delle reti neurali probabilistiche che sostituisce l'assunzione gaussiana con una distribuzione t per generare intervalli di previsione più stretti e robusti rispetto ai valori anomali, migliorando così la quantificazione dell'incertezza nelle regressioni.

Farhad Pourkamali-Anaraki2026-03-02📊 stat

What Makes a Reward Model a Good Teacher? An Optimization Perspective

Questo studio dimostra che, oltre all'accuratezza, un modello di ricompensa efficace deve generare una varianza sufficiente per evitare paesaggi di ottimizzazione piatti e garantire un addestramento efficiente nell'ambito del Reinforcement Learning from Human Feedback (RLHF).

Noam Razin, Zixuan Wang, Hubert Strauss + 3 more2026-03-02💬 cs.CL

Operator Learning with Domain Decomposition for Geometry Generalization in PDE Solving

Il paper propone un framework di apprendimento operatoriale basato sulla decomposizione del dominio e su uno schema iterativo chiamato Schwarz Neural Inference (SNI) per risolvere equazioni differenziali parziali su geometrie arbitrarie, migliorando significativamente la generalizzazione geometrica e l'efficienza dei dati rispetto ai metodi esistenti.

Jianing Huang, Kaixuan Zhang, Youjia Wu + 1 more2026-03-02🤖 cs.AI

Sparsity Forcing: Reinforcing Token Sparsity of MLLMs

Il paper introduce "Sparsity Forcing", un framework di post-addestramento basato sul reinforcement learning che ottimizza il compromesso tra efficienza e accuratezza nei modelli linguistici multimodali, permettendo di ridurre fino al 75% dei token con un impatto minimo sulle prestazioni e accelerando significativamente l'inferenza.

Feng Chen, Yefei He, Lequan Lin + 4 more2026-03-02🤖 cs.LG

Discrete Optimal Transport and Voice Conversion

Questo lavoro propone un metodo di conversione vocale basato sul trasporto ottimo discreto e sulla proiezione baricentrica per allineare gli embedding audio, dimostrando non solo l'efficacia del sistema ma anche la sua capacità di generare un potente attacco avversario che induce i rilevatori a classificare la voce sintetica come reale.

Anton Selitskiy, Maitreya Kocharekar2026-03-02⚡ eess

Apple: Toward General Active Perception via Reinforcement Learning

Il paper presenta APPLE, un nuovo framework basato sul reinforcement learning che addestra congiuntamente un modulo percettivo e una politica decisionale per risolvere in modo generale e versatile problemi di percezione attiva in robotica, superando i limiti delle metodologie attuali legate a compiti specifici.

Tim Schneider, Cristiana de Farias, Roberto Calandra + 2 more2026-03-02🤖 cs.LG

Manifold Learning with Normalizing Flows: Towards Regularity, Expressivity and Iso-Riemannian Geometry

Questo lavoro affronta le distorsioni e gli errori di modellazione nei dati multimodali proponendo un approccio che isometrizza la struttura Riemanniana appresa e bilancia regolarità ed espressività delle parametrizzazioni di diffeomorfismo, migliorando così l'analisi dei dati non lineari attraverso flussi normalizzanti.

Willem Diepeveen, Deanna Needell2026-03-02🤖 cs.LG

Continuous Optimization for Feature Selection with Permutation-Invariant Embedding and Policy-Guided Search

Il paper propone un nuovo framework per la selezione delle caratteristiche che combina un'architettura encoder-decoder con invarianza alla permutazione e un agente di apprendimento per rinforzo basato su policy, superando le limitazioni delle embedding continue sensibili all'ordine e delle ipotesi di convessità per ottimizzare l'esplorazione dello spazio delle soluzioni.

Rui Liu, Rui Xie, Zijun Yao + 2 more2026-03-02🤖 cs.AI

Fairness-in-the-Workflow: How Machine Learning Practitioners at Big Tech Companies Approach Fairness in Recommender Systems

Attraverso interviste a 11 professionisti di grandi aziende tecnologiche, questo studio analizza le sfide pratiche nell'integrare l'equità nei sistemi di raccomandazione e offre raccomandazioni concrete per migliorare la collaborazione interdisciplinare e i flussi di lavoro tecnici.

Jing Nathan Yan, Emma Harvey, Junxiong Wang + 2 more2026-03-02🤖 cs.AI

Multi-View Encoders for Performance Prediction in LLM-Based Agentic Workflows

Il paper presenta Agentic Predictor, un modello leggero che utilizza un encoding multi-vista e un pre-addestramento non supervisionato per prevedere con precisione le prestazioni dei flussi di lavoro agenziali basati su LLM, riducendo così la necessità di costose valutazioni empiriche.

Patara Trirat, Wonyong Jeong, Sung Ju Hwang2026-03-02🤖 cs.AI

REA-RL: Reflection-Aware Online Reinforcement Learning for Efficient Reasoning

Il paper propone REA-RL, un metodo di apprendimento per rinforzo online che utilizza un modello di riflessione e una ricompensa specifica per ridurre i costi di inferenza dei modelli di ragionamento senza comprometterne le prestazioni, bilanciando efficienza e capacità di riflessione.

Hexuan Deng, Wenxiang Jiao, Xuebo Liu + 2 more2026-03-02💬 cs.CL

Apprenticeship learning with prior beliefs using inverse optimization

Questo lavoro esplora la relazione tra apprendimento per imitazione e ottimizzazione inversa nei processi decisionali di Markov, proponendo un quadro regolarizzato che incorpora credenze a priori per risolvere l'indeterminatezza dell'apprendimento da esperti subottimali e risolvendo il problema risultante tramite discesa speculare stocastica.

Mauricio Junca, Esteban Leiva2026-03-02🤖 cs.LG

On the Lipschitz Continuity of Set Aggregation Functions and Neural Networks for Sets

Questo articolo analizza la continuità di Lipschitz delle funzioni di aggregazione per insiemi e delle reti neurali che le utilizzano, derivando limiti superiori per le loro costanti di Lipschitz, studiando la loro stabilità e generalizzazione, e validando i risultati teorici attraverso esperimenti empirici.

Giannis Nikolentzos, Konstantinos Skianis2026-03-02🤖 cs.LG

Bridging the Performance Gap Between Target-Free and Target-Based Reinforcement Learning

Il documento presenta iS-QL, un metodo di apprendimento per rinforzo che condivide i parametri tra la rete online e quella target tranne l'ultimo strato lineare, colmando il divario prestazionale tra approcci con e senza target e migliorando l'efficienza dei campioni grazie all'apprendimento iterato delle Q-value.

Théo Vincent, Yogesh Tripathi, Tim Faust + 5 more2026-03-02🤖 cs.AI

Quantum Learning and Estimation for Coordinated Operation between Distribution Networks and Energy Communities

Il paper propone un approccio di apprendimento e stima quantistica, basato su un modello ibrido Q-TCN-LSTM e sull'estimazione dell'ampiezza quantistica, per ottimizzare la coordinazione tra reti di distribuzione e comunità energetiche, migliorando significativamente l'accuratezza e riducendo il carico computazionale rispetto ai metodi classici.

Yingrui Zhuang, Lin Cheng, Yuji Cao + 4 more2026-03-02🤖 cs.LG

CoMind: Towards Community-Driven Agents for Machine Learning Engineering

Il paper presenta CoMind, un sistema multi-agente che sfrutta la conoscenza collettiva di una comunità di ricerca simulata per ottenere risultati all'avanguardia, superando la maggior parte dei concorrenti umani nelle competizioni Kaggle.

Sijie Li, Weiwei Sun, Shanda Li + 2 more2026-03-02🤖 cs.AI

Knowledge-Guided Machine Learning: Illustrating the use of Explainable Boosting Machines to Identify Overshooting Tops in Satellite Imagery

Questo lavoro illustra l'uso delle Macchine a Boosting Esplicabili (EBM) in un approccio di Machine Learning guidato dalla conoscenza per identificare le sommità sovrastanti (overshooting tops) nelle immagini satellitari, dimostrando come sia possibile sviluppare algoritmi interpretabili che integrano strategie umane per migliorare l'affidabilità nelle previsioni meteorologiche ad alto rischio.

Nathan Mitchell, Lander Ver Hoef, Imme Ebert-Uphoff + 4 more2026-03-02🤖 cs.LG

pFedMMA: Personalized Federated Fine-Tuning with Multi-Modal Adapter for Vision-Language Models

Il paper presenta pFedMMA, un innovativo framework di apprendimento federato personalizzato che utilizza adattatori multi-modali per ottimizzare i modelli visione-linguaggio su dati decentralizzati, ottenendo un equilibrio superiore tra personalizzazione e generalizzazione rispetto ai metodi esistenti.

Sajjad Ghiasvand, Mahnoosh Alizadeh, Ramtin Pedarsani2026-03-02🤖 cs.LG

Conformal Prediction for Long-Tailed Classification

Il paper propone nuovi metodi di previsione conformale per la classificazione a code lunghe che bilanciano efficacemente la dimensione degli insiemi di previsione e la copertura condizionale per classe, superando il compromesso tradizionale tra insiemi piccoli ma inaffidabili e insiemi troppo grandi.

Tiffany Ding, Jean-Baptiste Fermanian, Joseph Salmon2026-03-02📊 stat

← Precedente Successivo →