cs.LG articoli | Gist.Science

Efficient Reasoning at Fixed Test-Time Cost via Length-Aware Attention Priors and Gain-Aware Training

Il paper propone un metodo per migliorare l'efficienza del ragionamento nei Transformer a costo di test fisso, introducendo durante l'addestramento un prior di attenzione sensibile alla lunghezza e un controller "Guardian" che, senza aggiungere parametri o latenza durante l'inferenza, riduce l'entropia incrociata di validazione mantenendo invariati i costi computazionali.

Rian AtriWed, 11 Ma🤖 cs.LG

Transductive Generalization via Optimal Transport and Its Application to Graph Node Classification

Questo lavoro stabilisce nuovi limiti di generalizzazione trasduttiva basati sul trasporto ottimo e sulle distanze di Wasserstein, dimostrando che sono efficientemente calcolabili e correlati all'errore empirico nella classificazione di nodi su grafi, rivelando inoltre come l'aggregazione delle GNN influenzi la generalizzazione attraverso un compromesso tra concentrazione intra-classe e separazione inter-classe.

MoonJeong Park, Seungbeom Lee, Kyungmin Kim, Jaeseung Heo, Seunghyuk Cho, Shouheng Li, Sangdon Park, Dongwoo KimWed, 11 Ma🤖 cs.LG

DendroNN: Dendrocentric Neural Networks for Energy-Efficient Classification of Event-Based Data

Il paper presenta DendroNN, una rete neurale ispirata ai dendriti biologici che utilizza un meccanismo di ricollegamento senza gradienti e un'architettura hardware asincrona per classificare efficientemente dati basati su eventi, raggiungendo un'efficienza energetica fino a 4 volte superiore rispetto alle soluzioni neuromorfiche esistenti.

Jann Krausse, Zhe Su, Kyrus Mama, Maryada, Klaus Knobloch, Giacomo Indiveri, Jürgen BeckerWed, 11 Ma🤖 cs.AI

On Regret Bounds of Thompson Sampling for Bayesian Optimization

Questo articolo colma le lacune nell'analisi del regret per il campionamento di Thompson basato su processi gaussiani (GP-TS) fornendo nuovi limiti inferiori, superiori sul secondo momento, limiti attesi di regret "lenient" e un limite superiore cumulativo migliorato rispetto all'orizzonte temporale $T$ .

Shion Takeno, Shogo IwazakiWed, 11 Ma🤖 cs.LG

Proxy-Guided Measurement Calibration

Questo articolo propone un quadro guidato da variabili proxy e basato su autoencoder variazionali per identificare e correggere gli errori di misurazione sistematici nelle variabili di esito aggregate, separando i fattori latenti che generano il vero risultato da quelli che inducono il bias.

Saketh Vishnubhatla, Shu Wan, Andre Harrison, Adrienne Raglin, Huan LiuWed, 11 Ma🤖 cs.LG

A Gaussian Comparison Theorem for Training Dynamics in Machine Learning

Questo lavoro presenta un teorema di confronto non asintotico basato sul teorema di Gordon per analizzare la dinamica di addestramento di algoritmi su modelli a mistura gaussiana, dimostrando la validità delle espressioni del campo medio dinamico e proponendo uno schema di raffinamento iterativo per scenari non asintotici.

Ashkan PanahiWed, 11 Ma🤖 cs.LG

CLoE: Expert Consistency Learning for Missing Modality Segmentation

Il paper presenta CLoE, un framework di apprendimento della consistenza degli esperti che migliora la segmentazione delle immagini mediche multimodali in presenza di modalità mancanti garantendo un accordo decisionale globale e regionale tra gli esperti e un ricalibrazione delle caratteristiche basata sull'affidabilità.

Xinyu Tong, Meihua Zhou, Bowu Fan, Haitao LiWed, 11 Ma🤖 cs.AI

Reward-Zero: Language Embedding Driven Implicit Reward Mechanisms for Reinforcement Learning

Il paper introduce Reward-Zero, un meccanismo di ricompensa implicito che trasforma le descrizioni dei compiti in linguaggio naturale in segnali di progresso densi e semanticamente allineati tramite embedding linguistici, accelerando l'addestramento e migliorando la generalizzazione degli agenti di Reinforcement Learning senza richiedere ingegneria specifica per ogni compito.

Heng Zhang, Haddy Alchaer, Arash Ajoudani, Yu SheWed, 11 Ma🤖 cs.LG

TA-GGAD: Testing-time Adaptive Graph Model for Generalist Graph Anomaly Detection

Il paper introduce TA-GGAD, un modello grafico adattivo che risolve il problema dello spostamento di dominio identificando e modellando la "Disassortatività delle Anomalie" ( $\mathcal{AD}$ ), consentendo così un rilevamento generalizzato e all'avanguardia delle anomalie su diversi domini con un'unica fase di addestramento.

Xiong Zhang, Hong Peng, Changlong Fu, Xin Jin, Yun Yang, Cheng XieWed, 11 Ma🤖 cs.AI

Interactive 3D visualization of surface roughness predictions in additive manufacturing: A data-driven framework

Questo lavoro presenta un framework basato sui dati che combina un regressore a perceptron multistrato e una rete generativa avversaria condizionale per prevedere la rugosità superficiale nella manifattura additiva, integrando un'interfaccia web interattiva che visualizza le previsioni su modelli 3D per ottimizzare l'orientamento e i parametri di stampa.

Engin Deniz Erkan, Elif Surer, Ulas YamanWed, 11 Ma🤖 cs.LG

Democratising Clinical AI through Dataset Condensation for Classical Clinical Models

Questo articolo propone un quadro di ottimizzazione di ordine zero con privacy differenziale che estende la condensazione dei dataset ai modelli clinici non differenziabili, consentendo la condivisione sicura di dati sintetici che preservano l'utilità predittiva senza esporre informazioni sensibili dei pazienti.

Anshul Thakur, Soheila Molaei, Pafue Christy Nganjimi, Joshua Fieggen, Andrew A. S. Soltan, Danielle Belgrave, Lei Clifton, David A. CliftonWed, 11 Ma🤖 cs.AI

From Representation to Clusters: A Contrastive Learning Approach for Attributed Hypergraph Clustering

Il paper propone CAHC, un metodo end-to-end di apprendimento contrastivo che integra l'apprendimento delle rappresentazioni e l'assegnazione dei cluster per migliorare il clustering su ipergrafi attribuiti, superando i limiti delle approcci tradizionali privi di supervisione diretta.

Li Ni, Shuaikang Zeng, Lin Mu, Longlong LinWed, 11 Ma🤖 cs.LG

Flow Field Reconstruction via Voronoi-Enhanced Physics-Informed Neural Networks with End-to-End Sensor Placement Optimization

Questo studio propone VSOPINN, un approccio che integra le reti neurali fisicamente informate (PINN) con un'ottimizzazione differenziabile del posizionamento dei sensori basata su diagrammi di Voronoi, per ricostruire con precisione e robustezza campi di flusso complessi anche in presenza di dati sparsi o guasti dei sensori.

Renjie Xiao, Bingteng Sun, Yiling Chen, Lin Lu, Qiang Du, Junqiang ZhuWed, 11 Ma🤖 cs.LG

SPAARS: Safer RL Policy Alignment through Abstract Exploration and Refined Exploitation of Action Space

Il paper introduce SPAARS, un framework di apprendimento curricolare per l'allineamento delle politiche RL che combina un'esplorazione sicura nello spazio latente con un'ottimizzazione diretta nello spazio delle azioni, superando i limiti di prestazione dei metodi basati su CVAE e dimostrando miglioramenti significativi nell'efficienza del campione e nei risultati su diversi benchmark robotici.

Swaminathan S K, Aritra HazraWed, 11 Ma🤖 cs.AI

Reviving ConvNeXt for Efficient Convolutional Diffusion Models

Il paper introduce il Fully Convolutional Diffusion Model (FCDM), un'architettura basata su ConvNeXt che dimostra come i modelli convoluzionali moderni possano offrire un'alternativa altamente efficiente e competitiva rispetto ai Transformer per la generazione di immagini, riducendo drasticamente i requisiti computazionali e di tempo di addestramento.

Taesung Kwon, Lorenzo Bianchi, Lennart Wittke, Felix Watine, Fabio Carrara, Jong Chul Ye, Romann Weber, Vinicius AzevedoWed, 11 Ma🤖 cs.AI

Reconstructing Movement from Sparse Samples: Enhanced Spatio-Temporal Matching Strategies for Low-Frequency Data

Questo articolo propone quattro modifiche all'algoritmo di abbinamento spaziotemporale per migliorare l'efficienza computazionale e la precisione del tracciamento GPS su reti stradali in ambienti densi, validando i risultati su dati reali di Milano attraverso nuove metriche di valutazione.

Ali Yousefian, Arianna Burzacchi, Simone VantiniWed, 11 Ma🤖 cs.LG

Impact of Markov Decision Process Design on Sim-to-Real Reinforcement Learning

Questo studio analizza sistematicamente come le scelte di progettazione del Processo Decisionale di Markov influenzino il trasferimento sim-to-real nell'apprendimento per rinforzo per il controllo dei processi industriali, dimostrando sperimentalmente che l'uso di modelli di dinamica basati sulla fisica è fondamentale per raggiungere un successo reale fino al 50% in compiti di precisione dove i modelli semplificati falliscono.

Tatjana Krau, Jorge Mandlmaier, Tobias Damm, Frieder HeieckWed, 11 Ma🤖 cs.LG

From Weighting to Modeling: A Nonparametric Estimator for Off-Policy Evaluation

Questo lavoro propone un nuovo stimatore non parametrico per la valutazione di politiche fuori corso nei banditi contestuali, che combina pesi non parametrici e previsioni delle ricompense per ottenere stime di valore con varianza significativamente ridotta e bias contenuto rispetto alle tecniche esistenti.

Rong J. B. ZhuWed, 11 Ma🤖 cs.LG

Variational Routing: A Scalable Bayesian Framework for Calibrated Mixture-of-Experts Transformers

Il paper introduce VMoER, un approccio bayesiano strutturato che applica l'inferenza variazionale alla fase di routing nelle architetture Mixture-of-Experts, consentendo una quantificazione dell'incertezza calibrata e scalabile per i modelli foundation con un costo computazionale trascurabile.

Albus Yizhuo Li, Matthew WickerWed, 11 Ma🤖 cs.AI

Temporal-Conditioned Normalizing Flows for Multivariate Time Series Anomaly Detection

Il paper introduce i flussi di normalizzazione condizionati temporalmente (tcNF), un nuovo framework autoregressivo che migliora il rilevamento di anomalie nelle serie temporali multivariate modellando con precisione le dipendenze temporali e le incertezze per generare distribuzioni probabilistiche affidabili.

David Baumgartner, Helge Langseth, Kenth Engø-Monsen, Heri RamampiaroWed, 11 Ma🤖 cs.AI

← Precedente Successivo →