cs.LG papers | Gist.Science

Efficient Reasoning at Fixed Test-Time Cost via Length-Aware Attention Priors and Gain-Aware Training

Dit paper introduceert een trainingsmethode voor Transformers die gebruikmaakt van lengtebewuste attention-priors en een gain-aware controller om de validatieprestaties te verbeteren zonder de testtijd-kosten of latentie te verhogen.

Rian AtriWed, 11 Ma🤖 cs.LG

Transductive Generalization via Optimal Transport and Its Application to Graph Node Classification

Dit artikel introduceert nieuwe, efficiënt berekenbare transductieve generalisatiegrenzen voor grafnodeclassificatie op basis van optimale transport en Wasserstein-afstanden, die empirisch beter presteren dan klassieke complexiteitsmaten en het niet-monotone effect van GNN-diepte op generalisatie verklaren.

MoonJeong Park, Seungbeom Lee, Kyungmin Kim, Jaeseung Heo, Seunghyuk Cho, Shouheng Li, Sangdon Park, Dongwoo KimWed, 11 Ma🤖 cs.LG

DendroNN: Dendrocentric Neural Networks for Energy-Efficient Classification of Event-Based Data

Dit artikel introduceert DendroNN, een energiezuinig, niet-gedifferentieerd neuronaal netwerk dat inspiratie put uit dendritische sequentiedetectie om event-based data te verwerken en via een asynchrone hardware-architectuur een tot vier keer hogere efficiëntie bereikt dan bestaande neuromorfe systemen.

Jann Krausse, Zhe Su, Kyrus Mama, Maryada, Klaus Knobloch, Giacomo Indiveri, Jürgen BeckerWed, 11 Ma🤖 cs.AI

On Regret Bounds of Thompson Sampling for Bayesian Optimization

Dit artikel vult bestaande kennisgaten over de spijtbegrensingen van Gaussian Process Thompson Sampling (GP-TS) in door zowel een ondergrens als verbeterde bovengrenzen voor de verwachte, leniente en cumulatieve spijt af te leiden, waarbij wordt aangetoond dat GP-TS een polynoomafhankelijkheid van $1/\delta$ vertoont en dat recente verbeteringen voor GP-UCB ook op GP-TS van toepassing zijn.

Shion Takeno, Shogo IwazakiWed, 11 Ma🤖 cs.LG

Proxy-Guided Measurement Calibration

Dit artikel presenteert een door proxyvariabelen geleid raamwerk dat variatie-automatische coderingen gebruikt om systematische meetfouten in uitkomstvariabelen te identificeren en te corrigeren door latente inhouds- en biasvariabelen te ontrafelen.

Saketh Vishnubhatla, Shu Wan, Andre Harrison, Adrienne Raglin, Huan LiuWed, 11 Ma🤖 cs.LG

A Gaussian Comparison Theorem for Training Dynamics in Machine Learning

Dit paper presenteert een niet-asymptotisch resultaat dat de trainingsdynamica van machine learning-modellen onder een Gaussisch mengselmodel koppelt aan een makkelijker te analyseren surrogaat-dynamisch systeem, waarbij gebruik wordt gemaakt van de Gordon-vergelijkingstheorema om de geldigheid van dynamische mean-field-expressies te bewijzen en een iteratief verfijningsschema voor niet-asymptotische scenario's voor te stellen.

Ashkan PanahiWed, 11 Ma🤖 cs.LG

CLoE: Expert Consistency Learning for Missing Modality Segmentation

Het artikel introduceert CLoE, een consistentiegedreven raamwerk dat de segmentatieprestaties bij ontbrekende medische beeldmodaliteiten verbetert door experts op besluit- en regienniveau tot overeenstemming te brengen en modale betrouwbaarheid dynamisch te wegen.

Xinyu Tong, Meihua Zhou, Bowu Fan, Haitao LiWed, 11 Ma🤖 cs.AI

Reward-Zero: Language Embedding Driven Implicit Reward Mechanisms for Reinforcement Learning

Dit paper introduceert Reward-Zero, een universeel mechanisme dat natuurlijke taalbeschrijvingen omzet in semantisch onderbouwde, impliciete beloningssignalen om het leren van versterking te versnellen en te stabiliseren zonder handmatige beloningseigenschappen.

Heng Zhang, Haddy Alchaer, Arash Ajoudani, Yu SheWed, 11 Ma🤖 cs.LG

TA-GGAD: Testing-time Adaptive Graph Model for Generalist Graph Anomaly Detection

Dit paper introduceert TA-GGAD, een adaptief grafmodel dat het 'Anomaly Disassortativity'-probleem aanpakt om generalistische, domeinonafhankelijke anomaliedetectie te realiseren met state-of-the-art prestaties op diverse real-world grafen.

Xiong Zhang, Hong Peng, Changlong Fu, Xin Jin, Yun Yang, Cheng XieWed, 11 Ma🤖 cs.AI

Interactive 3D visualization of surface roughness predictions in additive manufacturing: A data-driven framework

Dit artikel presenteert een datagedreven raamwerk dat een interactieve 3D-visualisatie biedt om de oppervlakteruwheid bij materiaal-extrusie-additieve productie te voorspellen en te optimaliseren door gebruik te maken van een multilayer perceptron en een conditionele generatieve tegenstrijdige netwerken.

Engin Deniz Erkan, Elif Surer, Ulas YamanWed, 11 Ma🤖 cs.LG

Democratising Clinical AI through Dataset Condensation for Classical Clinical Models

Dit artikel introduceert een differentieel-private, nulde-orde optimalisatieframework dat datasetcondensatie mogelijk maakt voor niet-differentieerbare klinische modellen, zoals beslisbomen en Cox-regressie, waardoor veilige en modelonafhankelijke datauitwisseling voor klinische voorspellingsopdrachten wordt gerealiseerd zonder de privacy van patiënten te schaden.

Anshul Thakur, Soheila Molaei, Pafue Christy Nganjimi, Joshua Fieggen, Andrew A. S. Soltan, Danielle Belgrave, Lei Clifton, David A. CliftonWed, 11 Ma🤖 cs.AI

From Representation to Clusters: A Contrastive Learning Approach for Attributed Hypergraph Clustering

Dit paper introduceert CAHC, een end-to-end contrastive learning-methode voor geattribueerde hypergraafclustering die tegelijkertijd knoopembeddings leert en clusterresultaten genereert door middel van een combinatie van knoop- en hyperedge-niveau doelen, waardoor het de prestaties van bestaande methoden op acht datasets verbetert.

Li Ni, Shuaikang Zeng, Lin Mu, Longlong LinWed, 11 Ma🤖 cs.LG

Flow Field Reconstruction via Voronoi-Enhanced Physics-Informed Neural Networks with End-to-End Sensor Placement Optimization

Deze studie introduceert VSOPINN, een physics-informed neural network dat via differentieerbare Voronoi-constructie en end-to-end optimalisatie de plaatsing van sensoren aanpast om robuuste en nauwkeurige reconstructie van stromingsvelden mogelijk te maken, zelfs bij onvolledige metingen of sensoruitval.

Renjie Xiao, Bingteng Sun, Yiling Chen, Lin Lu, Qiang Du, Junqiang ZhuWed, 11 Ma🤖 cs.LG

SPAARS: Safer RL Policy Alignment through Abstract Exploration and Refined Exploitation of Action Space

SPAARS is een curriculumleerframework voor offline-naar-online versterkingsleer dat veilig online verkenning eerst beperkt tot een laagdimensionale latente ruimte om vervolgens naadloos over te schakelen naar de ruwe actieruimte, waardoor de prestatieplafond van decoder-bottlenecks wordt doorbroken en aanzienlijk betere sample-efficiëntie en prestaties worden bereikt.

Swaminathan S K, Aritra HazraWed, 11 Ma🤖 cs.AI

Reviving ConvNeXt for Efficient Convolutional Diffusion Models

Dit paper introduceert FCDM, een volledig convolutiegebaseerd diffusiemodel dat ConvNeXt herintroduceert als een uiterst efficiënt alternatief voor Transformer-architecturen, waarbij het met slechts 50% van de FLOPs en aanzienlijk minder trainingsstappen vergelijkbare prestaties levert.

Taesung Kwon, Lorenzo Bianchi, Lennart Wittke, Felix Watine, Fabio Carrara, Jong Chul Ye, Romann Weber, Vinicius AzevedoWed, 11 Ma🤖 cs.AI

Reconstructing Movement from Sparse Samples: Enhanced Spatio-Temporal Matching Strategies for Low-Frequency Data

Dit paper introduceert vier verbeteringen aan het ruimtelijk-temporele matching-algoritme voor GPS-trajecten om de rekenkracht en nauwkeurigheid in stedelijke omgevingen met lage sample-frequentie te verhogen, wat wordt gevalideerd met data uit Milaan.

Ali Yousefian, Arianna Burzacchi, Simone VantiniWed, 11 Ma🤖 cs.LG

Impact of Markov Decision Process Design on Sim-to-Real Reinforcement Learning

Dit onderzoek toont aan dat zorgvuldige ontwerpprincipes voor Markov-beslissingsprocessen, met name het gebruik van op fysica gebaseerde dynamische modellen, de kloof tussen simulatie en realiteit in industriële procesregeling aanzienlijk kunnen verkleinen en de succeskans op echte hardware tot 50% kunnen verhogen.

Tatjana Krau, Jorge Mandlmaier, Tobias Damm, Frieder HeieckWed, 11 Ma🤖 cs.LG

From Weighting to Modeling: A Nonparametric Estimator for Off-Policy Evaluation

Dit artikel introduceert de Model-assisted Nonparametric Weighting (MNW)-methode voor off-policy evaluatie in contextuele bandieten, die door het combineren van niet-parametrische weging en beloningsschattingen een lagere variantie en nauwkeurige schattingen biedt ten opzichte van bestaande technieken zoals inverse probability weighting en doubly robust schatters.

Rong J. B. ZhuWed, 11 Ma🤖 cs.LG

Variational Routing: A Scalable Bayesian Framework for Calibrated Mixture-of-Experts Transformers

Dit paper introduceert VMoER, een schaalbaar Bayesiaans framework dat variational inference toepast op de routering in Mixture-of-Experts Transformers om zo met minimale rekentijd gecalibreerde onzekerheidsschattingen te bieden voor foundation modellen.

Albus Yizhuo Li, Matthew WickerWed, 11 Ma🤖 cs.AI

Temporal-Conditioned Normalizing Flows for Multivariate Time Series Anomaly Detection

Dit paper introduceert Temporal-Conditioned Normalizing Flows (tcNF), een nieuw raamwerk voor het detecteren van anomalieën in multivariate tijdsreeksen door complexe temporele afhankelijkheden en onzekerheid nauwkeurig te modelleren via autoregressieve conditionering op eerdere waarnemingen.

David Baumgartner, Helge Langseth, Kenth Engø-Monsen, Heri RamampiaroWed, 11 Ma🤖 cs.AI

← Vorige Volgende →