cs.LG papers | Gist.Science

XConv: Low-memory stochastic backpropagation for convolutional layers

XConv is een geheugen-efficiënte, drop-in vervanging voor convolutielagen die de opslag van tussenactivaties drastisch reduceert door gebruik te maken van gecomprimeerde representaties en stochastische schattingen, zonder de architectuur te beperken of significante rekenkosten toe te voegen.

Anirudh Thatipelli, Jeffrey Sam, Mathias Louboutin, Ali Siahkoohi, Rongrong Wang, Felix J. HerrmannWed, 11 Ma🤖 cs.LG

A Survey on Decentralized Federated Learning

Deze survey biedt een overzicht van decentrale federatieve leermethodes tot begin 2026, classificeert ze in traditionele en blockchain-gebaseerde families, stelt een nieuwe taxonomie voor die gebaseerd is op uitdagingen, en identificeert kritieke onderzoekslacunes en toekomstige richtingen op het gebied van beveiliging, privacy en prikkels.

Edoardo Gabrielli, Anthony Di Pietro, Dario Fenoglio, Giovanni Pica, Gabriele TolomeiWed, 11 Ma🤖 cs.LG

Polynomially Over-Parameterized Convolutional Neural Networks Contain Structured Strong Winning Lottery Tickets

Deze paper overwint de beperkingen van eerdere wiskundige analyses om aan te tonen dat willekeurig geïnitieerde, polynomaal over-geparameteriseerde convolutionele neurale netwerken gestructureerde 'winnende loterijtickets' bevatten die zonder training andere netwerken kunnen benaderen.

Arthur da Cunha, Francesco d'Amore, Emanuele NataleWed, 11 Ma🤖 cs.LG

Provable Filter for Real-world Graph Clustering

Dit paper introduceert een theoretisch onderbouwde, proefbare filter voor grafclustering die zowel homofiele als heterofiele structuren in real-world grafen effectief verwerkt door het construeren van lage- en hoogdoorlaatfilters en het versterken van belangrijke kenmerken via een squeeze-and-excitation blok.

Xuanting Xie, Erlin Pan, Zhao Kang, Wenyu Chen, Bingheng LiWed, 11 Ma🤖 cs.LG

Enhancing Computational Efficiency in Multiscale Systems Using Deep Learning of Coordinates and Flow Maps

Dit paper presenteert een diep learning-gebaseerd raamwerk dat door gezamenlijke ontdekking van coördinaten en stroomkaarten de computationele efficiëntie van multischaal-systemen verbetert met state-of-the-art voorspellende nauwkeurigheid en lagere kosten.

Asif Hamid, Danish Rafiq, Shahkar Ahmad Nahvi, Mohammad Abid BazazWed, 11 Ma🤖 cs.LG

Sparse Variational Student-t Processes for Heavy-tailed Modeling

Deze paper introduceert Sparse Variational Student-t Processes (SVTP), een schaalbaar raamwerk dat de robuustheid van Student-t-processen combineert met efficiënte inference-algoritmen voor het modelleren van zwaarstaartige data en uitbijters, waarbij het aanzienlijk beter presteert dan bestaande methoden op grote datasets.

Jian Xu, Delu Zeng, John PaisleyWed, 11 Ma🤖 cs.AI

HYGENE: A Diffusion-based Hypergraph Generation Method

Dit paper introduceert HYGENE, een pionierende methode die gebruikmaakt van een op diffusie gebaseerd proces en een bipartiete representatie om realistische en diverse hypergrafen te genereren door een globale structuur geleidelijk uit te breiden en lokale details te verfijnen.

Dorian Gailhard, Enzo Tartaglione, Lirida Naviner, Jhony H. GiraldoWed, 11 Ma🤖 cs.LG

Robust Training of Neural Networks at Arbitrary Precision and Sparsity

Deze paper introduceert een unificerend raamwerk dat kwantisatie en verduidelijking als additief ruis modelleert en een afgeleid denoising-dekwantisatietransform toepast om stabiele training van neurale netwerken op willekeurige precisie- en sparsiteitsniveaus mogelijk te maken, waardoor state-of-the-art resultaten worden behaald in ultra-lage precisie-regimes zoals A1W1.

Chengxi Ye, Grace Chu, Yanfeng Liu, Yichi Zhang, Lukasz Lew, Li Zhang, Mark Sandler, Andrew HowardWed, 11 Ma🤖 cs.AI

ARLBench: Flexible and Efficient Benchmarking for Hyperparameter Optimization in Reinforcement Learning

Dit paper introduceert ARLBench, een efficiënt en flexibel benchmark voor hyperparameteroptimalisatie in versterkingsleer dat het mogelijk maakt om diverse AutoRL-methoden te vergelijken met een fractie van de gebruikelijke rekkracht door gebruik te maken van een geselecteerde subset van representatieve taken.

Jannis Becktepe, Julian Dierkes, Carolin Benjamins, Aditya Mohan, David Salinas, Raghu Rajan, Frank Hutter, Holger Hoos, Marius Lindauer, Theresa EimerWed, 11 Ma🤖 cs.LG

DRUPI: Dataset Reduction Using Privileged Information

Dit paper introduceert DCPI, een methode voor datasetcondensatie die de prestaties verbetert door naast de gereduceerde dataset ook 'geprivilegieerde informatie' te synthetiseren die als aanvullende supervisie dient tijdens het trainen van modellen.

Shaobo Wang, Youxin Jiang, Tianle Niu, Yantai Yang, Ruiji Zhang, Shuhao Hu, Shuaiyu Zhang, Chenghao Sun, Weiya Li, Conghui He, Xuming Hu, Linfeng ZhangWed, 11 Ma🤖 cs.AI

Unsupervised Representation Learning from Sparse Transformation Analysis

Deze paper introduceert een onbeheerde methode voor representatieleren die sequentiegegevens analyseert door latente transformaties te ontleden in een combinatie van actieve, sparsere rotatie- en potentiaalvelden, wat leidt tot nieuwe ontkoppelde representaties met state-of-the-art prestaties in waarschijnlijkheid en equivariantie.

Yue Song, Thomas Anderson Keller, Yisong Yue, Pietro Perona, Max WellingWed, 11 Ma🤖 cs.LG

Learning responsibility allocations for multi-agent interactions: A differentiable optimization approach with control barrier functions

Dit paper introduceert een datagedreven aanpak op basis van differentieerbare optimalisatie en controle-barrièrefuncties om verantwoordelijkheidsallocaties voor veilige multi-agent-interacties te leren, waardoor een interpreteerbaar inzicht wordt verkregen in hoe agenten hun gedrag aanpassen om de veiligheid van anderen te waarborgen.

Isaac Remy, David Fridovich-Keil, Karen LeungWed, 11 Ma🤖 cs.LG

Calabi-Yau metrics through Grassmannian learning and Donaldson's algorithm

Dit artikel presenteert een nieuwe machine learning-methode die gradiëntafdaaltechnieken op Grassmanniaanse variëteiten combineert met Donaldson's algoritme om efficiënte benaderingen van Calabi-Yau-metrieken te verkrijgen, waarbij de auteurs de prestaties testen op de Dwork-familie van driedimensionale variëteiten en de opkomst van niet-triviale lokale minima in de moduli-ruimte observeren.

Carl Henrik Ek, Oisin Kim, Challenger MishraWed, 11 Ma🤖 cs.LG

Adaptive and Stratified Subsampling for High-Dimensional Robust Estimation

Dit artikel introduceert en analyseert twee subsampling-schatters, Adaptive Importance Sampling en Stratified Sub-sampling, voor robuuste hoogdimensionale regressie onder zware-tail ruis, contaminatie en tijdsafhankelijkheid, waarbij het theorie-algoritme-gat wordt overbrugd en bewezen wordt dat deze methoden de minimax-optimale snelheid bereiken en empirisch superieur presteren ten opzichte van uniforme subsampling.

Prateek Mittal, Joohi ChauhanWed, 11 Ma🤖 cs.LG

Scalable Message Passing Neural Networks: No Need for Attention in Large Graph Representation Learning

Deze paper introduceert Scalable Message Passing Neural Networks (SMPNNs), een architectuur die standaard convolutie combineert met Pre-Layer Normalization in plaats van attention, waardoor diepe en schaalbare graafneuralen netwerken mogelijk worden die prestaties leveren die concurreren met de beste Graph Transformers zonder de hoge rekenkosten van attention-mechanismen.

Haitz Sáez de Ocáriz Borde, Artem Lukoianov, Anastasis Kratsios, Michael Bronstein, Xiaowen DongWed, 11 Ma🤖 cs.LG

SPDIM: Source-Free Unsupervised Conditional and Label Shift Adaptation in EEG

Dit paper introduceert SPDIM, een parameter-efficiënte geometrische deep learning-methode die bronvrije onbeheerde domeinadaptatie voor EEG-data mogelijk maakt door labelverschuivingen te compenseren via optimalisatie op een SPD-maand, waardoor de generalisatie van neurotechnologieën zoals slaapstadiëring aanzienlijk verbetert.

Shanglin Li, Motoaki Kawanabe, Reinmar J. KoblerWed, 11 Ma🤖 cs.LG

Prognostics for Autonomous Deep-Space Habitat Health Management under Multiple Unknown Failure Modes

Deze paper presenteert een onbewaakte prognostiekframework dat ongelabelde data gebruikt om verborgen faalmodi te identificeren en informatieve sensoren te selecteren, waardoor de nauwkeurigheid van de voorspelling van de resterende levensduur voor autonome diep-ruimte habitats wordt verbeterd.

Benjamin Peters, Ayush Mohanty, Xiaolei Fang, Stephen K. Robinson, Nagi GebraeelWed, 11 Ma🤖 cs.LG

Morphological-Symmetry-Equivariant Heterogeneous Graph Neural Network for Robotic Dynamics Learning

Dit artikel introduceert MS-HGNN, een heterogene graf-neurale netwerkarchitectuur die robotische kinematische structuren en morfologische symmetrieën integreert om dynamische leerprocessen voor multi-lichaamssystemen efficiënter en generaliseerbaarder te maken.

Fengze Xie, Sizhe Wei, Yue Song, Yisong Yue, Lu GanWed, 11 Ma🤖 cs.LG

CuriousBot: Interactive Mobile Exploration via Actionable 3D Relational Object Graph

Dit paper introduceert CuriousBot, een systeem dat gebruikmaakt van een 3D-relatieobjectgrafiek om mobiele robots in staat te stellen hun omgeving actief te verkennen door interactie, waarmee het de beperkingen van bestaande methoden die zich voornamelijk op waarneming richten, overtreft.

Yixuan Wang, Leonor Fermoselle, Tarik Kelestemur, Jiuguang Wang, Yunzhu LiWed, 11 Ma🤖 cs.LG

Molecular Fingerprints Are Strong Models for Peptide Function Prediction

Deze studie toont aan dat eenvoudige, domeinspecifieke moleculaire vingerafdrukken, in combinatie met LightGBM, peptidefuncties nauwkeuriger voorspellen dan complexe grafische neurale netwerken of transformers, waardoor langdurige interactiemodellering minder essentieel is dan eerder werd aangenomen.

Jakub Adamczyk, Piotr Ludynia, Wojciech CzechWed, 11 Ma🤖 cs.LG