cs.LG papers | Gist.Science

Regret-Optimal Q-Learning with Low Cost for Single-Agent and Federated Reinforcement Learning

Deze paper introduceert twee nieuwe modelvrije algoritmen, Q-EarlySettled-LowCost en FedQ-EarlySettled-LowCost, die voor het eerst tegelijkertijd bijna-optimale regret, lineaire opstartkosten en logaritmische schakel- of communicatiekosten bereiken in single-agent en federatief versterkend leren.

Haochen Zhang, Zhong Zheng, Lingzhou XueWed, 11 Ma🤖 cs.LG

Towards Robust Real-World Multivariate Time Series Forecasting: A Unified Framework for Dependency, Asynchrony, and Missingness

Dit artikel introduceert ChannelTokenFormer, een Transformer-gebaseerd raamwerk dat tegelijkertijd complexe kanaalafhankelijkheden, asynchrone bemonstering en ontbrekende waarden aanpakt om robuuste multivariate tijdreeksvoorspellingen in real-world scenario's mogelijk te maken.

Jinkwan Jang, Hyungjin Park, Jinmyeong Choi, Taesup KimWed, 11 Ma🤖 cs.AI

Uncovering Social Network Activity Using Joint User and Topic Interaction

Dit paper introduceert het MIC-model, een methode op basis van gemengde tijdsgebonden processen die gezamenlijke interacties tussen gebruikers en informatie-cascades in sociale netwerken modelleert en hiermee superieure prestaties en inzichten biedt ten opzichte van bestaande methoden.

Gaspard Abel, Argyris Kalogeratos, Jean-Pierre Nadal, Julien Randon-FurlingWed, 11 Ma🤖 cs.LG

ConLID: Supervised Contrastive Learning for Low-Resource Language Identification

Dit paper introduceert ConLID, een methode voor superviserend contrastief leren die de taalidentificatie voor taakarme talen op domein-onafhankelijke data significant verbetert zonder de prestaties voor talen met veel data te verstoren.

Negar Foroutan, Jakhongir Saydaliev, Ye Eun Kim, Antoine BosselutWed, 11 Ma🤖 cs.AI

Global Convergence of Iteratively Reweighted Least Squares for Robust Subspace Recovery

Dit artikel bewijst dat een variant van Iteratively Reweighted Least Squares (IRLS) met dynamische regularisatie onder deterministische voorwaarden lineair convergeert naar de onderliggende deelruimte, waarmee voor het eerst globale convergentie wordt gegarandeerd voor IRLS in robuuste subspace recovery en niet-convexe optimalisatie op Riemanniaanse variëteiten.

Gilad Lerman, Kang Li, Tyler Maunu, Teng ZhangWed, 11 Ma🤖 cs.LG

Convergence Rate for the Last Iterate of Stochastic Gradient Descent Schemes

Dit artikel analyseert de convergentiesnelheid van de laatste iteratie van stochastische gradiëntafdaal- en zware-bal-methoden voor convex en niet-convex doelfuncties met $\gamma$ -Hölder-gladde gradiënten, en bewijst nieuwe convergentie-resultaten voor zowel de minimale dan wel de laatste iteratie door gebruik te maken van de discrete Gronwall-ongelijkheid in plaats van de Robbins-Siegmund-stelling.

Marcel HudianiWed, 11 Ma🤖 cs.LG

Operator Learning for Consolidation: An Architectural Comparison for DeepONet Variants

Deze studie vergelijkt DeepONet-architecturen voor het consolideringsprobleem in de geotechniek en toont aan dat een Fourier-features-gebaseerde variant (Model 4) niet alleen superieure nauwkeurigheid biedt bij sterk variërende oplossingen, maar ook een snelheidswinst van ongeveer 1.000x in 3D-scenario's mogelijk maakt, wat de weg vrijmaakt voor efficiënte onzekerheidskwantificering.

Yongjin Choi, Chenying Liu, Jorge MacedoWed, 11 Ma🤖 cs.LG

Langevin Flows for Modeling Neural Latent Dynamics

Deze paper introduceert LangevinFlow, een fysica-geïnspireerd Variational Auto-Encoder-model dat de onderdrukte Langevin-vergelijking en lokaal gekoppelde oscillatoren gebruikt om complexe neurale latente dynamiek nauwkeuriger te modelleren dan bestaande methoden.

Yue Song, T. Anderson Keller, Yisong Yue, Pietro Perona, Max WellingWed, 11 Ma🤖 cs.LG

Latent Policy Steering with Embodiment-Agnostic Pretrained World Models

Dit paper introduceert Latent Policy Steering (LPS), een methode die een vooraf getraind wereldmodel en een waardefunctie gebruikt om robotvisuomotorische beleidsplanning te verbeteren door optische stroming als embodiment-agnostische actierepresentatie te benutten, wat leidt tot aanzienlijke prestatiewinsten in scenario's met beperkte trainingsdata.

Yiqi Wang, Mrinal Verghese, Jeff SchneiderWed, 11 Ma🤖 cs.AI

Multimodal LLM-assisted Evolutionary Search for Programmatic Control Policies

Dit paper introduceert MLES, een nieuwe aanpak die multimodale grote taalmodellen combineert met evolutionaire zoekopdrachten om transparante, verifieerbare en mensgerichte programmatieke controlepolities te genereren die prestatie-technisch vergelijkbaar zijn met diepe versterkingsleermethoden.

Qinglong Hu, Xialiang Tong, Mingxuan Yuan, Fei Liu, Zhichao Lu, Qingfu ZhangWed, 11 Ma🤖 cs.LG

CTRL Your Shift: Clustered Transfer Residual Learning for Many Small Datasets

Dit paper introduceert CTRL, een meta-leermethode die clusteren en residu-lering combineert om nauwkeurige en bron-specifieke voorspellingen te genereren voor scenario's met vele kleine datasets en distributieverschillen, zoals bij de plaatsing van asielzoekers in Zwitserland.

Gauri Jain, Dominik Rothenhäusler, Kirk Bansak, Elisabeth PaulsonWed, 11 Ma🤖 cs.LG

Singing Syllabi with Virtual Avatars: Enhancing Student Engagement Through AI-Generated Music and Digital Embodiment

Dit artikel presenteert een innovatieve aanpak waarbij AI gegenereerde zang en virtuele avatars worden gebruikt om studiegidsen in een aantrekkelijk audiovisueel formaat te presenteren, wat volgens de resultaten de betrokkenheid van studenten verhoogt en de retentie van belangrijke cursusinformatie verbetert.

Xinxing WuWed, 11 Ma🤖 cs.AI

RF-Informed Graph Neural Networks for Accurate and Data-Efficient Circuit Performance Prediction

Dit artikel introduceert een lichtgewicht, data-efficiënt framework op basis van grafische neurale netwerken dat door gebruik te maken van RF-domeinkennis en apparaat-semantiek nauwkeurige prestatievoorspellingen mogelijk maakt voor diverse actieve RF-circuits, met een gemiddelde relatieve fout van 3,45% en een aanzienlijke verbetering in generalisatievermogen ten opzichte van bestaande methoden.

Anahita Asadi, Leonid Popryho, Inna Partin-VaisbandWed, 11 Ma🤖 cs.LG

Iterative In-Context Learning to Enhance LLMs Abstract Reasoning: The Case-Study of Algebraic Tasks

Dit paper introduceert een iteratieve in-context learning-methode met geselecteerde voorbeelden die de generalisatievermogen van grote taalmodellen verbetert bij abstracte algebraïsche taken, waarbij blijkt dat eenvoudigere voorbeelden soms effectiever zijn dan complexere.

Stefano Fioravanti, Matteo Zavatteri, Roberto Confalonieri, Kamyar Zeinalipour, Paolo Frazzetto, Alessandro Sperduti, Nicolò NavarinWed, 11 Ma🤖 cs.LG

A Surrogate model for High Temperature Superconducting Magnets to Predict Current Distribution with Neural Network

Dit artikel introduceert een op een volledig verbonden residual-neuraalnetwerk gebaseerd surrogate-model dat, getraind op FEM-simulaties, de stroomdichtheidsverdeling in REBCO-solenoiden snel en nauwkeurig voorspelt, waardoor de intelligente ontwerpoptimatie van grote hoogtemperatuur-supraconductieve magneten mogelijk wordt gemaakt.

Mianjun Xiao, Peng Song, Yulong Liu, Cedric Korte, Ziyang Xu, Jiale Gao, Jiaqi Lu, Haoyang Nie, Qiantong Deng, Timing QuWed, 11 Ma🤖 cs.LG

Repulsive Monte Carlo on the sphere for the sliced Wasserstein distance

Dit artikel onderzoekt Monte Carlo-methode met repulsieve punten voor het berekenen van integraalwaarden op de eenheidsbol, met name voor de gesneden Wasserstein-afstand, en concludeert dat UnifOrtho de beste keuze is voor hoge dimensies terwijl randomized quasi-Monte Carlo in lage dimensies superieur is.

Vladimir Petrovic, Rémi Bardenet, Agnès DesolneuxWed, 11 Ma🤖 cs.LG

Robot Control Stack: A Lean Ecosystem for Robot Learning at Scale

Dit paper introduceert de Robot Control Stack (RCS), een lichtgewicht en modulair ecosysteem dat de kloof tussen simulatie en de echte wereld overbrugt om onderzoek naar robotleren met grote Vision-Language-Action-modellen te faciliteren.

Tobias Jülg, Pierre Krack, Seongjin Bien, Yannik Blei, Khaled Gamal, Ken Nakahara, Johannes Hechtl, Roberto Calandra, Wolfram Burgard, Florian WalterWed, 11 Ma🤖 cs.LG

Kuramoto Orientation Diffusion Models

Deze paper introduceert een score-based generatief model dat biologisch geïnspireerde Kuramoto-dynamica gebruikt om de coherentie van richtingspatronen in oriëntatie-rijke afbeeldingen, zoals vingerafdrukken en texturen, effectiever te modelleren dan traditionele isotrope diffusie-methoden.

Yue Song, T. Anderson Keller, Sevan Brodjian, Takeru Miyato, Yisong Yue, Pietro Perona, Max WellingWed, 11 Ma🤖 cs.LG

ZeroSiam: An Efficient Asymmetry for Test-Time Entropy Optimization without Collapse

Dit paper introduceert ZeroSiam, een efficiënte asymmetrische Siamese architectuur die testtijd-entropie-optimalisatie mogelijk maakt zonder modelinstorting, waardoor modellen zich in real-time kunnen aanpassen en verbeteren op zowel visuele taken als redeneerproblemen.

Guohao Chen, Shuaicheng Niu, Deyu Chen, Jiahao Yang, Zitian Zhang, Mingkui Tan, Pengcheng Wu, Zhiqi ShenWed, 11 Ma🤖 cs.LG

Compose Your Policies! Improving Diffusion-based or Flow-based Robot Policies via Test-time Distribution-level Composition

Deze paper introduceert General Policy Composition (GPC), een trainingsvrije methode die de prestaties van bestaande robotbeleidmodellen op basis van diffusie of stroming verbetert door hun distributiescores tijdens de testfase te combineren, zonder dat extra training vereist is.

Jiahang Cao, Yize Huang, Hanzhong Guo, Rui Zhang, Mu Nan, Weijian Mai, Jiaxu Wang, Hao Cheng, Jingkai Sun, Gang Han, Wen Zhao, Qiang Zhang, Yijie Guo, Qihao Zheng, Chunfeng Song, Xiao Li, Ping Luo, Andrew F. LuoWed, 11 Ma🤖 cs.LG

← Vorige Volgende →