cs.LG Arbeiten | Gist.Science

Regret-Optimal Q-Learning with Low Cost for Single-Agent and Federated Reinforcement Learning

Die Autoren stellen zwei neue modellfreie Algorithmen für Single-Agent- und Federated-Reinforcement-Learning vor, die erstmals gleichzeitig nahezu optimale Regret, lineare Burn-in-Kosten in Bezug auf Zustands- und Aktionsraum sowie logarithmische Kosten für Politikwechsel oder Kommunikation erreichen.

Haochen Zhang, Zhong Zheng, Lingzhou XueWed, 11 Ma🤖 cs.LG

Towards Robust Real-World Multivariate Time Series Forecasting: A Unified Framework for Dependency, Asynchrony, and Missingness

Die Arbeit stellt ChannelTokenFormer vor, ein Transformer-basiertes Framework, das durch die gleichzeitige Modellierung von Kanalabhängigkeiten, asynchroner Abtastung und fehlenden Werten eine robuste multivariate Zeitreihenvorhersage unter realen Bedingungen ermöglicht.

Jinkwan Jang, Hyungjin Park, Jinmyeong Choi, Taesup KimWed, 11 Ma🤖 cs.AI

Uncovering Social Network Activity Using Joint User and Topic Interaction

Die vorgestellte Arbeit führt das Modell „Mixture of Interacting Cascades" (MIC) ein, das mithilfe von markierten mehrdimensionalen Hawkes-Prozessen die komplexe Wechselwirkung zwischen Informationskaskaden und Nutzerverhalten in sozialen Netzwerken gemeinsam modelliert und dabei sowohl eine überlegene Leistung als auch aussagekräftige Visualisierungen ermöglicht.

Gaspard Abel, Argyris Kalogeratos, Jean-Pierre Nadal, Julien Randon-FurlingWed, 11 Ma🤖 cs.LG

ConLID: Supervised Contrastive Learning for Low-Resource Language Identification

Die Arbeit stellt ConLID vor, eine Methode des überwachten kontrastiven Lernens, die die domänenunabhängige Sprachidentifikation für ressourcenarme Sprachen verbessert und deren Leistung auf Out-of-Domain-Daten um 3,2 Prozentpunkte steigert, ohne die Ergebnisse für ressourcenstarke Sprachen zu beeinträchtigen.

Negar Foroutan, Jakhongir Saydaliev, Ye Eun Kim, Antoine BosselutWed, 11 Ma🤖 cs.AI

Global Convergence of Iteratively Reweighted Least Squares for Robust Subspace Recovery

Diese Arbeit liefert die ersten globalen Konvergenzgarantien für eine Variante des iterativ gewichteten kleinsten Quadrate-Verfahrens (IRLS) mit dynamischer Regularisierung, die unter deterministischen Bedingungen von jeder Initialisierung aus linear zum zugrunde liegenden Unterraum konvergiert und diese Ergebnisse zudem auf die affinen Unterraumschätzung sowie Anwendungen im Training neuronaler Netze erweitert.

Gilad Lerman, Kang Li, Tyler Maunu, Teng ZhangWed, 11 Ma🤖 cs.LG

Convergence Rate for the Last Iterate of Stochastic Gradient Descent Schemes

Die Arbeit leitet unter Verwendung diskreter Gronwall-Ungleichungen Konvergenzraten für die letzte Iteration von stochastischem Gradientenabstieg und stochastischem Heavy-Ball-Verfahren bei konvexen und nicht-konvexen Zielfunktionen mit $\gamma$ -Hölder-stetigem Gradienten her.

Marcel HudianiWed, 11 Ma🤖 cs.LG

Operator Learning for Consolidation: An Architectural Comparison for DeepONet Variants

Diese Studie vergleicht DeepONet-Architekturen für die Konsolidierung in der Geotechnik, identifiziert eine physikinspirierte Variante mit Fourier-Features als leistungsfähigste Lösung und demonstriert deren Potenzial zur drastischen Beschleunigung der Unsicherheitsquantifizierung in 3D-Szenarien.

Yongjin Choi, Chenying Liu, Jorge MacedoWed, 11 Ma🤖 cs.LG

Langevin Flows for Modeling Neural Latent Dynamics

Dieses Paper stellt LangevinFlow vor, ein physikinspiriertes sequenzielles Variational Auto-Encoder-Modell, das unterdämpfte Langevin-Dynamik und lokal gekoppelte Oszillatoren nutzt, um latente neuronale Dynamiken präziser zu modellieren als bestehende Methoden.

Yue Song, T. Anderson Keller, Yisong Yue, Pietro Perona, Max WellingWed, 11 Ma🤖 cs.LG

Latent Policy Steering with Embodiment-Agnostic Pretrained World Models

Die Arbeit stellt „Latent Policy Steering" (LPS) vor, eine Methode, die durch Vortraining eines Weltmodells mit embodiment-unabhängigem optischem Fluss und anschließendem Feinabstimmen auf wenigen Zielsystem-Demonstrationen die Leistung visuomotorischer Robotik-Policies in datenarmen Szenarien erheblich verbessert.

Yiqi Wang, Mrinal Verghese, Jeff SchneiderWed, 11 Ma🤖 cs.AI

Multimodal LLM-assisted Evolutionary Search for Programmatic Control Policies

Diese Arbeit stellt MLES vor, einen neuartigen Ansatz, der multimodale Large Language Models mit evolutionärer Suche kombiniert, um transparente, verifizierbare und leistungsfähige programmatische Steuerungsstrategien zu entdecken, die die Black-Box-Natur herkömmlicher Deep-Reinforcement-Learning-Policies überwinden.

Qinglong Hu, Xialiang Tong, Mingxuan Yuan, Fei Liu, Zhichao Lu, Qingfu ZhangWed, 11 Ma🤖 cs.LG

CTRL Your Shift: Clustered Transfer Residual Learning for Many Small Datasets

Die Arbeit stellt CTRL vor, eine Meta-Learning-Methode, die durch die Kombination von residualer Transferlernung und adaptiver Clusterbildung die Vorhersagegenauigkeit über viele kleine, heterogene Datenquellen hinweg verbessert und dabei gleichzeitig die spezifischen Unterschiede zwischen den Quellen bewahrt.

Gauri Jain, Dominik Rothenhäusler, Kirk Bansak, Elisabeth PaulsonWed, 11 Ma🤖 cs.LG

Singing Syllabi with Virtual Avatars: Enhancing Student Engagement Through AI-Generated Music and Digital Embodiment

Diese Studie stellt einen neuartigen Ansatz vor, bei dem mithilfe von KI-generiertem Gesang und virtuellen Avataren (insbesondere mit dem Tool HeyGem) Lehrpläne in unterhaltsame audiovisuelle Präsentationen umgewandelt werden, um das Engagement der Studierenden zu steigern und die Merkfähigkeit wichtiger Kursinformationen zu verbessern.

Xinxing WuWed, 11 Ma🤖 cs.AI

RF-Informed Graph Neural Networks for Accurate and Data-Efficient Circuit Performance Prediction

Diese Arbeit stellt einen dateneffizienten, topologiebewussten Graph-Neural-Network-Ansatz vor, der durch domänenspezifische Merkmalsindizierung und Transistor-Level-Graphenabstraktionen die Leistungsvorhersage aktiver RF-Schaltungen mit einer durchschnittlichen relativen Fehlerquote von 3,45 % und einer deutlich verbesserten Generalisierungsfähigkeit ermöglicht.

Anahita Asadi, Leonid Popryho, Inna Partin-VaisbandWed, 11 Ma🤖 cs.LG

Iterative In-Context Learning to Enhance LLMs Abstract Reasoning: The Case-Study of Algebraic Tasks

Die Studie stellt eine iterative In-Context-Learning-Methode vor, die durch schrittweise Auswahl angepasster Few-Shot-Beispiele und explizite Anweisungen die systematische Generalisierungsfähigkeit von LLMs bei algebraischen Aufgaben mit nicht-standardisierten Rechenregeln verbessert, wobei überraschenderweise einfachere Beispiele oft wirksamer sind als komplexe.

Stefano Fioravanti, Matteo Zavatteri, Roberto Confalonieri, Kamyar Zeinalipour, Paolo Frazzetto, Alessandro Sperduti, Nicolò NavarinWed, 11 Ma🤖 cs.LG

A Surrogate model for High Temperature Superconducting Magnets to Predict Current Distribution with Neural Network

Diese Arbeit stellt ein auf einem residualen neuronalen Netz basierendes Surrogatmodell vor, das die Stromverteilung in REBCO-Solenoiden effizient vorhersagt und damit die zeitaufwendige Optimierung von Hochtemperatursupraleiter-Magneten durch schnelle und präzise Designprozesse ermöglicht.

Mianjun Xiao, Peng Song, Yulong Liu, Cedric Korte, Ziyang Xu, Jiale Gao, Jiaqi Lu, Haoyang Nie, Qiantong Deng, Timing QuWed, 11 Ma🤖 cs.LG

Repulsive Monte Carlo on the sphere for the sliced Wasserstein distance

Diese Arbeit untersucht und vergleicht verschiedene Monte-Carlo-Quadraturmethoden mit repulsiven Knoten zur effizienten Berechnung des geschnittenen Wasserstein-Abstands auf der Kugel, wobei sie insbesondere die Varianzreduktion durch deterministische Punktprozesse analysiert und für niedrige Dimensionen randomisierte Quasi-Monte-Carlo-Verfahren sowie für hohe Dimensionen den UnifOrtho-Schätzer empfiehlt.

Vladimir Petrovic, Rémi Bardenet, Agnès DesolneuxWed, 11 Ma🤖 cs.LG

Robot Control Stack: A Lean Ecosystem for Robot Learning at Scale

Dieses Paper stellt den Robot Control Stack (RCS) vor, ein schlankes und modulares Ökosystem, das speziell entwickelt wurde, um die Forschung im Bereich des Robot Learning mit großen generalistischen Vision-Language-Action-Modellen zu unterstützen und dabei die Lücke zwischen Simulation und realer Welt zu schließen.

Tobias Jülg, Pierre Krack, Seongjin Bien, Yannik Blei, Khaled Gamal, Ken Nakahara, Johannes Hechtl, Roberto Calandra, Wolfram Burgard, Florian WalterWed, 11 Ma🤖 cs.LG

Kuramoto Orientation Diffusion Models

Diese Arbeit stellt ein score-basiertes generatives Modell vor, das stochastische Kuramoto-Dynamiken nutzt, um die Erzeugung von orientierungsreichen Bildern wie Fingerabdrücken und Texturen durch die Modellierung von Phasensynchronisation auf periodischen Domänen zu verbessern.

Yue Song, T. Anderson Keller, Sevan Brodjian, Takeru Miyato, Yisong Yue, Pietro Perona, Max WellingWed, 11 Ma🤖 cs.LG

ZeroSiam: An Efficient Asymmetry for Test-Time Entropy Optimization without Collapse

Die Arbeit stellt ZeroSiam vor, eine effiziente asymmetrische Siamese-Architektur, die durch Divergenz-Alignment mit einem Stop-Gradient-Operator das Kollabieren von Modellen während der Testzeit-Entropieoptimierung verhindert und gleichzeitig die Anpassungsfähigkeit und Leistung bei visuellen sowie sprachbasierten Aufgaben verbessert.

Guohao Chen, Shuaicheng Niu, Deyu Chen, Jiahao Yang, Zitian Zhang, Mingkui Tan, Pengcheng Wu, Zhiqi ShenWed, 11 Ma🤖 cs.LG

Compose Your Policies! Improving Diffusion-based or Flow-based Robot Policies via Test-time Distribution-level Composition

Die Arbeit stellt General Policy Composition (GPC) vor, eine trainingsfreie Methode, die durch die testzeitliche konvexe Kombination von Verteilungsscores mehrerer vortrainierter Diffusions- oder Flow-basierter Roboterpolicies deren Leistung über das Niveau der einzelnen Elternmodelle hinaus steigert.

Jiahang Cao, Yize Huang, Hanzhong Guo, Rui Zhang, Mu Nan, Weijian Mai, Jiaxu Wang, Hao Cheng, Jingkai Sun, Gang Han, Wen Zhao, Qiang Zhang, Yijie Guo, Qihao Zheng, Chunfeng Song, Xiao Li, Ping Luo, Andrew F. LuoWed, 11 Ma🤖 cs.LG

← Zurück Weiter →