cs.LG Arbeiten | Gist.Science

Open-World Reinforcement Learning over Long Short-Term Imagination

Das Paper stellt LS-Imagine vor, eine Methode, die durch die Einführung eines lang-kurzfristigen Weltmodells und die Simulation zielgerichteter Sprungübergänge die Erkundungseffizienz in hochdimensionalen offenen Welten verbessert und so langfristige Belohnungen effektiver nutzt.

Jiajian Li, Qi Wang, Yunbo Wang, Xin Jin, Yang Li, Wenjun Zeng, Xiaokang Yang2026-03-10🤖 cs.LG

How Learning Dynamics Drive Adversarially Robust Generalization?

Die Arbeit führt ein PAC-Bayes-Analyserahmenwerk ein, das Adversarial Training als diskretes dynamisches System modelliert, um durch die Verfolgung der Posterior-Entwicklung einen mechanistischen Erklärungsansatz für robustes Overfitting zu liefern und die Wirkung von Adversarial Weight Perturbation auf die Generalisierung zu beleuchten.

Yuelin Xu, Xiao Zhang2026-03-10🤖 cs.LG

Transformers as Implicit State Estimators: In-Context Learning in Dynamical Systems

Die Studie zeigt, dass Transformer-Modelle im In-Context-Learning-Modus ohne Gradienten-Updates oder explizites Systemwissen versteckte Zustände dynamischer Systeme implizit schätzen können, um Vorhersagen zu treffen, die in linearen und nichtlinearen Szenarien mit klassischen Methoden wie dem Kalman-Filter oder Partikelfiltern konkurrieren.

Usman Akram, Haris Vikalo2026-03-10🤖 cs.LG

Adaptive Transfer Clustering: A Unified Framework

Die Autoren stellen einen allgemeinen Transfer-Learning-Rahmen für das Clustering vor, der einen adaptiven Algorithmus (ATC) nutzt, um die Gemeinsamkeiten zwischen einem Haupt- und einem Hilfsdatensatz automatisch zu nutzen, selbst bei unbekannten Diskrepanzen, und dessen theoretische Optimalität sowie praktische Wirksamkeit in verschiedenen Szenarien nachgewiesen wird.

Yuqi Gu, Zhongyuan Lyu, Kaizheng Wang2026-03-10🤖 cs.LG

A Learned Proximal Alternating Minimization Algorithm and Its Induced Network for a Class of Two-block Nonconvex and Nonsmooth Optimization

Diese Arbeit stellt den allgemeinen lernbaren Proximalen Alternierenden Minimierungsalgorithmus (LPAM) und das daraus abgeleitete LPAM-Netzwerk vor, die durch eine Kombination aus Glättungstechniken, Residual Learning und Blockkoordinatenabstieg konvergente Lösungen für nichtkonvexe und nichtglatte Zwei-Block-Optimierungsprobleme bieten, wie sie beispielsweise bei der Rekonstruktion von MRT-Bildern aus stark unterabgetasteten Daten erfolgreich angewendet werden.

Yunmei Chen, Lezhi Liu, Lei Zhang2026-03-10🤖 cs.LG

Autoassociative Learning of Structural Representations for Modeling and Classification in Medical Imaging

Diese Studie stellt ein neurosymbolisches System vor, das durch die Rekonstruktion von Bildern mittels visueller Primitiven strukturelle Darstellungen lernt und sich in der histologischen Bildanalyse sowohl durch höhere Klassifizierungsgenauigkeit als auch durch größere Transparenz gegenüber herkömmlichen Deep-Learning-Architekturen auszeichnet.

Zuzanna Buchnajzer, Kacper Dobek, Stanisław Hapke, Daniel Jankowski, Krzysztof Krawiec2026-03-10🤖 cs.LG

Puppet-CNN: Continuous Parameter Dynamics for Input-Adaptive Convolutional Networks

Die Arbeit stellt Puppet-CNN vor, ein Framework, das die Parameter von Faltungsschichten als Zustände eines durch neuronale gewöhnliche Differentialgleichungen gesteuerten kontinuierlichen dynamischen Systems modelliert, wodurch eine eingabeadaptive Berechnung ermöglicht und die Anzahl der gespeicherten trainierbaren Parameter erheblich reduziert wird.

Yucheng Xing, Xin Wang2026-03-10🤖 cs.LG

Input-Adaptive Generative Dynamics in Diffusion Models

Diese Arbeit stellt einen Ansatz vor, bei dem Diffusionsmodelle ihre Generierungsprozesse an die Komplexität einzelner Eingaben anpassen, indem sie unter variierenden Zeitrahmen und Rauschplänen trainiert werden, was zu einer Reduktion der erforderlichen Abtastschritte bei gleichbleibender Bildqualität führt.

Yucheng Xing, Xiaodong Liu, Xin Wang2026-03-10🤖 cs.LG

Optimizing Locomotor Task Sets in Biological Joint Moment Estimation for Hip Exoskeleton Applications

Diese Studie stellt eine Optimierungsstrategie für Locomotor-Aufgabensets vor, die durch Clusteranalyse eine minimale, repräsentative Datengrundlage identifiziert, um die Genauigkeit der biomedizinischen Gelenkmomentenschätzung für Hüftexoskelette zu erhalten und gleichzeitig den Aufwand für die Datenerhebung erheblich zu reduzieren.

Jimin An, Changseob Song, Eni Halilaj + 1 more2026-03-10🤖 cs.LG

Finite Sample Bounds for Non-Parametric Regression: Optimal Sample Efficiency and Space Complexity

Die Autoren schlagen einen parametrischen Ansatz vor, der durch eine endliche Dimensionsdarstellung minimax-optimalen Konvergenzraten bei der nichtparametrischen Regression unter Supremumsnorm erreicht und gleichzeitig den Speicherbedarf sowie die Rechenkosten im Vergleich zu traditionellen Kernel-Methoden drastisch reduziert.

Davide Maran, Marcello Restelli2026-03-10🤖 cs.LG

GDM4MMIMO: Generative Diffusion Models for Massive MIMO Communications

Dieser Artikel untersucht das Potenzial generativer Diffusionsmodelle (GDM) für Massive-MIMO-Kommunikation, indem er einen Überblick über die Technologie bietet, eine Fallstudie zur Kanalschätzung im Nahfeld vorstellt und zukünftige Herausforderungen sowie Forschungsrichtungen aufzeigt.

Zhenzhou Jin, Li You, Huibin Zhou + 6 more2026-03-10⚡ eess

Exploring Embedding Priors in Prompt-Tuning for Improved Interpretability and Control

Diese Arbeit untersucht den Einfluss von Embedding-Priors auf das Prompt-Tuning, zeigt, dass Modelle auch mit neuartigen Embedding-Bereichen effektiv arbeiten können, und stellt die Bedeutung einer einzigen Aktivierungscluster für die Generalisierungsfähigkeit großer Sprachmodelle in Frage.

Sergey Sedov, Sumanth Bharadwaj Hachalli Karanam, Venu Gopal Kadamba2026-03-10🤖 cs.LG

From Pixels to Predicates: Learning Symbolic World Models via Pretrained Vision-Language Models

Diese Arbeit stellt eine Methode vor, die vortrainierte Vision-Language-Modelle nutzt, um abstrakte symbolische Weltmodelle aus wenigen Bild-Demonstrationen zu lernen, wodurch Roboter in der Lage sind, langfristige Entscheidungsprobleme in komplexen Umgebungen durch Planung auf neue Ziele und Szenarien zu verallgemeinern.

Ashay Athalye, Nishanth Kumar, Tom Silver, Yichao Liang, Jiuguang Wang, Tomás Lozano-Pérez, Leslie Pack Kaelbling2026-03-10🤖 cs.LG

UFGraphFR: Graph Federation Recommendation System based on User Text description features

Die Arbeit stellt UFGraphFR vor, ein privatsphäreschonendes Empfehlungssystem für das Federated Learning, das durch die Umwandlung lokaler Daten in semantische Textvektoren und die sichere Rekonstruktion globaler Benutzerbeziehungsgraphen auf dem Server die Empfehlungsgenauigkeit und Personalisierung signifikant verbessert.

Xudong Wang, Qingbo Hao, Yingyuan Xiao2026-03-10🤖 cs.LG

Efficient Semi-Supervised Adversarial Training via Latent Clustering-Based Data Reduction

Diese Arbeit stellt effiziente Datenreduktionsstrategien für das semi-supervisierte adversarielle Training vor, die durch latente Clustering-Techniken die benötigte Menge an ungelabelten Daten und die Rechenzeit drastisch senken, ohne dabei die Robustheit des Modells zu beeinträchtigen.

Somrita Ghosh, Yuelin Xu, Xiao Zhang2026-03-10🤖 cs.LG

The Exploration of Error Bounds in Classification with Noisy Labels

Diese Arbeit leitet Fehlergrenzen für den Excess Risk bei Klassifizierungsproblemen mit verrauschten Labels in Deep-Learning-Frameworks ab, indem sie statistische Fehler unter Berücksichtigung von Abhängigkeiten und Approximationsfehler im Vektorraum unter der Low-Dimensional-Manifold-Hypothese analysiert.

Haixia Liu, Boxiao Li, Can Yang, Yang Wang2026-03-10🤖 cs.LG

Strengthening Generative Robot Policies through Predictive World Modeling

Die Arbeit stellt GPC vor, ein Lernsteuerungsframework, das durch die Kombination einer generativen Diffusions-Policy, eines prädiktiven Weltmodells und eines Online-Planers die Leistung von Behavior Cloning in verschiedenen robotischen Manipulationsaufgaben sowohl in Simulation als auch in der realen Welt übertrifft.

Han Qi, Haocheng Yin, Aris Zhu, Yilun Du, Heng Yang2026-03-10🤖 cs.LG

General Coded Computing in a Probabilistic Straggler Regime

Diese Arbeit analysiert theoretisch und experimentell die Konvergenz des Approximationsfehlers bei allgemeinen kodierten Berechnungsverfahren (BACC und LeTCC) unter probabilistischen Straggler-Bedingungen und zeigt, dass die Fehler trotz einer mit der Serveranzahl skalierenden erwarteten Anzahl von Stragglern gegen Null konvergieren.

Parsa Moradi, Mohammad Ali Maddah-Ali2026-03-10🤖 cs.LG

GRADIEND: Feature Learning within Neural Networks Exemplified through Biases

Die Studie stellt GRADIEND vor, eine neuartige Encoder-Decoder-Methode, die Modellgradienten nutzt, um gesellschaftliche Vorurteile wie Geschlecht oder Herkunft zu identifizieren und gezielt zu entfernen, ohne dabei andere Fähigkeiten des Modells zu beeinträchtigen.

Jonathan Drechsel, Steffen Herbold2026-03-10🤖 cs.LG

Security and Quality in LLM-Generated Code: A Multi-Language, Multi-Model Analysis

Diese Studie analysiert die Sicherheit und Qualität von Code, der von großen Sprachmodellen (LLMs) in verschiedenen Programmiersprachen generiert wurde, und stellt fest, dass die Modelle oft veraltete Methoden verwenden und moderne Sicherheitsfeatures nicht nutzen, was eine Weiterentwicklung zur Integration aktueller Best Practices erforderlich macht.

Mohammed Kharma, Soohyeon Choi, Mohammed AlKhanafseh, David Mohaisen2026-03-10🤖 cs.LG

← Zurück Weiter →