cs.LG Arbeiten | Gist.Science

Black Box Meta-Learning Intrinsic Rewards

Diese Arbeit stellt eine Methode vor, die Meta-Learning nutzt, um intrinsische Belohnungen als schwarze Kisten zu optimieren und so Reinforcement-Learning-Agenten in Umgebungen mit spärlichen Belohnungen zu besseren Daten-Effizienz und Generalisierungsfähigkeit zu verhelfen.

Octavio Pappalardo, Rodrigo Ramele, Juan Miguel Santos2026-03-05🤖 cs.LG

AuToMATo: An Out-Of-The-Box Persistence-Based Clustering Algorithm

Die Autoren stellen AuToMATo vor, einen neuartigen, auf persistenter Homologie basierenden Clustering-Algorithmus, der durch eine Standardkonfiguration ohne manuelle Parametereinstellung auskommt, in Vergleichen mit anderen State-of-the-Art-Verfahren überzeugt und als Open-Source-Implementierung in Python verfügbar ist.

Marius Huber, Sara Kalisnik, Patrick Schnider2026-03-05🤖 cs.LG

A computational transition for detecting correlated stochastic block models by low-degree polynomials

Diese Arbeit bestimmt die Schwellenwerte für die Detektion korrelierter stochastischer Blockmodelle mittels Polynome niedrigen Grades und zeigt, dass eine Unterscheidung von unabhängigen Erdős-Rényi-Graphen genau dann möglich ist, wenn die Subsampling-Wahrscheinlichkeit $s$ den Minimum-Wert aus der Wurzel von Otters Konstante und dem Kehrwert des Kesten-Stigum-Schwellenwerts überschreitet.

Guanyi Chen, Jian Ding, Shuyang Gong + 1 more2026-03-05🤖 cs.LG

Diffusion & Adversarial Schrödinger Bridges via Iterative Proportional Markovian Fitting

Diese Arbeit stellt die Iterative Proportional Markovian Fitting (IPMF)-Methode vor, die durch die Integration von Iterative Markovian Fitting und Iterative Proportional Fitting die Schrödinger-Brücke effizient löst, konvergiert und einen flexiblen Kompromiss zwischen Bildähnlichkeit und Generierungsqualität ermöglicht.

Sergei Kholkin, Grigoriy Ksenofontov, David Li + 6 more2026-03-05🤖 cs.LG

Toward Reasoning on the Boundary: A Mixup-based Approach for Graph Anomaly Detection

Die Arbeit stellt ANOMIX vor, ein Mixup-basiertes Framework zur Graph-Anomalieerkennung, das durch die Synthese informativer „harter Negativbeispiele" die Grenzen des Entscheidungssraums verfeinert und so die Erkennung subtiler, schwer unterscheidbarer Anomalien verbessert.

Hwan Kim, Junghoon Kim, Sungsu Lim2026-03-05🤖 cs.AI

Curriculum-enhanced GroupDRO: Challenging the Norm of Avoiding Curriculum Learning in Subpopulation Shift Setups

Die Autoren stellen Curriculum-enhanced GroupDRO (CeGDRO) vor, eine Methode, die durch eine gezielte Kurrikulum-Lern-Strategie, die schwerste bias-bestätigende und einfachste bias-konfliktierende Beispiele priorisiert, die übliche Vermeidung von Kurrikulum-Lernen bei Subgruppenverschiebungen durchbricht und so die State-of-the-Art-Ergebnisse auf gängigen Datensätzen signifikant verbessert.

Antonio Barbalau2026-03-05🤖 cs.AI

FlowCLAS: Enhancing Normalizing Flow Via Contrastive Learning For Anomaly Segmentation

Die Arbeit stellt FlowCLAS vor, ein hybrides Framework, das Normalizing Flows durch einen kontrastiven Lernansatz mit Outlier Exposure verbessert, um die Leistung bei der Anomalie-Segmentierung in dynamischen Roboterszenen zu steigern und die Lücke zu diskriminativen Methoden zu schließen.

Chang Won Lee, Selina Leveugle, Svetlana Stolpner + 4 more2026-03-05🤖 cs.LG

FSMLP: Modelling Channel Dependencies With Simplex Theory Based Multi-Layer Perceptions In Frequency Domain

Diese Arbeit stellt FSMLP vor, ein neuartiges Framework für die Zeitreihenvorhersage, das durch die Einführung einer Simplex-MLP-Schicht mit Gewichtsbeschränkungen im Frequenzbereich die Überanpassung bei der Modellierung von Kanalabhängigkeiten reduziert und somit die Vorhersagegenauigkeit sowie die Skalierbarkeit verbessert.

Zhengnan Li, Haoxuan Li, Hao Wang + 3 more2026-03-05🤖 cs.LG

Unraveling the Complexity of Memory in RL Agents: an Approach for Classification and Evaluation

Diese Arbeit schlägt kognitionswissenschaftlich inspirierte Definitionen und eine standardisierte Evaluierungsmethodik vor, um die Vielfalt von Gedächtniskonzepten in Reinforcement-Learning-Agenten zu klären und deren Fähigkeiten objektiv zu vergleichen.

Egor Cherepanov, Nikita Kachaev, Artem Zholus + 2 more2026-03-05🤖 cs.AI

Low-Rank Contextual Reinforcement Learning from Heterogeneous Human Feedback

Die Arbeit stellt LoCo-RLHF vor, ein Framework, das durch die Nutzung einer niedrigrangigen Struktur und einer pessimistischen Strategie in einem reduzierten Subraum heterogenes menschliches Feedback effizient modelliert, um Large Language Models besser an individuelle Präferenzen anzupassen und Verteilungsverschiebungen zu bewältigen.

Seong Jin Lee, Will Wei Sun, Yufeng Liu2026-03-05🤖 cs.LG

Difficult Examples Hurt Unsupervised Contrastive Learning: A Theoretical Perspective

Diese Arbeit zeigt theoretisch und empirisch, dass das Entfernen schwieriger Beispiele die Generalisierung und Leistung des unüberwachten kontrastiven Lernens verbessert, da deren Anwesenheit sich negativ auf die Generalisierung auswirkt.

Yi-Ge Zhang, Jingyi Cui, Qiran Li + 1 more2026-03-05🤖 cs.AI

Preference Leakage: A Contamination Problem in LLM-as-a-judge

Diese Arbeit identifiziert und untersucht „Preference Leakage", ein Kontaminationsproblem bei der Verwendung von LLMs als Richter, das durch die Verwandtschaft zwischen Daten-Generatoren und Bewertungsmodellen entsteht und zu einer systematischen Verzerrung führt, die schwerer zu erkennen ist als bisher bekannte Bias-Phänomene.

Dawei Li, Renliang Sun, Yue Huang + 6 more2026-03-05🤖 cs.AI

Memory, Benchmark & Robots: A Benchmark for Solving Complex Tasks with Reinforcement Learning

Die Autoren stellen MIKASA vor, eine umfassende Benchmark-Suite mit einem neuen Klassifizierungsrahmen und spezifischen Roboteraufgaben, um die Gedächtnisleistungen von Reinforcement-Learning-Agenten in komplexen Szenarien systematisch zu bewerten.

Egor Cherepanov, Nikita Kachaev, Alexey K. Kovalev + 1 more2026-03-05🤖 cs.AI

A dataset of high-resolution plantar pressures for gait analysis across varying footwear and walking speeds

Die Autoren stellen das UNB StepUP-P150-Dataset vor, eine umfassende Datenbank mit hochauflösenden plantaren Druckdaten von 150 Probanden unter verschiedenen Gehgeschwindigkeiten und Schuhbedingungen, die als neuer Benchmark für die Analyse und biometrische Erkennung des Gangbildes dient.

Robyn Larracy, Angkoon Phinyomark, Ala Salehi + 5 more2026-03-05🤖 cs.LG

Implicit U-KAN2.0: Dynamic, Efficient and Interpretable Medical Image Segmentation

Die Arbeit stellt Implicit U-KAN 2.0 vor, ein neuartiges, theoretisch fundiertes und interpretierbares medizinisches Bildsegmentierungsnetzwerk, das durch die Integration von MultiKAN-Schichten und zweiten Ordnungs-Neuronalen Gewöhnlichen Differentialgleichungen (SONO) die Leistung und Effizienz bestehender U-Net-Architekturen übertrifft.

Chun-Wun Cheng, Yining Zhao, Yanqi Cheng + 3 more2026-03-05🤖 cs.LG

Leveraging Taxonomy Similarity for Next Activity Prediction in Patient Treatment

Dieser Artikel stellt den TS4NAP-Ansatz vor, der medizinische Taxonomien (ICD-10-CM und ICD-10-PCS) mit Graph-Matching kombiniert, um die Vorhersage des nächsten Behandlungsschritts bei Patienten zu verbessern und gleichzeitig die Entscheidungsfindung durch erklärbare Ergebnisse zu unterstützen.

Martin Kuhn, Joscha Grüger, Tobias Geyer + 1 more2026-03-05🤖 cs.AI

Beyond Accuracy: What Matters in Designing Well-Behaved Image Classification Models?

Diese Studie analysiert umfassend neun Qualitätsdimensionen von Bildklassifizierungsmodellen, identifiziert Schlüsselfaktoren wie Selbstüberwachtes Lernen und Datensatzgröße für deren Verbesserung und stellt mit dem QUBA-Score eine neue Metrik vor, die Modelle jenseits der reinen Genauigkeit bewertet.

Robin Hesse, Doğukan Bağcı, Bernt Schiele + 2 more2026-03-05🤖 cs.LG

Generating Fine Details of Entity Interactions

Diese Arbeit stellt \data, einen interaktionsfokussierten Datensatz, und \model, ein neues Verfahren zur Verfeinerung von Text-zu-Bild-Generierung durch Zerlegung und MLLM-gestützte Kritik, vor, um die Darstellung komplexer Objektinteraktionen zu verbessern.

Xinyi Gu, Jiayuan Mao2026-03-05🤖 cs.LG

PinRec: Outcome-Conditioned, Multi-Token Generative Retrieval for Industry-Scale Recommendation Systems

Das Paper stellt PinRec vor, ein skalierbares, generatives Retrieval-Modell für Pinterest, das durch outcome-konditionierte und multi-token Generierung die Balance zwischen Geschäftszielen, Vielfalt und Effizienz in industriellen Empfehlungssystemen ermöglicht.

Prabhat Agarwal, Anirudhan Badrinath, Laksh Bhasin + 4 more2026-03-05🤖 cs.LG

When Your Own Output Becomes Your Training Data: Noise-to-Meaning Loops and a Formal RSI Trigger

Die Arbeit stellt N2M-RSI vor, ein formales, implementierungsunabhängiges Modell, das zeigt, wie KI-Agenten durch die Rückkopplung ihrer eigenen Ausgaben als Trainingsdaten eine unbeschränkte Komplexität erreichen können, sobald sie einen bestimmten Informationsintegrations-Schwellenwert überschreiten.

Rintaro Ando2026-03-05🤖 cs.AI

← Zurück Weiter →