cs.LG Arbeiten | Gist.Science

Censored LLMs as a Natural Testbed for Secret Knowledge Elicitation

Diese Studie nutzt zensierte chinesische Open-Weight-LLMs als Testumgebung, um Techniken zur Förderung von Ehrlichkeit und zur Erkennung von Lügen zu evaluieren, wobei sich zwar einige Methoden als wirksam erweisen, keine jedoch falsche Antworten vollständig eliminieren kann.

Helena Casademunt, Bartosz Cywiński, Khoi Tran + 3 more2026-03-06🤖 cs.AI

Cheap Thrills: Effective Amortized Optimization Using Inexpensive Labels

Die vorgestellte Arbeit schlägt einen dreistufigen Rahmen vor, der kostengünstige, ungenaue Labels mit überwachtem Vortraining und selbstüberwachtem Feintuning kombiniert, um Optimierungsmodelle effizient zu trainieren und dabei die Gesamtkosten um bis zu 59-fach zu senken sowie Genauigkeit und Konvergenz zu verbessern.

Khai Nguyen, Petros Ellinas, Anvita Bhagavathula + 1 more2026-03-06🔢 math

POET-X: Memory-efficient LLM Training by Scaling Orthogonal Transformation

Der Artikel stellt POET-X vor, eine speichereffiziente und skalierbare Variante des POET-Frameworks, die durch optimierte orthogonale Transformationen die Stabilität beim Training großer Sprachmodelle beibehält und deren Vorverarbeitung auf einer einzigen GPU ermöglicht, wo herkömmliche Optimierer wie AdamW an Speicherproblemen scheitern.

Zeju Qiu, Lixin Liu, Adrian Weller + 2 more2026-03-06🤖 cs.AI

RoboPocket: Improve Robot Policies Instantly with Your Phone

RoboPocket ist ein mobiles System, das mithilfe von Augmented Reality und asynchronem Online-Finetuning Robotik-Policies ohne physischen Roboter sofort verbessert, indem es Sammler in die Lage versetzt, gezielt kritische Zustände zu erfassen und so die Dateneffizienz im Vergleich zu Offline-Strategien zu verdoppeln.

Junjie Fang, Wendi Chen, Han Xue + 7 more2026-03-06🤖 cs.AI

Recurrent Action Transformer with Memory

Das Paper stellt den Recurrent Action Transformer with Memory (RATE) vor, eine neuartige Transformer-Architektur für Offline-Reinforcement-Learning, die durch einen rekurrenten Speichermechanismus die Leistung in teilweise beobachtbaren Umgebungen mit langen Abhängigkeiten erheblich verbessert und gleichzeitig auf Standard-Benchmarks wettbewerbsfähig bleibt.

Egor Cherepanov, Alexey Staroverov, Alexey K. Kovalev + 1 more2026-03-05🤖 cs.AI

Crystal-GFN: sampling crystals with desirable properties and constraints

Das Paper stellt Crystal-GFN vor, ein generatives Modell auf Basis von GFlowNets, das durch die sequenzielle Generierung von Kristallstrukturen unter Berücksichtigung physikalischer und geometrischer Randbedingungen effizient neue Materialien mit gewünschten Eigenschaften wie niedriger Bildungsenthalpie und spezifischer Bandlücke entdeckt.

Mila AI4Science, :, Alex Hernandez-Garcia + 11 more2026-03-05🤖 cs.LG

GeoTop: Advancing Image Classification with Geometric-Topological Analysis

Der Artikel stellt GeoTop vor, ein mathematisch fundiertes Framework, das Topologische Datenanalyse und Lipschitz-Killing-Krümmungen vereint, um die Unterscheidung zwischen gutartigen und bösartigen Strukturen in der diagnostischen Bildgebung durch die Kombination topologischer Invarianz mit geometrischer Sensitivität zu verbessern und dabei sowohl die Genauigkeit als auch die Interpretierbarkeit zu steigern.

Mariem Abaach, Ian Morilla2026-03-05🤖 cs.LG

Sample-Optimal Locally Private Hypothesis Selection and the Provable Benefits of Interactivity

Diese Arbeit stellt einen optimalen, interaktiven Algorithmus für die Hypothesenauswahl unter lokaler Differentialprivatsphäre vor, der die bisherige Probenkomplexität von $\Omega(k \log k)$ auf $\Theta(k)$ senkt und dabei zeigt, dass bereits wenige Interaktionsrunden ausreichen, um die Grenzen nicht-interaktiver Verfahren zu durchbrechen.

Alireza F. Pour, Hassan Ashtiani, Shahab Asoodeh2026-03-05🤖 cs.LG

Graph Neural Networks in EEG-based Emotion Recognition: A Survey

Diese Übersichtsarbeit bietet einen einheitlichen Rahmen und klare Leitlinien für den Einsatz von Graph Neural Networks in der EEG-basierten Emotionserkennung, indem sie bestehende Methoden kategorisiert, physiologische Besonderheiten hervorhebt und zukünftige Herausforderungen wie zeitliche vollständig verbundene Graphen diskutiert.

Chenyu Liu, Yuqiu Deng, Yihao Wu + 10 more2026-03-05🤖 cs.LG

List Sample Compression and Uniform Convergence

Diese Arbeit untersucht die Anwendbarkeit klassischer Lernprinzipien im Kontext des List-PAC-Lernens und zeigt, dass zwar die gleichmäßige Konvergenz weiterhin mit der Lernbarkeit äquivalent ist, die Vermutung der Stichprobenkompression jedoch widerlegt wird, da bestimmte lernbare Klassen nicht komprimiert werden können.

Steve Hanneke, Shay Moran, Tom Waknine2026-03-05🤖 cs.LG

Agnostic Tomography of Stabilizer Product States

Die Autoren stellen einen effizienten Algorithmus für die agnostische Tomografie von Stabilisator-Produktzuständen vor, der es ermöglicht, einen beliebigen Quantenzustand so gut zu approximieren wie der beste Zustand innerhalb dieser Klasse, und dies in polynomieller Zeit für konstante Fidelity-Schwellenwerte erreicht.

Sabee Grewal, Vishnu Iyer, William Kretschmer + 1 more2026-03-05⚛️ quant-ph

A Review of Reward Functions for Reinforcement Learning in the context of Autonomous Driving

Diese Arbeit analysiert bestehende Belohnungsfunktionen für das Reinforcement Learning im autonomen Fahren, identifiziert deren Mängel hinsichtlich Standardisierung und Kontextsensitivität und schlägt zukünftige Forschungsansätze vor, um diese Defizite durch strukturierte, konfliktlösende und validierbare Belohnungsmechanismen zu überwinden.

Ahmed Abouelazm, Jonas Michel, J. Marius Zoellner2026-03-05🤖 cs.AI

Tracking solutions of time-varying variational inequalities

Diese Arbeit erweitert bestehende Ergebnisse zur Verfolgung von Lösungen zeitvariabler Variationsungleichungen, indem sie Schranken für nicht-monotone Funktionen und periodische Probleme ohne sublineare Lösungspfade liefert, das Konvergenzverhalten diskreter dynamischer Systeme untersucht und sowohl chaotisches Verhalten als auch Konvergenz nachweist.

Hédi Hadiji, Sarah Sachs, Cristóbal Guzmán2026-03-05🤖 cs.LG

Black Box Meta-Learning Intrinsic Rewards

Diese Arbeit stellt eine Methode vor, die Meta-Learning nutzt, um intrinsische Belohnungen als schwarze Kisten zu optimieren und so Reinforcement-Learning-Agenten in Umgebungen mit spärlichen Belohnungen zu besseren Daten-Effizienz und Generalisierungsfähigkeit zu verhelfen.

Octavio Pappalardo, Rodrigo Ramele, Juan Miguel Santos2026-03-05🤖 cs.LG

AuToMATo: An Out-Of-The-Box Persistence-Based Clustering Algorithm

Die Autoren stellen AuToMATo vor, einen neuartigen, auf persistenter Homologie basierenden Clustering-Algorithmus, der durch eine Standardkonfiguration ohne manuelle Parametereinstellung auskommt, in Vergleichen mit anderen State-of-the-Art-Verfahren überzeugt und als Open-Source-Implementierung in Python verfügbar ist.

Marius Huber, Sara Kalisnik, Patrick Schnider2026-03-05🤖 cs.LG

A computational transition for detecting correlated stochastic block models by low-degree polynomials

Diese Arbeit bestimmt die Schwellenwerte für die Detektion korrelierter stochastischer Blockmodelle mittels Polynome niedrigen Grades und zeigt, dass eine Unterscheidung von unabhängigen Erdős-Rényi-Graphen genau dann möglich ist, wenn die Subsampling-Wahrscheinlichkeit $s$ den Minimum-Wert aus der Wurzel von Otters Konstante und dem Kehrwert des Kesten-Stigum-Schwellenwerts überschreitet.

Guanyi Chen, Jian Ding, Shuyang Gong + 1 more2026-03-05🤖 cs.LG

Diffusion & Adversarial Schrödinger Bridges via Iterative Proportional Markovian Fitting

Diese Arbeit stellt die Iterative Proportional Markovian Fitting (IPMF)-Methode vor, die durch die Integration von Iterative Markovian Fitting und Iterative Proportional Fitting die Schrödinger-Brücke effizient löst, konvergiert und einen flexiblen Kompromiss zwischen Bildähnlichkeit und Generierungsqualität ermöglicht.

Sergei Kholkin, Grigoriy Ksenofontov, David Li + 6 more2026-03-05🤖 cs.LG

Toward Reasoning on the Boundary: A Mixup-based Approach for Graph Anomaly Detection

Die Arbeit stellt ANOMIX vor, ein Mixup-basiertes Framework zur Graph-Anomalieerkennung, das durch die Synthese informativer „harter Negativbeispiele" die Grenzen des Entscheidungssraums verfeinert und so die Erkennung subtiler, schwer unterscheidbarer Anomalien verbessert.

Hwan Kim, Junghoon Kim, Sungsu Lim2026-03-05🤖 cs.AI

Curriculum-enhanced GroupDRO: Challenging the Norm of Avoiding Curriculum Learning in Subpopulation Shift Setups

Die Autoren stellen Curriculum-enhanced GroupDRO (CeGDRO) vor, eine Methode, die durch eine gezielte Kurrikulum-Lern-Strategie, die schwerste bias-bestätigende und einfachste bias-konfliktierende Beispiele priorisiert, die übliche Vermeidung von Kurrikulum-Lernen bei Subgruppenverschiebungen durchbricht und so die State-of-the-Art-Ergebnisse auf gängigen Datensätzen signifikant verbessert.

Antonio Barbalau2026-03-05🤖 cs.AI

FlowCLAS: Enhancing Normalizing Flow Via Contrastive Learning For Anomaly Segmentation

Die Arbeit stellt FlowCLAS vor, ein hybrides Framework, das Normalizing Flows durch einen kontrastiven Lernansatz mit Outlier Exposure verbessert, um die Leistung bei der Anomalie-Segmentierung in dynamischen Roboterszenen zu steigern und die Lücke zu diskriminativen Methoden zu schließen.

Chang Won Lee, Selina Leveugle, Svetlana Stolpner + 4 more2026-03-05🤖 cs.LG

← Zurück Weiter →