cs.LG Arbeiten | Gist.Science

In-Run Data Shapley for Adam Optimizer

Diese Arbeit stellt „Adam-Aware In-Run Data Shapley" vor, eine Methode, die durch eine geschlossene Näherung und eine neuartige Linearisierung die genaue Datenattribution für den Adam-Optimierer ermöglicht und dabei die hohe Rechenleistung moderner Trainingspipelines beibehält.

Meng Ding, Zeqing Zhang, Di Wang, Lijie Hu2026-03-10🤖 cs.LG

Do Schwartz Higher-Order Values Help Sentence-Level Human Value Detection? A Study of Hierarchical Gating and Calibration

Die Studie zeigt, dass die Struktur der Schwartz-Höherwert-Kategorien als induktive Verzerrung nützlich ist, jedoch die Kalibrierung und Ensemble-Methoden im Vergleich zu starren hierarchischen Gating-Mechanismen oder eigenständigen kompakten LLMs die entscheidenden Verbesserungen bei der Erkennung menschlicher Werte auf Satzebene liefern.

Víctor Yeste, Paolo Rosso2026-03-10🤖 cs.LG

LatentMem: Customizing Latent Memory for Multi-Agent Systems

Die Arbeit stellt LatentMem vor, ein lernbares Multi-Agenten-Gedächtnisframework, das durch eine rollenspezifische Anpassung und die Optimierung kompakter latenter Repräsentationen mittels LMPO die Leistung bestehender Systeme signifikant steigert, ohne deren zugrundeliegende Architekturen zu verändern.

Muxin Fu, Xiangyuan Xue, Yafu Li, Zefeng He, Siyuan Huang, Xiaoye Qu, Yu Cheng, Yang Yang2026-03-10🤖 cs.LG

Thickening-to-Thinning: Reward Shaping via Human-Inspired Learning Dynamics for LLM Reasoning

Die Arbeit stellt T2T (Thickening-to-Thinning) vor, ein dynamisches Belohnungsframework für das Reinforcement Learning von Large Language Models, das menschliche Lernprozesse nachahmt, indem es bei fehlerhaften Versuchen längere Suchpfade fördert und bei korrekten Lösungen Redundanzen bestraft, um so die mathematische Reasoning-Leistung signifikant zu steigern.

Wenze Lin, Zhen Yang, Xitai Jiang, Pony Ma, Gao Huang2026-03-10🤖 cs.LG

Inference-Time Backdoors via Hidden Instructions in LLM Chat Templates

Die Studie zeigt, dass Angreifer durch Manipulation der Chat-Templates in Open-Weight-Modellen inferencezeitbasierte Backdoors implementieren können, die ohne Änderungen an den Modellgewichten oder Trainingsdaten zu einer drastischen Verschlechterung der Faktenkorrektheit und zur Ausgabe manipulierter URLs führen, während sie gleichzeitig bestehende Sicherheitsmechanismen umgehen.

Ariel Fogel, Omer Hofman, Eilon Cohen, Roman Vainshtein2026-03-10🤖 cs.LG

Hinge Regression Tree: A Newton Method for Oblique Regression Tree Splitting

Die Arbeit stellt den Hinge Regression Tree (HRT) vor, ein Verfahren, das oblique Entscheidungsbäume durch eine effiziente, auf dem Damped-Newton-Verfahren basierende Optimierung formuliert, um schnelle Konvergenz, mathematische Konvergenzbeweise und universelle Approximationsfähigkeit zu gewährleisten.

Hongyi Li, Han Lin, Jun Xu2026-03-10🤖 cs.LG

Radial Müntz-Szász Networks: Neural Architectures with Learnable Power Bases for Multidimensional Singularities

Der Artikel stellt Radiale Müntz-Szász-Netzwerke (RMN) vor, eine neuartige Architektur mit lernbaren Potenzbasen, die singuläre radiale Felder effizient modelliert und dabei deutlich geringere Fehler sowie einen wesentlich sparsameren Parameterbedarf als herömliche neuronale Netze erreicht.

Gnankan Landry Regis N'guessan, Bum Jun Kim2026-03-10🤖 cs.LG

SDFed: Bridging Local Global Discrepancy via Subspace Refinement and Divergence Control in Federated Prompt Learning

Das Paper stellt SDFed vor, ein heterogenes Framework für das federierte Prompt-Learning, das durch Subspace-Refinement und Divergenzkontrolle die Diskrepanz zwischen lokalen und globalen Repräsentationen überbrückt, indem es variable lokale Prompts bei gleichzeitiger Beibehaltung eines festen globalen Prompts ermöglicht.

Yicheng Di, Wei Yuan, Tieke He, Yuan Liu, Hongzhi Yin2026-03-10🤖 cs.LG

Retrieval Pivot Attacks in Hybrid RAG: Measuring and Mitigating Amplified Leakage from Vector Seeds to Graph Expansion

Die Studie zeigt, dass hybride RAG-Pipelines durch eine neue Sicherheitslücke namens „Retrieval Pivot Attacks" anfällig für Datenlecks sind, die durch die unkontrollierte Erweiterung von Vektor- zu Graphendaten entstehen, und demonstriert, dass eine Autorisierung an der Übergangsstelle dieses Risiko effektiv eliminiert.

Scott Thornton2026-03-10🤖 cs.LG

Diffusion-Guided Pretraining for Brain Graph Foundation Models

Die Arbeit stellt ein einheitliches, diffusionsbasiertes Pretraining-Framework für Gehirngraphen vor, das durch struktur- und topologiebewusste Augmentierungs- sowie Rekonstruktionsstrategien die Grenzen bestehender kontrastiver und Maskierungsverfahren überwindet und so robustere, übertragbare Repräsentationen für neuroimaging-Daten liefert.

Xinxu Wei, Rong Zhou, Lifang He, Yu Zhang2026-03-10🤖 cs.LG

Learning Page Order in Shuffled WOO Releases

Die Studie untersucht Methoden zur Wiederherstellung der Seitenreihenfolge in 5.461 verschütteten niederländischen WOO-Dokumenten und zeigt, dass spezialisierte Modelle bei langen Dokumenten deutlich besser abschneiden als Seq2Seq-Transformer, die aufgrund unterschiedlicher Ordnungsstrategien bei kurzen und langen Texten sowie fehlender Generalisierungsfähigkeit versagen.

Efe Kahraman, Giulio Tosato2026-03-10🤖 cs.LG

Discovering Semantic Latent Structures in Psychological Scales: A Response-Free Pathway to Efficient Simplification

Diese Studie stellt einen reaktionsfreien Framework vor, der mithilfe von Topic Modeling und semantischen Embeddings psychologische Skalen effizient vereinfacht, indem sie die inhärente semantische Struktur der Items nutzt, um die Skalenlänge im Durchschnitt um 60,5 % zu reduzieren, ohne dabei die psychometrische Güte oder die zugrundeliegenden Konstrukte zu beeinträchtigen.

Bo Wang, Yuxuan Zhang, Yueqin Hu, Hanchao Hou, Kaiping Peng, Shiguang Ni2026-03-10🤖 cs.LG

TrasMuon: Trust-Region Adaptive Scaling for Orthogonalized Momentum Optimizers

TrasMuon ist ein neuer Optimierer, der die geometrischen Vorteile orthogonaler Momentum-Methoden mit einer globalen RMS-Kalibrierung und einem energiebasierten Trust-Region-Clipping kombiniert, um die Stabilität zu erhöhen und eine schnellere Konvergenz ohne Warmup-Stufen zu ermöglichen.

Peng Cheng, Jiucheng Zang, Qingnan Li, Liheng Ma, Yufei Cui, Yingxue Zhang, Boxing Chen, Ming Jian, Wen Tong2026-03-10🤖 cs.LG

Benchmark Leakage Trap: Can We Trust LLM-based Recommendation?

Diese Studie zeigt, dass Datenlecks in Benchmark-Datensätzen die Leistungsbewertung von LLM-basierten Empfehlungssystemen verfälschen können, indem sie durch Domänen-relevante Kontamination künstlich überhöhte Ergebnisse erzeugen oder durch irrelevante Daten die Genauigkeit verschlechtern.

Mingqiao Zhang, Qiyao Peng, Yumeng Wang, Chunyuan Liu, Hongtao Liu2026-03-10🤖 cs.LG

Mean Flow Policy with Instantaneous Velocity Constraint for One-step Action Generation

Die Arbeit stellt die Mean Velocity Policy (MVP) vor, eine neue generative Politik, die durch die Modellierung eines mittleren Geschwindigkeitsfeldes unter einer instantanen Geschwindigkeitsbeschränkung (IVC) sowohl eine hochexpressive als auch extrem schnelle Ein-Schritt-Aktionsgenerierung in der robotischen Manipulation ermöglicht.

Guojian Zhan, Letian Tao, Pengcheng Wang, Yixiao Wang, Yiheng Li, Yuxin Chen, Hongyang Li, Masayoshi Tomizuka, Shengbo Eben Li2026-03-10🤖 cs.LG

Pawsterior: Variational Flow Matching for Structured Simulation-Based Inference

Das Papier stellt Pawsterior vor, ein variationsbasiertes Flow-Matching-Framework für die simulationsbasierte Inferenz, das durch die Einführung einer endpunktabhängigen affinen geometrischen Einschränkung sowohl strukturierte Domänen als auch diskrete latente Strukturen effektiv handhabt.

Jorge Carrasco-Pollo, Floor Eijkelboom, Jan-Willem van de Meent2026-03-10🤖 cs.LG

Why Code, Why Now: Learnability, Computability, and the Real Limits of Machine Learning

Das Papier argumentiert, dass der Erfolg von Code-Generierung im Vergleich zu Reinforcement Learning auf einer hierarchischen Lernbarkeit beruht, die durch die Informationsstruktur und die Verfügbarkeit von Feedback bestimmt wird, und zeigt auf, dass die Grenzen des maschinellen Lernens weniger von der Modellgröße als vielmehr von der grundlegenden Lernbarkeit der Aufgaben abhängen.

Zhimin Zhao2026-03-10🤖 cs.LG

LongAudio-RAG: Event-Grounded Question Answering over Multi-Hour Long Audio

Das Paper stellt LongAudio-RAG vor, ein hybrides Framework, das durch die Umwandlung von stundenlangen Audioaufnahmen in strukturierte, zeitgestempelte Ereignisdaten und deren gezielte Abfrage mittels SQL die präzise Beantwortung natürlicher Sprachfragen mit minimierten Halluzinationen ermöglicht.

Naveen Vakada, Kartik Hegde, Arvind Krishna Sridhar, Yinyi Guo, Erik Visser2026-03-10🤖 cs.LG

Accelerated Predictive Coding Networks via Direct Kolen-Pollack Feedback Alignment

Die vorgestellte Arbeit führt Direct Kolen-Pollack Predictive Coding (DKP-PC) ein, einen effizienteren und skalierbaren Algorithmus, der durch direkte Lernfeedbackverbindungen die zeitliche Komplexität der Fehlerausbreitung von O(L) auf O(1) reduziert und gleichzeitig die Lokaliät der Updates sowie die Leistungsfähigkeit gegenüber herkömmlichen Predictive-Coding-Methoden verbessert.

Davide Casnici, Martin Lefebvre, Justin Dauwels, Charlotte Frenkel2026-03-10🤖 cs.LG

On the Power of Source Screening for Learning Shared Feature Extractors

Diese Arbeit zeigt, dass durch die gezielte Auswahl einer informierenden Teilmenge von Datenquellen bereits eine statistisch optimale Schätzung des gemeinsamen Unterraums erreicht werden kann, selbst wenn ein erheblicher Teil der Daten verworfen wird.

Leo Muxing Wang, Connor Mclaughlin, Lili Su2026-03-10🤖 cs.LG

← Zurück Weiter →