cs.LG Arbeiten | Gist.Science

Efficient Generative Modeling with Unitary Matrix Product States Using Riemannian Optimization

Diese Arbeit stellt einen effizienten Riemannschen Optimierungsansatz für generative Modelle vor, der unitäre Matrix Product States nutzt, um die Ambiguität bei Parameterupdates zu reduzieren und eine stabile, leistungsfähige Modellierung hochdimensionaler Wahrscheinlichkeitsverteilungen zu ermöglichen.

Haotong Duan, Zhongming Chen, Ngai Wong2026-03-13🤖 cs.LG

AGMARL-DKS: An Adaptive Graph-Enhanced Multi-Agent Reinforcement Learning for Dynamic Kubernetes Scheduling

Die Studie stellt AGMARL-DKS vor, einen adaptiven, graphenbasierten Multi-Agenten-Verstärkungslern-Scheduler für Kubernetes, der durch dezentrale Ausführung, globale Kontextmodellierung mittels Graph Neural Networks und stressbewusste lexikografische Priorisierung die Skalierbarkeit, Fehlertoleranz und Ressourcennutzung im Vergleich zu herkömmlichen Ansätzen signifikant verbessert.

Hamed Hamzeh2026-03-13🤖 cs.LG

Frequentist Consistency of Prior-Data Fitted Networks for Causal Inference

Diese Arbeit zeigt, dass Prior-Data-Fitted-Networks (PFNs) für kausale Inferenz ohne Korrektur zu einer durch den Prior verursachten Verzerrung führen, und schlägt eine Kalibrierung mittels einer einstufigen Posterior-Korrektur (OSPC) auf Basis von Martingal-Posterior-Verteilungen vor, um die frequentistische Konsistenz und eine korrekte Unsicherheitsquantifizierung für den durchschnittlichen Behandlungseffekt (ATE) wiederherzustellen.

Valentyn Melnychuk, Vahid Balazadeh, Stefan Feuerriegel, Rahul G. Krishnan2026-03-13🤖 cs.LG

Slow-Fast Inference: Training-Free Inference Acceleration via Within-Sentence Support Stability

Die Arbeit stellt Slow-Fast Inference vor, ein trainingsfreies Decodierungsframework, das durch die Ausnutzung der Stabilität von Aufmerksamkeitsmustern innerhalb semantisch kohärenter Spannungen die Inferenzgeschwindigkeit um das 1,6- bis 14,4-fache steigert, ohne dabei die Qualität zu beeinträchtigen.

Xingyu Xie, Zhaochen Yu, Yue Liao, Tao Wang, Kim-Chuan Toh, Shuicheng Yan2026-03-13🤖 cs.LG

Continual Learning with Vision-Language Models via Semantic-Geometry Preservation

Die Arbeit stellt SeGP-CL vor, eine exemplarfreie Methode zum kontinuierlichen Lernen von Vision-Language-Modellen, die durch die Erhaltung der semantisch-geometrischen Struktur mittels adversarischer Anker und geometrischer Distillation katastrophales Vergessen verhindert und gleichzeitig die Stabilität sowie den Vorwärts-Transfer verbessert.

Chiyuan He, Zihuan Qiu, Fanman Meng, Runtong Zhang, Linfeng Xu, Qingbo Wu, Hongliang Li2026-03-13🤖 cs.LG

Chemical Reaction Networks Learn Better than Spiking Neural Networks

Die Arbeit beweist mathematisch und durch numerische Experimente, dass chemische Reaktionsnetzwerke ohne versteckte Schichten bestimmte Klassifizierungsaufgaben effizienter und genauer lösen können als Spiking-Neuronale-Netzwerke, die dafür versteckte Schichten benötigen.

Sophie Jaffard, Ivo F. Sbalzarini2026-03-13📊 stat

A Multi-Label Temporal Convolutional Framework for Transcription Factor Binding Characterization

Die Studie stellt ein auf Temporal Convolutional Networks basierendes Multi-Label-Deep-Learning-Framework vor, das die Vorhersage von Transkriptionsfaktor-Bindungsstellen verbessert, indem es kooperative Mechanismen und Korrelationen zwischen verschiedenen Transkriptionsfaktoren erfasst.

Pietro Demurtas, Ferdinando Zanchetta, Giovanni Perini, Rita Fioresi2026-03-13🧬 q-bio

Cross-Domain Policy Optimization via Bellman Consistency and Hybrid Critics

Die Arbeit stellt QAvatar vor, einen hybriden Kritiker, der durch die Einführung der Bellman-Konsistenz über Domänen hinweg die Daten-effizienz im Cross-Domain-Reinforcement-Learning verbessert, indem er Quell- und Ziel-Q-Funktionen adaptiv kombiniert, um negative Übertragungseffekte zu vermeiden und eine zuverlässige Wissensübertragung in verschiedenen Robotik-Aufgaben zu gewährleisten.

Ming-Hong Chen, Kuan-Chen Pan, You-De Huang, Xi Liu, Ping-Chun Hsieh2026-03-13🤖 cs.LG

Resource-Efficient Iterative LLM-Based NAS with Feedback Memory

Die Autoren stellen eine ressourceneffiziente, iterative Neural-Architecture-Search-Methode vor, die große Sprachmodelle mit einem speicherbasierten Feedback-Mechanismus kombiniert, um auf einer einzelnen Consumer-GPU ohne Feinabstimmung der Modelle kompakte und leistungsfähige Bildklassifizierungsarchitekturen zu entwerfen.

Xiaojie Gu, Dmitry Ignatov, Radu Timofte2026-03-13🤖 cs.LG

Wasserstein Gradient Flows for Batch Bayesian Optimal Experimental Design

Diese Arbeit stellt einen neuen Ansatz für das Batch-Bayes'sche Optimal-Experiment-Design vor, der das Optimierungsproblem durch eine probabilistische Hebung in den Raum der Wahrscheinlichkeitsmaße transformiert und unter Verwendung von Wasserstein-Gradientenflüssen skalierbare, partikelbasierte Algorithmen entwickelt, um hochdimensionale und nicht-konvexe Nutzenfunktionen effizient zu optimieren.

Louis Sharrock2026-03-13📊 stat

Taming the Adversary: Stable Minimax Deep Deterministic Policy Gradient via Fractional Objectives

Diese Arbeit stellt MMDDPG vor, ein Framework, das durch die Formulierung eines Minimax-Optimierungsproblems mit einem fraktionalen Ziel, das Leistung und Störungsstärke ausbalanciert, robuste Steuerungsstrategien für kontinuierliche Aufgaben unter Unsicherheit und externen Störungen entwickelt.

Taeho Lee, Donghwan Lee2026-03-13🤖 cs.LG

Cornserve: A Distributed Serving System for Any-to-Any Multimodal Models

Cornserve ist ein verteiltes Serving-System, das auf Kubernetes basiert und durch flexible Aufgabenabstraktion sowie eine effiziente Record-and-Replay-Ausführung die Skalierbarkeit und Leistung von beliebigen Any-to-Any-Multimodalmodellen mit bis zu 3,81-fach höherem Durchsatz und 5,79-fach niedrigerer Tail-Latenz verbessert.

Jae-Won Chung, Jeff J. Ma, Jisang Ahn, Yizhuo Liang, Akshay Jajoo, Myungjin Lee, Mosharaf Chowdhury2026-03-13🤖 cs.LG

Hoi3DGen: Generating High-Quality Human-Object-Interactions in 3D

Die Arbeit stellt Hoi3DGen vor, ein Framework, das mithilfe von multimodalen großen Sprachmodellen hochwertige, textgetreue 3D-Meshes für Mensch-Objekt-Interaktionen generiert und dabei bestehende Methoden in Bezug auf Textkonsistenz und Modellqualität deutlich übertrifft.

Agniv Sharma, Xianghui Xie, Tom Fischer, Eddy Ilg, Gerard Pons-Moll2026-03-13🤖 cs.LG

Automatic Generation of High-Performance RL Environments

Diese Arbeit stellt eine wiederverwendbare Methode vor, die komplexe Reinforcement-Learning-Umgebungen mithilfe von KI-Agenten, hierarchischer Verifizierung und iterativer Reparatur automatisch in hochoptimierte Implementierungen übersetzt, wodurch die Entwicklungszeit drastisch verkürzt und die Trainingsgeschwindigkeit um Größenordnungen gesteigert wird.

Seth Karten, Rahul Dev Appapogu, Chi Jin2026-03-13🤖 cs.LG

FlashMotion: Few-Step Controllable Video Generation with Trajectory Guidance

Die Arbeit stellt FlashMotion vor, ein neuartiges Trainingsframework, das durch eine spezielle Hybrid-Strategie aus Diffusions- und adversariellen Zielen die Lücke zwischen Few-Step-Video-Generierung und präziser Trajektoriensteuerung schließt und dabei sowohl die Bildqualität als auch die Bewegungsgenauigkeit im Vergleich zu bestehenden Methoden verbessert.

Quanhao Li, Zhen Xing, Rui Wang, Haidong Cao, Qi Dai, Daoguo Dong, Zuxuan Wu2026-03-13🤖 cs.LG

IsoCompute Playbook: Optimally Scaling Sampling Compute for LLM RL

Die Studie „IsoCompute Playbook" leitet berechnungsoptimale Regeln für die Allokation von Sampling-Ressourcen beim Reinforcement Learning von Large Language Models ab und zeigt, wie sich die Anzahl paralleler Rollouts je Problem je nach Budget und Schwierigkeitsgrad gezielt skalieren lässt, um Stabilität und Effizienz zu maximieren.

Zhoujun Cheng, Yutao Xie, Yuxiao Qu, Amrith Setlur, Shibo Hao, Varad Pimpalkhute, Tongtong Liang, Feng Yao, Zhengzhong Liu, Eric Xing, Virginia Smith, Ruslan Salakhutdinov, Zhiting Hu, Taylor Killian, Aviral Kumar2026-03-13🤖 cs.LG

A Quantitative Characterization of Forgetting in Post-Training

Diese Arbeit liefert eine quantitative Charakterisierung des Vergessens beim Nachtrainieren generativer Modelle, indem sie zeigt, wie die Wahl der Divergenzrichtung (Forward- vs. Reverse-KL), die geometrische Überlappung der Aufgaben und das Sampling-Verfahren das Ausmaß von Massenverlust und Komponentenverschiebung bestimmen.

Krishnakumar Balasubramanian, Shiva Prasad Kasiviswanathan2026-03-13📊 stat

Proof-Carrying Materials: Falsifiable Safety Certificates for Machine-Learned Interatomic Potentials

Die Arbeit stellt „Proof-Carrying Materials" (PCM) vor, ein dreistufiges Verfahren aus adversarieller Fälschung, Bootstrap-Verfeinerung und formaler Verifizierung, das die Zuverlässigkeit maschinengelernter Interatomarer Potentiale sicherstellt und deren Nachweisfähigkeit für die Entdeckung stabiler Materialien im Vergleich zu herkömmlichen Filtern um 25 % steigert.

Abhinaba Basu, Pavan Chakraborty2026-03-13🔬 cond-mat.mtrl-sci

IndexCache: Accelerating Sparse Attention via Cross-Layer Index Reuse

Die Arbeit stellt IndexCache vor, eine Methode zur Beschleunigung von Sparse Attention in großen Sprachmodellen, die durch die Wiederverwendung von Index-Informationen zwischen Schichten die Rechenkosten des Indexers um 75 % senkt und dabei die Modellqualität nahezu unverändert lässt.

Yushi Bai, Qian Dong, Ting Jiang, Xin Lv, Zhengxiao Du, Aohan Zeng, Jie Tang, Juanzi Li2026-03-13💬 cs.CL

HiAP: A Multi-Granular Stochastic Auto-Pruning Framework for Vision Transformers

Die Arbeit stellt HiAP vor, ein neuartiges Framework zur stochastischen, mehrstufigen automatischen Pruning von Vision Transformern, das durch die gleichzeitige Optimierung von Makro- und Mikro-Granularitäten in einem einzigen End-to-End-Trainingsschritt effiziente Subnetzwerke ohne manuelle Heuristiken oder mehrstufige Pipelines erzeugt.

Andy Li, Aiden Durrant, Milan Markovic, Georgios Leontidis2026-03-13🤖 cs.LG

← Zurück Weiter →