cs.LG Arbeiten | Gist.Science

Topological DeepONets and a generalization of the Chen-Chen operator approximation theorem

Diese Arbeit erweitert das klassische Chen-Chen-Approximationstheorem für Deep Operator Networks auf beliebige lokal konvexe Räume, indem sie topologische DeepONets einführt, die nichtlineare Operatoren zwischen solchen Räumen und Funktionenräumen über kompakten euklidischen Domänen uniform approximieren können.

Vugar Ismailov2026-03-13🤖 cs.LG

On-Average Stability of Multipass Preconditioned SGD and Effective Dimension

Diese Arbeit entwickelt eine neue Stabilitätsanalyse für multipass Preconditioned SGD, die zeigt, wie die Wechselwirkung zwischen der Krümmung des Populationsrisikos und der Gradientenrauschen-Geometrie die Generalisierungsfähigkeit über die effektive Dimension bestimmt, und liefert dazu sowohl obere Schranken als auch passende untere Schranken.

Simon Vary, Tyler Farghly, Ilja Kuzborskij, Patrick Rebeschini2026-03-13📊 stat

BTZSC: A Benchmark for Zero-Shot Text Classification Across Cross-Encoders, Embedding Models, Rerankers and LLMs

Die Arbeit stellt BTZSC vor, ein umfassendes Benchmark für das Zero-Shot-Textklassifizieren, das zeigt, dass moderne Reranker wie Qwen3-Reranker-8B den aktuellen State-of-the-Art erreichen, während starke Embedding-Modelle und Instruktion-tuned LLMs ebenfalls wettbewerbsfähige Ergebnisse liefern und die Grenzen früherer NLI-basierter Ansätze überwinden.

Ilias Aarab2026-03-13💬 cs.CL

Few-for-Many Personalized Federated Learning

Die Arbeit stellt FedFew vor, einen personalisierten Federated-Learning-Ansatz, der das Problem der Skalierbarkeit bei heterogenen Client-Daten durch die Optimierung weniger gemeinsamer Servermodelle löst und dabei automatisch eine optimale Modellvielfalt ohne manuelle Partitionierung oder Hyperparameter-Tuning erreicht.

Ping Guo, Tiantian Zhang, Xi Lin, Xiang Li, Zhi-Ri Tang, Qingfu Zhang2026-03-13🤖 cs.AI

Decentralized Orchestration Architecture for Fluid Computing: A Secure Distributed AI Use Case

Diese Arbeit stellt eine dezentrale Orchestrierungsarchitektur für Fluid Computing vor, die durch die Nutzung domänenspezifischer Fähigkeiten und eines SDN-basierten Anomalieerkennungsmechanismus (FU-HST) eine sichere, mehrdomänige Verteilung von Federated Learning unter Byzantinischen Bedrohungen ermöglicht.

Diego Cajaraville-Aboy, Ana Fernández-Vilas, Rebeca P. Díaz-Redondo, Manuel Fernández-Veiga, Pablo Picallo-López2026-03-13🤖 cs.LG

Deep Learning-Based Metamodeling of Nonlinear Stochastic Dynamic Systems under Parametric and Predictive Uncertainty

Die Studie stellt drei Deep-Learning-basierte Metamodellierungsrahmen vor, die durch die Kombination von Merkmalsextraktionsmodulen (MLP, MPNN oder Autoencoder) mit LSTM-Netzen und Monte-Carlo-Dropout erfolgreich nichtlineare, stochastische dynamische Systeme unter simultaner Berücksichtigung von Parameter- und Vorhersageunsicherheiten modellieren und dabei sowohl für einfache als auch komplexe Bauwerksmodelle präzise Ergebnisse mit zuverlässigen Unsicherheitsquantifizierungen liefern.

Haimiti Atila, Seymour M. J. Spence2026-03-13🤖 cs.LG

Flowcean - Model Learning for Cyber-Physical Systems

Das Paper stellt Flowcean vor, ein modulares und benutzerfreundliches Framework, das die datengetriebene Automatisierung der Modellierung komplexer cyber-physischer Systeme durch die Integration verschiedener Lernstrategien und Werkzeuge ermöglicht.

Maximilian Schmidt, Swantje Plambeck, Markus Knitt, Hendrik Rose, Goerschwin Fey, Jan Christian Wieck, Stephan Balduin2026-03-13🤖 cs.LG

Efficient Generative Modeling with Unitary Matrix Product States Using Riemannian Optimization

Diese Arbeit stellt einen effizienten Riemannschen Optimierungsansatz für generative Modelle vor, der unitäre Matrix Product States nutzt, um die Ambiguität bei Parameterupdates zu reduzieren und eine stabile, leistungsfähige Modellierung hochdimensionaler Wahrscheinlichkeitsverteilungen zu ermöglichen.

Haotong Duan, Zhongming Chen, Ngai Wong2026-03-13🤖 cs.LG

AGMARL-DKS: An Adaptive Graph-Enhanced Multi-Agent Reinforcement Learning for Dynamic Kubernetes Scheduling

Die Studie stellt AGMARL-DKS vor, einen adaptiven, graphenbasierten Multi-Agenten-Verstärkungslern-Scheduler für Kubernetes, der durch dezentrale Ausführung, globale Kontextmodellierung mittels Graph Neural Networks und stressbewusste lexikografische Priorisierung die Skalierbarkeit, Fehlertoleranz und Ressourcennutzung im Vergleich zu herkömmlichen Ansätzen signifikant verbessert.

Hamed Hamzeh2026-03-13🤖 cs.LG

Frequentist Consistency of Prior-Data Fitted Networks for Causal Inference

Diese Arbeit zeigt, dass Prior-Data-Fitted-Networks (PFNs) für kausale Inferenz ohne Korrektur zu einer durch den Prior verursachten Verzerrung führen, und schlägt eine Kalibrierung mittels einer einstufigen Posterior-Korrektur (OSPC) auf Basis von Martingal-Posterior-Verteilungen vor, um die frequentistische Konsistenz und eine korrekte Unsicherheitsquantifizierung für den durchschnittlichen Behandlungseffekt (ATE) wiederherzustellen.

Valentyn Melnychuk, Vahid Balazadeh, Stefan Feuerriegel, Rahul G. Krishnan2026-03-13🤖 cs.LG

Slow-Fast Inference: Training-Free Inference Acceleration via Within-Sentence Support Stability

Die Arbeit stellt Slow-Fast Inference vor, ein trainingsfreies Decodierungsframework, das durch die Ausnutzung der Stabilität von Aufmerksamkeitsmustern innerhalb semantisch kohärenter Spannungen die Inferenzgeschwindigkeit um das 1,6- bis 14,4-fache steigert, ohne dabei die Qualität zu beeinträchtigen.

Xingyu Xie, Zhaochen Yu, Yue Liao, Tao Wang, Kim-Chuan Toh, Shuicheng Yan2026-03-13🤖 cs.LG

Continual Learning with Vision-Language Models via Semantic-Geometry Preservation

Die Arbeit stellt SeGP-CL vor, eine exemplarfreie Methode zum kontinuierlichen Lernen von Vision-Language-Modellen, die durch die Erhaltung der semantisch-geometrischen Struktur mittels adversarischer Anker und geometrischer Distillation katastrophales Vergessen verhindert und gleichzeitig die Stabilität sowie den Vorwärts-Transfer verbessert.

Chiyuan He, Zihuan Qiu, Fanman Meng, Runtong Zhang, Linfeng Xu, Qingbo Wu, Hongliang Li2026-03-13🤖 cs.LG

Chemical Reaction Networks Learn Better than Spiking Neural Networks

Die Arbeit beweist mathematisch und durch numerische Experimente, dass chemische Reaktionsnetzwerke ohne versteckte Schichten bestimmte Klassifizierungsaufgaben effizienter und genauer lösen können als Spiking-Neuronale-Netzwerke, die dafür versteckte Schichten benötigen.

Sophie Jaffard, Ivo F. Sbalzarini2026-03-13📊 stat

A Multi-Label Temporal Convolutional Framework for Transcription Factor Binding Characterization

Die Studie stellt ein auf Temporal Convolutional Networks basierendes Multi-Label-Deep-Learning-Framework vor, das die Vorhersage von Transkriptionsfaktor-Bindungsstellen verbessert, indem es kooperative Mechanismen und Korrelationen zwischen verschiedenen Transkriptionsfaktoren erfasst.

Pietro Demurtas, Ferdinando Zanchetta, Giovanni Perini, Rita Fioresi2026-03-13🧬 q-bio

Cross-Domain Policy Optimization via Bellman Consistency and Hybrid Critics

Die Arbeit stellt QAvatar vor, einen hybriden Kritiker, der durch die Einführung der Bellman-Konsistenz über Domänen hinweg die Daten-effizienz im Cross-Domain-Reinforcement-Learning verbessert, indem er Quell- und Ziel-Q-Funktionen adaptiv kombiniert, um negative Übertragungseffekte zu vermeiden und eine zuverlässige Wissensübertragung in verschiedenen Robotik-Aufgaben zu gewährleisten.

Ming-Hong Chen, Kuan-Chen Pan, You-De Huang, Xi Liu, Ping-Chun Hsieh2026-03-13🤖 cs.LG

Resource-Efficient Iterative LLM-Based NAS with Feedback Memory

Die Autoren stellen eine ressourceneffiziente, iterative Neural-Architecture-Search-Methode vor, die große Sprachmodelle mit einem speicherbasierten Feedback-Mechanismus kombiniert, um auf einer einzelnen Consumer-GPU ohne Feinabstimmung der Modelle kompakte und leistungsfähige Bildklassifizierungsarchitekturen zu entwerfen.

Xiaojie Gu, Dmitry Ignatov, Radu Timofte2026-03-13🤖 cs.LG

Wasserstein Gradient Flows for Batch Bayesian Optimal Experimental Design

Diese Arbeit stellt einen neuen Ansatz für das Batch-Bayes'sche Optimal-Experiment-Design vor, der das Optimierungsproblem durch eine probabilistische Hebung in den Raum der Wahrscheinlichkeitsmaße transformiert und unter Verwendung von Wasserstein-Gradientenflüssen skalierbare, partikelbasierte Algorithmen entwickelt, um hochdimensionale und nicht-konvexe Nutzenfunktionen effizient zu optimieren.

Louis Sharrock2026-03-13📊 stat

Taming the Adversary: Stable Minimax Deep Deterministic Policy Gradient via Fractional Objectives

Diese Arbeit stellt MMDDPG vor, ein Framework, das durch die Formulierung eines Minimax-Optimierungsproblems mit einem fraktionalen Ziel, das Leistung und Störungsstärke ausbalanciert, robuste Steuerungsstrategien für kontinuierliche Aufgaben unter Unsicherheit und externen Störungen entwickelt.

Taeho Lee, Donghwan Lee2026-03-13🤖 cs.LG

Cornserve: A Distributed Serving System for Any-to-Any Multimodal Models

Cornserve ist ein verteiltes Serving-System, das auf Kubernetes basiert und durch flexible Aufgabenabstraktion sowie eine effiziente Record-and-Replay-Ausführung die Skalierbarkeit und Leistung von beliebigen Any-to-Any-Multimodalmodellen mit bis zu 3,81-fach höherem Durchsatz und 5,79-fach niedrigerer Tail-Latenz verbessert.

Jae-Won Chung, Jeff J. Ma, Jisang Ahn, Yizhuo Liang, Akshay Jajoo, Myungjin Lee, Mosharaf Chowdhury2026-03-13🤖 cs.LG

Hoi3DGen: Generating High-Quality Human-Object-Interactions in 3D

Die Arbeit stellt Hoi3DGen vor, ein Framework, das mithilfe von multimodalen großen Sprachmodellen hochwertige, textgetreue 3D-Meshes für Mensch-Objekt-Interaktionen generiert und dabei bestehende Methoden in Bezug auf Textkonsistenz und Modellqualität deutlich übertrifft.

Agniv Sharma, Xianghui Xie, Tom Fischer, Eddy Ilg, Gerard Pons-Moll2026-03-13🤖 cs.LG

← Zurück Weiter →