cs.LG Arbeiten | Gist.Science

Improving Conditional VAE with Non-Volume Preserving transformations

Diese Arbeit verbessert bedingte Variationsautoencoder für die Bildgenerierung, indem sie die Varianz des Gauß-Decoders als lernbaren Parameter nutzt und die Annahme einer gleichverteilten latenten Verteilung durch nicht-volumenerhaltende Transformationen ersetzt, was zu einer signifikanten Reduktion des FID und einer Steigerung der Log-Likelihood führt.

Tuhin Subhra De2026-03-10🤖 cs.LG

Tight Robustness Certification Through the Convex Hull of $\ell_0$ Attacks

Die Autoren zeigen, dass die konvexe Hülle einer $\ell_0$ -Kugel durch einen asymmetrisch skalierten $\ell_1$ -ähnlichen Polytop approximiert werden kann, und entwickeln eine darauf basierende lineare Schrankenpropagierung, die die Effizienz bestehender $\ell_0$ -Robustheitsverifizierer um das 3,16-fache (geometrisches Mittel) steigert.

Yuval Shapira, Dana Drachsler-Cohen2026-03-10🤖 cs.LG

Angular Gradient Sign Method: Uncovering Vulnerabilities in Hyperbolic Networks

Die vorgestellte Arbeit entwickelt eine neuartige Angriffsmethode für hyperbolische Netzwerke, die durch die gezielte Manipulation der Winkelkomponente des Gradienten im Tangentialraum effizientere und geometrisch konsistente Adversarial Examples erzeugt als herkömmliche Verfahren.

Minsoo Jo, Dongyoon Yang, Taesup Kim2026-03-10🤖 cs.LG

Towards Realistic Guarantees: A Probabilistic Certificate for SmoothLLM

Diese Arbeit verbessert die Zuverlässigkeit der SmoothLLM-Abwehr gegen Jailbreaking-Angriffe, indem sie eine strengere Annahme durch ein realistischeres probabilistisches (k, $\varepsilon$ )-Instabilitäts-Framework ersetzt, das auf empirischen Angriffsmodellen basiert und praktikable Sicherheitsgarantien für den Einsatz von LLMs liefert.

Adarsh Kumarappan, Ayushi Mehrotra2026-03-10🤖 cs.LG

Automating Deception: Scalable Multi-Turn LLM Jailbreaks

Diese Studie stellt eine automatisierte Pipeline zur Generierung großskaliger, psychologisch fundierter Multi-Turn-Jailbreak-Datensätze vor und zeigt, dass LLMs der GPT-Familie durch kontextbasierte Manipulationen erheblich anfälliger sind als widerstandsfähigere Modelle wie Gemini 2.5 Flash und Claude 3 Haiku.

Adarsh Kumarappan, Ananya Mujoo2026-03-10🤖 cs.LG

Shortcut Invariance: Targeted Jacobian Regularization in Disentangled Latent Space

Die Arbeit stellt eine neue Methode vor, die durch gezielte anisotrope Rauschinjektion im entkoppelten latenten Raum die Abhängigkeit von Shortcut-Merkmalen reduziert und so die Generalisierungsfähigkeit auf Out-of-Distribution-Daten verbessert, ohne auf Shortcut-Labels oder widersprüchliche Trainingsbeispiele angewiesen zu sein.

Shivam Pal, Sakshi Varshney, Piyush Rai2026-03-10🤖 cs.LG

Crowdsourcing the Frontier: Advancing Hybrid Physics-ML Climate Simulation via a $50,000 Kaggle Competition

Diese Studie zeigt, dass durch die Crowdsourcing-Initiative eines Kaggle-Wettbewerbs entwickelte hybride Physik-ML-Parameterisierungen in einem interaktiven Klimamodell nicht nur eine bisher unerreichte Online-Stabilität erreichen, sondern auch State-of-the-Art-Ergebnisse für globale Klimaprojektionen liefern.

Jerry Lin, Zeyuan Hu, Tom Beucler, Katherine Frields, Hannah Christensen, Walter Hannah, Helge Heuer, Peter Ukkonnen, Laura A. Mansfield, Tian Zheng, Liran Peng, Ritwik Gupta, Pierre Gentine, Yusef Al-Naher, Mingjiang Duan, Kyo Hattori, Weiliang Ji, Chunhan Li, Kippei Matsuda, Naoki Murakami, Shlomo Ron, Marec Serlin, Hongjian Song, Yuma Tanabe, Daisuke Yamamoto, Jianyao Zhou, Mike Pritchard2026-03-10🤖 cs.LG

CRAwDAD: Causal Reasoning Augmentation with Dual-Agent Debate

Die Arbeit stellt CRAwDAD vor, ein Dual-Agenten-Debatte-Framework, das durch den Austausch zwischen einem kausalen Inferenz-Agenten und einem kritischen Prüfer die Genauigkeit von Sprachmodellen bei der Beantwortung von Kausalitätsfragen, insbesondere auf der Ebene der kontrafaktischen Analyse, signifikant verbessert.

Finn G. Vamosi, Nils D. Forkert2026-03-10🤖 cs.LG

ForamDeepSlice: A High-Accuracy Deep Learning Framework for Foraminifera Species Classification from 2D Micro-CT Slices

Die Studie stellt ForamDeepSlice vor, ein hochpräzises Deep-Learning-Framework, das auf einem Ensemble von CNN-Architekturen basiert und eine Genauigkeit von 95,64 % bei der automatisierten Klassifizierung von Foraminiferen-Arten aus 2D-Mikro-CT-Schnitten erreicht, wodurch ein neuer Benchmark für die KI-gestützte mikropaläontologische Identifizierung gesetzt wird.

Abdelghafour Halimi, Ali Alibrahim, Didier Barradas-Bautista, Ronell Sicat, Abdulkader M. Afifi2026-03-10🤖 cs.LG

AltNet: Addressing the Plasticity-Stability Dilemma in Reinforcement Learning

Die Arbeit stellt AltNet vor, eine Methode, die das Dilemma zwischen Plastizität und Stabilität im Reinforcement Learning durch den Einsatz von zwei sich abwechselnden Twin-Netzwerken löst, wodurch Plastizität ohne die für Sicherheitsanwendungen kritischen Leistungseinbußen bei Parameterrücksetzungen wiederhergestellt wird.

Mansi Maheshwari, John C. Raisbeck, Bruno Castro da Silva2026-03-10🤖 cs.LG

MSPT: Efficient Large-Scale Physical Modeling via Parallelized Multi-Scale Attention

Das Paper stellt MSPT vor, einen effizienten Transformer-basierten Solver, der durch die Kombination von lokaler Punkt- und globaler Patch-Aufmerksamkeit sowie die Nutzung von Ball-Bäumen für die Patch-Partitionierung physikalische Simulationen mit Millionen von Elementen auf einer einzigen GPU mit hohem Genauigkeitsniveau und geringem Ressourcenbedarf ermöglicht.

Pedro M. P. Curvo, Jan-Willem van de Meent, Maksim Zhdanov2026-03-10🤖 cs.LG

Dual Randomized Smoothing: Beyond Global Noise Variance

Die Arbeit schlägt einen „Dual Randomized Smoothing"-Ansatz vor, der durch inputabhängige Rauschvarianzen die bisherige Beschränkung globaler Varianzen überwindet und gleichzeitig hohe Genauigkeit bei kleinen und großen Robustheitsradien erreicht.

Chenhao Sun, Yuhao Mao, Martin Vechev2026-03-10🤖 cs.LG

Dual-Robust Cross-Domain Offline Reinforcement Learning Against Dynamics Shifts

Die Arbeit stellt DROCO vor, einen neuen Algorithmus für das cross-domain Offline-Reinforcement-Learning, der durch einen robusten Bellman-Operator und zusätzliche Regularisierungstechniken sowohl Trainings- als auch Testzeit-Robustheit gegenüber Dynamikverschiebungen gewährleistet und dabei die Leistung bestehender Methoden übertrifft.

Zhongjian Qiao, Rui Yang, Jiafei Lyu, Xiu Li, Zhongxiang Dai, Zhuoran Yang, Siyang Gao, Shuang Qiu2026-03-10🤖 cs.LG

Evolving Diffusion and Flow Matching Policies for Online Reinforcement Learning

Die Arbeit stellt GoRL vor, ein algorithmusagnostisches Framework, das durch die Entkopplung von Optimierung in einem handhabbaren latenten Raum und der Generierung von Aktionen mittels eines bedingten Decoders stabile und ausdrucksstarke Richtlinien für das Online-Reinforcement-Learning ermöglicht und dabei bestehende Baseline-Methoden in kontinuierlichen Steuerungsaufgaben deutlich übertrifft.

Chubin Zhang, Zhenglin Wan, Feng Chen, Fuchao Yang, Lang Feng, Yaxin Zhou, Xingrui Yu, Yang You, Ivor Tsang, Bo An2026-03-10🤖 cs.LG

Beyond Additivity: Sparse Isotonic Shapley Regression toward Nonlinear Explainability

Die Arbeit stellt SISR (Sparse Isotonic Shapley Regression) vor, ein einheitliches nichtlineares Erklärungsframework, das durch gleichzeitiges Lernen einer monotonen Transformation zur Wiederherstellung der Additivität und Erzwungung von L0-Sparsity die Verzerrungen herkömmlicher Shapley-Werte bei nicht-additiven Payoffs und hochdimensionalen Merkmalen überwindet.

Jialai She2026-03-10🤖 cs.LG

Two-Step Data Augmentation for Masked Face Detection and Recognition: Turning Fake Masks to Real

Diese Arbeit stellt ein zweistufiges generatives Daten-Augmentierungsverfahren vor, das regelbasierte Maskenverformung mit unpaariger Bild-zu-Bild-Übersetzung mittels GANs kombiniert, um trotz erheblicher Ressourcenbeschränkungen und ohne KI-Unterstützung effektive Trainingsdaten für die Erkennung und Identifizierung von maskierten Gesichtern zu erzeugen.

Yan Yang, George Bebis, Mircea Nicolescu2026-03-10🤖 cs.LG

SALVE: Sparse Autoencoder-Latent Vector Editing for Mechanistic Control of Neural Networks

Die Arbeit stellt SALVE vor, ein einheitliches Framework, das durch den Einsatz von Sparse Autoencodern und Grad-FAM zur Validierung eine mechanistische Interpretierbarkeit ermöglicht und präzise, dauerhafte Eingriffe im Gewichtsraum zur kontrollierten Modifikation von neuronalen Netzen erlaubt.

Vegard Flovik2026-03-10🤖 cs.LG

Meta-RL Induces Exploration in Language Agents

Die Studie stellt LaMer vor, ein Meta-RL-Framework, das Sprachagenten durch eine cross-episodische Trainingsstruktur und kontextbasierte Reflexion befähigt, aktiv zu explorieren und sich ohne Gradientenupdates an Umgebungen anzupassen, was zu signifikant besseren Leistungen und einer stärkeren Generalisierungsfähigkeit im Vergleich zu herkömmlichen RL-Ansätzen führt.

Yulun Jiang, Liangze Jiang, Damien Teney, Michael Moor, Maria Brbic2026-03-10🤖 cs.LG

ReDepth Anything: Test-Time Depth Refinement via Self-Supervised Re-lighting

Der Artikel stellt Re-Depth Anything vor, ein Testzeit-Framework, das durch selbstüberwachtes Nachbeleuchten und Generierung mit Diffusionsmodellen die Tiefenschätzung von Foundation Models wie Depth Anything V2 und DA3 verbessert, indem es den Domänenabstand schließt und gleichzeitig eine Optimierungskollaps verhindert.

Ananta R. Bhattarai, Helge Rhodin2026-03-10🤖 cs.LG

Concurrent training methods for Kolmogorov-Arnold networks: Disjoint datasets and FPGA implementation

Diese Arbeit stellt drei komplementäre Strategien vor, um das sequenzielle Limit des Newton-Kaczmarz-basierten Trainings von Kolmogorov-Arnold-Netzwerken (KANs) durch eine angepasste Vortrainingsmethode, das Zusammenführen von Modellen, die auf disjunkten Datensätzen trainiert wurden, und eine FPGA-spezifische Parallelisierung zu überwinden und so die Konvergenzgeschwindigkeit erheblich zu steigern.

Andrew Polar, Michael Poluektov2026-03-10🤖 cs.LG

← Zurück Weiter →

cs.LG