cs.LG Arbeiten | Gist.Science

Jailbreak Foundry: From Papers to Runnable Attacks for Reproducible Benchmarking

Das Paper stellt JAILBREAK FOUNDRY (JBF) vor, ein Multi-Agenten-System, das Sicherheitslücken-Forschungspapiere automatisch in ausführbare Module übersetzt, um durch eine standardisierte Infrastruktur reproduzierbare und vergleichbare Benchmarks für die Robustheit von Large Language Models zu ermöglichen.

Zhicheng Fang, Jingjie Zheng, Chenxu Fu, Wei Xu2026-03-06🔒 cs.CR

DiffusionHarmonizer: Bridging Neural Reconstruction and Photorealistic Simulation with Online Diffusion Enhancer

Die Arbeit stellt DiffusionHarmonizer vor, ein Online-Framework, das mithilfe eines einzelnen, zeitlich konditionierten Diffusions-Enhancers und einer speziellen Datenaufbereitung neuartige Ansichten aus neuralen Rekonstruktionen in fotorealistische und zeitlich konsistente Simulationen umwandelt, um Artefakte zu beheben und dynamische Objekte realistisch zu integrieren.

Yuxuan Zhang, Katarína Tóthová, Zian Wang + 7 more2026-03-06💻 cs

Fine-grained Soundscape Control for Augmented Hearing

Die Studie stellt Aurchestra vor, ein System für Hearables, das erstmals eine feingranulare, Echtzeit-Steuerung mehrerer überlappender Schallquellen direkt auf ressourcenbeschränkten Geräten ermöglicht, indem es eine dynamische Schnittstelle und ein optimiertes Multi-Output-Extraktionsnetzwerk kombiniert, um die Umgebung wie ein Audio-Mischpult individuell anzupassen.

Seunghyun Oh, Malek Itani, Aseem Gauri + 1 more2026-03-06💻 cs

Agents Learn Their Runtime: Interpreter Persistence as Training-Time Semantics

Die Studie zeigt, dass die Persistenz von Interpreter-Zuständen während des Trainings die Effizienz und Stabilität von Agenten-LLMs maßgeblich beeinflusst, indem sie bei Nichtübereinstimmung mit der Laufzeitumgebung zu hohen Token-Kosten oder häufigen Fehlern führt, ohne die Lösungsqualität selbst zu verändern.

Victor May, Aaditya Salgarkar, Yishan Wang + 2 more2026-03-06💻 cs

Learn Hard Problems During RL with Reference Guided Fine-tuning

Die Arbeit stellt ReGFT vor, eine Methode, die menschliche Referenzlösungen nutzt, um positive Lernpfade für schwierige mathematische Probleme zu synthetisieren und so die Reward-Sparsity bei Reinforcement Learning zu überwinden, was zu schnellerem Training und besseren Ergebnissen führt.

Yangzhen Wu, Shanda Li, Zixin Wen + 5 more2026-03-06💻 cs

VoxKnesset: A Large-Scale Longitudinal Hebrew Speech Dataset for Aging Speaker Modeling

Das Paper stellt VoxKnesset vor, einen großen, longitudinalen hebräischen Sprachdatensatz mit Parlamentsaufnahmen von 393 Sprechern über 15 Jahre, der genutzt wird, um die Auswirkungen des Alterns auf die Sprechererkennung und Altersvorhersage zu untersuchen und robuste Sprachsysteme zu entwickeln.

Yanir Marmor, Arad Zulti, David Krongauz + 4 more2026-03-06💻 cs

MatRIS: Toward Reliable and Efficient Pretrained Machine Learning Interatomic Potentials

Die Arbeit stellt MatRIS vor, ein effizientes und skalierbares invariantes Machine-Learning-Interatompotential, das durch einen neuartigen separablen Aufmerksamkeitsmechanismus die Genauigkeit führender äquivarianter Modelle bei deutlich geringeren Trainingskosten erreicht.

Yuanchang Zhou, Siyu Hu, Xiangyu Zhang + 3 more2026-03-06💻 cs

Conformal Graph Prediction with Z-Gromov Wasserstein Distances

Die Autoren schlagen einen konformen Vorhersagerahmen für graphenbasierte Ausgaben vor, der mithilfe des Z-Gromov-Wasserstein-Abstands und der Score Conformalized Quantile Regression (SCQR) eine verteilungsfreie Unsicherheitsquantifizierung für strukturierte Graphen wie Moleküle ermöglicht.

Gabriel Melo, Thibaut de Saivre, Anna Calissano + 1 more2026-03-06💻 cs

IoUCert: Robustness Verification for Anchor-based Object Detectors

Das Paper stellt IoUCert vor, ein neuartiges formales Verifikationsframework, das erstmals die Robustheitsprüfung realer, ankerbasierter Objektdetektoren wie SSD und YOLO durch die Entwicklung einer präzisen Koordinatentransformation und einer optimierten Intervallgrenzenausbreitung für IoU-Berechnungen ermöglicht.

Benedikt Brückner, Alejandro J. Mercado, Yanghao Zhang, Panagiotis Kouvaros, Alessio Lomuscio2026-03-06🔒 cs.CR

Incremental Graph Construction Enables Robust Spectral Clustering of Texts

Die vorgestellte Arbeit führt eine inkrementelle $k$ -NN-Graph-Konstruktion ein, die durch gezielte Verknüpfung neuer Knoten mit bereits eingefügten Nachbarn die Konnektivität garantiert und so die Robustheit des spektralen Clusterings von Text-Embeddings insbesondere bei geringer Nachbarschaftszahl ( $k$ ) verbessert.

Marko Pranjić, Boshko Koloski, Nada Lavrač + 2 more2026-03-06💻 cs

Inverse Reconstruction of Shock Time Series from Shock Response Spectrum Curves using Machine Learning

Die Studie stellt einen auf einem Conditional Variational Autoencoder basierenden maschinellen Lernansatz vor, der die rekonstruktive Umkehrung von Schockantwortspektren zu Beschleunigungszeitreihen effizient und ohne iterative Optimierung ermöglicht und dabei sowohl höhere spektrale Genauigkeit als auch eine um mehrere Größenordnungen schnellere Inferenz als herkömmliche Methoden bietet.

Adam Watts, Andrew Jeon, Destry Newton + 1 more2026-03-06💻 cs

AOI: Turning Failed Trajectories into Training Signals for Autonomous Cloud Diagnosis

Die Arbeit stellt AOI vor, ein trainierbares Multi-Agenten-Framework, das durch die Kombination von GRPO-basiertem Lernen auf lokalen Modellen, einer sicheren Trennung von Lese- und Schreibzugriffen sowie einem geschlossenen Regelkreis zur Umwandlung gescheiterter Trajektorien in Trainingsdaten die Automatisierung von SRE-Aufgaben in geschützten Unternehmensumgebungen signifikant verbessert.

Pei Yang, Wanyi Chen, Asuka Yuxi Zheng + 11 more2026-03-06💻 cs

RADAR: Learning to Route with Asymmetry-aware DistAnce Representations

Die Arbeit stellt RADAR vor, ein skalierbares neuronales Framework, das durch die Kombination von Singulärwertzerlegung zur Initialisierung statischer Embeddings und Sinkhorn-Normalisierung für dynamische Asymmetrie in Aufmerksamkeitsmechanismen bestehende Lösungsansätze für Fahrzeug-Routing-Probleme erweitert und so eine robuste Generalisierung auf asymmetrische Distanzen ermöglicht.

Hang Yi, Ziwei Huang, Yining Ma + 1 more2026-03-06💻 cs

stratum: A System Infrastructure for Massive Agent-Centric ML Workloads

Das Paper stellt Stratum vor, eine neue Systeminfrastruktur, die die Ausführung von ML-Pipelines von der Planung autonomer Agenten entkoppelt und durch die Kompilierung in optimierte Ausführungsgraphen sowie die Nutzung heterogener Backends, einschließlich einer Rust-Laufzeitumgebung, die Skalierbarkeit und Geschwindigkeit von agenter Pipelinesuche in der Python-ML-Ökosystem um bis zu 16,6-fach steigert.

Arnab Phani, Elias Strauss, Sebastian Schelter2026-03-06💻 cs

Why Are Linear RNNs More Parallelizable?

Diese Arbeit erklärt die überlegene Parallelisierbarkeit linearer RNNs im Vergleich zu nichtlinearen RNNs durch eine Verbindung zu Komplexitätsklassen, wonach lineare RNNs logarithmische Tiefenschaltungen darstellen, während nichtlineare Varianten P-vollständige Probleme lösen können, was eine fundamentale Barriere für ihre effiziente Parallelisierung darstellt.

William Merrill, Hongjian Jiang, Yanhong Li + 2 more2026-03-06💻 cs

DMD-augmented Unpaired Neural Schrödinger Bridge for Ultra-Low Field MRI Enhancement

Die Autoren stellen einen unpaarigen Übersetzungsrahmen auf Basis des Neuralen Schrödinger-Brücken-Modells vor, der durch Diffusions-gestützte Verteilungsausrichtung und anatomische Regularisierung die Bildqualität von Ultra-Niederfeld-MRT-Aufnahmen (64 mT) verbessert, ohne dabei die anatomische Struktur zu verfälschen.

Youngmin Kim, Jaeyun Shin, Jeongchan Kim + 5 more2026-03-06💻 cs

LoRA-MME: Multi-Model Ensemble of LoRA-Tuned Encoders for Code Comment Classification

Das Paper stellt LoRA-MME vor, einen Multi-Model-Ensemble-Ansatz, der vier mit LoRA feinabgestimmte Transformer-Encoder kombiniert, um die Klassifizierung von Code-Kommentaren in Java, Python und Pharo zu verbessern, wobei trotz hoher semantischer Genauigkeit (F1-Weighted 0,7906) der hohe Rechenaufwand zu einer niedrigeren Gesamtbewertung im Wettbewerb führte.

Md Akib Haider, Ahsan Bulbul, Nafis Fuad Shahid + 2 more2026-03-06💻 cs

Lost in Translation: How Language Re-Aligns Vision for Cross-Species Pathology

Diese Studie zeigt, dass die Einführung von „Semantic Anchoring" die durch artspezifische Ausrichtung verursachte semantische Kollaps in CPath-CLIP-Modellen überwindet und durch sprachgesteuerte Neuausrichtung der visuellen Merkmale die Leistung bei der kreuzspeziesigen und kreuztumorartigen Pathologieerkennung signifikant verbessert.

Ekansh Arora2026-03-06💻 cs

One Size Does Not Fit All: Token-Wise Adaptive Compression for KV Cache

Das Paper stellt DynaKV vor, ein nachträglich trainierbares Framework zur tokenweisen adaptiven Kompression des KV-Caches, das durch dynamische Zuweisung von Kompressionsraten je nach semantischer Bedeutung eine signifikante Speichereinsparung bei Erhalt der Generierungsqualität ermöglicht.

Liming Lu, Kaixi Qiu, Jiayu Zhou + 6 more2026-03-06💻 cs

Decorrelating the Future: Joint Frequency Domain Learning for Spatio-temporal Forecasting

Die vorgestellte Arbeit führt den FreST-Loss ein, eine frequenzbasierte Trainingsmethode, die mithilfe der gemeinsamen Fourier-Transformation räumliche und zeitliche Abhängigkeiten in Graphdaten gemeinsam im Spektralbereich modelliert und so bestehende Vorhersagemodelle signifikant verbessert.

Zepu Wang, Bowen Liao, Jeff + 1 more2026-03-06💻 cs

← Zurück Weiter →