cs.LG Arbeiten | Gist.Science

Multimodal Multi-Agent Ransomware Analysis Using AutoGen

Diese Arbeit stellt ein multimodales Multi-Agenten-Framework vor, das mithilfe von AutoEncoders und einem Transformer-Klassifikator statische, dynamische und Netzwerkdaten integriert, um durch einen iterativen Feedback-Mechanismus die Ransomware-Klassifizierungsgenauigkeit signifikant zu verbessern und eine zuverlässige Erkennung auch bei Null-Tag-Bedrohungen zu ermöglichen.

Asifullah Khan, Aimen Wadood, Mubashar Iqbal + 1 more2026-03-04🤖 cs.AI

Learning Contextual Runtime Monitors for Safe AI-Based Autonomy

Die Autoren stellen ein neues Framework vor, das kontextbewusste Laufzeitmonitore unter Verwendung von Techniken aus dem kontextuellen Multi-Armed Bandit lernt, um in KI-gesteuerten autonomen Systemen die Sicherheit und Leistung durch die dynamische Auswahl des für den aktuellen Kontext besten Controllers zu verbessern.

Alejandro Luque-Cerpa, Mengyuan Wang, Emil Carlsson + 3 more2026-03-04⚡ eess

On the Relationship Between Representation Geometry and Generalization in Deep Neural Networks

Die Studie zeigt, dass die effektive Dimension als unüberwachtes geometrisches Maß die Leistung von 52 vortrainierten Bilderkennungsmodellen stark vorhersagt und somit einen domänenunabhängigen, label-freien Indikator für die Generalisierungsfähigkeit neuronaler Netze darstellt.

Sumit Yadav2026-03-04🤖 cs.LG

SwiftRepertoire: Few-Shot Immune-Signature Synthesis via Dynamic Kernel Codes

SwiftRepertoire ist ein Few-Shot-Lernframework, das durch die dynamische Synthese kompakter Adapter-Module aus einem Prototypen-Wörterbuch und leichten Aufgabenbeschreibungen eine effiziente, interpretierbare und rechenarme Anpassung vortrainierter T-Zell-Rezeptor-Modelle an neue klinische Aufgaben mit nur wenigen gelabelten Beispielen ermöglicht.

Rong Fu, Muge Qi, Yang Li + 11 more2026-03-04🤖 cs.LG

Contextual Drag: How Errors in the Context Affect LLM Reasoning

Die Studie zeigt, dass das Phänomen „Contextual Drag" die Leistung von Sprachmodellen bei der Selbstverbesserung um 10–20 % verschlechtert, indem fehlgeschlagene Versuche im Kontext zu strukturell ähnlichen Folgefähern führen, die durch gängige Korrekturmechanismen nicht vollständig behoben werden können.

Yun Cheng, Xingyu Zhu, Haoyu Zhao + 1 more2026-03-04💬 cs.CL

Classification Under Local Differential Privacy with Model Reversal and Model Averaging

Diese Arbeit verbessert die Klassifizierung unter lokaler Differentialprivatsphäre, indem sie privates Lernen als Transferlernen neu interpretiert und durch ein verrauschtes Feedback-Evaluierungsverfahren, Modellumkehrung sowie gewichtete Modellmittelung die durch Rauschen verursachten Genauigkeitsverluste kompensiert.

Caihong Qin, Yang Bai2026-03-04📊 stat

Linear Model Extraction via Factual and Counterfactual Queries

Diese Arbeit untersucht, wie sich durch die Einbeziehung von kontrafaktischen und robusten kontrafaktischen Abfragen die Anzahl der benötigten Anfragen zur Extraktion linearer Modelle verändert, wobei sich zeigt, dass die Wahl der Distanzfunktion und der Robustheit einen entscheidenden Einfluss auf die Sicherheit des Modells hat.

Daan Otto, Jannis Kurtz, Dick den Hertog + 1 more2026-03-04🤖 cs.LG

Near-Constant Strong Violation and Last-Iterate Convergence for Online CMDPs via Decaying Safety Margins

Die Arbeit stellt den FlexDOME-Algorithmus vor, der als erste Methode für sichere Online-Reinforcement-Learning in Constrained Markov Decision Processes (CMDPs) nachweislich sublineare starke Reue, eine nahezu konstante starke Verletzung von Sicherheitsbedingungen und eine nicht-asymptotische Konvergenz der letzten Iteration durch den Einsatz von zeitlich variierenden Sicherheitsmargen und Regularisierung erreicht.

Qian Zuo, Zhiyong Wang, Fengxiang He2026-03-04🤖 cs.LG

MoToRec: Sparse-Regularized Multimodal Tokenization for Cold-Start Recommendation

Der Artikel stellt MoToRec vor, ein Framework zur kalten Start-Empfehlung, das multimodale Daten durch eine spärlich regularisierte diskrete Tokenisierung mittels RQ-VAE in interpretierbare semantische Codes umwandelt, um durch adaptive Seltenheitsverstärkung und hierarchische Graph-Enkodierung die Leistung bei neuen Artikeln signifikant zu verbessern.

Jialin Liu, Zhaorui Zhang, Ray C. C. Cheung2026-03-04🤖 cs.LG

Function-Space Decoupled Diffusion for Forward and Inverse Modeling in Carbon Capture and Storage

Die Studie stellt Fun-DDPS vor, einen generativen Rahmen, der Diffusionsmodelle im Funktionsraum mit differentierbaren neuronalen Operatoren kombiniert, um sowohl bei extrem spärlichen Daten präzise Vorhersagen für die Kohlenstoffspeicherung zu treffen als auch physikalisch konsistente inverse Lösungen mit höherer Effizienz als herkömmliche Methoden zu liefern.

Xin Ju, Jiachen Yao, Anima Anandkumar + 2 more2026-03-04🤖 cs.LG

A Penalty Approach for Differentiation Through Black-Box Quadratic Programming Solvers

Die Arbeit stellt dXPP vor, ein straffungs-basiertes Differenzierungsframework für quadratische Optimierungsprobleme, das durch die Entkopplung von Lösung und Ableitung beliebige Black-Box-Solver nutzt und im Vergleich zu KKT-basierten Methoden bei großen Problemen eine deutlich höhere Recheneffizienz und numerische Robustheit bietet.

Yuxuan Linghu, Zhiyuan Liu, Qi Deng2026-03-04🤖 cs.LG

The Implicit Bias of Adam and Muon on Smooth Homogeneous Neural Networks

Die Arbeit zeigt, dass momentumbasierte Optimierer wie Adam und Muon bei glatten homogenen neuronalen Netzen unter einem abklingenden Lernratenplan als approximative steilste Abstiegsverfahren wirken und somit eine implizite Verzerrung hin zur Maximierung spezifischer Margen (entsprechend ihren Normen) aufweisen.

Eitan Gronich, Gal Vardi2026-03-04📊 stat

Selecting Optimal Variable Order in Autoregressive Ising Models

Die Autoren schlagen vor, die Struktur eines inferierten Markov-Zufallsfeldes zu nutzen, um optimale Variablenreihenfolgen für autoregressive Ising-Modelle zu bestimmen, was bei bildähnlichen Daten zu reduzierter Modellkomplexität und höherwertigen generierten Proben führt.

Shiba Biswal, Marc Vuffray, Andrey Y. Lokhov2026-03-04📊 stat

A Researcher's Guide to Empirical Risk Minimization

Dieser Leitfaden bietet einen modularen Rahmen für die Herleitung hochwahrscheinlicher Regret-Schranken bei der empirischen Risikominimierung, der auf einer dreistufigen Methode basiert und sich sowohl auf klassische Funktionklassen als auch auf Probleme mit Störkomponenten in der kausalen Inferenz erstreckt, wobei auch der in-sample-Fall behandelt wird.

Lars van der Laan2026-03-04📊 stat

SigmaQuant: Hardware-Aware Heterogeneous Quantization Method for Edge DNN Inference

SigmaQuant ist ein adaptives Framework für die heterogene Quantisierung von Deep-Learning-Modellen, das die Genauigkeit und Ressourceneffizienz auf Edge-Geräten durch eine hardwarebewusste, schichtspezifische Bitbreiten-Zuweisung ohne exhaustive Suche optimiert.

Qunyou Liu, Pengbo Yu, Marina Zapater + 1 more2026-03-04🤖 cs.LG

PSQE: A Theoretical-Practical Approach to Pseudo Seed Quality Enhancement for Unsupervised Multimodal Entity Alignment

Die Arbeit stellt PSQE vor, einen theoretisch fundierten und praktischen Ansatz zur Verbesserung der Qualität und Verteilung von Pseudo-Samen für das unüberwachte multimodale Entitäten-Alignment, der durch Clustering-Resampling und theoretische Analysen die Leistung bestehender Modelle signifikant steigert.

Yunpeng Hong, Chenyang Bu, Jie Zhang + 3 more2026-03-04🤖 cs.LG

Tell Me What To Learn: Generalizing Neural Memory to be Controllable in Natural Language

Die vorgestellte Arbeit entwickelt ein generalisiertes neuronales Gedächtnissystem, das es ermöglicht, das Lernen und Vergessen von Informationen durch natürliche Sprachanweisungen flexibel zu steuern, um so kostspielige Nachtrainingsverfahren zu vermeiden und die Anpassungsfähigkeit an heterogene Datenquellen zu verbessern.

Max S. Bennett, Thomas P. Zollo, Richard Zemel2026-03-04🤖 cs.LG

FlexGuard: Continuous Risk Scoring for Strictness-Adaptive LLM Content Moderation

Die Arbeit stellt FlexGuard vor, ein LLM-basiertes Moderationssystem, das durch kontinuierliche Risikobewertung und eine neue Benchmark (FlexBench) die Anpassungsfähigkeit und Robustheit von Inhaltsfiltern an unterschiedliche und sich wandelnde Strengeanforderungen verbessert.

Zhihao Ding, Jinming Li, Ze Lu + 1 more2026-03-04🤖 cs.AI

A Boundary Integral-based Neural Operator for Mesh Deformation

Diese Arbeit stellt einen effizienten, auf Randintegralen und neuronalen Operatoren basierenden Ansatz (BINO) vor, der die Gitterverformung als lineares Elastizitätsproblem formuliert und durch die mathematische Entkopplung physikalischer Integration von geometrischen Darstellungen hohe Genauigkeit sowie Recheneffizienz für parametrische Gittergenerierung und Formoptimierung gewährleistet.

Zhengyu Wu, Jun Liu, Wei Wang2026-03-04🤖 cs.LG

Beyond State-Wise Mirror Descent: Offline Policy Optimization with Parameteric Policies

Diese Arbeit überwindet die Beschränkungen bestehender offline-Reinforcement-Learning-Algorithmen für große oder kontinuierliche Aktionsräume, indem sie theoretische Garantien für parametrisierte Policies durch eine Verbindung von Mirror Descent und Natural Policy Gradient liefert, was zudem eine überraschende Vereinheitlichung von offline RL und Imitationslernen ermöglicht.

Xiang Li, Yuheng Zhang, Nan Jiang2026-03-04🤖 cs.AI

← Zurück Weiter →