cs.LG Arbeiten | Gist.Science

Lightweight and Scalable Transfer Learning Framework for Load Disaggregation

Das Paper stellt RefQuery vor, einen skalierbaren Transfer-Learning-Rahmen für die nicht-intrusive Lastzerlegung, der durch das Einfrieren eines vortrainierten Netzwerks und das Lernen kompakter Geräte-Embeddings eine präzise und ressourcenschonende Echtzeit-Analyse auf Edge-Geräten ermöglicht.

L. E. Garcia-Marrero, G. Petrone, E. Monmasson2026-03-06🤖 cs.LG

Competitive Multi-Operator Reinforcement Learning for Joint Pricing and Fleet Rebalancing in AMoD Systems

Diese Arbeit stellt ein Multi-Operator-Reinforcement-Learning-Framework vor, das strategische Preisgestaltung und Flottenumschichtung in wettbewerbsorientierten autonomen Mobilitätsdiensten modelliert und zeigt, wie Wettbewerb durch endogene Nachfragesimulation zu niedrigeren Preisen und anderen Flottenstrategien führt als in Monopolszenarien.

Emil Kragh Toft, Carolin Schmidt, Daniele Gammelli + 1 more2026-03-06🤖 cs.LG

Non-Euclidean Gradient Descent Operates at the Edge of Stability

Die Arbeit interpretiert das Phänomen der „Edge of Stability" durch Richtungs-Glattheit und erweitert es auf nicht-euklidische Normen, wodurch ein einheitlicher, geometrieaware Schärfe-Maßstab entsteht, der zeigt, dass auch nicht-euklidische Gradientenabstiegsverfahren (wie $\ell_{\infty}$ -Descent oder Block-CD) eine progressive Schärfung bis zu einem Schwellenwert von $2/\eta$ aufweisen.

Rustem Islamov, Michael Crawshaw, Jeremy Cohen + 1 more2026-03-06🔢 math

Poisoning the Inner Prediction Logic of Graph Neural Networks for Clean-Label Backdoor Attacks

Die Arbeit stellt BA-Logic vor, eine Methode für saubere-label Backdoor-Angriffe auf Graph-Neuronale-Netzwerke, die durch die gezielte Vergiftung der inneren Vorhersagelogik des Modells eine hohe Angriffserfolgsrate ohne Label-Manipulation erreicht.

Yuxiang Zhang, Bin Ma, Enyan Dai2026-03-06🤖 cs.AI

Measuring the Fragility of Trust: Devising Credibility Index via Explanation Stability (CIES) for Business Decision Support Systems

Diese Arbeit stellt den Credibility Index via Explanation Stability (CIES) vor, eine mathematisch fundierte Metrik, die die Stabilität von Erklärungen in erklärbarer KI unter realistischen Geschäftsbedingungen misst und damit Entscheidungsträgern ein zuverlässiges Instrument zur Bewertung der Vertrauenswürdigkeit von KI-gestützten Entscheidungssystemen bietet.

Alin-Gabriel Vaduva, Simona-Vasilica Oprea, Adela Bara2026-03-06🤖 cs.AI

RepoLaunch: Automating Build&Test Pipeline of Code Repositories on ANY Language and ANY Platform

Das Paper stellt RepoLaunch vor, einen autonomen Agenten, der Build- und Test-Pipelines für Code-Repositories in beliebigen Programmiersprachen und auf jeder Plattform automatisiert und damit eine vollständig automatisierte Pipeline zur Erstellung von Datensätzen für Software-Engineering-Forschung ermöglicht.

Kenan Li, Rongzhi Li, Linghao Zhang + 17 more2026-03-06🤖 cs.LG

Good-Enough LLM Obfuscation (GELO)

Das Paper stellt GELO vor, ein leichtgewichtiges Protokoll, das die Privatsphäre von LLM-Prompts auf unsicheren Beschleunigern durch pro-Batch-invertierbare Mischungen der versteckten Zustände schützt, wodurch statistische Angriffe vereitelt werden, während die Ausgabeintegrität erhalten bleibt und nur ein moderater Latenzüberhead entsteht.

Anatoly Belikov, Ilya Fedotov2026-03-06🔒 cs.CR

MCEL: Margin-Based Cross-Entropy Loss for Error-Tolerant Quantized Neural Networks

Die Arbeit stellt die Margin-Based Cross-Entropy Loss (MCEL) vor, eine effiziente und skalierbare Verlustfunktion, die die Robustheit quantisierter neuronaler Netze gegenüber Bitfehlern durch gezielte Vergrößerung der Klassifikationsmargen verbessert und damit den rechenintensiven Ansatz des Trainings mit Bitflip-Injektion ersetzt.

Mikail Yayla, Akash Kumar2026-03-06🤖 cs.LG

Asymptotic Behavior of Multi--Task Learning: Implicit Regularization and Double Descent Effects

Diese Arbeit liefert eine präzise asymptotische Analyse des Multi-Task-Learnings, die zeigt, dass die Kombination verwandter Aufgaben einer zusätzlichen Regularisierung entspricht und das Double-Descent-Phänomen sowohl theoretisch erklärt als auch empirisch abschwächt.

Ayed M. Alrashdi, Oussama Dhifallah, Houssem Sifaou2026-03-06🔢 math

Deep Learning-Driven Friendly Jamming for Secure Multicarrier ISAC Under Channel Uncertainty

Diese Arbeit stellt einen tiefenlernbasierten Rahmen für sichere, mehrträgerbasierte ISAC-Systeme unter Kanalunsicherheit vor, der mithilfe von Radarecho-Feedback und einem neuartigen nichtparametrischen FIM-Schätzer auf f-Divergenz-Basis eine robuste, zielgerichtete Freundliche Störung ohne Kenntnis der Abhörposition ermöglicht und dabei durch einen quantisierten Tensor-Train-Encoder eine signifikante Modellkomprimierung erreicht.

Bui Minh Tuan, Van-Dinh Nguyen, Diep N. Nguyen + 5 more2026-03-06🤖 cs.LG

Reward-Conditioned Reinforcement Learning

Die Arbeit stellt RCRL vor, ein Framework, das einen einzelnen Agenten darauf trainiert, eine Familie von Belohnungsspezifikationen aus einem einzigen nominalen Ziel zu lernen, wodurch robuste und anpassungsfähige Richtlinien ohne Kompromisse bei der Einfachheit des Trainings ermöglicht werden.

Michal Nauman, Marek Cygan, Pieter Abbeel2026-03-06🤖 cs.LG

Synchronization-based clustering on the unit hypersphere

Die Autoren stellen einen neuartigen, auf dem $d$ -dimensionalen verallgemeinerten Kuramoto-Modell basierenden Algorithmus zur Clusteranalyse von Daten auf der Einheitskugel vor, der aufgrund der Berücksichtigung der sphärischen Geometrie in Tests vergleichbare oder bessere Ergebnisse als traditionelle Methoden liefert.

Zinaid Kapić, Aladin Crnkić, Goran Mauša2026-03-06🤖 cs.LG

Aura: Universal Multi-dimensional Exogenous Integration for Aviation Time Series

Das Papier stellt Aura vor, ein universelles Framework, das durch eine maßgeschneiderte dreiteilige Kodierungsmechanik heterogene externe Faktoren in die Zeitreihenvorhersage für die Luftfahrt integriert und damit auf einem großen Datensatz der China Southern Airlines state-of-the-art-Ergebnisse erzielt.

Jiafeng Lin, Mengren Zheng, Simeng Ye + 5 more2026-03-06🤖 cs.AI

Axiomatic On-Manifold Shapley via Optimal Generative Flows

Die Autoren stellen eine neue Theorie für Axiomatische On-Manifold-Shapley-Attribution vor, die auf optimalen generativen Flüssen und der Minimierung der kinetischen Energie basiert, um die Probleme von Off-Manifold-Artefakten zu lösen und eine geometrisch effiziente, stabile sowie semantisch kohärente Erklärungsmethode zu gewährleisten.

Cenwei Zhang, Lin Zhu, Manxi Lin + 1 more2026-03-06🤖 cs.AI

ARC-TGI: Human-Validated Task Generators with Reasoning Chain Templates for ARC-AGI

Die Arbeit stellt ARC-TGI vor, ein Open-Source-Framework für von Menschen validierte Python-Generatoren, die diverse und regelkonforme ARC-AGI-Aufgaben mit zugehörigen Begründungsketten erzeugen, um Overfitting zu vermeiden und skalierbare, kontrollierte Benchmarking-Möglichkeiten zu schaffen.

Jens Lehmann, Syeda Khushbakht, Nikoo Salehfard + 4 more2026-03-06🤖 cs.AI

BLINK: Behavioral Latent Modeling of NK Cell Cytotoxicity

Das Paper stellt BLINK vor, ein rekurrentes Zustandsraummodell, das latente Interaktionsdynamiken zwischen NK-Zellen und Tumorzellen aus Zeitreihendaten lernt, um zytotoxische Ergebnisse präziser zu erkennen, vorherzusagen und interpretierbare Verhaltensmuster aufzudecken.

Iman Nematollahi, Jose Francisco Villena-Ossa, Alina Moter + 6 more2026-03-06🤖 cs.LG

Decoupling Task and Behavior: A Two-Stage Reward Curriculum in Reinforcement Learning for Robotics

Die vorgestellte Arbeit schlägt ein zweistufiges Reward-Curriculum vor, das aufgabenbezogene Ziele von Verhaltensaspekten entkoppelt, um das Training von Robotern in der Deep Reinforcement Learning zu stabilisieren und effizienter zu gestalten, indem zunächst eine vereinfachte Belohnungsfunktion für die Exploration genutzt wird, bevor zusätzliche Verhaltenskriterien wie Energieeffizienz eingeführt werden.

Kilian Freitag, Knut Åkesson, Morteza Haghir Chehreghani2026-03-06🤖 cs.LG

FedBCD:Communication-Efficient Accelerated Block Coordinate Gradient Descent for Federated Learning

Die Arbeit stellt FedBCGD und dessen beschleunigte Variante FedBCGD+ vor, die durch eine blockweise Kommunikation von Modellparametern in Federated Learning die Kommunikationskosten für große Modelle wie Vision Transformer signifikant senken und dabei eine schnellere Konvergenz als bestehende Methoden erreichen.

Junkang Liu, Fanhua Shang, Yuanyuan Liu + 3 more2026-03-06🤖 cs.AI

SRasP: Self-Reorientation Adversarial Style Perturbation for Cross-Domain Few-Shot Learning

Die Arbeit stellt SRasP vor, eine neuartige Methode zur Selbst-Neuausrichtung adversarialer Stilstörungen, die durch globale semantische Führung und eine multi-objektive Optimierung die Gradientenstabilität verbessert und robustere Lösungen für das Few-Shot-Lernen über Domänengrenzen hinweg ermöglicht.

Wenqian Li, Pengfei Fang, Hui Xue2026-03-06🤖 cs.LG

Particle-Guided Diffusion for Gas-Phase Reaction Kinetics

Diese Studie demonstriert, dass ein durch Diffusionsmodelle geleiteter Sampling-Ansatz, der auf Lösungen der Advektions-Reaktions-Diffusions-Gleichung trainiert wurde, physikalisch konsistente Konzentrationsfelder für Gasphasenreaktionen erzeugt und auch bei nicht gesehene Parametern genaue Vorhersagen der Austrittskonzentrationen ermöglicht.

Andrew Millard, Henrik Pedersen2026-03-06🔬 physics

← Zurück Weiter →