cs.LG Arbeiten | Gist.Science

TimeWarp: Evaluating Web Agents by Revisiting the Past

Die Arbeit stellt TimeWarp vor, einen Benchmark zur Evaluierung der Robustheit von Web-Agenten gegenüber sich wandelnden Web-Designs, und schlägt mit TimeTraj einen effizienten Algorithmus vor, der durch Plan-Distillation über mehrere UI-Versionen hinweg die Leistungsfähigkeit dieser Agenten signifikant steigert.

Md Farhan Ishmam, Kenneth Marino2026-03-06🤖 cs.AI

Uncertainty-aware Blood Glucose Prediction from Continuous Glucose Monitoring Data

Diese Studie zeigt, dass Transformer-Modelle mit evidenzbasierten Ausgabelagen auf dem HUPA-UCM-Datensatz die genauesten und am besten kalibrierten Unsicherheitsschätzungen für die Vorhersage des Blutzuckerspiegels bei Typ-1-Diabetes liefern und somit einen wertvollen Ansatz für klinisch sichere Echtzeitsysteme darstellen.

Hai Siong Tan2026-03-06✓ Author reviewed ⓘ🔬 physics

WaterSIC: information-theoretically (near) optimal linear layer quantization

Das Paper stellt WaterSIC vor, einen informationstheoretisch nahezu optimalen Algorithmus zur linearen Schicht-Quantisierung, der durch eine wasserfüllungsähnliche Zuweisung unterschiedlicher Quantisierungsraten zu den Eingangsfeatures die Leistung von GPTQ übertrifft und neue State-of-the-Art-Ergebnisse für LLMs wie Llama und Qwen bei 1 bis 4 Bit erzielt.

Egor Lifar, Semyon Savkin, Or Ordentlich + 1 more2026-03-06🔢 math

Replaying pre-training data improves fine-tuning

Die Studie zeigt, dass das Wiederholen von generischen Vorab-Trainingsdaten während des Feinabstimmungsprozesses die Leistung auf spezifischen Zielaufgaben verbessert und die Daten-Effizienz sowie die Genauigkeit in praktischen Anwendungen signifikant steigert.

Suhas Kotha, Percy Liang2026-03-06🤖 cs.LG

Mixture of Universal Experts: Scaling Virtual Width via Depth-Width Transformation

Die Arbeit stellt Mixture of Universal Experts (MOUE) vor, eine Verallgemeinerung von Mixture-of-Experts-Modellen, die durch die Einführung einer „virtuellen Breite" mittels wiederverwendeter, schichtübergreifender Expertenpools die Skalierbarkeit verbessert und dabei spezifische Herausforderungen wie Routing-Komplexität und Lastverteilung durch innovative Topologien und Router-Mechanismen adressiert.

Yilong Chen, Naibin Gu, Junyuan Shang + 8 more2026-03-06🤖 cs.AI

Functionality-Oriented LLM Merging on the Fisher--Rao Manifold

Diese Arbeit schlägt eine funktionale Methode zum Zusammenführen von LLMs vor, die den Fisher-Rao-Manifold nutzt, um die Limitierungen euklidischer Parameter-Space-Ansätze zu überwinden und stabile, hochwertige Modelle auch bei der Kombination heterogener Experten zu gewährleisten.

Jiayu Wang, Zuojun Ye, Wenpeng Yin2026-03-06🤖 cs.LG

Lightweight and Scalable Transfer Learning Framework for Load Disaggregation

Das Paper stellt RefQuery vor, einen skalierbaren Transfer-Learning-Rahmen für die nicht-intrusive Lastzerlegung, der durch das Einfrieren eines vortrainierten Netzwerks und das Lernen kompakter Geräte-Embeddings eine präzise und ressourcenschonende Echtzeit-Analyse auf Edge-Geräten ermöglicht.

L. E. Garcia-Marrero, G. Petrone, E. Monmasson2026-03-06🤖 cs.LG

Competitive Multi-Operator Reinforcement Learning for Joint Pricing and Fleet Rebalancing in AMoD Systems

Diese Arbeit stellt ein Multi-Operator-Reinforcement-Learning-Framework vor, das strategische Preisgestaltung und Flottenumschichtung in wettbewerbsorientierten autonomen Mobilitätsdiensten modelliert und zeigt, wie Wettbewerb durch endogene Nachfragesimulation zu niedrigeren Preisen und anderen Flottenstrategien führt als in Monopolszenarien.

Emil Kragh Toft, Carolin Schmidt, Daniele Gammelli + 1 more2026-03-06🤖 cs.LG

Non-Euclidean Gradient Descent Operates at the Edge of Stability

Die Arbeit interpretiert das Phänomen der „Edge of Stability" durch Richtungs-Glattheit und erweitert es auf nicht-euklidische Normen, wodurch ein einheitlicher, geometrieaware Schärfe-Maßstab entsteht, der zeigt, dass auch nicht-euklidische Gradientenabstiegsverfahren (wie $\ell_{\infty}$ -Descent oder Block-CD) eine progressive Schärfung bis zu einem Schwellenwert von $2/\eta$ aufweisen.

Rustem Islamov, Michael Crawshaw, Jeremy Cohen + 1 more2026-03-06🔢 math

Poisoning the Inner Prediction Logic of Graph Neural Networks for Clean-Label Backdoor Attacks

Die Arbeit stellt BA-Logic vor, eine Methode für saubere-label Backdoor-Angriffe auf Graph-Neuronale-Netzwerke, die durch die gezielte Vergiftung der inneren Vorhersagelogik des Modells eine hohe Angriffserfolgsrate ohne Label-Manipulation erreicht.

Yuxiang Zhang, Bin Ma, Enyan Dai2026-03-06🤖 cs.AI

Measuring the Fragility of Trust: Devising Credibility Index via Explanation Stability (CIES) for Business Decision Support Systems

Diese Arbeit stellt den Credibility Index via Explanation Stability (CIES) vor, eine mathematisch fundierte Metrik, die die Stabilität von Erklärungen in erklärbarer KI unter realistischen Geschäftsbedingungen misst und damit Entscheidungsträgern ein zuverlässiges Instrument zur Bewertung der Vertrauenswürdigkeit von KI-gestützten Entscheidungssystemen bietet.

Alin-Gabriel Vaduva, Simona-Vasilica Oprea, Adela Bara2026-03-06🤖 cs.AI

RepoLaunch: Automating Build&Test Pipeline of Code Repositories on ANY Language and ANY Platform

Das Paper stellt RepoLaunch vor, einen autonomen Agenten, der Build- und Test-Pipelines für Code-Repositories in beliebigen Programmiersprachen und auf jeder Plattform automatisiert und damit eine vollständig automatisierte Pipeline zur Erstellung von Datensätzen für Software-Engineering-Forschung ermöglicht.

Kenan Li, Rongzhi Li, Linghao Zhang + 17 more2026-03-06🤖 cs.LG

Good-Enough LLM Obfuscation (GELO)

Das Paper stellt GELO vor, ein leichtgewichtiges Protokoll, das die Privatsphäre von LLM-Prompts auf unsicheren Beschleunigern durch pro-Batch-invertierbare Mischungen der versteckten Zustände schützt, wodurch statistische Angriffe vereitelt werden, während die Ausgabeintegrität erhalten bleibt und nur ein moderater Latenzüberhead entsteht.

Anatoly Belikov, Ilya Fedotov2026-03-06🔒 cs.CR

MCEL: Margin-Based Cross-Entropy Loss for Error-Tolerant Quantized Neural Networks

Die Arbeit stellt die Margin-Based Cross-Entropy Loss (MCEL) vor, eine effiziente und skalierbare Verlustfunktion, die die Robustheit quantisierter neuronaler Netze gegenüber Bitfehlern durch gezielte Vergrößerung der Klassifikationsmargen verbessert und damit den rechenintensiven Ansatz des Trainings mit Bitflip-Injektion ersetzt.

Mikail Yayla, Akash Kumar2026-03-06🤖 cs.LG

Asymptotic Behavior of Multi--Task Learning: Implicit Regularization and Double Descent Effects

Diese Arbeit liefert eine präzise asymptotische Analyse des Multi-Task-Learnings, die zeigt, dass die Kombination verwandter Aufgaben einer zusätzlichen Regularisierung entspricht und das Double-Descent-Phänomen sowohl theoretisch erklärt als auch empirisch abschwächt.

Ayed M. Alrashdi, Oussama Dhifallah, Houssem Sifaou2026-03-06🔢 math

Deep Learning-Driven Friendly Jamming for Secure Multicarrier ISAC Under Channel Uncertainty

Diese Arbeit stellt einen tiefenlernbasierten Rahmen für sichere, mehrträgerbasierte ISAC-Systeme unter Kanalunsicherheit vor, der mithilfe von Radarecho-Feedback und einem neuartigen nichtparametrischen FIM-Schätzer auf f-Divergenz-Basis eine robuste, zielgerichtete Freundliche Störung ohne Kenntnis der Abhörposition ermöglicht und dabei durch einen quantisierten Tensor-Train-Encoder eine signifikante Modellkomprimierung erreicht.

Bui Minh Tuan, Van-Dinh Nguyen, Diep N. Nguyen + 5 more2026-03-06🤖 cs.LG

Reward-Conditioned Reinforcement Learning

Die Arbeit stellt RCRL vor, ein Framework, das einen einzelnen Agenten darauf trainiert, eine Familie von Belohnungsspezifikationen aus einem einzigen nominalen Ziel zu lernen, wodurch robuste und anpassungsfähige Richtlinien ohne Kompromisse bei der Einfachheit des Trainings ermöglicht werden.

Michal Nauman, Marek Cygan, Pieter Abbeel2026-03-06🤖 cs.LG

Synchronization-based clustering on the unit hypersphere

Die Autoren stellen einen neuartigen, auf dem $d$ -dimensionalen verallgemeinerten Kuramoto-Modell basierenden Algorithmus zur Clusteranalyse von Daten auf der Einheitskugel vor, der aufgrund der Berücksichtigung der sphärischen Geometrie in Tests vergleichbare oder bessere Ergebnisse als traditionelle Methoden liefert.

Zinaid Kapić, Aladin Crnkić, Goran Mauša2026-03-06🤖 cs.LG

Aura: Universal Multi-dimensional Exogenous Integration for Aviation Time Series

Das Papier stellt Aura vor, ein universelles Framework, das durch eine maßgeschneiderte dreiteilige Kodierungsmechanik heterogene externe Faktoren in die Zeitreihenvorhersage für die Luftfahrt integriert und damit auf einem großen Datensatz der China Southern Airlines state-of-the-art-Ergebnisse erzielt.

Jiafeng Lin, Mengren Zheng, Simeng Ye + 5 more2026-03-06🤖 cs.AI

Axiomatic On-Manifold Shapley via Optimal Generative Flows

Die Autoren stellen eine neue Theorie für Axiomatische On-Manifold-Shapley-Attribution vor, die auf optimalen generativen Flüssen und der Minimierung der kinetischen Energie basiert, um die Probleme von Off-Manifold-Artefakten zu lösen und eine geometrisch effiziente, stabile sowie semantisch kohärente Erklärungsmethode zu gewährleisten.

Cenwei Zhang, Lin Zhu, Manxi Lin + 1 more2026-03-06🤖 cs.AI

← Zurück Weiter →