cs.LG Arbeiten | Gist.Science

Agent Memory Below the Prompt: Persistent Q4 KV Cache for Multi-Agent LLM Inference on Edge Devices

Diese Arbeit stellt ein System vor, das durch die persistente Speicherung von 4-bit quantisierten KV-Caches auf der Festplatte die wiederholte Neuberechnung bei Multi-Agenten-LLM-Inferenz auf Edge-Geräten eliminiert und so die Time-to-First-Token-Zeit um bis zu 136-fach reduziert, während gleichzeitig die Speicherkapazität vervierfacht wird.

Yakov Pyotr Shkolnikov2026-03-06💻 cs

Flowers: A Warp Drive for Neural PDE Solvers

Die Arbeit stellt „Flowers" vor, eine neuartige neuronale Architektur zur Lösung von PDEs, die ausschließlich auf Multihead-Warping basiert, um adaptive globale Interaktionen bei linearen Kosten zu ermöglichen und dabei Fourier-Methoden, Faltungen sowie Dot-Product-Attention zu ersetzen, was zu überlegener Leistung auf 2D- und 3D-PDE-Benchmarks führt.

Till Muser, Alexandra Spitzer, Matti Lassas + 2 more2026-03-06💻 cs

Uncertainty-Calibrated Spatiotemporal Field Diffusion with Sparse Supervision

Das Paper stellt SOLID vor, ein maskenbasiertes Diffusionsmodell, das physikalische Felder ausschließlich aus spärlichen Sensordaten lernt, indem es eine duale Maskierungsstrategie nutzt, um sowohl unbeobachtete Bereiche zu rekonstruieren als auch verlässliche Ankerpunkte zu gewichten, was zu deutlich verbesserten probabilistischen Vorhersagen und kalibrierten Unsicherheitskarten führt.

Kevin Valencia, Xihaier Luo, Shinjae Yoo + 1 more2026-03-06💻 cs

Auction-Based RIS Allocation With DRL: Controlling the Cost-Performance Trade-Off

Diese Studie untersucht die Zuweisung von rekonfigurierbaren intelligenten Oberflächen (RIS) in Multi-Cell-Netzen mittels einer aufsteigenden Auktion, bei der Deep-Reinforcement-Learning-Agenten die Gebotsstrategien optimieren, um eine flexible Steuerung des Trade-offs zwischen Netzwerkleistung und Kosten zu ermöglichen.

Martin Mark Zan, Stefan Schwarz2026-03-06💻 cs

ZorBA: Zeroth-order Federated Fine-tuning of LLMs with Heterogeneous Block Activation

Die Arbeit stellt ZorBA vor, ein Framework für das federierte Fine-Tuning von LLMs, das durch den Einsatz von Zeroth-Order-Optimierung und einer heterogenen Blockaktivierung den VRAM-Verbrauch erheblich senkt und gleichzeitig die Konvergenz beschleunigt.

Chuiyang Meng, Ming Tang, Vincent W. S. Wong2026-03-06💻 cs

ASFL: An Adaptive Model Splitting and Resource Allocation Framework for Split Federated Learning

Die vorgestellte Arbeit schlägt ein adaptives Split-Federated-Learning-Framework (ASFL) vor, das durch die Kombination von serverseitigem Training, adaptiver Modellaufteilung und Ressourcenallokation die Konvergenzgeschwindigkeit verbessert und die Gesamtverzögerung sowie den Energieverbrauch im Vergleich zu bestehenden Methoden um bis zu 75 % bzw. 80 % reduziert.

Chuiyang Meng, Ming Tang, Vincent W. S. Wong2026-03-06💻 cs

CogGen: Cognitive-Load-Informed Fully Unsupervised Deep Generative Modeling for Compressively Sampled MRI Reconstruction

Die Arbeit stellt CogGen vor, ein vollständig unüberwachtes Deep-Generative-Modell, das durch eine kognitionsbelastungsinformierte, stufenweise Anpassung der Trainingsdaten von niedrigen zu hohen Frequenzen die Rekonstruktion komprimiert abgetasteter MRT-Bilder verbessert und dabei Überanpassung sowie Konvergenzprobleme herkömmlicher Methoden überwindet.

Qingyong Zhu, Yumin Tan, Xiang Gu + 1 more2026-03-06💻 cs

Explainable Regime Aware Investing

Die Studie stellt ein erklärbares, regimebewusstes Portfolio-Management-Framework vor, das auf einem streng kausalen Wasserstein-Hidden-Markov-Modell basiert und durch dynamische Anpassung der Regime-Komplexität sowie stabile Identitätsverfolgung im Vergleich zu Benchmarks und nichtparametrischen Ansätzen deutlich verbesserte risikoadjustierte Renditen und geringere Drawdowns erzielt.

Amine Boukardagha2026-03-06💻 cs

AMV-L: Lifecycle-Managed Agent Memory for Tail-Latency Control in Long-Running LLM Systems

Die Studie stellt AMV-L vor, ein Framework für das lebenszyklusgesteuerte Speichermanagement von LLM-Agenten, das durch wertbasierte Promotion und Entlassung sowie eine auf die Arbeitsmenge beschränkte Suche die Tail-Latenz und den Durchsatz in langlaufenden Systemen im Vergleich zu herkömmlichen TTL- und LRU-Ansätzen signifikant verbessert.

Emmanuel Bamidele2026-03-06💻 cs

SkillNet: Create, Evaluate, and Connect AI Skills

Die Arbeit stellt SkillNet vor, eine offene Infrastruktur, die durch die Erstellung, Evaluierung und Vernetzung von über 200.000 KI-Fähigkeiten in einer einheitlichen Ontologie die Leistung von Agenten signifikant steigert und so den Übergang von transienter Erfahrung zu dauerhafter Meisterschaft ermöglicht.

Yuan Liang, Ruobin Zhong, Haoming Xu + 46 more2026-03-06✓ Author reviewed ⓘ💻 cs

An Explainable Ensemble Framework for Alzheimer's Disease Prediction Using Structured Clinical and Cognitive Data

Diese Forschung stellt einen erklärbaren Ensemble-Rahmen vor, der durch die Kombination von fünf Ensemble-Algorithmen und einer künstlichen neuronalen Netzwerks auf strukturierten klinischen und kognitiven Daten eine zuverlässige und transparente Vorhersage der Alzheimer-Krankheit ermöglicht, wobei XGBoost, Random Forest und Soft Voting die besten Ergebnisse erzielen.

Nishan Mitra2026-03-06💻 cs

MPBMC: Multi-Property Bounded Model Checking with GNN-guided Clustering

Die vorgestellte Arbeit führt MPBMC ein, einen hybriden Ansatz zur effizienten Verifikation mehrerer Eigenschaften mittels GNN-gestützter Clustering, der funktionale Repräsentationen von Hardware-Schaltungen und Laufzeitstatistiken nutzt, um die Leistung von Bounded Model Checking signifikant zu steigern.

Soumik Guha Roy, Sumana Ghosh, Ansuman Banerjee + 2 more2026-03-06💻 cs

On Emergences of Non-Classical Statistical Characteristics in Classical Neural Networks

Die Studie stellt eine klassische neuronale Architektur namens NCnet vor, die durch Gradientenkonkurrenzen in geteilten versteckten Schichten nicht-klassische statistische Merkmale aufweist und zeigt, dass der CHSH-Wert $S$ als Indikator für interne Interaktionen und Generalisierungsleistung in tiefen Netzwerken dienen kann.

Hanyu Zhao, Yang Wu, Yuexian Hou2026-03-06⚛️ quant-ph

Induced Numerical Instability: Hidden Costs in Multimodal Large Language Models

Die Studie identifiziert und demonstriert eine neue Fehlerart bei multimodalen großen Sprachmodellen, bei der durch die Optimierung auf numerische Instabilität minimal veränderte Bilder erzeugt werden, die zu einer signifikanten Leistungsverschlechterung führen, ohne dass dies durch herkömmliche adversarielle Angriffe erfasst wird.

Wai Tuck Wong, Jun Sun, Arunesh Sinha2026-03-06💻 cs

Learning Unified Distance Metric for Heterogeneous Attribute Data Clustering

Diese Arbeit stellt das HARR-Lernparadigma vor, das heterogene numerische und kategoriale Daten durch eine projektionsbasierte Repräsentation in einen homogenen Raum überführt, um einen einheitlichen Distanzmetrik-Lernprozess zu ermöglichen, der die Clusteranalyse ohne manuelle Parameteranpassung verbessert.

Yiqun Zhang, Mingjie Zhao, Yizhou Chen + 2 more2026-03-06💻 cs

VSPrefill: Vertical-Slash Sparse Attention with Lightweight Indexing for Long-Context Prefilling

Die Arbeit stellt VSPrefill vor, eine vertikal-schräg strukturierte, sparse-Attention-Methode mit leichtgewichtiger Indexierung, die durch adaptive Budgetzuweisung und On-the-Fly-Indexierung bei langen Kontexten (bis 128k) eine 4,95-fache Beschleunigung bei nur minimalen Genauigkeitsverlusten erreicht.

Chen Guanzhong2026-03-06💻 cs

MAD-SmaAt-GNet: A Multimodal Advection-Guided Neural Network for Precipitation Nowcasting

Die Studie stellt MAD-SmaAt-GNet vor, ein multimodales, advektionsgesteuertes neuronales Netzwerk, das die Architektur SmaAt-UNet durch die Integration zusätzlicher Wettervariablen und physikalischer Advektionskomponenten erweitert und damit die Genauigkeit der Niederschlagsvorhersage im Vergleich zum Basismodell signifikant verbessert.

Samuel van Wonderen, Siamak Mehrkanoon2026-03-06💻 cs

Understanding the Dynamics of Demonstration Conflict in In-Context Learning

Die Studie analysiert, wie große Sprachmodelle durch widersprüchliche Few-Shot-Beispiele bei der Regelableitung in In-Context-Learning getäuscht werden, und identifiziert mittels linearer Sonden und Logit-Lens-Analyse spezifische Aufmerksamkeitsköpfe in frühen und späten Schichten, deren gezielte Ablation die Robustheit gegen solche Konflikte signifikant verbessert.

Difan Jiao, Di Wang, Lijie Hu2026-03-06💻 cs

Act-Observe-Rewrite: Multimodal Coding Agents as In-Context Policy Learners for Robot Manipulation

Die Arbeit stellt den Act-Observe-Rewrite (AOR)-Rahmen vor, der multimodale Sprachmodelle befähigt, Robotermanipulationsaufgaben durch das visuelle Beobachten von Fehlern und das automatische Neu-Schreiben des zugrunde liegenden Python-Steuerungscode zwischen den Versuchen zu meistern, ohne dabei Demonstrationen, Reward-Engineering oder Gradienten-Updates zu benötigen.

Vaishak Kumar2026-03-06💻 cs

Towards Explainable Deep Learning for Ship Trajectory Prediction in Inland Waterways

Diese Studie stellt einen erklärungsstarken LSTM-basierten Ansatz zur Vorhersage von Schiffsbahnen auf Binnengewässern vor, der zwar eine hohe Genauigkeit erreicht, jedoch zeigt, dass die durch das gelernte Schiffsdomänenmodell gewichteten Interaktionen nicht vollständig kausal mit den tatsächlichen Begegnungssituationen übereinstimmen.

Tom Legel, Dirk Söffker, Roland Schätzle + 1 more2026-03-06💻 cs

← Zurück Weiter →