SNPgen: Phenotype-Supervised Genotype Representation and Synthetic Data Generation via Latent Diffusion

Das Paper stellt SNPgen vor, ein zweistufiges, phänotypüberwachtes latentes Diffusionsmodell, das synthetische Genotypdaten erzeugt, die sowohl die genetische Struktur und Privatsphäre der Originaldaten bewahren als auch in Vorhersageaufgaben die Leistung realer Daten erreichen.

Andrea Lampis, Michela Carlotta Massi, Nicola Pirastu, Francesca Ieva, Matteo Matteucci, Emanuele Di Angelantonio2026-03-12🧬 q-bio

Dynamics-Predictive Sampling for Active RL Finetuning of Large Reasoning Models

Diese Arbeit stellt Dynamics-Predictive Sampling (DPS) vor, eine Methode, die durch die Modellierung des Lernfortschritts als dynamisches System und die Nutzung von Online-Bayes-Inferenz informative Prompts vorhersagt, um den rechenintensiven Aufwand für Rollouts beim Reinforcement-Learning-Finetuning von Large Reasoning Models erheblich zu reduzieren und die Trainingsleistung zu steigern.

Yixiu Mao, Yun Qu, Qi Wang, Heming Zou, Xiangyang Ji2026-03-12🤖 cs.LG

Ergodicity in reinforcement learning

Dieser Artikel untersucht die Auswirkungen nicht-ergodischer Belohnungsprozesse auf das Reinforcement Learning, stellt fest, dass die Optimierung des Erwartungswerts für die Leistung einzelner Agenten unzureichend ist, und präsentiert Lösungsansätze zur Verbesserung der Langzeitperformance auf einzelnen Trajektorien.

Dominik Baumann, Erfaun Noorani, Arsenii Mustafin, Xinyi Sheng, Bert Verbruggen, Arne Vanhoyweghen, Vincent Ginis, Thomas B. Schön2026-03-12🤖 cs.LG

LookaheadKV: Fast and Accurate KV Cache Eviction by Glimpsing into the Future without Generation

Der Artikel stellt LookaheadKV vor, einen leichten Rahmen zur effizienten Eviction von KV-Caches in großen Sprachmodellen, der durch parametereffiziente Module zukünftige Wichtigkeitsvorhersagen ohne rechenintensive Entwurfsgenerierung ermöglicht und dabei sowohl die Genauigkeit als auch die Geschwindigkeit im Vergleich zu bestehenden Methoden erheblich verbessert.

Jinwoo Ahn, Ingyu Seong, Akhil Kedia, Junhan Kim, Hyemi Jang, Kangwook Lee, Yongkweon Jeon2026-03-12🤖 cs.LG

Safe RLHF Beyond Expectation: Stochastic Dominance for Universal Spectral Risk Control

Die Arbeit stellt RAD vor, ein neuartiges Framework für das sichere Reinforcement Learning aus menschlichem Feedback, das durch den Einsatz von First-Order Stochastic Dominance in Kombination mit Optimal Transport und quantilengewichteten Spektralrisikomaßen die Kontrolle über Verteilungsschwänze und seltene Katastrophenereignisse ermöglicht und so robustere, schädigungsärmere KI-Modelle liefert.

Yaswanth Chittepu, Ativ Joshi, Rajarshi Bhattacharjee, Scott Niekum2026-03-12🤖 cs.LG

When should we trust the annotation? Selective prediction for molecular structure retrieval from mass spectra

Die Studie stellt einen Rahmen für die selektive Vorhersage zur Massenspektren-basierten Molekülidentifikation vor, der durch die Nutzung von Unsicherheitsquantifizierung auf Abfrageebene und verteilungsfreien Risikokontrollen eine zuverlässige Abstimmung zwischen Vorhersagegenauigkeit und Abdeckung ermöglicht.

Mira Jürgens, Gaetan De Waele, Morteza Rakhshaninejad, Willem Waegeman2026-03-12📊 stat

Bio-Inspired Self-Supervised Learning for Wrist-worn IMU Signals

Diese Arbeit stellt eine bio-inspirierte, selbstüberwachte Lernmethode für Handgelenk-IMU-Signale vor, die auf der Subbewegungstheorie basiert und durch eine neuartige Tokenisierung sowie Maskierung von Bewegungssegmenten robustere und dateneffizientere Repräsentationen für die menschliche Aktivitätserkennung erzeugt als bestehende Ansätze.

Prithviraj Tarale, Kiet Chu, Abhishek Varghese, Kai-Chun Liu, Maxwell A Xu, Mohit Iyyer, Sunghoon I. Lee2026-03-12🤖 cs.LG

FRIEND: Federated Learning for Joint Optimization of multi-RIS Configuration and Eavesdropper Intelligent Detection in B5G Networks

Diese Arbeit stellt einen neuen, datenschutzkonformen Ansatz mittels Federated Learning vor, der in B5G-Netzen mit rekonfigurierbaren intelligenten Oberflächen (RIS) und zellfreien mmWave-Architekturen sowohl die Abhörsicherheit durch optimierte RIS-Konfiguration als auch die Erkennung von Lauschern durch ein effizientes Deep-Learning-Modell verbessert.

Maria Lamprini A. Bartsioka, Ioannis A. Bartsiokas, Anastasios K. Papazafeiropoulos, Maria A. Seimeni, Dimitra I. Kaklamani, Iakovos S. Venieris2026-03-12🤖 cs.LG

Federated Learning-driven Beam Management in LEO 6G Non-Terrestrial Networks

Diese Arbeit untersucht den Einsatz von Graph Neural Networks (GNN) im Rahmen des Federated Learning für das Beam-Management in LEO-Satellitennetzwerken und zeigt, dass GNN-Modelle im Vergleich zu Multi-Layer Perceptrons eine überlegene Genauigkeit und Stabilität bei der Strahlvorhersage, insbesondere in niedrigen Elevationswinkeln, bieten.

Maria Lamprini Bartsioka, Ioannis A. Bartsiokas, Athanasios D. Panagopoulos, Dimitra I. Kaklamani, Iakovos S. Venieris2026-03-12🔬 physics