cs.LG Arbeiten | Gist.Science

SNPgen: Phenotype-Supervised Genotype Representation and Synthetic Data Generation via Latent Diffusion

Das Paper stellt SNPgen vor, ein zweistufiges, phänotypüberwachtes latentes Diffusionsmodell, das synthetische Genotypdaten erzeugt, die sowohl die genetische Struktur und Privatsphäre der Originaldaten bewahren als auch in Vorhersageaufgaben die Leistung realer Daten erreichen.

Andrea Lampis, Michela Carlotta Massi, Nicola Pirastu, Francesca Ieva, Matteo Matteucci, Emanuele Di Angelantonio2026-03-12🧬 q-bio

LAtte: Hyperbolic Lorentz Attention for Cross-Subject EEG Classification

Das Paper stellt LAtte vor, ein neuartiges Framework, das Lorentz-Attention-Module mit einem InceptionTime-basierten Encoder kombiniert, um durch geteiltes Pretraining und subjekt-spezifische Anpassungen robuste und generalisierbare EEG-Klassifikation über verschiedene Probanden hinweg zu ermöglichen.

Johannes Burchert, Ahmad Bdeir, Tom Hanika, Lars Schmidt-Thieme, Niels Landwehr2026-03-12🤖 cs.LG

Continuous Diffusion Transformers for Designing Synthetic Regulatory Elements

Die Studie stellt einen parameter-effizienten Diffusion-Transformer vor, der durch den Ersatz des U-Net-Rückgrats durch einen Transformer mit 2D-CNN-Encoder und eine DDPO-Feinabstimmung mit Enformer als Belohnungsmodell hochwirksame, zelltypspezifische regulatorische DNA-Sequenzen mit deutlich geringerem Rechenaufwand, besserer Konvergenz und weniger Memorierung erzeugt.

Jonathan Liu, Kia Ghods2026-03-12🧬 q-bio

Kernel Tests of Equivalence

Dieser Beitrag stellt neuartige Kernel-basierte Tests vor, die unter Verwendung der Kernel-Stein-Diskrepanz und der Maximum-Mean-Diskrepanz die Äquivalenz von Verteilungen überprüfen und damit die Grenzen traditioneller Anpassungstests überwinden, indem sie das Fehlen statistisch relevanter Unterschiede mit kontrollierten Fehlerquoten nachweisen.

Xing Liu, Axel Gandy2026-03-12📊 stat

Dynamics-Predictive Sampling for Active RL Finetuning of Large Reasoning Models

Diese Arbeit stellt Dynamics-Predictive Sampling (DPS) vor, eine Methode, die durch die Modellierung des Lernfortschritts als dynamisches System und die Nutzung von Online-Bayes-Inferenz informative Prompts vorhersagt, um den rechenintensiven Aufwand für Rollouts beim Reinforcement-Learning-Finetuning von Large Reasoning Models erheblich zu reduzieren und die Trainingsleistung zu steigern.

Yixiu Mao, Yun Qu, Qi Wang, Heming Zou, Xiangyang Ji2026-03-12🤖 cs.LG

Ergodicity in reinforcement learning

Dieser Artikel untersucht die Auswirkungen nicht-ergodischer Belohnungsprozesse auf das Reinforcement Learning, stellt fest, dass die Optimierung des Erwartungswerts für die Leistung einzelner Agenten unzureichend ist, und präsentiert Lösungsansätze zur Verbesserung der Langzeitperformance auf einzelnen Trajektorien.

Dominik Baumann, Erfaun Noorani, Arsenii Mustafin, Xinyi Sheng, Bert Verbruggen, Arne Vanhoyweghen, Vincent Ginis, Thomas B. Schön2026-03-12🤖 cs.LG

LookaheadKV: Fast and Accurate KV Cache Eviction by Glimpsing into the Future without Generation

Der Artikel stellt LookaheadKV vor, einen leichten Rahmen zur effizienten Eviction von KV-Caches in großen Sprachmodellen, der durch parametereffiziente Module zukünftige Wichtigkeitsvorhersagen ohne rechenintensive Entwurfsgenerierung ermöglicht und dabei sowohl die Genauigkeit als auch die Geschwindigkeit im Vergleich zu bestehenden Methoden erheblich verbessert.

Jinwoo Ahn, Ingyu Seong, Akhil Kedia, Junhan Kim, Hyemi Jang, Kangwook Lee, Yongkweon Jeon2026-03-12🤖 cs.LG

NCAA Bracket Prediction Using Machine Learning and Combinatorial Fusion Analysis

Diese Arbeit stellt eine neue Methode zur Vorhersage von NCAA-Turnierergebnissen vor, die auf der kombinatorischen Fusionsanalyse (CFA) basiert und mit einer Genauigkeit von 74,60 % die Leistung der zehn besten öffentlichen Ranglistensysteme übertrifft.

Yuanhong Wu, Isaiah Smith, Tushar Marwah, Michael Schroeter, Mohamed Rahouti, D. Frank Hsu2026-03-12🤖 cs.LG

ECoLAD: Deployment-Oriented Evaluation for Automotive Time-Series Anomaly Detection

Die Arbeit stellt ECoLAD vor, ein evaluationsorientiertes Protokoll, das zeigt, dass bei der Bereitstellung von Anomalieerkennungssystemen in Fahrzeugen unter realen Ressourcenbeschränkungen leichtgewichtige klassische Detektoren oft robuster sind als tiefere neuronale Netze, die trotz hoher Genauigkeit häufig ihre Durchführbarkeit verlieren.

Kadir-Kaan Özer, René Ebeling, Markus Enzweiler2026-03-12🤖 cs.LG

Historical Consensus: Preventing Posterior Collapse via Iterative Selection of Gaussian Mixture Priors

Diese Arbeit stellt die „Historical Consensus Training"-Methode vor, die durch iterative Auswahl und Optimierung von Gaußschen Mischverteilungs-Priors einen stabilen Parameterbereich schafft, der das Posterior-Collapse-Phänomen in Variational Autoencodern unabhängig von Architektur oder Regularisierung vollständig verhindert.

Zegu Zhang, Jian Zhang2026-03-12🤖 cs.LG

Quantifying Membership Disclosure Risk for Tabular Synthetic Data Using Kernel Density Estimators

Diese Arbeit stellt eine praktische Methode vor, die Kernel-Dichteschätzer nutzt, um das Risiko der Mitgliedschaftsoffenlegung in tabellarischen synthetischen Daten zu quantifizieren und dabei effizientere und genauere Bewertungen als bisherige Ansätze ohne aufwändige Schattenmodelle ermöglicht.

Rajdeep Pathak, Sayantee Jana2026-03-12📊 stat

Safe RLHF Beyond Expectation: Stochastic Dominance for Universal Spectral Risk Control

Die Arbeit stellt RAD vor, ein neuartiges Framework für das sichere Reinforcement Learning aus menschlichem Feedback, das durch den Einsatz von First-Order Stochastic Dominance in Kombination mit Optimal Transport und quantilengewichteten Spektralrisikomaßen die Kontrolle über Verteilungsschwänze und seltene Katastrophenereignisse ermöglicht und so robustere, schädigungsärmere KI-Modelle liefert.

Yaswanth Chittepu, Ativ Joshi, Rajarshi Bhattacharjee, Scott Niekum2026-03-12🤖 cs.LG

When should we trust the annotation? Selective prediction for molecular structure retrieval from mass spectra

Die Studie stellt einen Rahmen für die selektive Vorhersage zur Massenspektren-basierten Molekülidentifikation vor, der durch die Nutzung von Unsicherheitsquantifizierung auf Abfrageebene und verteilungsfreien Risikokontrollen eine zuverlässige Abstimmung zwischen Vorhersagegenauigkeit und Abdeckung ermöglicht.

Mira Jürgens, Gaetan De Waele, Morteza Rakhshaninejad, Willem Waegeman2026-03-12📊 stat

Ranking Reasoning LLMs under Test-Time Scaling

Die Arbeit stellt Scorio, eine Open-Source-Bibliothek für statistische Ranking-Methoden, vor, die es ermöglicht, Reasoning-LLMs unter Test-Time-Scaling zuverlässig zu bewerten, wobei sich zeigt, dass die meisten Methoden auch bei begrenzten Versuchen mit einem Bayesianischen Goldstandard übereinstimmen.

Mohsen Hariri, Michael Hinczewski, Jing Ma, Vipin Chaudhary2026-03-12📊 stat

Bio-Inspired Self-Supervised Learning for Wrist-worn IMU Signals

Diese Arbeit stellt eine bio-inspirierte, selbstüberwachte Lernmethode für Handgelenk-IMU-Signale vor, die auf der Subbewegungstheorie basiert und durch eine neuartige Tokenisierung sowie Maskierung von Bewegungssegmenten robustere und dateneffizientere Repräsentationen für die menschliche Aktivitätserkennung erzeugt als bestehende Ansätze.

Prithviraj Tarale, Kiet Chu, Abhishek Varghese, Kai-Chun Liu, Maxwell A Xu, Mohit Iyyer, Sunghoon I. Lee2026-03-12🤖 cs.LG

Pointy - A Lightweight Transformer for Point Cloud Foundation Models

Die Arbeit stellt Pointy vor, einen leichten Transformer für Punktwolken, der durch eine sorgfältig kuratierte Architektur und ein kontrolliertes Training mit nur 39.000 Punktwolken die Leistung größerer Foundation-Modelle übertrifft und dabei auf umfangreiche Kreuzmodalsupervision verzichtet.

Konrad Szafer, Marek Kraft, Dominik Belter2026-03-12🤖 cs.LG

TOSSS: a CVE-based Software Security Benchmark for Large Language Models

Das Paper stellt TOSSS vor, ein auf CVE-Daten basierendes Benchmark-System zur Bewertung der Fähigkeit von Large Language Models, sichere von anfälligen Code-Snippets in C/C++ und Java zu unterscheiden, wobei die getesteten Modelle Sicherheitswerte zwischen 0,48 und 0,89 erreichten.

Marc Damie, Murat Bilgehan Ertan, Domenico Essoussi, Angela Makhanu, Gaëtan Peter, Roos Wensveen2026-03-12🤖 cs.LG

FRIEND: Federated Learning for Joint Optimization of multi-RIS Configuration and Eavesdropper Intelligent Detection in B5G Networks

Diese Arbeit stellt einen neuen, datenschutzkonformen Ansatz mittels Federated Learning vor, der in B5G-Netzen mit rekonfigurierbaren intelligenten Oberflächen (RIS) und zellfreien mmWave-Architekturen sowohl die Abhörsicherheit durch optimierte RIS-Konfiguration als auch die Erkennung von Lauschern durch ein effizientes Deep-Learning-Modell verbessert.

Maria Lamprini A. Bartsioka, Ioannis A. Bartsiokas, Anastasios K. Papazafeiropoulos, Maria A. Seimeni, Dimitra I. Kaklamani, Iakovos S. Venieris2026-03-12🤖 cs.LG

Federated Learning-driven Beam Management in LEO 6G Non-Terrestrial Networks

Diese Arbeit untersucht den Einsatz von Graph Neural Networks (GNN) im Rahmen des Federated Learning für das Beam-Management in LEO-Satellitennetzwerken und zeigt, dass GNN-Modelle im Vergleich zu Multi-Layer Perceptrons eine überlegene Genauigkeit und Stabilität bei der Strahlvorhersage, insbesondere in niedrigen Elevationswinkeln, bieten.

Maria Lamprini Bartsioka, Ioannis A. Bartsiokas, Athanasios D. Panagopoulos, Dimitra I. Kaklamani, Iakovos S. Venieris2026-03-12🔬 physics

The Discrete Charm of the MLP: Binary Routing of Continuous Signals in Transformer Feed-Forward Layers

Die Studie zeigt, dass MLP-Schichten in Transformer-Sprachmodellen kontinuierliche Signale durch eine binäre Routing-Struktur verarbeiten, bei der spezifische Neuronen in späteren Schichten als Konsens- und Ausnahmemechanismus fungieren, um zu entscheiden, welche Tokens einer nichtlinearen Verarbeitung bedürfen.

Peter Balogh2026-03-12🤖 cs.LG

← Zurück Weiter →