cs.LG Arbeiten | Gist.Science

Safe RLHF Beyond Expectation: Stochastic Dominance for Universal Spectral Risk Control

Die Arbeit stellt RAD vor, ein neuartiges Framework für das sichere Reinforcement Learning aus menschlichem Feedback, das durch den Einsatz von First-Order Stochastic Dominance in Kombination mit Optimal Transport und quantilengewichteten Spektralrisikomaßen die Kontrolle über Verteilungsschwänze und seltene Katastrophenereignisse ermöglicht und so robustere, schädigungsärmere KI-Modelle liefert.

Yaswanth Chittepu, Ativ Joshi, Rajarshi Bhattacharjee, Scott Niekum2026-03-12🤖 cs.LG

When should we trust the annotation? Selective prediction for molecular structure retrieval from mass spectra

Die Studie stellt einen Rahmen für die selektive Vorhersage zur Massenspektren-basierten Molekülidentifikation vor, der durch die Nutzung von Unsicherheitsquantifizierung auf Abfrageebene und verteilungsfreien Risikokontrollen eine zuverlässige Abstimmung zwischen Vorhersagegenauigkeit und Abdeckung ermöglicht.

Mira Jürgens, Gaetan De Waele, Morteza Rakhshaninejad, Willem Waegeman2026-03-12📊 stat

Ranking Reasoning LLMs under Test-Time Scaling

Die Arbeit stellt Scorio, eine Open-Source-Bibliothek für statistische Ranking-Methoden, vor, die es ermöglicht, Reasoning-LLMs unter Test-Time-Scaling zuverlässig zu bewerten, wobei sich zeigt, dass die meisten Methoden auch bei begrenzten Versuchen mit einem Bayesianischen Goldstandard übereinstimmen.

Mohsen Hariri, Michael Hinczewski, Jing Ma, Vipin Chaudhary2026-03-12📊 stat

Bio-Inspired Self-Supervised Learning for Wrist-worn IMU Signals

Diese Arbeit stellt eine bio-inspirierte, selbstüberwachte Lernmethode für Handgelenk-IMU-Signale vor, die auf der Subbewegungstheorie basiert und durch eine neuartige Tokenisierung sowie Maskierung von Bewegungssegmenten robustere und dateneffizientere Repräsentationen für die menschliche Aktivitätserkennung erzeugt als bestehende Ansätze.

Prithviraj Tarale, Kiet Chu, Abhishek Varghese, Kai-Chun Liu, Maxwell A Xu, Mohit Iyyer, Sunghoon I. Lee2026-03-12🤖 cs.LG

Pointy - A Lightweight Transformer for Point Cloud Foundation Models

Die Arbeit stellt Pointy vor, einen leichten Transformer für Punktwolken, der durch eine sorgfältig kuratierte Architektur und ein kontrolliertes Training mit nur 39.000 Punktwolken die Leistung größerer Foundation-Modelle übertrifft und dabei auf umfangreiche Kreuzmodalsupervision verzichtet.

Konrad Szafer, Marek Kraft, Dominik Belter2026-03-12🤖 cs.LG

TOSSS: a CVE-based Software Security Benchmark for Large Language Models

Das Paper stellt TOSSS vor, ein auf CVE-Daten basierendes Benchmark-System zur Bewertung der Fähigkeit von Large Language Models, sichere von anfälligen Code-Snippets in C/C++ und Java zu unterscheiden, wobei die getesteten Modelle Sicherheitswerte zwischen 0,48 und 0,89 erreichten.

Marc Damie, Murat Bilgehan Ertan, Domenico Essoussi, Angela Makhanu, Gaëtan Peter, Roos Wensveen2026-03-12🤖 cs.LG

FRIEND: Federated Learning for Joint Optimization of multi-RIS Configuration and Eavesdropper Intelligent Detection in B5G Networks

Diese Arbeit stellt einen neuen, datenschutzkonformen Ansatz mittels Federated Learning vor, der in B5G-Netzen mit rekonfigurierbaren intelligenten Oberflächen (RIS) und zellfreien mmWave-Architekturen sowohl die Abhörsicherheit durch optimierte RIS-Konfiguration als auch die Erkennung von Lauschern durch ein effizientes Deep-Learning-Modell verbessert.

Maria Lamprini A. Bartsioka, Ioannis A. Bartsiokas, Anastasios K. Papazafeiropoulos, Maria A. Seimeni, Dimitra I. Kaklamani, Iakovos S. Venieris2026-03-12🤖 cs.LG

Federated Learning-driven Beam Management in LEO 6G Non-Terrestrial Networks

Diese Arbeit untersucht den Einsatz von Graph Neural Networks (GNN) im Rahmen des Federated Learning für das Beam-Management in LEO-Satellitennetzwerken und zeigt, dass GNN-Modelle im Vergleich zu Multi-Layer Perceptrons eine überlegene Genauigkeit und Stabilität bei der Strahlvorhersage, insbesondere in niedrigen Elevationswinkeln, bieten.

Maria Lamprini Bartsioka, Ioannis A. Bartsiokas, Athanasios D. Panagopoulos, Dimitra I. Kaklamani, Iakovos S. Venieris2026-03-12🔬 physics

The Discrete Charm of the MLP: Binary Routing of Continuous Signals in Transformer Feed-Forward Layers

Die Studie zeigt, dass MLP-Schichten in Transformer-Sprachmodellen kontinuierliche Signale durch eine binäre Routing-Struktur verarbeiten, bei der spezifische Neuronen in späteren Schichten als Konsens- und Ausnahmemechanismus fungieren, um zu entscheiden, welche Tokens einer nichtlinearen Verarbeitung bedürfen.

Peter Balogh2026-03-12🤖 cs.LG

MCMC Informed Neural Emulators for Uncertainty Quantification in Dynamical Systems

Die vorgestellte Arbeit entwickelt einen MCMC-gestützten Ansatz, der die Unsicherheitsquantifizierung dynamischer Systeme durch die Eingabe von Modellparameter-Verteilungen in das Netzwerktraining effizient und architekturunabhängig ermöglicht, ohne auf zeitaufwändige direkte Parametersondierungen angewiesen zu sein.

Heikki Haario, Zhi-Song Liu, Martin Simon, Hendrik Weichel2026-03-12🤖 cs.LG

ForwardFlow: Simulation only statistical inference using deep learning

Der Artikel stellt „ForwardFlow" vor, ein rein simulationsbasiertes statistisches Inferenzverfahren, das ein einziges Deep-Learning-Netzwerk nutzt, um aus simulierten Daten Parameterschätzungen zu gewinnen und dabei Eigenschaften wie endliche Stichprobengenauigkeit, Robustheit gegenüber Datenverfälschungen und die automatische Approximation komplexer Algorithmen wie des EM-Algorithmus demonstriert.

Stefan Böhringer2026-03-12📊 stat

Bayesian Optimization with Gaussian Processes to Accelerate Stationary Point Searches

Diese Arbeit stellt ein einheitliches Bayesian-Optimization-Framework mit Gauß-Prozessen vor, das die Suche nach stationären Punkten auf Potentialenergieflächen durch einen gemeinsamen Sechs-Schritte-Schleifenansatz, erweiterte Kernel-Methoden und effiziente Skalierung für hochdimensionale Systeme beschleunigt.

Rohit Goswami (Institute IMX and Lab-COSMO, École polytechnique fédérale de Lausanne)2026-03-12📊 stat

Factorized Neural Implicit DMD for Parametric Dynamics

Die Autoren stellen eine datengetriebene, modellfreie Methode namens Factorized Neural Implicit DMD vor, die eine faktorisierbare Flussoperator-Parameterisierung nutzt, um die zeitliche Entwicklung parametrischer dynamischer Systeme mit hoher Dimensionalität und Nichtlinearität durch die Entkopplung räumlicher Modi und zeitlicher Evolution präzise vorherzusagen und dabei Stabilität, Generalisierungsfähigkeit sowie spektrale Analysen zu ermöglichen.

Siyuan Chen, Zhecheng Wang, Yixin Chen, Yue Chang, Peter Yichen Chen, Eitan Grinspun, Jonathan Panuelos2026-03-12🤖 cs.LG

Cross-Species Transfer Learning for Electrophysiology-to-Transcriptomics Mapping in Cortical GABAergic Interneurons

Diese Studie demonstriert die Reproduzierbarkeit des Gouwens-Frameworks für die Abbildung von Elektrophysiologie auf Transkriptomik in GABAergen Interneuronen und zeigt, dass ein auf Mausdaten vortrainiertes, aufmerksamkeitsbasiertes BiLSTM-Modell durch Transferlernen die Vorhersagegenauigkeit für menschliche Neuronenklassen im Vergleich zu einem rein menschlichen Trainingsansatz verbessert.

Theo Schwider, Ramin Ramezani2026-03-12🧬 q-bio

Leech Lattice Vector Quantization for Efficient LLM Compression

Diese Arbeit stellt die Leech-Gitter-Vektorquantisierung (LLVQ) vor, einen praktischen Algorithmus, der durch die Nutzung der optimalen Packungseigenschaften des 24-dimensionalen Leech-Gitters und einer effizienten Suche ohne explizite Codebooks den State-of-the-Art bei der Kompression von Large Language Models erreicht.

Tycho F. A. van der Ouderaa, Mart van Baalen, Paul Whatmough, Markus Nagel2026-03-12🤖 cs.LG

V2M-Zero: Zero-Pair Time-Aligned Video-to-Music Generation

Die Arbeit stellt V2M-Zero vor, eine Methode zur Erzeugung von zeitlich synchronisierter Musik aus Videos ohne gepaarte Trainingsdaten, indem sie die gemeinsame zeitliche Struktur beider Modalitäten über intramodale Ereigniskurven nutzt, um Text-zu-Musik-Modelle effektiv für Video-zu-Musik-Aufgaben anzupassen.

Yan-Bo Lin, Jonah Casebeer, Long Mai, Aniruddha Mahapatra, Gedas Bertasius, Nicholas J. Bryan2026-03-12🤖 cs.AI

Neural Field Thermal Tomography: A Differentiable Physics Framework for Non-Destructive Evaluation

Die Arbeit stellt NeFTY vor, ein differenzierbares physikalisches Framework, das mithilfe eines neuronalen Feldes und eines rigorosen numerischen Löschers die quantitative 3D-Rekonstruktion von Materialeigenschaften und die Lokalisierung von Untergrundfehlern aus transienten Oberflächentemperaturmessungen ermöglicht.

Tao Zhong, Yixun Hu, Dongzhe Zheng, Aditya Sood, Christine Allen-Blanchette2026-03-12🔬 cond-mat.mtrl-sci

XConv: Low-memory stochastic backpropagation for convolutional layers

Die Arbeit stellt XConv vor, eine nahtlos integrierbare Methode zur drastischen Reduzierung des Speicherverbrauchs beim Training von Faltungsschichten durch komprimierte Aktivierungen und stochastische Gradientenschätzung, ohne dabei die Architektur einzuschränken oder die Leistung signifikant zu beeinträchtigen.

Anirudh Thatipelli, Jeffrey Sam, Mathias Louboutin, Ali Siahkoohi, Rongrong Wang, Felix J. Herrmann2026-03-11🤖 cs.LG

A Survey on Decentralized Federated Learning

Diese Arbeit bietet eine umfassende Übersicht über dezentriertes Federated Learning (DFL) von 2018 bis 2026, klassifiziert die Methoden in traditionelle und blockchain-basierte Ansätze, entwickelt eine einheitliche, herausforderungsorientierte Taxonomie und identifiziert kritische Forschungsbedarfslücken in Bezug auf Topologie, Privatsphäre, Anreize und Modellziele.

Edoardo Gabrielli, Anthony Di Pietro, Dario Fenoglio, Giovanni Pica, Gabriele Tolomei2026-03-11🤖 cs.LG

Polynomially Over-Parameterized Convolutional Neural Networks Contain Structured Strong Winning Lottery Tickets

Diese Arbeit beweist erstmals, dass stark überparametrisierte Convolutional Neural Networks durch die Anwendung verallgemeinerter Zufalls-Teilsummen-Probleme strukturierte „Winning Lottery Tickets" enthalten, die kleinere Netzwerke approximieren können, ohne trainiert zu werden.

Arthur da Cunha, Francesco d'Amore, Emanuele Natale2026-03-11🤖 cs.LG

← Zurück Weiter →