Generative Drifting is Secretly Score Matching: a Spectral and Variational Perspective

Diese Arbeit stellt theoretisch dar, dass generatives Drifting unter einem Gaußschen Kernel exakt Score Matching auf geglätteten Verteilungen entspricht, und liefert damit durch eine spektrale und variationale Analyse Erklärungen für die Stabilität des Trainings, die Wahl des Kernels sowie eine neue Bandbreiten-Annealing-Strategie zur Überwindung von Konvergenzengpässen.

Erkan Turan, Maks OvsjanikovWed, 11 Ma🤖 cs.LG

SignalMC-MED: A Multimodal Benchmark for Evaluating Biosignal Foundation Models on Single-Lead ECG and PPG

Die Studie stellt SignalMC-MED vor, ein multimodales Benchmark-Verfahren zur systematischen Evaluierung von Biosignal-Foundation-Modellen auf synchronisierten EKG- und PPG-Daten, das zeigt, dass domänenspezifische Modelle und multimodale Fusion die Vorhersageleistung verbessern, während längere Signalsegmente vorteilhafter sind als kürzere.

Fredrik K. Gustafsson, Xiao Gu, Mattia Carletti, Patitapaban Palo, David W. Eyre, David A. CliftonWed, 11 Ma🤖 cs.LG

When Learning Rates Go Wrong: Early Structural Signals in PPO Actor-Critic

Die Studie zeigt, dass der Overfitting-Underfitting-Indicator (OUI) bereits zu einem frühen Trainingszeitpunkt von 10 % als wirksames Signal dient, um in PPO-Actor-Critic-Systemen stabile Lernraten von instabilen zu unterscheiden und dadurch ineffiziente Hyperparametersuchen durch eine präzise Früherkennung zu vermeiden.

Alberto Fernández-Hernández, Cristian Pérez-Corral, Jose I. Mestre, Manuel F. Dolz, Jose Duato, Enrique S. Quintana-OrtíWed, 11 Ma🤖 cs.AI

Towards a Neural Debugger for Python

Die Arbeit stellt „Neural Debuggers" vor, eine neue Klasse von Sprachmodellen, die traditionelle Debugger-Funktionen wie das Setzen von Haltepunkten und das schrittweise Durchlaufen von Code nachahmen, um sowohl die Vorwärts- als auch die Rückwärtsausführung von Python-Programmen zuverlässig zu modellieren und so die Grundlage für fortschrittlichere Agenten-basierte Codiersysteme zu legen.

Maximilian Beck, Jonas Gehring, Jannik Kossen, Gabriel SynnaeveWed, 11 Ma🤖 cs.AI

From Semantics to Pixels: Coarse-to-Fine Masked Autoencoders for Hierarchical Visual Understanding

Die Arbeit stellt C2FMAE vor, einen hierarchischen Masked Autoencoder, der durch einen kaskadierten Decoder und einen progressiven Maskierungs-Lehrplan semantische, instanzbasierte und pixelgenaue Repräsentationen vereint, um die inhärenten Spannungen zwischen kontrastivem Lernen und Masked Image Modeling aufzulösen und so robustere visuelle Darstellungen zu erlernen.

Wenzhao Xiang, Yue Wu, Hongyang Yu, Feng Gao, Fan Yang, Xilin ChenWed, 11 Ma🤖 cs.LG

Think Before You Lie: How Reasoning Improves Honesty

Die Studie zeigt, dass im Gegensatz zum menschlichen Verhalten das Nachdenken bei großen Sprachmodellen die Ehrlichkeit erhöht, da der Prozess des moralischen Abwägens das Modell durch einen verzerrten Repräsentationsraum führt, in dem ehrliche Antworten stabiler sind als täuschende.

Ann Yuan, Asma Ghandeharioun, Carter Blum, Alicia Machado, Jessica Hoffmann, Daphne Ippolito, Martin Wattenberg, Lucas Dixon, Katja FilippovaWed, 11 Ma🤖 cs.AI

A White-Box SVM Framework and its Swarm-Based Optimization for Supervision of Toothed Milling Cutter through Characterization of Spindle Vibrations

Diese Arbeit stellt ein weißes SVM-Framework mit schwarmbasierter Optimierung vor, das zur Überwachung von Zahnfräsern durch die Echtzeit-Charakterisierung von Spindelvibrationen und die Analyse von Verschleißmustern dient.

Tejas Y. Deo, B. B. Deshmukh, Keshav H. Jatakar, Kamlesh M. Chhajed, S. S. Pardeshi, R. Jegadeeshwaran, Apoorva N. Khairnar, Hrushikesh S. Khade, A. D. PatangeTue, 10 Ma🤖 cs.LG

Automated Reinforcement Learning: An Overview

Dieser Artikel bietet einen Überblick über das automatisierte Reinforcement Learning (AutoRL), das verschiedene Komponenten wie MDP-Modellierung, Algorithmusauswahl und Hyperparameter-Optimierung automatisiert, und fasst dabei aktuelle Forschung, einschließlich LLM-basierter Techniken, sowie zukünftige Herausforderungen und Forschungsrichtungen zusammen.

Reza Refaei Afshar, Joaquin Vanschoren, Uzay Kaymak, Rui Zhang, Yaoxin Wu, Wen Song, Yingqian ZhangTue, 10 Ma🤖 cs.LG

Explainable classification of astronomical uncertain time series

Diese Arbeit stellt ein erklärbares, unsicherheitsbewusstes Subsequenz-Modell vor, das die Klassifizierung astronomischer Zeitreihen mit vergleichbarer Leistung wie Black-Box-Methoden ermöglicht, indem es Datenunsicherheit direkt als Eingabe verarbeitet und Domain-Experten die Nachvollziehbarkeit der Vorhersagen sowie potenzielle neue Erkenntnisse für die theoretische Astrophysik bietet.

Michael Franklin Mbouopda (LIMOS, UCA), Emille E. O. Ishida (LIMOS, UCA), Engelbert Mephu Nguifo (LIMOS, UCA), Emmanuel Gangler (LPC, UCA)Tue, 10 Ma🔭 astro-ph

Cost-Driven Representation Learning for Linear Quadratic Gaussian Control: Part I

Dieser Beitrag stellt eine kostengesteuerte Methode zur Erlernung von Zustandsrepräsentationen für die lineare quadratische Gaußsche (LQG) Steuerung vor und liefert erstmals endliche Stichproben-Garantien für die Konvergenz zu einem nahezu optimalen Regler, indem ein latentes Modell ausschließlich durch die Vorhersage von Kosten statt von Beobachtungen gelernt wird.

Yi Tian, Kaiqing Zhang, Russ Tedrake, Suvrit SraTue, 10 Ma🤖 cs.LG

Remaining-data-free Machine Unlearning by Suppressing Sample Contribution

Die Arbeit stellt MU-Mis vor, eine bahnbrechende Methode zum maschinellen Vergessen, die durch die direkte Unterdrückung der Sensitivität des Modells gegenüber den zu vergessenden Daten diese vollständig entfernt, ohne dabei die Leistung auf den verbleibenden Daten zu beeinträchtigen oder Zugriff auf diese Daten zu benötigen.

Xinwen Cheng, Zhehao Huang, Wenxin Zhou, Zhengbao He, Ruikai Yang, Yingwen Wu, Xiaolin HuangTue, 10 Ma🤖 cs.LG

Survey of Computerized Adaptive Testing: A Machine Learning Perspective

Dieser Übersichtsartikel bietet eine maschinelle Lernperspektive auf den Computerized Adaptive Testing (CAT), indem er die Integration von ML-Techniken in Messmodelle, Fragenauswahl, Itembank-Konstruktion und Teststeuerung analysiert, um robuste, faire und effiziente adaptive Testsysteme zu entwickeln.

Yan Zhuang, Qi Liu, Haoyang Bi, Zhenya Huang, Weizhe Huang, Jiatong Li, Junhao Yu, Zirui Liu, Zirui Hu, Yuting Hong, Zachary A. Pardos, Haiping Ma, Mengxiao Zhu, Shijin Wang, Enhong ChenTue, 10 Ma🤖 cs.LG

LoRA-Ensemble: Efficient Uncertainty Modelling for Self-Attention Networks

Die Arbeit stellt LoRA-Ensemble vor, eine parametereffiziente Methode zur Unsicherheitsmodellierung in Self-Attention-Netzwerken, die durch die Nutzung individueller Low-Rank-Matrizen innerhalb eines geteilten Moduls die Genauigkeit expliziter Ensembles erreicht und gleichzeitig eine überlegene Kalibrierung sowie geringere Rechenkosten bietet.

Dominik J. Mühlematter, Michelle Halbheer, Alexander Becker, Dominik Narnhofer, Helge Aasen, Konrad Schindler, Mehmet Ozgur TurkogluTue, 10 Ma🤖 cs.LG