cs.LG Arbeiten | Gist.Science

OptEMA: Adaptive Exponential Moving Average for Stochastic Optimization with Zero-Noise Optimality

Die Arbeit stellt OptEMA vor, einen adaptiven Exponential Moving Average-Optimierer für stochastische Probleme, der ohne Kenntnis der Lipschitz-Konstante auskommt und im noise-freien Fall eine nahezu optimale Konvergenzrate von $\widetilde{\mathcal{O}}(T^{-1/2})$ erreicht.

Ganzhao YuanWed, 11 Ma🤖 cs.LG

Generative Drifting is Secretly Score Matching: a Spectral and Variational Perspective

Diese Arbeit stellt theoretisch dar, dass generatives Drifting unter einem Gaußschen Kernel exakt Score Matching auf geglätteten Verteilungen entspricht, und liefert damit durch eine spektrale und variationale Analyse Erklärungen für die Stabilität des Trainings, die Wahl des Kernels sowie eine neue Bandbreiten-Annealing-Strategie zur Überwindung von Konvergenzengpässen.

Erkan Turan, Maks OvsjanikovWed, 11 Ma🤖 cs.LG

SignalMC-MED: A Multimodal Benchmark for Evaluating Biosignal Foundation Models on Single-Lead ECG and PPG

Die Studie stellt SignalMC-MED vor, ein multimodales Benchmark-Verfahren zur systematischen Evaluierung von Biosignal-Foundation-Modellen auf synchronisierten EKG- und PPG-Daten, das zeigt, dass domänenspezifische Modelle und multimodale Fusion die Vorhersageleistung verbessern, während längere Signalsegmente vorteilhafter sind als kürzere.

Fredrik K. Gustafsson, Xiao Gu, Mattia Carletti, Patitapaban Palo, David W. Eyre, David A. CliftonWed, 11 Ma🤖 cs.LG

When Learning Rates Go Wrong: Early Structural Signals in PPO Actor-Critic

Die Studie zeigt, dass der Overfitting-Underfitting-Indicator (OUI) bereits zu einem frühen Trainingszeitpunkt von 10 % als wirksames Signal dient, um in PPO-Actor-Critic-Systemen stabile Lernraten von instabilen zu unterscheiden und dadurch ineffiziente Hyperparametersuchen durch eine präzise Früherkennung zu vermeiden.

Alberto Fernández-Hernández, Cristian Pérez-Corral, Jose I. Mestre, Manuel F. Dolz, Jose Duato, Enrique S. Quintana-OrtíWed, 11 Ma🤖 cs.AI

Towards a Neural Debugger for Python

Die Arbeit stellt „Neural Debuggers" vor, eine neue Klasse von Sprachmodellen, die traditionelle Debugger-Funktionen wie das Setzen von Haltepunkten und das schrittweise Durchlaufen von Code nachahmen, um sowohl die Vorwärts- als auch die Rückwärtsausführung von Python-Programmen zuverlässig zu modellieren und so die Grundlage für fortschrittlichere Agenten-basierte Codiersysteme zu legen.

Maximilian Beck, Jonas Gehring, Jannik Kossen, Gabriel SynnaeveWed, 11 Ma🤖 cs.AI

On the Width Scaling of Neural Optimizers Under Matrix Operator Norms I: Row/Column Normalization and Hyperparameter Transfer

Die Arbeit führt eine neue Familie von mittelnormalisierten Operator-Normen ein, um stabilen Lernraten-Transfer über verschiedene Netzwerkbreiten hinweg zu ermöglichen, und stellt den darauf basierenden Optimierer MOGA vor, der in großen Sprachmodellen mit Muon konkurrierbar ist und dabei schneller konvergiert.

Ruihan Xu, Jiajin Li, Yiping LuWed, 11 Ma🤖 cs.LG

From Semantics to Pixels: Coarse-to-Fine Masked Autoencoders for Hierarchical Visual Understanding

Die Arbeit stellt C2FMAE vor, einen hierarchischen Masked Autoencoder, der durch einen kaskadierten Decoder und einen progressiven Maskierungs-Lehrplan semantische, instanzbasierte und pixelgenaue Repräsentationen vereint, um die inhärenten Spannungen zwischen kontrastivem Lernen und Masked Image Modeling aufzulösen und so robustere visuelle Darstellungen zu erlernen.

Wenzhao Xiang, Yue Wu, Hongyang Yu, Feng Gao, Fan Yang, Xilin ChenWed, 11 Ma🤖 cs.LG

Think Before You Lie: How Reasoning Improves Honesty

Die Studie zeigt, dass im Gegensatz zum menschlichen Verhalten das Nachdenken bei großen Sprachmodellen die Ehrlichkeit erhöht, da der Prozess des moralischen Abwägens das Modell durch einen verzerrten Repräsentationsraum führt, in dem ehrliche Antworten stabiler sind als täuschende.

Ann Yuan, Asma Ghandeharioun, Carter Blum, Alicia Machado, Jessica Hoffmann, Daphne Ippolito, Martin Wattenberg, Lucas Dixon, Katja FilippovaWed, 11 Ma🤖 cs.AI

From Data Statistics to Feature Geometry: How Correlations Shape Superposition

Die Studie zeigt, dass in realistischen Szenarien mit korrelierten Merkmalen Interferenz konstruktiv genutzt werden kann, um semantische Cluster und zyklische Strukturen zu bilden, was die traditionelle Sichtweise der Superposition als rein störendes Rauschen erweitert.

Lucas Prieto, Edward Stevinson, Melih Barsbey, Tolga Birdal, Pedro A. M. MedianoWed, 11 Ma🤖 cs.AI

Task Aware Modulation Using Representation Learning for Upsaling of Terrestrial Carbon Fluxes

Die Studie stellt TAM-RL vor, ein Framework, das durch die Kombination von räumlich-zeitlichem Repräsentationslernen mit physikalisch fundierten Constraints die Genauigkeit und Übertragbarkeit von hochskalierten terrestrischen Kohlenstoffflüssen im Vergleich zu bestehenden Methoden signifikant verbessert.

Aleksei Rozanov, Arvind Renganathan, Vipin KumarWed, 11 Ma🤖 cs.LG

Online Neural Networks for Change-Point Detection

In diesem Paper werden zwei auf neuronalen Netzen und Online-Lernen basierende Verfahren zur Erkennung von Strukturbrüchen in großen Zeitreihen vorgestellt, die sich durch lineare Komplexität, Überlegenheit gegenüber bestehenden Methoden und bewiesene Konvergenz auszeichnen.

Mikhail Hushchyn, Kenenbek Arzymatov, Denis DerkachTue, 10 Ma🤖 cs.LG

A White-Box SVM Framework and its Swarm-Based Optimization for Supervision of Toothed Milling Cutter through Characterization of Spindle Vibrations

Diese Arbeit stellt ein weißes SVM-Framework mit schwarmbasierter Optimierung vor, das zur Überwachung von Zahnfräsern durch die Echtzeit-Charakterisierung von Spindelvibrationen und die Analyse von Verschleißmustern dient.

Tejas Y. Deo, B. B. Deshmukh, Keshav H. Jatakar, Kamlesh M. Chhajed, S. S. Pardeshi, R. Jegadeeshwaran, Apoorva N. Khairnar, Hrushikesh S. Khade, A. D. PatangeTue, 10 Ma🤖 cs.LG

Automated Reinforcement Learning: An Overview

Dieser Artikel bietet einen Überblick über das automatisierte Reinforcement Learning (AutoRL), das verschiedene Komponenten wie MDP-Modellierung, Algorithmusauswahl und Hyperparameter-Optimierung automatisiert, und fasst dabei aktuelle Forschung, einschließlich LLM-basierter Techniken, sowie zukünftige Herausforderungen und Forschungsrichtungen zusammen.

Reza Refaei Afshar, Joaquin Vanschoren, Uzay Kaymak, Rui Zhang, Yaoxin Wu, Wen Song, Yingqian ZhangTue, 10 Ma🤖 cs.LG

Explainable classification of astronomical uncertain time series

Diese Arbeit stellt ein erklärbares, unsicherheitsbewusstes Subsequenz-Modell vor, das die Klassifizierung astronomischer Zeitreihen mit vergleichbarer Leistung wie Black-Box-Methoden ermöglicht, indem es Datenunsicherheit direkt als Eingabe verarbeitet und Domain-Experten die Nachvollziehbarkeit der Vorhersagen sowie potenzielle neue Erkenntnisse für die theoretische Astrophysik bietet.

Michael Franklin Mbouopda (LIMOS, UCA), Emille E. O. Ishida (LIMOS, UCA), Engelbert Mephu Nguifo (LIMOS, UCA), Emmanuel Gangler (LPC, UCA)Tue, 10 Ma🔭 astro-ph

Empirical Asset Pricing via Ensemble Gaussian Process Regression

Die Studie stellt eine effiziente Ensemble-Methode auf Basis der Gauß-Prozess-Regression vor, die für US-Aktien von 1962 bis 2016 sowohl statistisch als auch wirtschaftlich überlegene Renditevorhersagen liefert und durch die Einbeziehung von Unsicherheiten in ein mean-variance-optimiertes Portfolio eine signifikante Outperformance gegenüber dem S&P 500 ermöglicht.

Damir Filipovic, Puneet PasrichaTue, 10 Ma🤖 cs.LG

Cost-Driven Representation Learning for Linear Quadratic Gaussian Control: Part I

Dieser Beitrag stellt eine kostengesteuerte Methode zur Erlernung von Zustandsrepräsentationen für die lineare quadratische Gaußsche (LQG) Steuerung vor und liefert erstmals endliche Stichproben-Garantien für die Konvergenz zu einem nahezu optimalen Regler, indem ein latentes Modell ausschließlich durch die Vorhersage von Kosten statt von Beobachtungen gelernt wird.

Yi Tian, Kaiqing Zhang, Russ Tedrake, Suvrit SraTue, 10 Ma🤖 cs.LG

Remaining-data-free Machine Unlearning by Suppressing Sample Contribution

Die Arbeit stellt MU-Mis vor, eine bahnbrechende Methode zum maschinellen Vergessen, die durch die direkte Unterdrückung der Sensitivität des Modells gegenüber den zu vergessenden Daten diese vollständig entfernt, ohne dabei die Leistung auf den verbleibenden Daten zu beeinträchtigen oder Zugriff auf diese Daten zu benötigen.

Xinwen Cheng, Zhehao Huang, Wenxin Zhou, Zhengbao He, Ruikai Yang, Yingwen Wu, Xiaolin HuangTue, 10 Ma🤖 cs.LG

Survey of Computerized Adaptive Testing: A Machine Learning Perspective

Dieser Übersichtsartikel bietet eine maschinelle Lernperspektive auf den Computerized Adaptive Testing (CAT), indem er die Integration von ML-Techniken in Messmodelle, Fragenauswahl, Itembank-Konstruktion und Teststeuerung analysiert, um robuste, faire und effiziente adaptive Testsysteme zu entwickeln.

Yan Zhuang, Qi Liu, Haoyang Bi, Zhenya Huang, Weizhe Huang, Jiatong Li, Junhao Yu, Zirui Liu, Zirui Hu, Yuting Hong, Zachary A. Pardos, Haiping Ma, Mengxiao Zhu, Shijin Wang, Enhong ChenTue, 10 Ma🤖 cs.LG

Simulating Non-Markovian Open Quantum Dynamics with Neural Quantum States

Die vorgestellte Arbeit führt das NQS-DQME-Framework ein, das künstliche neuronale Netze mit dissipaton-embeddeter Master-Gleichung kombiniert, um nicht-Markovsche offene Quantendynamiken effizient und skalierbar zu simulieren, wobei die Genauigkeit numerisch exakter Methoden bewahrt wird.

Long Cao, Liwei Ge, Daochi Zhang, Xiang Li, Yao Wang, Rui-Xue Xu, YiJing Yan, Xiao ZhengTue, 10 Ma⚛️ quant-ph

LoRA-Ensemble: Efficient Uncertainty Modelling for Self-Attention Networks

Die Arbeit stellt LoRA-Ensemble vor, eine parametereffiziente Methode zur Unsicherheitsmodellierung in Self-Attention-Netzwerken, die durch die Nutzung individueller Low-Rank-Matrizen innerhalb eines geteilten Moduls die Genauigkeit expliziter Ensembles erreicht und gleichzeitig eine überlegene Kalibrierung sowie geringere Rechenkosten bietet.

Dominik J. Mühlematter, Michelle Halbheer, Alexander Becker, Dominik Narnhofer, Helge Aasen, Konrad Schindler, Mehmet Ozgur TurkogluTue, 10 Ma🤖 cs.LG

← Zurück Weiter →