cs.LG Arbeiten | Gist.Science

SafeDPO: A Simple Approach to Direct Preference Optimization with Enhanced Safety

Das Paper stellt SafeDPO vor, eine einfache und theoretisch fundierte Methode zur direkten Optimierung von Präferenzen, die die Sicherheit von Large Language Models ohne komplexe Zusatzmodelle oder Online-Sampling verbessert und dabei die Hilfsbereitschaft erhält.

Geon-Hyeong Kim, Yu Jin Kim, Byoungjip Kim + 4 more2026-03-05🤖 cs.AI

Do We Need All the Synthetic Data? Targeted Image Augmentation via Diffusion Models

Die Arbeit stellt TADA vor, ein Framework zur gezielten Bildaugmentation mittels Diffusionsmodellen, das durch selektive Erweiterung nur derjenigen Trainingsdaten, die zu Beginn des Lernprozesses noch nicht erfasst wurden, die Generalisierungsfähigkeit von Bildklassifizierern effizient verbessert und dabei den Rechenaufwand im Vergleich zu herkömmlichen Methoden signifikant reduziert.

Dang Nguyen, Jiping Li, Jinghao Zheng + 1 more2026-03-05🤖 cs.LG

A Copula Based Supervised Filter for Feature Selection in Diabetes Risk Prediction Using Machine Learning

Die Studie stellt einen effizienten, kopulabasierten Filter vor, der Merkmale anhand ihrer gemeinsamen Extremwerte mit der positiven Klasse bewertet und sich in der Diabetes-Risikovorhersage als schneller und klinisch interpretierbarer Ansatz erweist, der insbesondere bei großen Datensätzen mit Standardmethoden konkurrieren kann.

Agnideep Aich, Md Monzur Murshed, Sameera Hewage + 1 more2026-03-05🤖 cs.LG

Boosting In-Context Learning in LLMs Through the Lens of Classical Supervised Learning

Die Arbeit stellt „Supervised Calibration" (SC) vor, ein auf Verlustminimierung basierendes Framework, das durch das Lernen optimaler affiner Transformationen im Logit-Raum und die Integration spezieller Regularisierungstechniken die Grenzen bestehender Kalibrierungsmethoden überwindet und so die Leistung von Large Language Models beim In-Context Learning signifikant verbessert.

Korel Gundem, Juncheng Dong, Dennis Zhang + 2 more2026-03-05🤖 cs.AI

An Approximation Theory Perspective on Machine Learning

Diese Arbeit bietet eine Übersicht über die Lücke zwischen Approximationstheorie und maschinellem Lernen, diskutiert aktuelle Trends wie tiefe Netzwerke und physik-informierte Surrogate, und stellt eine neue Forschung vor, die Funktionsapproximation auf unbekannten Mannigfaltigkeiten ohne explizite Merkmalslernen ermöglicht.

Hrushikesh N. Mhaskar, Efstratios Tsoukanis, Ameya D. Jagtap2026-03-05🤖 cs.LG

Structural Vibration Monitoring with Diffractive Optical Processors

Die Autoren stellen ein energieeffizientes und kostengünstiges System zur strukturellen Schwingungsüberwachung vor, das eine gemeinsam optimierte diffraktive Schicht mit einem neuronalen Netz kombiniert, um 3D-Schwingungsspektren von Bauwerken präzise und in Echtzeit zu rekonstruieren.

Yuntian Wang, Zafer Yilmaz, Yuhang Li + 5 more2026-03-05🔬 physics.optics

AutoQD: Automatic Discovery of Diverse Behaviors with Quality-Diversity Optimization

Das Paper stellt AutoQD vor, einen theoretisch fundierten Ansatz, der mithilfe von Zufalls-Fourier-Features und Occupancy-Maßen automatisch aussagekräftige Verhaltensdeskriptoren für Quality-Diversity-Optimierung generiert, wodurch die Abhängigkeit von manuell definierten Merkmalen überwunden und eine offene Entdeckung vielfältiger Verhaltensweisen in der Reinforcement Learning ermöglicht wird.

Saeed Hedayatian, Stefanos Nikolaidis2026-03-05🤖 cs.AI

Robust Adversarial Quantification via Conflict-Aware Evidential Deep Learning

Die vorgestellte Arbeit führt Conflict-Aware Evidential Deep Learning (C-EDL) ein, eine leichte Nachbearbeitungsmethode, die durch die Quantifizierung von Repräsentationswidersprüchen mittels diverser Transformationen die Robustheit von Evidential Deep Learning gegenüber adversariellen Angriffen und Out-of-Distribution-Daten signifikant verbessert, ohne dass ein Nachtraining erforderlich ist.

Charmaine Barker, Daniel Bethell, Simos Gerasimou2026-03-05🤖 cs.AI

Honesty in Causal Forests: When It Helps and When It Hurts

Die Studie zeigt, dass die standardmäßige „ehrliche" Schätzung bei Causal Forests die Genauigkeit individueller Behandlungseffekte beeinträchtigen kann, da sie durch die Aufteilung der Daten das Risiko des Underfitting erhöht, und empfiehlt daher eine anwendungsbezogene Abwägung statt einer reflexiven Anwendung.

Yanfang Hou, Carlos Fernández-Loría2026-03-05🤖 cs.LG

Federated ADMM from Bayesian Duality

Die Autoren stellen einen neuen bayesschen Ansatz vor, der die federierten ADMM-Methoden durch die Ausnutzung einer Variational-Bayes-Dualität verallgemeinert und dabei sowohl bekannte Updates als auch leistungsfähige neue Varianten wie Newton- und Adam-ähnliche Algorithmen für heterogene Deep-Learning-Szenarien hervorbringt.

Thomas Möllenhoff, Siddharth Swaroop, Finale Doshi-Velez + 1 more2026-03-05🤖 cs.LG

On the Limits of Sparse Autoencoders: A Theoretical Framework and Reweighted Remedy

Diese Arbeit liefert eine theoretische Analyse, die zeigt, dass herkömmliche Sparse Autoencoder die Wiederherstellung monosemantischer Merkmale oft versagen, und schlägt eine gewichtete Variante (WSAE) vor, die durch eine gezielte Umverteilung die Interpretierbarkeit signifikant verbessert.

Jingyi Cui, Qi Zhang, Yifei Wang + 1 more2026-03-05🤖 cs.LG

Context Biasing for Pronunciation-Orthography Mismatch in Automatic Speech Recognition

Die vorgestellte Methode verbessert die Erkennungsgenauigkeit von Wörtern mit Aussprache-Rechtschreib-Unterschieden in automatischen Spracherkennungssystemen durch die Nutzung von Korrekturdaten während der Inferenz, was zu einer signifikanten Reduzierung des Fehleranteils bei verzerrten Wörtern führt, ohne die Gesamtleistung zu beeinträchtigen.

Christian Huber, Alexander Waibel2026-03-05🤖 cs.LG

UMA: A Family of Universal Models for Atoms

Meta FAIR stellt UMA vor, eine Familie universeller Atommodelle, die auf einer einzigartigen Datenbank von 500 Millionen 3D-Strukturen trainiert wurden und durch eine innovative Architektur aus linearen Experten sowohl hohe Genauigkeit als auch Geschwindigkeit bieten, wodurch ein einzelnes Modell ohne Feinabstimmung in der Lage ist, spezialisierte Modelle in verschiedenen chemischen und materialwissenschaftlichen Anwendungen zu übertreffen.

Brandon M. Wood, Misko Dzamba, Xiang Fu + 15 more2026-03-05🤖 cs.LG

UQLM: A Python Package for Uncertainty Quantification in Large Language Models

Das Paper stellt UQLM, ein Python-Paket vor, das fortschrittliche Techniken zur Unsicherheitsquantifizierung nutzt, um Halluzinationen in großen Sprachmodellen durch die Berechnung von Konfidenzwerten zu erkennen und so die Zuverlässigkeit der Ausgaben zu erhöhen.

Dylan Bouchard, Mohit Singh Chauhan, David Skarbrevik + 3 more2026-03-05🤖 cs.AI

Q-Guided Stein Variational Model Predictive Control via RL-informed Policy Prior

Die Arbeit stellt Q-SVMPC vor, eine Methode, die modellprädiktive Steuerung mit einem RL-basierten Prior und Stein-Variational Gradient Descent kombiniert, um unter Q-Wert-Leitung diverse Trajektorien zu inferieren und so die Effizienz, Stabilität und Robustheit in verschiedenen robotischen Anwendungen zu verbessern.

Shizhe Cai, Zeya Yin, Jayadeep Jacob + 1 more2026-03-05🤖 cs.AI

Fast Equivariant Imaging: Acceleration for Unsupervised Learning via Augmented Lagrangian and Auxiliary PnP Denoisers

Die vorgestellte Arbeit entwickelt „Fast Equivariant Imaging" (FEI), ein neuartiges unüberwachtes Lernframework, das durch die Kombination von Augmented Lagrangian und Plug-and-Play-Denoisern das Training von Bildgebungsnetzwerken ohne Ground-Truth-Daten um den Faktor 10 beschleunigt und gleichzeitig die Generalisierungsleistung verbessert.

Guixian Xu, Jinglai Li, Junqi Tang2026-03-05🤖 cs.LG

Knowing When to Quit: Probabilistic Early Exits for Speech Separation

Die Autoren stellen eine probabilistische Architektur für die Ein-Kanal-Sprachtrennung vor, die durch unsicherheitsbasierte Frühbeendigung die Rechenleistung dynamisch an die Anforderungen anpasst und dabei sowohl Recheneffizienz als auch eine hohe Rekonstruktionsqualität gewährleistet.

Kenny Falkær Olsen, Mads Østergaard, Karl Ulbæk + 4 more2026-03-05🤖 cs.LG

Function Induction and Task Generalization: An Interpretability Study with Off-by-One Addition

Diese Studie nutzt Interpretierbarkeitsmethoden, um zu zeigen, wie Large Language Models durch einen neuartigen Mechanismus namens „Funktionsinduktion" generalisieren, bei dem parallele Aufmerksamkeitsköpfe abstrakte Funktionen (wie eine Off-by-One-Addition) lernen und auf diverse neue Aufgaben übertragen.

Qinyuan Ye, Robin Jia, Xiang Ren2026-03-05🤖 cs.AI

Finite-Dimensional Gaussian Approximation for Deep Neural Networks: Universality in Random Weights

Die Arbeit beweist, dass die endlich-dimensionalen Verteilungen von tiefen neuronalen Netzen mit zufällig initialisierten Gewichten und Lipschitz-stetigen Aktivierungsfunktionen bei wachsender Schichtbreite gegen eine Gauß-Verteilung konvergieren, wobei für proportional wachsende Schichten explizite Konvergenzraten hergeleitet werden.

Krishnakumar Balasubramanian, Nathan Ross2026-03-05🤖 cs.LG

Self-Supervised Inductive Logic Programming

Die Arbeit stellt Poker vor, ein neues selbstüberwachtes Induktives Logikprogrammierungssystem, das ohne negative Beispiele oder maßgeschneiderte Hintergrundtheorien auskommt, indem es automatisch neue Trainingsbeispiele generiert und eine zweite Ordnung Definite Normal Form (SONF) als allgemeine Hintergrundtheorie verwendet, um rekursive Logikprogramme zu erlernen.

Stassa Patsantzis2026-03-05🤖 cs.AI

← Zurück Weiter →