cs.LG Arbeiten | Gist.Science

AutoQD: Automatic Discovery of Diverse Behaviors with Quality-Diversity Optimization

Das Paper stellt AutoQD vor, einen theoretisch fundierten Ansatz, der mithilfe von Zufalls-Fourier-Features und Occupancy-Maßen automatisch aussagekräftige Verhaltensdeskriptoren für Quality-Diversity-Optimierung generiert, wodurch die Abhängigkeit von manuell definierten Merkmalen überwunden und eine offene Entdeckung vielfältiger Verhaltensweisen in der Reinforcement Learning ermöglicht wird.

Saeed Hedayatian, Stefanos Nikolaidis2026-03-05🤖 cs.AI

Robust Adversarial Quantification via Conflict-Aware Evidential Deep Learning

Die vorgestellte Arbeit führt Conflict-Aware Evidential Deep Learning (C-EDL) ein, eine leichte Nachbearbeitungsmethode, die durch die Quantifizierung von Repräsentationswidersprüchen mittels diverser Transformationen die Robustheit von Evidential Deep Learning gegenüber adversariellen Angriffen und Out-of-Distribution-Daten signifikant verbessert, ohne dass ein Nachtraining erforderlich ist.

Charmaine Barker, Daniel Bethell, Simos Gerasimou2026-03-05🤖 cs.AI

Honesty in Causal Forests: When It Helps and When It Hurts

Die Studie zeigt, dass die standardmäßige „ehrliche" Schätzung bei Causal Forests die Genauigkeit individueller Behandlungseffekte beeinträchtigen kann, da sie durch die Aufteilung der Daten das Risiko des Underfitting erhöht, und empfiehlt daher eine anwendungsbezogene Abwägung statt einer reflexiven Anwendung.

Yanfang Hou, Carlos Fernández-Loría2026-03-05🤖 cs.LG

Federated ADMM from Bayesian Duality

Die Autoren stellen einen neuen bayesschen Ansatz vor, der die federierten ADMM-Methoden durch die Ausnutzung einer Variational-Bayes-Dualität verallgemeinert und dabei sowohl bekannte Updates als auch leistungsfähige neue Varianten wie Newton- und Adam-ähnliche Algorithmen für heterogene Deep-Learning-Szenarien hervorbringt.

Thomas Möllenhoff, Siddharth Swaroop, Finale Doshi-Velez + 1 more2026-03-05🤖 cs.LG

On the Limits of Sparse Autoencoders: A Theoretical Framework and Reweighted Remedy

Diese Arbeit liefert eine theoretische Analyse, die zeigt, dass herkömmliche Sparse Autoencoder die Wiederherstellung monosemantischer Merkmale oft versagen, und schlägt eine gewichtete Variante (WSAE) vor, die durch eine gezielte Umverteilung die Interpretierbarkeit signifikant verbessert.

Jingyi Cui, Qi Zhang, Yifei Wang + 1 more2026-03-05🤖 cs.LG

Context Biasing for Pronunciation-Orthography Mismatch in Automatic Speech Recognition

Die vorgestellte Methode verbessert die Erkennungsgenauigkeit von Wörtern mit Aussprache-Rechtschreib-Unterschieden in automatischen Spracherkennungssystemen durch die Nutzung von Korrekturdaten während der Inferenz, was zu einer signifikanten Reduzierung des Fehleranteils bei verzerrten Wörtern führt, ohne die Gesamtleistung zu beeinträchtigen.

Christian Huber, Alexander Waibel2026-03-05🤖 cs.LG

UMA: A Family of Universal Models for Atoms

Meta FAIR stellt UMA vor, eine Familie universeller Atommodelle, die auf einer einzigartigen Datenbank von 500 Millionen 3D-Strukturen trainiert wurden und durch eine innovative Architektur aus linearen Experten sowohl hohe Genauigkeit als auch Geschwindigkeit bieten, wodurch ein einzelnes Modell ohne Feinabstimmung in der Lage ist, spezialisierte Modelle in verschiedenen chemischen und materialwissenschaftlichen Anwendungen zu übertreffen.

Brandon M. Wood, Misko Dzamba, Xiang Fu + 15 more2026-03-05🤖 cs.LG

UQLM: A Python Package for Uncertainty Quantification in Large Language Models

Das Paper stellt UQLM, ein Python-Paket vor, das fortschrittliche Techniken zur Unsicherheitsquantifizierung nutzt, um Halluzinationen in großen Sprachmodellen durch die Berechnung von Konfidenzwerten zu erkennen und so die Zuverlässigkeit der Ausgaben zu erhöhen.

Dylan Bouchard, Mohit Singh Chauhan, David Skarbrevik + 3 more2026-03-05🤖 cs.AI

Q-Guided Stein Variational Model Predictive Control via RL-informed Policy Prior

Die Arbeit stellt Q-SVMPC vor, eine Methode, die modellprädiktive Steuerung mit einem RL-basierten Prior und Stein-Variational Gradient Descent kombiniert, um unter Q-Wert-Leitung diverse Trajektorien zu inferieren und so die Effizienz, Stabilität und Robustheit in verschiedenen robotischen Anwendungen zu verbessern.

Shizhe Cai, Zeya Yin, Jayadeep Jacob + 1 more2026-03-05🤖 cs.AI

Fast Equivariant Imaging: Acceleration for Unsupervised Learning via Augmented Lagrangian and Auxiliary PnP Denoisers

Die vorgestellte Arbeit entwickelt „Fast Equivariant Imaging" (FEI), ein neuartiges unüberwachtes Lernframework, das durch die Kombination von Augmented Lagrangian und Plug-and-Play-Denoisern das Training von Bildgebungsnetzwerken ohne Ground-Truth-Daten um den Faktor 10 beschleunigt und gleichzeitig die Generalisierungsleistung verbessert.

Guixian Xu, Jinglai Li, Junqi Tang2026-03-05🤖 cs.LG

Knowing When to Quit: Probabilistic Early Exits for Speech Separation

Die Autoren stellen eine probabilistische Architektur für die Ein-Kanal-Sprachtrennung vor, die durch unsicherheitsbasierte Frühbeendigung die Rechenleistung dynamisch an die Anforderungen anpasst und dabei sowohl Recheneffizienz als auch eine hohe Rekonstruktionsqualität gewährleistet.

Kenny Falkær Olsen, Mads Østergaard, Karl Ulbæk + 4 more2026-03-05🤖 cs.LG

Function Induction and Task Generalization: An Interpretability Study with Off-by-One Addition

Diese Studie nutzt Interpretierbarkeitsmethoden, um zu zeigen, wie Large Language Models durch einen neuartigen Mechanismus namens „Funktionsinduktion" generalisieren, bei dem parallele Aufmerksamkeitsköpfe abstrakte Funktionen (wie eine Off-by-One-Addition) lernen und auf diverse neue Aufgaben übertragen.

Qinyuan Ye, Robin Jia, Xiang Ren2026-03-05🤖 cs.AI

Finite-Dimensional Gaussian Approximation for Deep Neural Networks: Universality in Random Weights

Die Arbeit beweist, dass die endlich-dimensionalen Verteilungen von tiefen neuronalen Netzen mit zufällig initialisierten Gewichten und Lipschitz-stetigen Aktivierungsfunktionen bei wachsender Schichtbreite gegen eine Gauß-Verteilung konvergieren, wobei für proportional wachsende Schichten explizite Konvergenzraten hergeleitet werden.

Krishnakumar Balasubramanian, Nathan Ross2026-03-05🤖 cs.LG

Self-Supervised Inductive Logic Programming

Die Arbeit stellt Poker vor, ein neues selbstüberwachtes Induktives Logikprogrammierungssystem, das ohne negative Beispiele oder maßgeschneiderte Hintergrundtheorien auskommt, indem es automatisch neue Trainingsbeispiele generiert und eine zweite Ordnung Definite Normal Form (SONF) als allgemeine Hintergrundtheorie verwendet, um rekursive Logikprogramme zu erlernen.

Stassa Patsantzis2026-03-05🤖 cs.AI

Effective Sample Size and Generalization Bounds for Temporal Networks

Die Arbeit schlägt eine abhängigkeitssensible Evaluierungsmethodik vor, die die effektive Stichprobengröße statt der Rohlänge berücksichtigt, und liefert damit generalisierbare Garantien für Temporal Convolutional Networks auf β-mischenden Sequenzen, die zeigen, dass stärkere zeitliche Abhängigkeiten bei korrekter Kontrolle die Generalisierungslücken sogar verringern können.

Barak Gahtan, Alex M. Bronstein2026-03-05🤖 cs.AI

ObfusQAte: A Proposed Framework to Evaluate LLM Robustness on Obfuscated Factual Question Answering

Die Studie stellt ObfusQAte und das darauf aufbauende Framework ObfusQA vor, um die Robustheit von Large Language Models bei der Beantwortung von Fragen mit mehrstufiger Verschleierung zu evaluieren und dabei festzustellen, dass Modelle bei solchen nuancierten Variationen häufig versagen oder Halluzinationen produzieren.

Shubhra Ghosh, Abhilekh Borah, Aditya Kumar Guru + 1 more2026-03-05🤖 cs.AI

Subsampling Factorization Machine Annealing

Die Autoren stellen Subsampling Factorization Machine Annealing (SFMA) vor, einen optimierten Algorithmus für die schwarze-Box-Optimierung, der durch das Training auf Stichprobendatensätzen eine ausgewogene Balance zwischen Exploration und Exploitation erreicht und damit gegenüber dem ursprünglichen FMA-Verfahren sowohl in Geschwindigkeit als auch Genauigkeit überlegen ist.

Yusuke Hama, Tadashi Kadowaki2026-03-05⚛️ quant-ph

On the Generalization Limits of Quantum Generative Adversarial Networks with Pure State Generators

Die Studie zeigt, dass Quanten-Generative Adversarial Networks (QGANs) mit reinen Zuständen als Generatoren aufgrund analytisch hergeleiteter Fidelity-Schranken Schwierigkeiten haben, Trainingsdaten zu generalisieren, und stattdessen lediglich deren Durchschnittsrepräsentation lernen.

Jasmin Frkatovic, Akash Malemath, Ivan Kankeu + 7 more2026-03-05⚛️ quant-ph

Zono-Conformal Prediction: Zonotope-Based Uncertainty Quantification for Regression and Classification Tasks

Die Arbeit stellt „Zono-Conformal Prediction" vor, eine neue Methode zur Unsicherheitsquantifizierung, die mittels Zonotopen effizientere und weniger konservative Vorhersagemengen für Regressions- und Klassifikationsaufgaben bereitstellt als bestehende Ansätze.

Laura Lützow, Michael Eichelbeck, Mykel J. Kochenderfer + 1 more2026-03-05🤖 cs.AI

Adaptive Quantized Planetary Crater Detection System for Autonomous Space Exploration

Dieses Konzeptpapier stellt das Adaptive Quantized Planetary Crater Detection System (AQ-PCDSys) vor, eine Architektur, die durch Quantisierungsbewusstes Training und adaptive Multi-Sensor-Fusion die Echtzeit-Erkennung von Planetenkranzern auf ressourcenbeschränkter, strahlungsharter Weltraumhardware ermöglicht.

Aditri Paul, Archan Paul2026-03-05🤖 cs.AI

← Zurück Weiter →