cs.LG Arbeiten | Gist.Science

PinRec: Outcome-Conditioned, Multi-Token Generative Retrieval for Industry-Scale Recommendation Systems

Das Paper stellt PinRec vor, ein skalierbares, generatives Retrieval-Modell für Pinterest, das durch outcome-konditionierte und multi-token Generierung die Balance zwischen Geschäftszielen, Vielfalt und Effizienz in industriellen Empfehlungssystemen ermöglicht.

Prabhat Agarwal, Anirudhan Badrinath, Laksh Bhasin + 4 more2026-03-05🤖 cs.LG

When Your Own Output Becomes Your Training Data: Noise-to-Meaning Loops and a Formal RSI Trigger

Die Arbeit stellt N2M-RSI vor, ein formales, implementierungsunabhängiges Modell, das zeigt, wie KI-Agenten durch die Rückkopplung ihrer eigenen Ausgaben als Trainingsdaten eine unbeschränkte Komplexität erreichen können, sobald sie einen bestimmten Informationsintegrations-Schwellenwert überschreiten.

Rintaro Ando2026-03-05🤖 cs.AI

Akkumula: Evidence accumulation driver models with Spiking Neural Networks

Das Papier stellt Akkumula vor, ein Framework zur Nachbildung von Fahrerentscheidungen mittels Spiking Neural Networks, das die realistische, skalierbare und transparente Modellierung von Beschleunigungs-, Brems- und Lenkmanövern ermöglicht.

Alberto Morando2026-03-05🤖 cs.LG

Healthy LLMs? Benchmarking LLM Knowledge of UK Government Public Health Information

Diese Studie stellt mit PubHealthBench einen neuen Benchmark vor, der über 8000 Fragen zu britischen öffentlichen Gesundheitsinformationen enthält und zeigt, dass zwar fortschrittliche proprietäre LLMs bei Multiple-Choice-Fragen menschliche Leistungen übertreffen, ihre Genauigkeit bei freien Textantworten jedoch weiterhin verbesserungswürdig ist und zusätzliche Sicherheitsvorkehrungen erfordert.

Joshua Harris, Fan Grayson, Felix Feldman + 8 more2026-03-05🤖 cs.LG

Emotion-Gradient Metacognitive RSI (Part I): Theoretical Foundations and Single-Agent Architecture

Dieser erste Teil des EG-MRSI-Frameworks etabliert die theoretischen Grundlagen und die Single-Agent-Architektur für ein selbstreflexives System, das emotionale intrinsische Motivation mit metakognitiver Selbstmodifikation unter formalen Sicherheitsgrenzen vereint, um offene AGI-Entwicklung voranzutreiben.

Rintaro Ando2026-03-05🤖 cs.AI

Unsupervised Representation Learning - an Invariant Risk Minimization Perspective

Die Autoren stellen ein neues unüberwachtes Framework für die invariante Risikominimierung vor, das durch Methoden wie PICA und VIAE robuste Repräsentationen aus ungelabelten Daten extrahiert, indem es Invarianz über die Ausrichtung von Merkmalsverteilungen definiert, anstatt auf Labels angewiesen zu sein.

Yotam Norman, Ron Meir2026-03-05✓ Author reviewed ⓘ🤖 cs.AI

TSPulse: Tiny Pre-Trained Models with Disentangled Representations for Rapid Time-Series Analysis

Die Arbeit stellt TSPulse vor, eine Familie ultra-leichter, vortrainierter Modelle mit entkoppelten Repräsentationen, die durch ein neuartiges Pre-Training-Framework und hybride Maskierungsstrategien in der Lage sind, auf über 75 Datensätzen in verschiedenen Zeitreihenaufgaben wie Anomalieerkennung und Imputation state-of-the-art Zero-Shot-Leistungen zu erzielen und dabei deutlich größere Modelle zu übertreffen.

Vijay Ekambaram, Subodh Kumar, Arindam Jati + 5 more2026-03-05🤖 cs.AI

Optimal Best-Arm Identification under Fixed Confidence with Multiple Optima

Diese Arbeit leitet eine strengere informationstheoretische untere Schranke für die erwartete Stichprobenkomplexität bei der Identifizierung des besten Arms in stochastischen Multi-Armed-Bandits mit bekannter Anzahl mehrerer optimaler Arme her und zeigt, dass eine modifizierte Version des Track-and-Stop-Algorithmus diese Schranke asymptotisch erreicht.

Lan V. Truong2026-03-05🤖 cs.LG

Extremely Simple Multimodal Outlier Synthesis for Out-of-Distribution Detection and Segmentation

Die Arbeit stellt eine extrem einfache und theoretisch fundierte Methode namens Feature Mixing zur Synthese multimodaler Ausreißer für die Verbesserung der Out-of-Distribution-Erkennung und -Segmentierung vor, ergänzt durch einen neuen Datensatz namens CARLA-OOD, und demonstriert damit einen neuen State-of-the-Art mit einer bis zu 370-fachen Geschwindigkeitssteigerung.

Moru Liu, Hao Dong, Jessica Kelly + 2 more2026-03-05🤖 cs.AI

Convergence, Sticking and Escape: Stochastic Dynamics Near Critical Points in SGD

Die Arbeit untersucht die Konvergenz- und Fluchtdynamik des stochastischen Gradientenabstiegs in eindimensionalen Landschaften mit unterschiedlichem Rauschen und zeigt, wie Rauschcharakteristika und die Geometrie der Funktion bestimmen, ob SGD in Minima konvergiert, in der Nähe von Maxima verweilt oder diese mit einer bestimmten Wahrscheinlichkeit zu benachbarten Minima überwindet.

Dmitry Dudukalov, Artem Logachov, Vladimir Lotov + 3 more2026-03-05🤖 cs.LG

BAH Dataset for Ambivalence/Hesitancy Recognition in Videos for Digital Behavioural Change

Dieses Paper stellt das BAH-Dataset vor, eine multimodale Videodatenbank mit 1.427 Aufnahmen von 300 Teilnehmern, die zur automatischen Erkennung von Ambivalenz und Zögern in digitalen Verhaltensänderungsinterventionen dient und erste Benchmark-Ergebnisse für die Entwicklung angepasster Modelle liefert.

Manuela González-González, Soufiane Belharbi, Muhammad Osama Zeeshan + 6 more2026-03-05🤖 cs.LG

SafeDPO: A Simple Approach to Direct Preference Optimization with Enhanced Safety

Das Paper stellt SafeDPO vor, eine einfache und theoretisch fundierte Methode zur direkten Optimierung von Präferenzen, die die Sicherheit von Large Language Models ohne komplexe Zusatzmodelle oder Online-Sampling verbessert und dabei die Hilfsbereitschaft erhält.

Geon-Hyeong Kim, Yu Jin Kim, Byoungjip Kim + 4 more2026-03-05🤖 cs.AI

Do We Need All the Synthetic Data? Targeted Image Augmentation via Diffusion Models

Die Arbeit stellt TADA vor, ein Framework zur gezielten Bildaugmentation mittels Diffusionsmodellen, das durch selektive Erweiterung nur derjenigen Trainingsdaten, die zu Beginn des Lernprozesses noch nicht erfasst wurden, die Generalisierungsfähigkeit von Bildklassifizierern effizient verbessert und dabei den Rechenaufwand im Vergleich zu herkömmlichen Methoden signifikant reduziert.

Dang Nguyen, Jiping Li, Jinghao Zheng + 1 more2026-03-05🤖 cs.LG

A Copula Based Supervised Filter for Feature Selection in Diabetes Risk Prediction Using Machine Learning

Die Studie stellt einen effizienten, kopulabasierten Filter vor, der Merkmale anhand ihrer gemeinsamen Extremwerte mit der positiven Klasse bewertet und sich in der Diabetes-Risikovorhersage als schneller und klinisch interpretierbarer Ansatz erweist, der insbesondere bei großen Datensätzen mit Standardmethoden konkurrieren kann.

Agnideep Aich, Md Monzur Murshed, Sameera Hewage + 1 more2026-03-05🤖 cs.LG

Boosting In-Context Learning in LLMs Through the Lens of Classical Supervised Learning

Die Arbeit stellt „Supervised Calibration" (SC) vor, ein auf Verlustminimierung basierendes Framework, das durch das Lernen optimaler affiner Transformationen im Logit-Raum und die Integration spezieller Regularisierungstechniken die Grenzen bestehender Kalibrierungsmethoden überwindet und so die Leistung von Large Language Models beim In-Context Learning signifikant verbessert.

Korel Gundem, Juncheng Dong, Dennis Zhang + 2 more2026-03-05🤖 cs.AI

An Approximation Theory Perspective on Machine Learning

Diese Arbeit bietet eine Übersicht über die Lücke zwischen Approximationstheorie und maschinellem Lernen, diskutiert aktuelle Trends wie tiefe Netzwerke und physik-informierte Surrogate, und stellt eine neue Forschung vor, die Funktionsapproximation auf unbekannten Mannigfaltigkeiten ohne explizite Merkmalslernen ermöglicht.

Hrushikesh N. Mhaskar, Efstratios Tsoukanis, Ameya D. Jagtap2026-03-05🤖 cs.LG

Structural Vibration Monitoring with Diffractive Optical Processors

Die Autoren stellen ein energieeffizientes und kostengünstiges System zur strukturellen Schwingungsüberwachung vor, das eine gemeinsam optimierte diffraktive Schicht mit einem neuronalen Netz kombiniert, um 3D-Schwingungsspektren von Bauwerken präzise und in Echtzeit zu rekonstruieren.

Yuntian Wang, Zafer Yilmaz, Yuhang Li + 5 more2026-03-05🔬 physics.optics

AutoQD: Automatic Discovery of Diverse Behaviors with Quality-Diversity Optimization

Das Paper stellt AutoQD vor, einen theoretisch fundierten Ansatz, der mithilfe von Zufalls-Fourier-Features und Occupancy-Maßen automatisch aussagekräftige Verhaltensdeskriptoren für Quality-Diversity-Optimierung generiert, wodurch die Abhängigkeit von manuell definierten Merkmalen überwunden und eine offene Entdeckung vielfältiger Verhaltensweisen in der Reinforcement Learning ermöglicht wird.

Saeed Hedayatian, Stefanos Nikolaidis2026-03-05🤖 cs.AI

Robust Adversarial Quantification via Conflict-Aware Evidential Deep Learning

Die vorgestellte Arbeit führt Conflict-Aware Evidential Deep Learning (C-EDL) ein, eine leichte Nachbearbeitungsmethode, die durch die Quantifizierung von Repräsentationswidersprüchen mittels diverser Transformationen die Robustheit von Evidential Deep Learning gegenüber adversariellen Angriffen und Out-of-Distribution-Daten signifikant verbessert, ohne dass ein Nachtraining erforderlich ist.

Charmaine Barker, Daniel Bethell, Simos Gerasimou2026-03-05🤖 cs.AI

Honesty in Causal Forests: When It Helps and When It Hurts

Die Studie zeigt, dass die standardmäßige „ehrliche" Schätzung bei Causal Forests die Genauigkeit individueller Behandlungseffekte beeinträchtigen kann, da sie durch die Aufteilung der Daten das Risiko des Underfitting erhöht, und empfiehlt daher eine anwendungsbezogene Abwägung statt einer reflexiven Anwendung.

Yanfang Hou, Carlos Fernández-Loría2026-03-05🤖 cs.LG

← Zurück Weiter →