cs.LG Arbeiten | Gist.Science

A Trust-Region Interior-Point Stochastic Sequential Quadratic Programming Method

Dieses Paper stellt eine neue Trust-Region-Innenpunkt-Stochastische-Sequentielle-Quadratische-Programmierung-Methode (TR-IP-SSQP) vor, die stochastische Zielfunktionen mit deterministischen nichtlinearen Nebenbedingungen löst, globale Konvergenz unter Standardannahmen garantiert und ihre praktische Leistungsfähigkeit an CUTEst-Problemen sowie logistischen Regressionen demonstriert.

Yuchen Fang, Jihun Kim, Sen Na, James Demmel, Javad Lavaei2026-03-12🔢 math

Why Does It Look There? Structured Explanations for Image Classification

Die Arbeit stellt I2X vor, ein Framework, das aus unstrukturierten Interpretierbarkeitsmethoden strukturierte Erklärungen für Bildklassifizierungsmodelle ableitet, um deren Entscheidungsfindung während des Trainings nachvollziehbar zu machen und durch gezielte Optimierung der unsicheren Prototypen die Vorhersagegenauigkeit zu verbessern.

Jiarui Li, Zixiang Yin, Samuel J Landry, Zhengming Ding, Ramgopal R. Mettu2026-03-12🤖 cs.LG

One Adapter for All: Towards Unified Representation in Step-Imbalanced Class-Incremental Learning

Die Arbeit stellt „One-A" vor, ein einheitliches Framework für das schrittweise inkrementelle Lernen bei Klassenungleichgewicht, das durch asymmetrische Subraumausrichtung und richtungsabhängiges Gating stabile Updates für große Aufgaben mit plastischen Anpassungen für kleine Aufgaben in einem einzigen Adapter vereint, um die Leistung zu verbessern und die Inferenzkosten konstant zu halten.

Xiaoyan Zhang, Jiangpeng He2026-03-12🤖 cs.LG

Intrinsic Numerical Robustness and Fault Tolerance in a Neuromorphic Algorithm for Scientific Computing

Die Studie zeigt, dass ein neuromorpher Algorithmus zur Lösung partieller Differentialgleichungen eine außergewöhnliche inhärente Fehlertoleranz aufweist, da er bis zu 32 % der Neuronen und 90 % der Spikes verlieren kann, ohne dass die Genauigkeit signifikant beeinträchtigt wird.

Bradley H. Theilman, James B. Aimone2026-03-12🤖 cs.AI

SiMPO: Measure Matching for Online Diffusion Reinforcement Learning

Die Arbeit stellt SiMPO vor, ein einfaches und einheitliches Framework für das Online-Diffusions-Reinforcement-Learning, das durch die Nutzung von $f$ -Divergenz regularisierter Optimierung und negativer Umgewichtierung eine übermäßige Gierigkeit vermeidet und die Leistung durch flexible, geometrisch fundierte Gewichtungsschemata verbessert.

Haitong Ma, Chenxiao Gao, Tianyi Chen, Na Li, Bo Dai2026-03-12🤖 cs.LG

Bayesian Hierarchical Models and the Maximum Entropy Principle

Die Arbeit zeigt, dass die abhängige Randverteilung in bayesschen hierarchischen Modellen, bei denen die bedingte Prior-Verteilung eine kanonische Maximum-Entropie-Verteilung ist, ebenfalls eine Maximum-Entropie-Eigenschaft bezüglich einer anderen Randverteilungsbedingung aufweist, was die impliziten Annahmen solcher Modelle verdeutlicht.

Brendon J. Brewer2026-03-12📊 stat

Improving TabPFN's Synthetic Data Generation by Integrating Causal Structure

Diese Arbeit verbessert die Qualität und Stabilität der synthetischen Tabellendatengenerierung des Modells TabPFN, indem sie kausale Strukturen durch DAG-basierte Konditionierung und CPDAG-Strategien in den autoregressiven Generierungsprozess integriert, um so kausale Effekte zu erhalten und Scheinkorrelationen zu vermeiden.

Davide Tugnoli, Andrea De Lorenzo, Marco Virgolin, Giovanni Cinà2026-03-12🤖 cs.LG

Discovery of a Hematopoietic Manifold in scGPT Yields a Method for Extracting Performant Algorithms from Biological Foundation Model Internals

Die Studie präsentiert eine dreistufige Methode zur Extraktion eines kompakten, hochleistungsfähigen hämatopoetischen Algorithmus aus dem Foundation-Modell scGPT mittels mechanischer Interpretierbarkeit, der ohne erneutes Training des Ziel-Datensatzes die Leistung bestehender Methoden übertrifft und biologisch interpretierbare Genprogramme offenbart.

Ihor Kendiukhov2026-03-12🧬 q-bio

From Prior to Pro: Efficient Skill Mastery via Distribution Contractive RL Finetuning

Die Arbeit stellt DICE-RL vor, ein effizientes Framework, das vortrainierte generative Robotik-Policies durch eine stabile, sample-effiziente Nachjustierung mit Reinforcement Learning in hochleistungsfähige Expertenmodelle verwandelt, um komplexe Manipulationsaufgaben direkt aus Bilddaten zu meistern.

Zhanyi Sun, Shuran Song2026-03-12🤖 cs.LG

Estimating condition number with Graph Neural Networks

Dieses Paper stellt eine schnelle Methode vor, die Graph Neural Networks nutzt, um den Konditionszahl von dünnbesetzten Matrizen effizient zu schätzen und dabei eine signifikante Beschleunigung gegenüber klassischen Verfahren wie Hager-Higham und Lanczos erreicht.

Erin Carson, Xinye Chen2026-03-12🤖 cs.LG

Robust Post-Training for Generative Recommenders: Why Exponential Reward-Weighted SFT Outperforms RLHF

Diese Arbeit zeigt, dass exponentiell reward-gewichtetes SFT (Supervised Fine-Tuning) eine robustere, skalierbare und theoretisch fundierte Alternative zu RLHF für generative Empfehlungssysteme darstellt, da es Reward-Hacking vermeidet, keine Propensity-Scores benötigt und den Trade-off zwischen Robustheit und Verbesserung durch einen einzigen interpretierbaren Hyperparameter steuert.

Keertana Chidambaram, Sanath Kumar Krishnamurthy, Qiuling Xu, Ko-Jen Hsiao, Moumita Bhattacharya2026-03-12🤖 cs.LG

Taming Score-Based Denoisers in ADMM: A Convergent Plug-and-Play Framework

Diese Arbeit stellt ADMM-PnP mit dem neuartigen AC-DC-Denoiser vor, der durch eine dreistufige Korrektur die Diskrepanz zwischen Trainingsdaten und ADMM-Iterationen überbrückt und unter definierten Bedingungen die Konvergenz von Score-basierten Denoisern in ADMM-Rahmenwerken garantiert.

Rajesh Shrestha, Xiao Fu2026-03-12🤖 cs.LG

GSVD for Geometry-Grounded Dataset Comparison: An Alignment Angle Is All You Need

Diese Arbeit stellt eine neue Methode vor, die die verallgemeinerte Singulärwertzerlegung (GSVD) nutzt, um einen interpretierbaren „Winkel-Score" zu berechnen, der für jede einzelne Stichprobe quantifiziert, ob sie eher durch den einen oder den anderen Datensatz geometrisch erklärt wird.

Eduarda de Souza Marques, Arthur Sobrinho Ferreira da Rocha, Joao Paixao, Heudson Mirandola, Daniel Sadoc Menasche2026-03-12🤖 cs.LG

Copula-ResLogit: A Deep-Copula Framework for Unobserved Confounding Effects

Die Studie stellt Copula-ResLogit vor, ein neuartiges, vollständig interpretierbares Deep-Learning-Framework, das ResNet-Architekturen mit Copula-Modellen kombiniert, um unbeobachtete Störfaktoren in der Verkehrsbedarfsanalyse zu erkennen und zu korrigieren.

Kimia Kamal, Bilal Farooq2026-03-12🤖 cs.LG

MultiwayPAM: Multiway Partitioning Around Medoids for LLM-as-a-Judge Score Analysis

Die vorgestellte Arbeit stellt MultiwayPAM vor, eine neue Tensor-Clustering-Methode, die durch die gleichzeitige Schätzung von Clusterzugehörigkeiten und Medoiden für Fragen, Antwortende und Bewerter hilft, die Rechenkosten und die inhärente Verzerrung bei der Bewertung von Texten durch LLMs zu adressieren und die Struktur dieser Bias aufzudecken.

Chihiro Watanabe, Jingyu Sun2026-03-12📊 stat

Quantum entanglement provides a competitive advantage in adversarial games

Die Studie zeigt, dass Quantenverschränkung in einem hybriden Quanten-Klassischen-Agenten für das Spiel Pong zu einer konsistenten Leistungssteigerung gegenüber separablen Quantenschaltungen und klassischen neuronalen Netzen führt, was die Verschränkung als wertvolle Ressource für das Repräsentationslernen in kompetitiven Reinforcement-Learning-Szenarien etabliert.

Peiyong Wang, Kieran Hymas, James Quach2026-03-12⚛️ quant-ph

Hybrid Self-evolving Structured Memory for GUI Agents

Die Arbeit stellt HyMEM vor, ein hybrides, selbstentwickelndes, graphbasiertes Gedächtnis, das diskrete symbolische Knoten mit kontinuierlichen Embeddings kombiniert, um GUI-Agenten durch strukturierte Mehrhop-Abfragen und dynamische Aktualisierungen zu verbessern und so Open-Source-Modelle mit 7B/8B-Parametern in die Lage zu versetzen, leistungsstarke geschlossene Modelle wie Gemini 2.5 Pro Vision und GPT-4o zu übertreffen.

Sibo Zhu, Wenyi Wu, Kun Zhou, Stephen Wang, Biwei Huang2026-03-12🤖 cs.AI

GaLoRA: Parameter-Efficient Graph-Aware LLMs for Node Classification

Das Paper stellt GaLoRA vor, ein parameter-effizientes Framework, das strukturelle Informationen in Large Language Models integriert, um bei der Knotenklassifizierung in textattribuierten Graphen mit nur 0,24 % der Parameter einer vollständigen Feinabstimmung konkurrenzfähige Ergebnisse zu erzielen.

Mayur Choudhary, Saptarshi Sengupta, Katerina Potika2026-03-12🤖 cs.LG

Regime-aware financial volatility forecasting via in-context learning

Diese Arbeit stellt ein regimebewusstes In-Context-Learning-Framework vor, das vortrainierte Large Language Models ohne Parameter-Feinabstimmung nutzt, um durch kontextbasiertes Schlussfolgern und bedingtes Sampling von Demonstrationen die Finanzvolatilität unter nichtstationären Marktbedingungen präziser vorherzusagen als klassische Ansätze.

Saba Asaad, Shayan Mohajer Hamidi, Ali Bereyhi2026-03-12🤖 cs.LG

What do near-optimal learning rate schedules look like?

Die Studie entwickelt ein Suchverfahren zur Ermittlung nahezu optimaler Lernraten-Schedules für neuronale Netze und zeigt, dass Warmup und Decay wesentliche Merkmale sind, während gängige Schedules oft suboptimal sind und der Weight Decay einen starken Einfluss auf die ideale Schedules-Form hat.

Hiroki Naganuma, Atish Agarwala, Priya Kasimbeg, George E. Dahl2026-03-12🤖 cs.LG

← Zurück Weiter →