cs.LG Arbeiten | Gist.Science

Estimating condition number with Graph Neural Networks

Dieses Paper stellt eine schnelle Methode vor, die Graph Neural Networks nutzt, um den Konditionszahl von dünnbesetzten Matrizen effizient zu schätzen und dabei eine signifikante Beschleunigung gegenüber klassischen Verfahren wie Hager-Higham und Lanczos erreicht.

Erin Carson, Xinye Chen2026-03-12🤖 cs.LG

Robust Post-Training for Generative Recommenders: Why Exponential Reward-Weighted SFT Outperforms RLHF

Diese Arbeit zeigt, dass exponentiell reward-gewichtetes SFT (Supervised Fine-Tuning) eine robustere, skalierbare und theoretisch fundierte Alternative zu RLHF für generative Empfehlungssysteme darstellt, da es Reward-Hacking vermeidet, keine Propensity-Scores benötigt und den Trade-off zwischen Robustheit und Verbesserung durch einen einzigen interpretierbaren Hyperparameter steuert.

Keertana Chidambaram, Sanath Kumar Krishnamurthy, Qiuling Xu, Ko-Jen Hsiao, Moumita Bhattacharya2026-03-12🤖 cs.LG

Taming Score-Based Denoisers in ADMM: A Convergent Plug-and-Play Framework

Diese Arbeit stellt ADMM-PnP mit dem neuartigen AC-DC-Denoiser vor, der durch eine dreistufige Korrektur die Diskrepanz zwischen Trainingsdaten und ADMM-Iterationen überbrückt und unter definierten Bedingungen die Konvergenz von Score-basierten Denoisern in ADMM-Rahmenwerken garantiert.

Rajesh Shrestha, Xiao Fu2026-03-12🤖 cs.LG

GSVD for Geometry-Grounded Dataset Comparison: An Alignment Angle Is All You Need

Diese Arbeit stellt eine neue Methode vor, die die verallgemeinerte Singulärwertzerlegung (GSVD) nutzt, um einen interpretierbaren „Winkel-Score" zu berechnen, der für jede einzelne Stichprobe quantifiziert, ob sie eher durch den einen oder den anderen Datensatz geometrisch erklärt wird.

Eduarda de Souza Marques, Arthur Sobrinho Ferreira da Rocha, Joao Paixao, Heudson Mirandola, Daniel Sadoc Menasche2026-03-12🤖 cs.LG

Copula-ResLogit: A Deep-Copula Framework for Unobserved Confounding Effects

Die Studie stellt Copula-ResLogit vor, ein neuartiges, vollständig interpretierbares Deep-Learning-Framework, das ResNet-Architekturen mit Copula-Modellen kombiniert, um unbeobachtete Störfaktoren in der Verkehrsbedarfsanalyse zu erkennen und zu korrigieren.

Kimia Kamal, Bilal Farooq2026-03-12🤖 cs.LG

MultiwayPAM: Multiway Partitioning Around Medoids for LLM-as-a-Judge Score Analysis

Die vorgestellte Arbeit stellt MultiwayPAM vor, eine neue Tensor-Clustering-Methode, die durch die gleichzeitige Schätzung von Clusterzugehörigkeiten und Medoiden für Fragen, Antwortende und Bewerter hilft, die Rechenkosten und die inhärente Verzerrung bei der Bewertung von Texten durch LLMs zu adressieren und die Struktur dieser Bias aufzudecken.

Chihiro Watanabe, Jingyu Sun2026-03-12📊 stat

Quantum entanglement provides a competitive advantage in adversarial games

Die Studie zeigt, dass Quantenverschränkung in einem hybriden Quanten-Klassischen-Agenten für das Spiel Pong zu einer konsistenten Leistungssteigerung gegenüber separablen Quantenschaltungen und klassischen neuronalen Netzen führt, was die Verschränkung als wertvolle Ressource für das Repräsentationslernen in kompetitiven Reinforcement-Learning-Szenarien etabliert.

Peiyong Wang, Kieran Hymas, James Quach2026-03-12⚛️ quant-ph

Hybrid Self-evolving Structured Memory for GUI Agents

Die Arbeit stellt HyMEM vor, ein hybrides, selbstentwickelndes, graphbasiertes Gedächtnis, das diskrete symbolische Knoten mit kontinuierlichen Embeddings kombiniert, um GUI-Agenten durch strukturierte Mehrhop-Abfragen und dynamische Aktualisierungen zu verbessern und so Open-Source-Modelle mit 7B/8B-Parametern in die Lage zu versetzen, leistungsstarke geschlossene Modelle wie Gemini 2.5 Pro Vision und GPT-4o zu übertreffen.

Sibo Zhu, Wenyi Wu, Kun Zhou, Stephen Wang, Biwei Huang2026-03-12🤖 cs.AI

GaLoRA: Parameter-Efficient Graph-Aware LLMs for Node Classification

Das Paper stellt GaLoRA vor, ein parameter-effizientes Framework, das strukturelle Informationen in Large Language Models integriert, um bei der Knotenklassifizierung in textattribuierten Graphen mit nur 0,24 % der Parameter einer vollständigen Feinabstimmung konkurrenzfähige Ergebnisse zu erzielen.

Mayur Choudhary, Saptarshi Sengupta, Katerina Potika2026-03-12🤖 cs.LG

Regime-aware financial volatility forecasting via in-context learning

Diese Arbeit stellt ein regimebewusstes In-Context-Learning-Framework vor, das vortrainierte Large Language Models ohne Parameter-Feinabstimmung nutzt, um durch kontextbasiertes Schlussfolgern und bedingtes Sampling von Demonstrationen die Finanzvolatilität unter nichtstationären Marktbedingungen präziser vorherzusagen als klassische Ansätze.

Saba Asaad, Shayan Mohajer Hamidi, Ali Bereyhi2026-03-12🤖 cs.LG

What do near-optimal learning rate schedules look like?

Die Studie entwickelt ein Suchverfahren zur Ermittlung nahezu optimaler Lernraten-Schedules für neuronale Netze und zeigt, dass Warmup und Decay wesentliche Merkmale sind, während gängige Schedules oft suboptimal sind und der Weight Decay einen starken Einfluss auf die ideale Schedules-Form hat.

Hiroki Naganuma, Atish Agarwala, Priya Kasimbeg, George E. Dahl2026-03-12🤖 cs.LG

How to make the most of your masked language model for protein engineering

Die Autoren stellen eine flexible Stichprobenmethode mit stochastischer Beam-Suche für Masked Language Models vor, die durch systematische in silico- und in vitro-Evaluierungen im Bereich der Antikörper-Engineering zeigt, dass die Wahl der Sampling-Methode mindestens genauso entscheidend für den Erfolg ist wie die Wahl des Modells selbst.

Calvin McCarter, Nick Bhattacharya, Sebastian W. Ober, Hunter Elliott2026-03-12🧬 q-bio

Data-Driven Integration Kernels for Interpretable Nonlocal Operator Learning

Die vorgestellte Arbeit führt datengesteuerte Integrationskerne ein, die das Lernen nichtlokaler Operatoren durch die Trennung der nichtlokalen Informationsaggregation von der lokalen nichtlinearen Vorhersage strukturieren, wodurch die Interpretierbarkeit erhöht und die Anzahl der trainierbaren Parameter bei gleichbleibender Vorhersagegüte für den südasiatischen Monsun drastisch reduziert wird.

Savannah L. Ferretti, Jerry Lin, Sara Shamekh, Jane W. Baldwin, Michael S. Pritchard, Tom Beucler2026-03-12🤖 cs.LG

NasoVoce: A Nose-Mounted Low-Audibility Speech Interface for Always-Available Speech Interaction

Das Paper stellt NasoVoce vor, eine unauffällige, an der Nasenbrücke montierte Schnittstelle, die durch die Fusion von Mikrofon- und Vibrationssensordaten eine robuste und diskrete Spracherkennung für leise und geflüsterte Sprache in lauten Umgebungen ermöglicht.

Jun Rekimoto, Yu Nishimura, Bojian Yang2026-03-12🤖 cs.AI

Federated Active Learning Under Extreme Non-IID and Global Class Imbalance

Das Paper stellt FairFAL vor, ein adaptives Framework für das federierte aktive Lernen, das durch die Analyse von Modellunterschieden und eine prototypengestützte Abfragestrategie die Effektivität unter extremen nicht-IID-Bedingungen und globaler Klassenungleichgewicht signifikant verbessert.

Chen-Chen Zong, Sheng-Jun Huang2026-03-12🤖 cs.LG

On The Complexity of Best-Arm Identification in Non-Stationary Linear Bandits

Die Arbeit untersucht das Problem der Identifizierung des besten Arms in nicht-stationären linearen Banditen mit festem Budget, indem sie eine arm-mengenabhängige untere Schranke für die Fehlerwahrscheinlichkeit herleitet und den zugehörigen $\textsf{Adjacent-BAI}$ -Algorithmus vorschlägt, der diese Schranke bis auf Konstanten erreicht.

Leo Maynard-Zhang, Zhihan Xiong, Kevin Jamieson, Maryam Fazel2026-03-12📊 stat

HEAL: Hindsight Entropy-Assisted Learning for Reasoning Distillation

Das Papier stellt HEAL vor, ein RL-freies Framework zur Wissensdistillation von großen zu kleineren Reasoning-Modellen, das durch die Kombination aus entropiegestützter Fehlerkorrektur, Unsicherheitsfilterung und einem progressiven Lehrplan die Grenzen traditioneller Rejektions-Sampling-Methoden überwindet.

Wenjing Zhang, Jiangze Yan, Jieyun Huang, Yi Shen, Shuming Shi, Ping Chen, Ning Wang, Zhaoxiang Liu, Kai Wang, Shiguo Lian2026-03-12🤖 cs.AI

Causal Concept Graphs in LLM Latent Space for Stepwise Reasoning

Die Arbeit stellt Causal Concept Graphs (CCG) vor, eine Methode, die sparse Autoencoder mit differentiablem Struktur-Lernen kombiniert, um kausale Abhängigkeiten zwischen Konzepten im latenten Raum von Sprachmodellen zu identifizieren und nachzuweisen, dass graphenbasierte Interventionen die reasoning-Fähigkeiten signifikant effektiver verbessern als bestehende Ansätze.

Md Muntaqim Meherab, Noor Islam S. Mohammad, Faiza Feroz2026-03-12🤖 cs.LG

Optimal Expert-Attention Allocation in Mixture-of-Experts: A Scalable Law for Dynamic Model Design

Diese Arbeit leitet ein skalierbares Gesetz her, das die optimale Aufteilung der Rechenleistung zwischen Experten- und Aufmerksamkeits-Schichten in Mixture-of-Experts-Modellen bestimmt, um die Leistung bei festem Budget zu maximieren und die Chinchilla-Skalierungsgesetze zu erweitern.

Junzhuo Li, Peijie Jiang, Changxin Tian, Jia Liu, Zhiqiang Zhang, Xuming Hu2026-03-12🤖 cs.LG

Variance-Aware Adaptive Weighting for Diffusion Model Training

Diese Arbeit stellt eine varianzbewusste adaptive Gewichtungsmethode vor, die das Ungleichgewicht im Trainingsprozess von Diffusionsmodellen über verschiedene Rauschpegel hinweg ausgleicht und dadurch auf CIFAR-Datensätzen eine stabilere Optimierung sowie eine verbesserte generative Leistung erzielt.

Nanlong Sun, Lei Shi2026-03-12🤖 cs.LG

← Zurück Weiter →