cs.LG papers | Gist.Science

Estimating condition number with Graph Neural Networks

Dit artikel presenteert een snelle methode voor het schatten van de conditienummer van schaarse matrices met behulp van graph neural networks, die aanzienlijke snelheidswinst biedt ten opzichte van traditionele methoden zoals Hager-Higham en Lanczos.

Erin Carson, Xinye Chen2026-03-12🤖 cs.LG

Robust Post-Training for Generative Recommenders: Why Exponential Reward-Weighted SFT Outperforms RLHF

Deze paper introduceert en bewijst dat exponentiële reward-gewogen SFT een robuustere en schaalbaarder post-training methode is voor generatieve aanbevelingssystemen dan RLHF, omdat deze direct op waargenomen beloningen werkt zonder reward-modellen of propensity scores, terwijl de temperatuurparameter de afweging tussen robuustheid en verbetering theoretisch en empirisch regelt.

Keertana Chidambaram, Sanath Kumar Krishnamurthy, Qiuling Xu, Ko-Jen Hsiao, Moumita Bhattacharya2026-03-12🤖 cs.LG

Taming Score-Based Denoisers in ADMM: A Convergent Plug-and-Play Framework

Deze paper introduceert ADMM-PnP met een AC-DC-ontruisingsmechanisme om de convergentie en prestaties van score-gebaseerde generatieve modellen in ADMM voor inverse problemen te verbeteren door een driestapsaanpak die de mismatch tussen trainingsmanifolden en iteraties oplost.

Rajesh Shrestha, Xiao Fu2026-03-12🤖 cs.LG

GSVD for Geometry-Grounded Dataset Comparison: An Alignment Angle Is All You Need

Dit paper introduceert een interpreteerbare 'hoekscore' gebaseerd op de gegeneraliseerde singuliere waardenontbinding (GSVD) om individuele steekproeven te diagnosticeren en te bepalen of ze beter worden verklaard door het ene of het andere dataset-geometrische model.

Eduarda de Souza Marques, Arthur Sobrinho Ferreira da Rocha, Joao Paixao, Heudson Mirandola, Daniel Sadoc Menasche2026-03-12🤖 cs.LG

Copula-ResLogit: A Deep-Copula Framework for Unobserved Confounding Effects

Het artikel introduceert Copula-ResLogit, een nieuw interpreteerbaar kader dat ResNet-architecturen en copula-modellen combineert om ongemeten verstorende factoren in reisvraaganalyses te detecteren en te corrigeren.

Kimia Kamal, Bilal Farooq2026-03-12🤖 cs.LG

MultiwayPAM: Multiway Partitioning Around Medoids for LLM-as-a-Judge Score Analysis

Dit artikel introduceert MultiwayPAM, een nieuwe tensor-clusteringmethode die de rekentijd en inherent bias van LLM-as-a-Judge-evaluaties vermindert door gelijktijdig clusterleden en medoïden te schatten voor vragen, antwoordgevers en beoordelaars.

Chihiro Watanabe, Jingyu Sun2026-03-12📊 stat

Quantum entanglement provides a competitive advantage in adversarial games

Dit onderzoek toont aan dat kwantumverstrengeling in een hybride agent voor het spel Pong leidt tot superieure prestaties in competitieve versterkende leeromgevingen door het leren van structureel verschillende en effectievere representaties van interacterende staten.

Peiyong Wang, Kieran Hymas, James Quach2026-03-12⚛️ quant-ph

Hybrid Self-evolving Structured Memory for GUI Agents

Dit artikel introduceert HyMEM, een hybride, zelfevoluerende gestructureerde grafgeheugenarchitectuur die open-source GUI-agents aanzienlijk verbetert door multi-hop-retrieval en dynamische updates mogelijk te maken, waardoor zelfs kleinere modellen presteren die concurreren met of superieur zijn aan geavanceerde gesloten modellen.

Sibo Zhu, Wenyi Wu, Kun Zhou, Stephen Wang, Biwei Huang2026-03-12🤖 cs.AI

GaLoRA: Parameter-Efficient Graph-Aware LLMs for Node Classification

Het artikel introduceert GaLoRA, een parameter-efficiënt framework dat structurele informatie integreert in grote taalmodellen om de prestaties van knoopclassificatie op tekst-geattribueerde grafen te verbeteren met slechts 0,24% van de parameters die nodig zijn voor volledige fine-tuning.

Mayur Choudhary, Saptarshi Sengupta, Katerina Potika2026-03-12🤖 cs.LG

Regime-aware financial volatility forecasting via in-context learning

Dit paper introduceert een regimewaakzaam in-context leerframework dat voorgeprogrammeerde grote taalmodellen gebruikt om financiële volatiliteit te voorspellen door historische patronen te redeneren en voorspellingen dynamisch aan te passen aan veranderende marktomstandigheden zonder parameterfine-tuning.

Saba Asaad, Shayan Mohajer Hamidi, Ali Bereyhi2026-03-12🤖 cs.LG

What do near-optimal learning rate schedules look like?

Dit onderzoek introduceert een zoekprocedure om bijna-optimale leerplansvormen te vinden en toont aan dat hoewel warmup en decay robuuste kenmerken zijn, veelgebruikte schema's niet optimaal zijn en dat gewichtsdecay een sterke invloed heeft op de ideale vorm.

Hiroki Naganuma, Atish Agarwala, Priya Kasimbeg, George E. Dahl2026-03-12🤖 cs.LG

How to make the most of your masked language model for protein engineering

Deze paper introduceert een flexibele steekproefmethode met stochastische beam search voor gemaskeerde taalkundige modellen die, zoals blijkt uit uitgebreide in silico en in vitro tests op antilichamen, minstens zo belangrijk is voor het optimaliseren van biologische eigenschappen als de keuze van het model zelf.

Calvin McCarter, Nick Bhattacharya, Sebastian W. Ober, Hunter Elliott2026-03-12🧬 q-bio

Data-Driven Integration Kernels for Interpretable Nonlocal Operator Learning

Dit paper introduceert data-gedreven integratiekernels als een interpreteerbaar raamwerk dat niet-lokale operatorlearning voor klimaatprocessen structureert door niet-lineaire interacties te beperken tot geïntegreerde kenmerken, wat leidt tot modellen met minder parameters en betere interpretatie zonder in te leveren op voorspellingskwaliteit.

Savannah L. Ferretti, Jerry Lin, Sara Shamekh, Jane W. Baldwin, Michael S. Pritchard, Tom Beucler2026-03-12🤖 cs.LG

NasoVoce: A Nose-Mounted Low-Audibility Speech Interface for Always-Available Speech Interaction

NasoVoce is een neusgemonteerd interface dat door het fusioneren van akoestische en trillingssignalen een robuuste, onopvallende en altijd beschikbare spraakinteractie met AI mogelijk maakt, zelfs bij fluisterende spraak in lawaaierige omgevingen.

Jun Rekimoto, Yu Nishimura, Bojian Yang2026-03-12🤖 cs.AI

Federated Active Learning Under Extreme Non-IID and Global Class Imbalance

Deze paper introduceert FairFAL, een adaptief framework voor federatief actief leren dat de prestaties verbetert onder extreme non-IID-omstandigheden en globale klasse-ongelijkheid door een slimme selectie tussen lokale en globale query-modellen, prototypegestuurde pseudo-labeling en een gebalanceerde bemonsteringsstrategie.

Chen-Chen Zong, Sheng-Jun Huang2026-03-12🤖 cs.LG

On The Complexity of Best-Arm Identification in Non-Stationary Linear Bandits

Deze paper introduceert een nieuwe ondergrens en het $\textsf{Adjacent-BAI}$ -algoritme voor het identificeren van de beste arm in niet-stationaire lineaire bandieten, waarmee de complexiteit voor willekeurige armsets wordt vastgesteld en de eerder te pessimistische, dimensie-afhankelijke ondergrens wordt overtroffen.

Leo Maynard-Zhang, Zhihan Xiong, Kevin Jamieson, Maryam Fazel2026-03-12📊 stat

HEAL: Hindsight Entropy-Assisted Learning for Reasoning Distillation

Dit paper introduceert HEAL, een RL-vrij raamwerk dat het 'lerend vermogen' van kleinere modellen verbetert door middel van een curriculum dat gebaseerd is op de Zone van de Naaste Ontwikkeling en gebruikmaakt van entropy-gestuurde herstelmechanismen om de beperkingen van traditionele distillatie te overwinnen.

Wenjing Zhang, Jiangze Yan, Jieyun Huang, Yi Shen, Shuming Shi, Ping Chen, Ning Wang, Zhaoxiang Liu, Kai Wang, Shiguo Lian2026-03-12🤖 cs.AI

Causal Concept Graphs in LLM Latent Space for Stepwise Reasoning

Dit artikel introduceert Causal Concept Graphs, een methode die sparse autoencoders en differentieerbare structuurlerning combineert om causale relaties tussen concepten in de latent ruimte van taalmodellen te visualiseren en te manipuleren voor verbeterde stapsgewijze redenering, wat resulteert in een significant hogere Causal Fidelity Score dan bestaande technieken.

Md Muntaqim Meherab, Noor Islam S. Mohammad, Faiza Feroz2026-03-12🤖 cs.LG

Optimal Expert-Attention Allocation in Mixture-of-Experts: A Scalable Law for Dynamic Model Design

Dit paper introduceert een nieuwe schaalwet voor Mixture-of-Experts-modellen die een optimale machtsverhouding tussen expert- en attentie-berekeningen definieert, waardoor efficiëntere modelontwerpen mogelijk zijn binnen vaste rekenbudgetten.

Junzhuo Li, Peijie Jiang, Changxin Tian, Jia Liu, Zhiqiang Zhang, Xuming Hu2026-03-12🤖 cs.LG

Variance-Aware Adaptive Weighting for Diffusion Model Training

Dit paper introduceert een variantiebewuste adaptieve wegingsstrategie die de onbalans in de trainingsdynamiek van diffusiemodellen over verschillende ruisniveaus oplost, wat resulteert in stabielere optimalisatie en verbeterde generatieve prestaties op CIFAR-10 en CIFAR-100.

Nanlong Sun, Lei Shi2026-03-12🤖 cs.LG

← Vorige Volgende →