cs.LG papers | Gist.Science

Best-of- $\infty$ -- Asymptotic Performance of Test-Time LLM Ensembling

Dit onderzoek analyseert de asymptotische prestaties van best-of- $N$ ensembling met meerderheidsstemming voor grote taalmodellen, introduceert een adaptief generatieschema om de inferentiekosten te optimaliseren en toont aan dat gewogen ensembles van meerdere modellen via een gemengd-geheelgetallig lineair programma superieure resultaten kunnen behalen.

Junpei Komiyama, Daisuke Oba, Masafumi Oyamada2026-03-05🤖 cs.AI

CAD-Tokenizer: Towards Text-based CAD Prototyping via Modality-Specific Tokenization

Dit paper introduceert CAD-Tokenizer, een raamwerk dat CAD-ontwerpen omzet in primitieve-bewuste tokens via een sequence-based VQ-VAE, waardoor tekstgestuurde CAD-prototyping en bewerking aanzienlijk effectiever worden dan met bestaande methoden.

Ruiyu Wang, Shizhao Sun, Weijian Ma + 1 more2026-03-05🤖 cs.LG

Talking Trees: Reasoning-Assisted Induction of Decision Trees for Tabular Data

Deze paper introduceert een agentische aanpak waarbij redenerende LLM's gebruikmaken van een set hulpmiddelen om interpretabele, lichtgewicht beslissingsbomen te genereren voor tabulaire data, die concurreren met zwarte-doosmodellen terwijl ze tegelijkertijd menselijke controle en het naleven van beperkingen zoals eerlijkheid mogelijk maken.

George Yakushev, Alina Shutova, Ivan Rubachev + 3 more2026-03-05🤖 cs.LG

Scalable Second-order Riemannian Optimization for $K$ -means Clustering

Dit artikel introduceert een schaalbaar tweede-orde Riemanniaanse optimalisatiemethode voor $K$ -means clustering die via een nieuwe gladde formulering en productvariëteit-factorisatie snellere convergentie bereikt dan bestaande eerste-orde methoden, terwijl het vergelijkbare statistische nauwkeurigheid behoudt.

Peng Xu, Chun-Ying Hou, Xiaohui Chen + 1 more2026-03-05🤖 cs.LG

Erase or Hide? Suppressing Spurious Unlearning Neurons for Robust Unlearning

Dit paper introduceert Ssiuu, een nieuwe methode die spuriële 'unlearning'-neuronen onderdrukt om gevoelige kennis in grote taalmodellen betrouwbaar te verwijderen en zo herinname tijdens vervolgotraining te voorkomen.

Nakyeong Yang, Dong-Kyum Kim, Jea Kwon + 3 more2026-03-05🤖 cs.LG

The Lie of the Average: How Class Incremental Learning Evaluation Deceives You?

Dit paper introduceert EDGE, een nieuw evaluatieprotocol voor Class Incremental Learning dat de beperkingen van traditionele gemiddelde-metingen overbrugt door adaptief extreme klassequenties te identificeren op basis van inter-taakgelijkenis, waardoor een nauwkeuriger beeld van de prestatieverdeling en robuustheid wordt verkregen.

Guannan Lai, Da-Wei Zhou, Xin Yang + 1 more2026-03-05🤖 cs.LG

Uni-NTFM: A Unified Foundation Model for EEG Signal Representation Learning

Uni-NTFM is een geünificeerd fundamenteel model voor EEG-signaalanalyse dat, geïnspireerd door biologische neurale mechanismen, een nieuwe architectuur introduceert met heterogene projectiemodules, topologische embeddings en een Mixture-of-Experts Transformer om universele representaties te leren die prestaties op negen downstream-taken aanzienlijk verbeteren.

Zhisheng Chen, Yingwei Zhang, Qizhen Lan + 7 more2026-03-05🤖 cs.AI

Benchmarking ECG FMs: A Reality Check Across Clinical Tasks

Deze studie toont aan dat ECG Foundation Models, met name het compacte ECG-CPC, de prestaties van toezicht opgeleide basismodellen overtreffen en de label-efficiëntie aanzienlijk verbeteren, waardoor architecturale keuzes belangrijker blijken dan schaal voor diverse klinische taken.

M A Al-Masud, Juan Miguel Lopez Alcaraz, Nils Strodthoff2026-03-05🤖 cs.LG

Learning in an Echo Chamber: Online Learning with Replay Adversary

Deze paper introduceert het leertheoretische model van online leren met een replay-adversariaal om het risico van echo-kamers te analyseren, en bewijst dat de Extended Threshold-dimensie de exacte maatstaf is voor leerbaarheid, waarbij proper leren onder deze omstandigheden strikt beperkt is tot bijna doorsnede-gesloten klassen.

Daniil Dmitriev, Harald Eskelund Franck, Carolin Heinzler + 1 more2026-03-05🤖 cs.LG

Even Faster Kernel Matrix Linear Algebra via Density Estimation

Dit artikel presenteert versnelde algoritmen voor lineaire algebra-taken met kernelmatrices door gebruik te maken van dichtheidsschatting, waardoor de afhankelijkheid van het aantal datapunten en de foutmarge aanzienlijk wordt verbeterd ten opzichte van eerdere methoden.

Rikhav Shah, Sandeep Silwal, Haike Xu2026-03-05🤖 cs.LG

FLOWR.root: A flow matching based foundation model for joint multi-purpose structure-aware 3D ligand generation and affinity prediction

FLOWR.root is een SE(3)-equivariant foundation model dat structure-bewuste 3D-ligandgeneratie en bindingsaffiniteitsvoorspelling combineert, waardoor het een krachtig en snel instrument biedt voor van hit-identificatie tot lead-optimatie in structurele geneesmiddelenontwerp.

Julian Cremer, Tuan Le, Mohammad M. Ghahremanpour + 3 more2026-03-05🤖 cs.LG

Learning Explicit Single-Cell Dynamics Using ODE Representations

In dit artikel stellen de auteurs Cell-Mechanistic Neural Networks (Cell-MNN) voor, een volledig end-to-end encoder-decoder architectuur die gebruikmaakt van een lokaal gelijnd ODE-model om de dynamiek van celdifferentiatie te leren en interpreteerbare, biologisch consistente geninteracties bloot te leggen zonder de noodzaak van dure optimal transport-preprocessing.

Jan-Philipp von Bassewitz, Adeel Pervez, Marco Fumero + 3 more2026-03-05🤖 cs.LG

ELMUR: External Layer Memory with Update/Rewrite for Long-Horizon RL Problems

Het artikel introduceert ELMUR, een transformer-architectuur met gestructureerd extern geheugen die door middel van een LRU-update- en herschrijfmechanisme effectieve horizons tot 100.000 keer de aandachtswindow verlengt en zo aanzienlijk betere prestaties behaalt op lange-horizon, gedeeltelijk waarneembare taken in vergelijking met bestaande methoden.

Egor Cherepanov, Alexey K. Kovalev, Aleksandr I. Panov2026-03-05🤖 cs.AI

Value Flows

Dit paper introduceert Value Flows, een nieuwe aanpak voor distributioneel versterkend leren die flexibele flow-modellen gebruikt om volledige toekomstige opbrengstdistributies te schatten en onzekerheid te kwantificeren, wat leidt tot significante prestatieverbeteringen op diverse benchmarks.

Perry Dong, Chongyi Zheng, Chelsea Finn + 2 more2026-03-05🤖 cs.AI

The Geometry of Reasoning: Flowing Logics in Representation Space

Dit artikel introduceert een nieuw geometrisch raamwerk dat redeneren in grote taalmodellen beschrijft als vloeiende trajecten in representatieruimte, waarbij empirische bevindingen aantonen dat deze modellen logische invarianten als hogere-orde geometrie internaliseren, wat de "stochastische papegaai"-hypothese uitdaagt en wijst op een universeel representatief principe.

Yufa Zhou, Yixiao Wang, Xunjian Yin + 2 more2026-03-05🤖 cs.AI

Topological Alignment of Shared Vision-Language Embedding Space

Dit paper introduceert ToMCLIP, een nieuw raamwerk dat persistente homologie en topologiebehoudende beperkingen toepast om de globale geometrie van meertalige visueel-taal-embeddings te verbeteren, wat leidt tot superieure zero-shot prestaties en meertalige zoekopdrachten.

Junwon You, Dasol Kang, Jae-Hun Jung2026-03-05🤖 cs.AI

Gym-TORAX: Open-source software for integrating RL with plasma control simulators

Dit artikel introduceert Gym-TORAX, een open-source Python-pakket dat Reinforcement Learning-omgevingen voor tokamak-plasmacontrole mogelijk maakt door TORAX te koppelen aan Gymnasium, waarmee onderzoekers effectief algoritmen kunnen trainen voor het optimaliseren van plasma-eigenschappen zoals prestaties en stabiliteit.

Antoine Mouchamps, Arthur Malherbe, Adrien Bolland + 1 more2026-03-05🤖 cs.LG

Circuit Insights: Towards Interpretability Beyond Activations

Dit paper introduceert WeightLens en CircuitLens, twee methoden die de interpretatie van neurale netwerken verbeteren door direct van gewichten te leren en interacties tussen componenten te analyseren, waardoor de afhankelijkheid van externe modellen en datasets wordt verwijderd en schaalbare mechanische interpretatie mogelijk wordt.

Elena Golimblevskaia, Aakriti Jain, Bruno Puri + 3 more2026-03-05🤖 cs.AI

Composition-Grounded Data Synthesis for Visual Reasoning

Dit paper introduceert COGS, een data-efficiënt raamwerk dat pretrained multi-modale grote taalmodellen in staat stelt tot geavanceerd visueel redeneren in domeinen zoals grafieken en webpagina's door een kleine set zaadvragen te decomponeren en te hercombineren voor het synthetiseren van grote datasets met procesbeloningen.

Xinyi Gu, Jiayuan Mao, Zhang-Wei Hong + 5 more2026-03-05🤖 cs.LG

A Geometry-Based View of Mahalanobis OOD Detection

Dit onderzoek toont aan dat de prestaties van Mahalanobis-gebaseerde OOD-detectie sterk afhankelijk zijn van de geometrie van de in-distributie-ruimte, en introduceert een nieuwe radiaal geschaalde normalisatiemethode die deze geometrie aanpast om detectie te verbeteren.

Denis Janiak, Jakub Binkowski, Tomasz Kajdanowicz2026-03-05🤖 cs.LG

← Vorige Volgende →

cs.LG

Best-of-∞\infty∞ -- Asymptotic Performance of Test-Time LLM Ensembling