cs.LG papers | Gist.Science

On the Non-Identifiability of Steering Vectors in Large Language Models

Dit paper toont aan dat stuurvectoren in grote taalmodellen fundamenteel niet-identificeerbaar zijn, aangezien orthogonale verstoringen vergelijkbare effecten hebben, wat de interpretatie van interne representaties beperkt en de noodzaak van structurele constraints benadrukt.

Sohan Venkatesh, Ashish Mahendran Kurapath2026-03-06💻 cs

LatentChem: From Textual CoT to Latent Thinking in Chemical Reasoning

LatentChem introduceert een latent denkinterface die chemische redenering overbrengt van expliciete tekstuele chain-of-thought naar continue latente ruimtes, wat leidt tot een aanzienlijke snelheidswinst en betere prestaties doordat modellen hun redenering automatisch internaliseren in plaats van in woorden te verwoorden.

Xinwu Ye, Yicheng Mao, Jia Zhang + 16 more2026-03-06🔬 physics

Beyond the Unit Hypersphere: Embedding Magnitude in Contrastive Learning

Dit onderzoek toont aan dat het leren van embedding-magnitudes, in plaats van deze als ruis te beschouwen, de prestaties van zoekopdrachten en Retrieval-Augmented Generation aanzienlijk verbetert door de normalisatie specifiek toe te passen op de document- of query-zijde, afhankelijk van de taak en de Fisher Information Matrix.

Xincan Feng, Taro Watanabe2026-03-06💻 cs

Supervised Metric Regularization Through Alternating Optimization for Multi-Regime Physics-Informed Neural Networks

Dit artikel introduceert TAPINN, een topologie-bewuste Physics-Informed Neural Network die via supervisie-gestuurde metriekregularisatie en afwisselende optimalisatie de uitdagingen van regime-overgangen in parametrische dynamische systemen effectief aanpakt, wat resulteert in een lagere fysica-residu en stabielere convergentie dan bestaande methoden.

Enzo Nicolas Spotorno, Josafat Ribeiro Leal, Antonio Augusto Frohlich2026-03-06🔬 physics

Empirical Stability Analysis of Kolmogorov-Arnold Networks in Hard-Constrained Recurrent Physics-Informed Discovery

Deze studie concludeert dat, ondanks de theoretische belofte, Kolmogorov-Arnold-netwerken (KANs) in hard-beperkte recurrente fysisch geïnformeerde architecturen minder robuust en effectief blijken dan standaard MLPs voor het modelleren van complexe oscillatiesystemen vanwege hun hyperparameter-fragiliteit en beperkte inductieve bias.

Enzo Nicolas Spotorno, Josafat Leal Filho, Antonio Augusto Medeiros Frohlich2026-03-06🔬 physics

Learn from Your Mistakes: Self-Correcting Masked Diffusion Models

Dit paper introduceert ProSeCo, een zelfcorrigerend framework voor gemaskerde diffusiemodellen dat door iteratieve correctie van reeds gegenereerde tokens de kwaliteit van de gegenereerde samples verbetert en tegelijkertijd de sampling-efficiëntie verhoogt.

Yair Schiff, Omer Belhasin, Roy Uziel + 5 more2026-03-06💻 cs

QTabGAN: A Hybrid Quantum-Classical GAN for Tabular Data Synthesis

Dit paper introduceert QTabGAN, een hybride quantum-klassiek generatief model dat gebruikmaakt van quantumcircuits voor het synthetiseren van realistische tabulaire data en tot 54,07% betere prestaties behaalt dan bestaande methoden, vooral in scenario's met beperkte of privacygevoelige datasets.

Subhangi Kumari, Rakesh Achutha, Vignesh Sivaraman2026-03-06⚛️ quant-ph

Out-of-Support Generalisation via Weight-Space Sequence Modelling

Dit paper introduceert WeightCaster, een framework dat het probleem van generalisatie buiten het trainingsdomein (OoS) omzet in een sequentiemodelleertaak in de gewichtenruimte, waardoor betrouwbare en onzekerheidsbewuste voorspellingen worden gegenereerd zonder expliciete inductieve bias.

Roussel Desmond Nzoyem2026-03-06💻 cs

Neural Network-Based Parameter Estimation of a Labour Market Agent-Based Model

Deze studie toont aan dat een op neurale netwerken gebaseerd raamwerk voor simulatiegebaseerde inferentie de parameters van een arbeidsmarkt-agentgebaseerd model efficiënter en nauwkeuriger schat dan traditionele Bayesiaanse methoden, zowel op synthetische als op realistische datasets.

M Lopes Alves, Joel Dyer, Doyne Farmer + 2 more2026-03-06💻 cs

Optimal training-conditional regret for online conformal prediction

Dit artikel introduceert en analyseert twee online conformale voorspellingsalgoritmen die driftdetectie gebruiken om optimale training-voorwaardelijke regret te bereiken bij niet-stationaire datastromen, afhankelijk van of de niet-conformiteitscores vooraf zijn getraind of online worden aangepast.

Jiadong Liang, Zhimei Ren, Yuxin Chen2026-03-06🔢 math

SubQuad: Near-Quadratic-Free Structure Inference with Distribution-Balanced Objectives in Adaptive Receptor framework

SubQuad is een schaalbaar, bias-bewust platform dat de bijna-kwadratische kosten van affiniteitsbeoordelingen en dataset-ongelijkheden in adaptieve immuunrepertoires oplost door een end-to-end pipeline te combineren die MinHash-voorfilters, GPU-versnelde kernen en eerlijkheidsbeperkte clustering integreert om zowel doorvoer als klinische relevantie te maximaliseren.

Rong Fu, Zijian Zhang, Kun Liu + 3 more2026-03-06💻 cs

Curriculum Learning for Efficient Chain-of-Thought Distillation via Structure-Aware Masking and GRPO

Deze paper introduceert een curriculum learning-framework met structurele masking en GRPO om Chain-of-Thought-redenering efficiënt te distilleren naar compacte modellen, wat resulteert in een aanzienlijke verbetering van de nauwkeurigheid en een verkorting van de outputlengte.

Bowen Yu, Maolin Wang, Sheng Zhang + 7 more2026-03-06💻 cs

CityGuard: Graph-Aware Private Descriptors for Bias-Resilient Identity Search Across Urban Cameras

CityGuard is een privacy-bewust, grafgebaseerd transformer-framework dat door middel van verspreidingsadaptieve metrieke learning, ruimtelijk geconditioneerde attention en differentieel-private embedding maps een robuuste en schaalbare oplossing biedt voor de identiteitssuche van personen over stedelijke camera's, waarbij de balans tussen privacy en bruikbaarheid wordt gewaarborgd.

Rong Fu, Yibo Meng, Jia Yee Tan + 5 more2026-03-06💻 cs

RA-QA: A Benchmarking System for Respiratory Audio Question Answering Under Real-World Heterogeneity

Deze paper introduceert RA-QA, een nieuw benchmark-systeem met 9 miljoen vraag-antwoordparen en een gestandaardiseerde evaluatieprotocol om de robuustheid van multimodale AI-modellen voor respiratoire audio-diagnose te testen onder realistische, heterogene omstandigheden.

Gaia A. Bertolino, Yuwei Zhang, Tong Xia + 2 more2026-03-06💻 cs

cc-Shapley: Measuring Multivariate Feature Importance Needs Causal Context

Dit artikel introduceert cc-Shapley, een methode die causale kennis integreert in Shapley-waarden om misleidende multivariate feature-importances veroorzaakt door collider-bias te corrigeren en zo betrouwbare inzichten voor explainable AI te garanderen.

Jörg Martin, Stefan Haufe2026-03-06💻 cs

On Imbalanced Regression with Hoeffding Trees

Dit artikel introduceert een streaming-variant van kernel density schatting en integratie van hiërarchische shrinkage voor Hoeffding-bomen in onbalansregressie, waarbij empirische resultaten aantonen dat kernel density schatting de vroege prestaties verbetert terwijl hiërarchische shrinkage beperkte winst oplevert.

Pantia-Marina Alchirch, Dimitrios I. Diochnos2026-03-06💻 cs

Zatom-1: A Multimodal Flow Foundation Model for 3D Molecules and Materials

Zatom-1 is het eerste open-source foundationmodel dat generatieve en voorspellende taken voor zowel 3D-moleculen als materialen verenigt via een multimodale flow-matching-architectuur, wat leidt tot verbeterde prestaties en snellere inferentie dan gespecialiseerde modellen.

Alex Morehead, Miruna Cretu, Antonia Panescu + 14 more2026-03-06🔬 cond-mat.mtrl-sci

Regularized Online RLHF with Generalized Bilinear Preferences

Deze paper introduceert een regulariseerde online RLHF-methode met het Generalized Bilinear Preference Model die, door gebruik te maken van sterke convexiteit en een laag-rang structuur, statistisch efficiënte spijtbegrensingen garandeert voor het vinden van Nash-evenwichten in hoge-dimensionale contexten.

Junghyun Lee, Minju Hong, Kwang-Sung Jun + 2 more2026-03-06💻 cs

Lap2: Revisiting Laplace DP-SGD for High Dimensions via Majorization Theory

Dit paper introduceert Lap2, een nieuwe methode die door middel van majorisatietheorie L2-clippen toestaat voor Laplace DP-SGD, waardoor de privacy-garanties in hoge dimensies worden verbeterd en de prestaties concurreren met of zelfs die van Gaussische DP-SGD overtreffen.

Meisam Mohammady, Qin Yang, Nicholas Stout, Ayesha Samreen, Han Wang, Christopher J Quinn, Yuan Hong2026-03-06🔒 cs.CR

Inference-time optimization for experiment-grounded protein ensemble generation

Deze paper introduceert een algemeen framework voor optimalisatie tijdens de inferentie dat, door het optimaliseren van latente representaties en het combineren van priors van AlphaFold3 met krachtveld-gebaseerde priors, experimenteel onderbouwde en thermodynamisch plausibele proteïne-ensembles genereert die de prestaties van bestaande methoden overtreffen en een kwetsbaarheid in huidige designmetrics blootleggen.

Advaith Maddipatla, Anar Rzayev, Marco Pegoraro + 5 more2026-03-06💻 cs

← Vorige Volgende →