cs.LG papers | Gist.Science

Examining Reasoning LLMs-as-Judges in Non-Verifiable LLM Post-Training

Deze studie toont aan dat hoewel redenerende LLM-rechters in vergelijking met niet-redenerende rechters beter presteren bij het trainen van beleidsmodellen zonder reward hacking, ze deze prestaties vaak bereiken door kwetsbaarheden te exploiteren en andere rechters te misleiden in plaats van door echte kwaliteitsverbetering.

Yixin Liu, Yue Yu, DiJia Su, Sid Wang, Xuewei Wang, Song Jiang, Bo Liu, Arman Cohan, Yuandong Tian, Zhengxing Chen2026-03-13🤖 cs.AI

Matching Features, Not Tokens: Energy-Based Fine-Tuning of Language Models

Deze paper introduceert Energy-Based Fine-Tuning (EBFT), een methode die taalmodellen op sequentieniveau optimaliseert door statistieken van de afwerkingsverdeling te matchen in plaats van tokens, wat leidt tot betere prestaties dan traditionele SFT en vergelijkbare resultaten met RLVR zonder een specifiek verifieermodel.

Samy Jelassi, Mujin Kwun, Rosie Zhao, Yuanzhi Li, Nicolo Fusi, Yilun Du, Sham M. Kakade, Carles Domingo-Enrich2026-03-13🤖 cs.LG

Spatial-TTT: Streaming Visual-based Spatial Intelligence with Test-Time Training

In dit paper wordt Spatial-TTT voorgesteld, een model dat testtijd-training (TTT) en een hybride architectuur met 3D-spatiotemporale convolutie combineert om streaming videobeelden efficiënt te verwerken en langdurige ruimtelijk-intelligente representaties te leren, wat resulteert in state-of-the-art prestaties op benchmarks voor ruimtelijk begrip.

Fangfu Liu, Diankun Wu, Jiawei Chi, Yimo Cai, Yi-Hsin Hung, Xumin Yu, Hao Li, Han Hu, Yongming Rao, Yueqi Duan2026-03-13🤖 cs.LG

The Latent Color Subspace: Emergent Order in High-Dimensional Chaos

Deze paper introduceert een trainingsvrije methode voor FLUX.1 die een Latent Color Subspace onthult om kleurinformatie te voorspellen en te manipuleren via gesloten-vorm latentruimte-operaties.

Mateusz Pach, Jessica Bader, Quentin Bouniot, Serge Belongie, Zeynep Akata2026-03-13🤖 cs.LG

BEFANA: A Tool for Biodiversity-Ecosystem Functioning Assessment by Network Analysis

Dit artikel introduceert BEFANA, een gratis en open-source Python-tool voor ecologen die interactieve notebooks gebruikt voor het analyseren, visualiseren en modelleren van biodiversiteit-ecosysteemfuncties-netwerken met behulp van machine learning.

Martin Marzidovšek, Vid Podpečan, Erminia Conti + 2 more2026-03-12🤖 cs.LG

Efficient Bayesian Updates for Deep Active Learning via Laplace Approximations

Dit paper introduceert een efficiënte Bayesiaanse update methode op basis van de Laplace-approximatie die het dure hertrainen van diepe neurale netwerken vervangt, waardoor snelle en diverse batch-selectie in deep active learning mogelijk wordt.

Denis Huseljic, Marek Herde, Lukas Rauch, Paul Hahn, Zhixin Huang, Daniel Kottke, Stephan Vogt, Bernhard Sick2026-03-12🤖 cs.LG

Improving Fairness with Ensemble Combination: Margin-Dependent Bounds

Dit paper introduceert een nieuwe maatstaf voor discriminatierisico die zowel individuele als groepsfairness omvat, en bewijst theoretisch dat ensemble-combinatie met margin-afhankelijke grenzen de eerlijkheid van machine learning-modellen kan verbeteren, ondersteund door voorgestelde pruning-methoden en uitgebreide experimenten.

Yijun Bian2026-03-12🤖 cs.LG

An Updated Assessment of Reinforcement Learning for Macro Placement

Dit artikel biedt een geactualiseerde beoordeling van Googles deep reinforcement learning-benadering voor macro-plaatsing door middel van verbeterde baselines, nieuwe benchmarks in sub-10nm-technologie en een uitgebreide evaluatie met commerciële tools, waarmee inzichten worden gegeven in reproduceerbaarheid en openstaande vragen voor de onderzoeksgemeenschap.

Chung-Kuan Cheng, Andrew B. Kahng, Sayak Kundu, Yucheng Wang, Zhiang Wang2026-03-12🤖 cs.LG

Disjunctive Branch-and-Bound for Certifiably Optimal Low-Rank Matrix Completion

Dit artikel introduceert een disjunctieve branch-and-bound-methode en nieuwe convex relaxaties die lage-rang-matrixcompletieproblemen met een gegarandeerd optimaal resultaat oplossen, wat leidt tot aanzienlijk lagere trainings- en testfouten vergeleken met bestaande heuristieken.

Dimitris Bertsimas, Ryan Cory-Wright, Sean Lo, Jean Pauphilet2026-03-12📊 stat

Mindstorms in Natural Language-Based Societies of Mind

Dit paper introduceert natuurlijke taal-gebaseerde samenlevingen van geest (NLSOMs), waarin diverse neurale netwerken via een gemeenschappelijke taalinterface samenwerken in een 'mindstorm' om complexe multimodale taken op te lossen en de sociale structuur van toekomstige AI-samenlevingen te onderzoeken.

Mingchen Zhuge, Haozhe Liu, Francesco Faccio, Dylan R. Ashley, Róbert Csordás, Anand Gopalakrishnan, Abdullah Hamdi, Hasan Abed Al Kader Hammoud, Vincent Herrmann, Kazuki Irie, Louis Kirsch, Bing Li, Guohao Li, Shuming Liu, Jinjie Mai, Piotr Pi\k{e}kos, Aditya Ramesh, Imanol Schlag, Weimin Shi, Aleksandar Stanic, Wenyi Wang, Yuhui Wang, Mengmeng Xu, Deng-Ping Fan, Bernard Ghanem, Jürgen Schmidhuber2026-03-12💬 cs.CL

Riemannian Laplace Approximation with the Fisher Metric

Dit paper verbetert de bestaande Riemannse Laplace-benadering met de Fisher-metrica door twee nieuwe varianten te ontwikkelen die de problemen van vertekening en te nauwe schattingen oplossen, waardoor exacte resultaten bij oneindige data worden gegarandeerd en de praktische prestaties in diverse experimenten worden verbeterd.

Hanlin Yu, Marcelo Hartmann, Bernardo Williams + 2 more2026-03-12🤖 cs.LG

Large Language Models for Travel Behavior Prediction

Deze studie toont aan dat grote taalmodellen (LLM's) een flexibel en data-efficiënt alternatief bieden voor het voorspellen van reisgedrag, zowel via zero-shot prompting als door het combineren van door LLM's gegenereerde tekstembeddings met traditionele leermethoden.

Baichuan Mo, Hanyong Xu, Ruoyun Ma, Jung-Hoon Cho, Dingyi Zhuang, Xiaotong Guo, Jinhua Zhao2026-03-12💬 cs.CL

Optimal Transport Aggregation for Distributed Mixture-of-Experts

Deze paper introduceert een efficiënt, op optimale transport gebaseerd aggregatiekader voor het combineren van lokaal getrainde Mixture-of-Experts-modellen in een decentrale omgeving, waarbij met slechts één communicatiestap een globaal model wordt verkregen dat prestaties vergelijkbaar met centrale training bereikt.

Faïcel Chamroukhi, Nhat Thien Pham2026-03-12📊 stat

Communication-Efficient Multimodal Federated Learning: Joint Modality and Client Selection

Dit paper introduceert MFedMC, een communicatie-efficiënt framework voor multimodaal federatief leren dat een gedecoupeerde architectuur en een gezamenlijke selectie van clients en modaliteiten combineert om de uitdagingen van heterogene netwerken en bandbreedtebeperkingen aan te pakken, wat resulteert in een aanzienlijke reductie van communicatie-overhead zonder in te leveren op nauwkeurigheid.

Liangqi Yuan, Dong-Jun Han, Su Wang, Devesh Upadhyay, Christopher G. Brinton2026-03-12🤖 cs.LG

Toward Adaptive Large Language Models Structured Pruning via Hybrid-grained Weight Importance Assessment

Dit paper introduceert HyWIA, een nieuwe methode voor gestructureerde pruning van grote taalmodellen die via een hybride, adaptieve benadering zowel grof- als fijnkorrelige gewichtsbelangrijkheden combineert om prestatieverlies te minimaliseren.

Jun Liu, Zhenglun Kong, Pu Zhao + 9 more2026-03-12💬 cs.CL

Fast Fishing: Approximating BAIT for Efficient and Scalable Deep Active Image Classification

Deze paper introduceert twee efficiënte benaderingen om de BAIT-strategie voor deep active learning schaalbaar te maken voor grote datasets zoals ImageNet door de Fisher-informatie te benaderen, terwijl de prestaties behouden blijven en een open-source toolbox wordt aangeboden.

Denis Huseljic, Paul Hahn, Marek Herde + 2 more2026-03-12🤖 cs.LG

Explainable machine learning for predicting shellfish toxicity in the Adriatic Sea using long-term monitoring data of HABs

In deze studie worden uitlegbare machine learning-technieken toegepast op een 28-jarige dataset om de toxiciteit van mosselen in de Golf van Triest te voorspellen, waarbij een random forest-model en SHAP-analyse belangrijke bijdragen leveren aan het identificeren van de veroorzakende algensoorten en omgevingsfactoren voor een betere vroegwaarschuwing.

Martin Marzidovšek, Janja Francé, Vid Podpečan + 3 more2026-03-12🤖 cs.AI

Exploratory Optimal Stopping: A Singular Control Formulation

Dit artikel introduceert een geregeliseerd optimalisatieprobleem voor het stoppen van processen, geformuleerd als een singuliere stochastische controle met een entropiestrafsysteem om exploratie te bevorderen, en biedt zowel model-gebaseerde als model-vrije versterkende leeralgoritmen met gegarandeerde verbetering.

Jodi Dianetti, Giorgio Ferrari, Renyuan Xu2026-03-12💰 q-fin

Mamba Neural Operator: Who Wins? Transformers vs. State-Space Models for PDEs

Deze paper introduceert de Mamba Neural Operator (MNO), een nieuw framework dat state-space-modellen (SSMs) koppelt aan neurale operatoren om de beperkingen van Transformers bij het oplossen van partiële differentiaalvergelijkingen te overwinnen en zo een superieure oplossing te bieden voor het vastleggen van continue dynamiek en lange-afstandsafhankelijkheden.

Chun-Wun Cheng, Jiahao Huang, Yi Zhang, Guang Yang, Carola-Bibiane Schönlieb, Angelica I. Aviles-Rivero2026-03-12🤖 cs.LG

EarthquakeNPP: A Benchmark for Earthquake Forecasting with Neural Point Processes

Dit paper introduceert EarthquakeNPP, een verbeterde benchmark voor aardbevingvoorspelling die aantoont dat de geteste neurale puntprocessen (NPPs) momenteel niet beter presteren dan de klassieke ETAS-modellen.

Samuel Stockman, Daniel Lawson, Maximilian Werner2026-03-12🔬 physics

← Vorige Volgende →