cs.LG papers | Gist.Science

Think Before You Lie: How Reasoning Improves Honesty

In tegenstelling tot mensen, die bij nadenken minder eerlijk worden, blijkt dat redenering bij grote taalmodellen de eerlijkheid verhoogt doordat het proces de modellen door een vertegenwoordigingsruimte leidt waar eerlijke antwoorden stabieler zijn dan leugenachtige.

Ann Yuan, Asma Ghandeharioun, Carter Blum, Alicia Machado, Jessica Hoffmann, Daphne Ippolito, Martin Wattenberg, Lucas Dixon, Katja Filippova2026-03-11🤖 cs.AI

From Data Statistics to Feature Geometry: How Correlations Shape Superposition

Dit paper introduceert Bag-of-Words Superposition (BOWS) om aan te tonen dat in realistische scenario's met gecorreleerde features, superpositie constructieve interferentie kan genereren die semantische clusters en cyclische structuren vormt, in plaats van dat interferentie uitsluitend als ruis moet worden gefilterd zoals in het standaardbeeld van superpositie wordt aangenomen.

Lucas Prieto, Edward Stevinson, Melih Barsbey, Tolga Birdal, Pedro A. M. Mediano2026-03-11🤖 cs.AI

Task Aware Modulation Using Representation Learning for Upsaling of Terrestrial Carbon Fluxes

Deze paper introduceert het TAM-RL-framework, dat representatieleren koppelt aan fysisch onderbouwde beperkingen om de nauwkeurigheid en generaliseerbaarheid van het opschalen van terrestrische koolstofstromen aanzienlijk te verbeteren.

Aleksei Rozanov, Arvind Renganathan, Vipin Kumar2026-03-11🤖 cs.LG

Online Neural Networks for Change-Point Detection

In dit paper presenteren de auteurs twee online neurale netwerkbenaderingen voor het detecteren van veranderingen in tijdsreeksen die lineaire computationele complexiteit hebben, sneller convergeren naar optimale oplossingen en beter presteren dan bestaande methoden op zowel synthetische als real-world datasets.

Mikhail Hushchyn, Kenenbek Arzymatov, Denis Derkach2026-03-10🤖 cs.LG

Accounting for shared covariates in semi-parametric Bayesian additive regression trees

De auteurs stellen een nieuwe semi-parametrische BART-methode voor die covariaten in zowel het lineaire als het niet-parametrische component toelaat door de boomgeneratiebewegingen aan te passen, waardoor vertekening en niet-identificeerbaarheid worden opgelost en complexe interacties kunnen worden gemodelleerd, wat wordt gevalideerd via simulaties en toepassingen op onderwijsdata.

Estevão B. Prado, Andrew C. Parnell, Keefe Murphy + 3 more2026-03-10🤖 cs.LG

A White-Box SVM Framework and its Swarm-Based Optimization for Supervision of Toothed Milling Cutter through Characterization of Spindle Vibrations

Dit artikel presenteert een witte-doos SVM-framework, geoptimaliseerd met zwermalgoritmen, voor het toezicht op tandvormige freesmessen door middel van karakterisering van asvibraties en selectie van relevante statistische kenmerken.

Tejas Y. Deo, B. B. Deshmukh, Keshav H. Jatakar, Kamlesh M. Chhajed, S. S. Pardeshi, R. Jegadeeshwaran, Apoorva N. Khairnar, Hrushikesh S. Khade, A. D. Patange2026-03-10🤖 cs.LG

Automated Reinforcement Learning: An Overview

Dit artikel biedt een overzicht van de literatuur over geautomatiseerd versterkend leren (AutoRL), inclusief recente LLM-technieken, en bespreekt de uitdagingen, open vragen en toekomstige onderzoeksrichtingen op dit gebied.

Reza Refaei Afshar, Joaquin Vanschoren, Uzay Kaymak, Rui Zhang, Yaoxin Wu, Wen Song, Yingqian Zhang2026-03-10🤖 cs.LG

Explainable classification of astronomical uncertain time series

In dit artikel wordt een nieuw, uitlegbaar model voorgesteld dat data-onzekerheid direct verwerkt om onzekere astronomische tijdsreeksen met een vergelijkbare nauwkeurigheid als state-of-the-art methoden te classificeren, terwijl het tegelijkertijd inzicht biedt in de onderliggende lichtkromme-eigenschappen.

Michael Franklin Mbouopda (LIMOS, UCA), Emille E. O. Ishida (LIMOS, UCA), Engelbert Mephu Nguifo (LIMOS, UCA), Emmanuel Gangler (LPC, UCA)2026-03-10🔭 astro-ph

Empirical Asset Pricing via Ensemble Gaussian Process Regression

Dit artikel introduceert een ensemble-leermethode op basis van Gaussian Process Regression die de computationele complexiteit verlaagt en statistisch en economisch superieure resultaten boekt ten opzichte van bestaande machine learning-modellen bij het voorspellen van aandelenrendementen en het construeren van optimale portefeuilles.

Damir Filipovic, Puneet Pasricha2026-03-10🤖 cs.LG

Cost-Driven Representation Learning for Linear Quadratic Gaussian Control: Part I

Deze paper biedt voor het eerst wiskundige garanties voor een kostgedreven aanpak die een latente staterepresentatie leert door kosten te voorspellen in plaats van observaties, waardoor een bijna-optimale regelaar kan worden gevonden voor eindhorizontale Lineair-Kwadratisch-Gaussische (LQG) controleproblemen.

Yi Tian, Kaiqing Zhang, Russ Tedrake, Suvrit Sra2026-03-10🤖 cs.LG

On the Impact of Sampling on Deep Sequential State Estimation

Dit paper introduceert de IW-DKF, een verbeterde variant van de Deep Kalman Filter die belangrijke steekproeven toepast om de schatting van log-waarschijnlijkheden en de nauwkeurigheid van de schatting van latente toestanden en parameters in niet-lineaire dynamische systemen te optimaliseren.

Helena Calatrava, Ricardo Augusto Borsoi, Tales Imbiriba + 1 more2026-03-10🤖 cs.LG

Remaining-data-free Machine Unlearning by Suppressing Sample Contribution

Dit paper introduceert MU-Mis, een methode voor machine unlearning die de bijdrage van te vergeten data onderdrukt door de gevoeligheid van het model te minimaliseren, waardoor een effectief vergeten mogelijk is zonder toegang tot de resterende data en zonder in te leveren op de modelprestaties.

Xinwen Cheng, Zhehao Huang, Wenxin Zhou, Zhengbao He, Ruikai Yang, Yingwen Wu, Xiaolin Huang2026-03-10🤖 cs.LG

Survey of Computerized Adaptive Testing: A Machine Learning Perspective

Dit artikel biedt een survey van Computerized Adaptive Testing (CAT) vanuit een machine learning-perspectief, waarbij wordt onderzocht hoe deze technieken de meetmodellen, vraagselectie, bankconstructie en testbeheer kunnen optimaliseren om robuustere, eerlijkere en efficiëntere adaptieve testsystemen te ontwikkelen.

Yan Zhuang, Qi Liu, Haoyang Bi, Zhenya Huang, Weizhe Huang, Jiatong Li, Junhao Yu, Zirui Liu, Zirui Hu, Yuting Hong, Zachary A. Pardos, Haiping Ma, Mengxiao Zhu, Shijin Wang, Enhong Chen2026-03-10🤖 cs.LG

Simulating Non-Markovian Open Quantum Dynamics with Neural Quantum States

Dit artikel introduceert het NQS-DQME-framework, dat kunstmatige neurale netwerken combineert met dissipaton-gebaseerde kwantummeestervergelijkingen om niet-Markoviaanse open kwantumsystemen nauwkeurig en schaalbaar te simuleren.

Long Cao, Liwei Ge, Daochi Zhang, Xiang Li, Yao Wang, Rui-Xue Xu, YiJing Yan, Xiao Zheng2026-03-10⚛️ quant-ph

LoRA-Ensemble: Efficient Uncertainty Modelling for Self-Attention Networks

Het artikel introduceert LoRA-Ensemble, een parameter-efficiënte methode voor zelfattentie-netwerken die via Low-Rank Adaptatie een impliciete ensemble vormt die niet alleen de nauwkeurigheid van expliciete ensembles evenaart of overtreft, maar ook superieure kalibratie biedt.

Dominik J. Mühlematter, Michelle Halbheer, Alexander Becker, Dominik Narnhofer, Helge Aasen, Konrad Schindler, Mehmet Ozgur Turkoglu2026-03-10🤖 cs.LG

Fast Explanations via Policy Gradient-Optimized Explainer

Dit paper introduceert FEX, een nieuw framework dat attributie-gebaseerde uitleggen via waarschijnlijkheidsverdelingen en policy gradient-optimalisatie mogelijk maakt, waardoor de inferentietijd met meer dan 97% en het geheugengebruik met 70% wordt gereduceerd ten opzichte van traditionele model-onafhankelijke methoden, terwijl de kwaliteit en toepasbaarheid behouden blijven.

Deng Pan, Nuno Moniz, Nitesh Chawla2026-03-10🤖 cs.LG

Exploring Diffusion Models' Corruption Stage in Few-Shot Fine-tuning and Mitigating with Bayesian Neural Networks

Dit paper identificeert en analyseert een 'corruptiestadium' tijdens het few-shot fine-tunen van diffusiemodellen, waarbij beeldkwaliteit tijdelijk verslechtert door een versmalde leerverdeling, en lost dit op door Bayesiaanse neurale netwerken toe te passen om de distributie te verbreden en zo de beeldkwaliteit, diversiteit en trouw te verbeteren zonder extra inferentiekosten.

Xiaoyu Wu, Jiaru Zhang, Yang Hua, Bohan Lyu, Hao Wang, Tao Song, Haibing Guan2026-03-10🤖 cs.LG

DKDL-Net: A Lightweight Bearing Fault Detection Model via Decoupled Knowledge Distillation and Low-Rank Adaptation Fine-tuning

Dit artikel introduceert DKDL-Net, een lichtgewicht model voor het detecteren van defecten in rollende lagers dat decoupled knowledge distillation en low-rank adaptatie combineert om een nauwkeurigheid van 99,48% te bereiken met aanzienlijk minder parameters dan bestaande methoden.

Ovanes Petrosian, Li Pengyi, He Yulong + 4 more2026-03-10🤖 cs.LG

Estimating Treatment Effects under Algorithmic Interference: A Structured Neural Networks Approach

Dit artikel introduceert een gestructureerd semiparametrisch raamwerk dat dubbel machine learning combineert met modellen voor algoritmekeuze en kijkersrespons om de vertekende schattingen van behandelingseffecten door algoritmische interferentie in tweezijdige markten te corrigeren en zo nauwkeurige globale effecten voor platformrollouts te kunnen bepalen.

Ruohan Zhan, Shichao Han, Yuchen Hu, Zhenling Jiang2026-03-10🤖 cs.LG

LAMBDA: A Large Model Based Data Agent

Dit paper introduceert LAMBDA, een open-source, codevrij multi-agent systeem dat grote taalmodellen gebruikt om data-analyse te stroomlijnen via een samenwerking tussen programmeur- en inspecteur-agenten, met ondersteuning voor menselijke ingrepen en externe kennisintegratie.

Maojun Sun, Ruijian Han, Binyan Jiang + 4 more2026-03-10🤖 cs.AI

← Vorige Volgende →