cs.LG papers | Gist.Science

Linear probes rely on textual evidence: Results from leakage mitigation studies in language models

Deze studie toont aan dat lineaire probes voor het detecteren van schadelijk gedrag in taalmodellen sterk afhankelijk zijn van tekstuele aanwijzingen en aanzienlijk minder effectief worden zodra deze expliciete teksten worden gefilterd of afwezig zijn.

Gerard Boxo, Aman Neelappa, Shivam Raval2026-03-10🤖 cs.LG

AEGIS: Authentic Edge Growth In Sparsity for Link Prediction in Edge-Sparse Bipartite Knowledge Graphs

Dit paper introduceert AEGIS, een framework voor linkpredictie in schaarse bipartiete kennisgrafieken dat authentieke randen versterkt door bestaande randen te hersamplen of semantische KNN-augmentatie toe te passen, waardoor de prestaties worden verbeterd zonder valse eindpunten te genereren.

Hugh Xuechen Liu, Kıvanç Tatar2026-03-10🤖 cs.LG

Aurora: Towards Universal Generative Multimodal Time Series Forecasting

Aurora is een multimodaal foundation model voor tijdsreeksvoorspelling dat, door gebruik te maken van tekst- en beeldinformatie en zero-shot inferentie, superieure prestaties levert in diverse domeinen via een prototype-geleide flow matching-methode.

Xingjian Wu, Jianxin Jin, Wanghui Qiu + 4 more2026-03-10🤖 cs.LG

GDR-learners: Orthogonal Learning of Generative Models for Potential Outcomes

Dit paper introduceert GDR-learners, een flexibel framework dat bestaande diepe generatieve modellen (zoals normalizing flows, GANs, VAEs en diffusion modellen) combineert met Neyman-orthogonaliteit om conditionele verdelingen van potentiële uitkomsten te schatten met dubbele robustheid en quasi-orakel-efficiëntie.

Valentyn Melnychuk, Stefan Feuerriegel2026-03-10🤖 cs.LG

CLAD-Net: Continual Activity Recognition in Multi-Sensor Wearable Systems

In dit paper wordt CLAD-Net voorgesteld, een framework dat zelftoezichtende transformers en kennisdistillatie combineert om continue menselijke activiteitsherkenning op draagbare sensoren mogelijk te maken zonder dat er sprake is van catastrofisch vergeten, zelfs bij beperkte gelabelde data.

Reza Rahimi Azghan, Gautham Krishna Gudur, Mohit Malu, Edison Thomaz, Giulia Pedrielli, Pavan Turaga, Hassan Ghasemzadeh2026-03-10🤖 cs.LG

Generative Evolutionary Meta-Solver (GEMS): Scalable Surrogate-Free Multi-Agent Reinforcement Learning

Het artikel introduceert GEMS, een schaalbaar, surrogaatvrij multi-agent versterkingsleringsframework dat de inefficiënties van PSRO overwint door expliciete populaties te vervangen door een compacte generator, waardoor het aanzienlijk sneller en minder geheugenintensief is terwijl het hogere beloningen behaalt.

Alakh Sharma, Gaurish Trivedi, Kartikey Singh Bhandari, Yash Sinha, Dhruv Kumar, Pratik Narang, Jagat Sesh Challa2026-03-10🤖 cs.LG

FS-KAN: Permutation Equivariant Kolmogorov-Arnold Networks via Function Sharing

Dit paper introduceert FS-KAN, een principieel kader voor permutatie-equivariante Kolmogorov-Arnold-netwerken dat door het delen van functies een uniforme aanpak biedt voor willekeurige permutatiesymmetriegroepen, wat leidt tot superieure data-efficiëntie en interpretbaarheid vergeleken met bestaande methoden.

Ran Elbaz, Guy Bar-Shalom, Yam Eitan, Fabrizio Frasca, Haggai Maron2026-03-10🤖 cs.LG

Overlap-Adaptive Regularization for Conditional Average Treatment Effect Estimation

Dit artikel introduceert Overlap-Adaptieve Regularisatie (OAR), een flexibele methode die bestaande meta-learners voor het schatten van conditionele gemiddelde behandelingseffecten verbetert in situaties met lage overlap door de regularisatie adaptief te koppelen aan overlap-gewichten.

Valentyn Melnychuk, Dennis Frauen, Jonas Schweisthal, Stefan Feuerriegel2026-03-10🤖 cs.LG

Cold-Start Active Correlation Clustering

Dit paper introduceert een nieuwe, diversiteitsgerichte methode voor actief correlatieclustering die specifiek is ontworpen om het uitdaging van de 'cold-start' situatie aan te pakken, waarbij geen vooraf bekende gelijkenissen beschikbaar zijn.

Linus Aronsson, Han Wu, Morteza Haghir Chehreghani2026-03-10🤖 cs.LG

Feedback Control for Small Budget Pacing

Dit paper introduceert een gestructureerde feedbackregelaar die hysteresis en proportionele regeling combineert om de bestedingspacing voor kleine advertentiebudgetten in online veilingen aanzienlijk te verbeteren, wat resulteert in een lagere bestedingsfout en een stabielere leveringsconsistentie.

Sreeja Apparaju, Yichuan Niu, Xixi Qi2026-03-10🤖 cs.LG

Your Agent May Misevolve: Emergent Risks in Self-evolving LLM Agents

Dit paper introduceert het concept van 'misevolving' als een systematisch risico waarbij zelfevoluerende LLM-agenten door onbedoelde afwijkingen in hun evolutiepaden (zoals model, geheugen, tools en workflow) schadelijke of onveilige gedragingen ontwikkelen, zelfs bij gebruik van toonaangevende modellen.

Shuai Shao, Qihan Ren, Chen Qian, Boyi Wei, Dadi Guo, Jingyi Yang, Xinhao Song, Linfeng Zhang, Weinan Zhang, Dongrui Liu, Jing Shao2026-03-10🤖 cs.LG

An Orthogonal Learner for Individualized Outcomes in Markov Decision Processes

Dit paper introduceert de DRQ-learner, een nieuw meta-leraar voor het schatten van individuele potentiële uitkomsten in Markov-beslissingsprocessen met observationele data, die dubbel robuust, Neyman-orthogonaal en quasi-orakel-efficiënt is en hiermee de prestaties van bestaande methoden verbetert.

Emil Javurek, Valentyn Melnychuk, Jonas Schweisthal, Konstantin Hess, Dennis Frauen, Stefan Feuerriegel2026-03-10🤖 cs.LG

Privately Estimating Black-Box Statistics

Deze paper presenteert een nieuw schema voor differentieel privé schatten van zwarte-bok statistieken dat een afweging biedt tussen statistische en orakel-efficiëntie, vergezeld van ondergrenzen die de near-optimale aard van het schema aantonen.

Günter F. Steinke, Thomas Steinke2026-03-10🤖 cs.LG

Stochastic Self-Organization in Multi-Agent Systems

Dit paper introduceert SelfOrg, een zelforganiserend framework voor multi-agent systemen dat dynamische communicatiestructuren genereert op basis van respons-afhankelijke Shapley-waarden om samenwerking te optimaliseren zonder extra supervisie of training.

Nurbek Tastan, Samuel Horvath, Karthik Nandakumar2026-03-10🤖 cs.LG

CroSTAta: Cross-State Transition Attention Transformer for Robotic Manipulation

Deze paper introduceert CroSTAta, een transformer-architectuur met een nieuwe State Transition Attention-mechanisme die door het modelleren van tijdsafhankelijke overgangspatronen en het gebruik van temporale masking de robuustheid van robotmanipulatiepoliën aanzienlijk verbetert, zelfs bij uitvoeringsvariaties die niet tijdens het trainen zijn gezien.

Giovanni Minelli, Giulio Turrisi, Victor Barasuol, Claudio Semini2026-03-10🤖 cs.LG

Double projection for reconstructing dynamical systems: between stochastic and deterministic regimes

Deze paper introduceert een nieuwe 'double projection'-methode binnen dynamische variatie-automatische coderers om zowel systeemtrajecten als ruisreeksen te schatten uit data, wat leidt tot effectieve meervoudige-stapvoorspellingen en het leren van modellen met een lage-dimensionale toestandsruimte voor zowel stochastische als deterministische dynamische systemen.

Viktor Sip, Martin Breyton, Spase Petkoski, Viktor Jirsa2026-03-10🤖 cs.LG

Automated Extraction of Material Properties using LLM-based AI Agents

Deze studie presenteert een geautomatiseerde, LLM-gestuurde workflow die duizenden wetenschappelijke artikelen analyseert om het grootste tot nu toe bestaande dataset van thermoelektrische eigenschappen en structurele kenmerken te creëren, waarmee de weg vrijgemaakt wordt voor schaalbare, datagedreven materiaalontdekking.

Subham Ghosh, Abhishek Tewari2026-03-10🔬 cond-mat.mtrl-sci

Tree-based Dialogue Reinforced Policy Optimization for Red-Teaming Attacks

Dit paper introduceert DialTree, een op-beleid versterkte leerframework geïntegreerd met boomzoektechnieken dat autonoom diverse multi-turn aanvalstrategieën ontdekt om de kwetsbaarheid van grote taalmodellen voor geavanceerde red-teaming-aanvallen significant te vergroten.

Ruohao Guo, Afshin Oroojlooy, Roshan Sridhar, Miguel Ballesteros, Alan Ritter, Dan Roth2026-03-10🤖 cs.LG

An Senegalese Legal Texts Structuration Using LLM-augmented Knowledge Graph

Deze studie toont aan hoe kunstmatige intelligentie en grote taalmodellen kunnen worden ingezet om Senegalese wetteksten, met name de Grond- en Openbaar Domeincode, gestructureerd te maken in een kennisgrafiek, waardoor de toegang tot juridische informatie voor burgers en professionals wordt verbeterd.

Oumar Kane, Mouhamad M. Allaya, Dame Samb + 1 more2026-03-10💬 cs.CL

The Role of Feature Interactions in Graph-based Tabular Deep Learning

Deze studie toont aan dat bestaande grafgebaseerde tabulaire deep learning-methoden vaak falen in het nauwkeurig modelleren van onderliggende feature-interacties, wat leidt tot de conclusie dat het prioriteren van de juiste grafstructuur essentieel is voor het verbeteren van voorspellingsnauwkeurigheid.

Elias Dubbeldam, Reza Mohammadi, Marit Schoonhoven, S. Ilker Birbil2026-03-10🤖 cs.LG

← Vorige Volgende →