cs.LG papers | Gist.Science

SWE-MiniSandbox: Container-Free Reinforcement Learning for Building Software Engineering Agents

Dit paper introduceert SWE-MiniSandbox, een lichtgewicht, container-vrije methode die schaalbaar reinforcement learning voor software-engineering-agenten mogelijk maakt door kernel-gebaseerde isolatie te gebruiken, wat leidt tot aanzienlijke besparingen in schijfruimte en opstarttijd zonder in te leveren op prestaties.

Danlong Yuan, Wei Wu, Zhengren Wang, Xueliang Zhao, Huishuai Zhang, Dongyan Zhao2026-03-09🤖 cs.AI

MiDAS: A Multimodal Data Acquisition System and Dataset for Robot-Assisted Minimally Invasive Surgery

Dit paper introduceert MiDAS, een open-source, platform-onafhankelijk systeem voor tijdgesynchroniseerde, niet-invasieve multimodale dataverzameling bij robot-assisterende minimaal invasieve chirurgie, dat wordt ondersteund door een nieuw dataset met hand- en voetbewegingen en video-opnames van chirurgen die taken uitvoeren op de Raven-II en da Vinci Xi.

Keshara Weerasinghe (MD), Seyed Hamid Reza Roodabeh (MD), Andrew Hawkins (MD), Zhaomeng Zhang, Zachary Schrader, Homa Alemzadeh2026-03-09🤖 cs.LG

An Adaptive Model Selection Framework for Demand Forecasting under Horizon-Induced Degradation to Support Business Strategy and Operations

Dit artikel introduceert AHSIV, een adaptief raamwerk voor modelselectie in vraagprognoses dat de prestatiedegradatie door forecast-horizonten en de variabiliteit in vraagpatronen adresseert door een horizonbewuste, regime-geconditioneerde aanpak te combineren met multi-objectieve optimalisatie en hiërarchische biascorrectie.

Adolfo González, Víctor Parada2026-03-09🤖 cs.AI

GaiaFlow: Semantic-Guided Diffusion Tuning for Carbon-Frugal Search

GaiaFlow is een innovatief framework dat semantisch geleide diffusietuning combineert met adaptieve vroege exits en kwantisatie om de ecologische voetafdruk van neurale zoeksystemen aanzienlijk te verminderen zonder in te leveren op de zoekkwaliteit.

Rong Fu, Jia Yee Tan, Chunlei Meng, Shuo Yin, Xiaowen Ma, Wangyu Wu, Muge Qi, Guangzhen Yao, Zhaolu Kang, Zeli Su, Simon Fong2026-03-09🤖 cs.LG

MolCrystalFlow: Molecular Crystal Structure Prediction via Flow Matching

Dit paper introduceert MolCrystalFlow, een op stroming gebaseerd generatief model dat intramoleculaire complexiteit en intermoleculaire pakking ontkoppelt door moleculen als stijve lichamen te behandelen op Riemanniaanse variëteiten, waardoor het de uitdaging van het voorspellen van kristalstructuren van grote moleculaire kristallen effectief aanpakt.

Cheng Zeng, Harry W. Sullivan, Thomas Egg, Maya M. Martirossyan, Philipp Höllmer, Jirui Jin, Richard G. Hennig, Adrian Roitberg, Stefano Martiniani, Ellad B. Tadmor, Mingjie Liu2026-03-09🔬 cond-mat.mtrl-sci

The Limits of Long-Context Reasoning in Automated Bug Fixing

Dit onderzoek toont aan dat hoewel agentische workflows met taakdecompositie de prestaties van grote taalmodellen bij het oplossen van bugs verbeteren, hun vermogen tot daadwerkelijk lang-context redeneren beperkt blijft, wat leidt tot scherpe prestatiedalingen bij het genereren van patches in contexten van 64k tokens.

Ravi Raju, Mengmeng Ji, Shubhangi Upasani, Bo Li, Urmish Thakker2026-03-09🤖 cs.LG

FLoRG: Federated Fine-tuning with Low-rank Gram Matrices and Procrustes Alignment

Het artikel introduceert FLoRG, een federatief fijnafstemkingsframework dat aggregatiefouten en decompositiedrift in LoRA vermindert door het gebruik van een enkele laag-rang Gram-matrix en Procrustes-uitlijning, wat leidt tot verbeterde nauwkeurigheid en een tot 2041-voudige reductie in communicatiekosten.

Chuiyang Meng, Ming Tang, Vincent W. S. Wong2026-03-09🤖 cs.AI

Conditionally Site-Independent Neural Evolution of Antibody Sequences

Dit paper introduceert CoSiNE, een deep learning-model dat de evolutionaire dynamiek van antilichamen nabootst door somatische hypermutatie en selectie te ontkoppelen, waardoor het superieure prestaties boekt in het voorspellen van varianteffecten en het optimaliseren van bindingsaffiniteit.

Stephen Zhewen Lu, Aakarsh Vermani, Kohei Sanno, Jiarui Lu, Frederick A Matsen, Milind Jagota, Yun S. Song2026-03-09🤖 cs.LG

What Topological and Geometric Structure Do Biological Foundation Models Learn? Evidence from 141 Hypotheses

Dit onderzoek toont aan dat biologische foundation-modellen zoals scGPT en Geneformer een betekenisvolle, gedeelde maar lokaal geconcentreerde topologische en geometrische structuur leren in hun interne representaties, zoals bevestigd door een autonoom gescreende reeks van 141 hypothesen.

Ihor Kendiukhov2026-03-09🤖 cs.LG

Exploratory Memory-Augmented LLM Agent via Hybrid On- and Off-Policy Optimization

Dit paper introduceert EMPO², een hybride RL-framework dat geheugen en een combinatie van on- en off-policy optimalisatie gebruikt om de exploratie en generalisatie van LLM-agenten te verbeteren, wat resulteert in aanzienlijke prestatieverbeteringen op benchmarks zoals ScienceWorld en WebShop.

Zeyuan Liu, Jeonghye Kim, Xufang Luo, Dongsheng Li, Yuqing Yang2026-03-09🤖 cs.AI

Modality Collapse as Mismatched Decoding: Information-Theoretic Limits of Multimodal LLMs

Dit artikel toont vanuit een informatie-theoretisch perspectief aan dat modality collapse in multimodale LLM's het gevolg is van een mismatch tussen de decoder en de brondata, waarbij het trainingsdoel van de decoder bepaalt welke informatie toegankelijk is in plaats van de modelarchitectuur of encoder-uitlijning.

Jayadev Billa2026-03-09🤖 cs.AI

Coverage-Aware Web Crawling for Domain-Specific Supplier Discovery via a Web--Knowledge--Web Pipeline

Dit artikel introduceert een Web-Kennis-Web-pijplijn die webcrawling, geavanceerde kennisgrafiek-extractie en ecologische dekkingsschatting combineert om de ontdekking van niche-toeleveranciers voor de toeleveringsketen-resilience te maximaliseren met een hogere precisie en een efficiënter gebruik van crawl-budget.

Yijiashun Qi, Yijiazhen Qi, Tanmay Wagh2026-03-09🤖 cs.LG

Weight Updates as Activation Shifts: A Principled Framework for Steering

Dit paper introduceert een principieel raamwerk dat activatie-sturing gelijkstelt aan gewichtsupdates, wat leidt tot een nieuwe 'joint adaptation'-methode die met slechts 0,04% van de parameters de prestaties van volledige fine-tuning benadert en bestaande technieken zoals LoRA en ReFT overtreft.

Dyah Adila, John Cooper, Alexander Yun, Avi Trost, Frederic Sala2026-03-09🤖 cs.LG

Reparameterized Tensor Ring Functional Decomposition for Multi-Dimensional Data Recovery

Dit paper introduceert een gereparameteriseerde tensorring-functionele decompositie die impliciete neurale representaties en een frequentiedomein-gebaseerde herparameterisatie combineert om de beperkingen van traditionele methoden voor discrete roosters te overwinnen en superieure prestaties te leveren bij het herstellen van multidimensionale data zoals afbeeldingen en puntwolken.

Yangyang Xu, Junbo Ke, You-Wei Wen, Chao Wang2026-03-09🤖 cs.AI

LMU-Based Sequential Learning and Posterior Ensemble Fusion for Cross-Domain Infant Cry Classification

Dit paper presenteert een compact acoustisch kader dat MFCC-, STFT- en pitch-kenmerken combineert met een verbeterde Legendre Memory Unit (LMU) en een geposte ensemble-fusie om de cross-domein classificatie van babyhuilen te verbeteren, wat leidt tot betere generalisatie en efficiëntie voor draagbare gezondheidsmonitoring.

Niloofar Jazaeri, Hilmi R. Dajani, Marco Janeczek, Martin Bouchard2026-03-09🤖 cs.LG

Whisper-RIR-Mega: A Paired Clean-Reverberant Speech Benchmark for ASR Robustness to Room Acoustics

Dit paper introduceert Whisper-RIR-Mega, een nieuw benchmarkdataset met gekoppelde schone en reverberante spraak om de robuustheid van Whisper-spraakherkenningsmodellen tegen ruimteakoestiek te evalueren en vast te stellen dat reverberatie de prestaties consistent verslechtert.

Mandip Goswami2026-03-09🤖 cs.AI

Rigidity-Aware Geometric Pretraining for Protein Design and Conformational Ensembles

Dit paper introduceert RigidSSL, een zelftoezichtend pretrainingsframework dat rigiditeitsbewuste geometrische priors leert om de ontwerpbereidheid, diversiteit en fysische realisme van eiwitgeneratie en conformationele ensembles aanzienlijk te verbeteren.

Zhanghan Ni, Yanjing Li, Zeju Qiu, Bernhard Schölkopf, Hongyu Guo, Weiyang Liu, Shengchao Liu2026-03-09🤖 cs.AI

mlx-vis: GPU-Accelerated Dimensionality Reduction and Visualization on Apple Silicon

mlx-vis is een Python-bibliotheek die zes methoden voor dimensiereductie en een k-nabuur-grafiek-algoritme volledig op Apple Silicon-gpu's implementeert via MLX, en tevens een versnelde renderer biedt voor het genereren van scatterplots en animaties.

Han Xiao2026-03-09🤖 cs.LG

Traversal-as-Policy: Log-Distilled Gated Behavior Trees as Externalized, Verifiable Policies for Safe, Robust, and Efficient Agents

Het artikel introduceert Traversal-as-Policy, een methode die OpenHands-uitvoeringslogs distilleert tot een uitvoerbaar, verifieerbaar Gated Behavior Tree-beleid dat autonome agents veiliger, robuuster en efficiënter maakt door het onbeperkte genereren te vervangen door gestructureerde boomtraversie met deterministische veiligheidscontroles.

Peiran Li, Jiashuo Sun, Fangzhou Lin, Shuo Xing, Tianfu Fu, Suofei Feng, Chaoqun Ni, Zhengzhong Tu2026-03-09🤖 cs.AI

Information-Theoretic Privacy Control for Sequential Multi-Agent LLM Systems

Dit artikel introduceert een theoretisch kader en een privacy-geregulariseerd trainingsframework om compositiegevoelige privacylekkage in sequentiële multi-agent LLM-systemen te beperken, waarbij wordt aangetoond dat privacy een systeemkarakteristiek is die niet alleen door lokale beperkingen kan worden gegarandeerd.

Sadia Asif, Mohammad Mohammadi Amiri2026-03-09🤖 cs.LG

← Vorige Volgende →