cs.LG papers | Gist.Science

Making LLMs Optimize Multi-Scenario CUDA Kernels Like Experts

Deze paper introduceert MSKernelBench, een uitgebreide benchmark voor diverse scenario's, en CUDAMaster, een multi-agent systeem dat Large Language Models gebruikt om CUDA-kernels te optimaliseren en hiermee aanzienlijke snelheidswinst behaalt die vaak de prestaties van gespecialiseerde bibliotheken zoals cuBLAS benadert of overtreft.

Yuxuan Han, Meng-Hao Guo, Zhengning Liu, Wenguang Chen, Shi-Min Hu2026-03-10🤖 cs.LG

Shaping Parameter Contribution Patterns for Out-of-Distribution Detection

Dit paper introduceert SPCP, een methode die de robuustheid van out-of-distribution detectie verbetert door tijdens het trainen de afhankelijkheid van een paar dominante parameters te verminderen en in plaats daarvan een bredere, dichte bijdragepatroon te stimuleren, waardoor oververzekerde voorspellingen voor afwijkende data worden voorkomen zonder de prestaties op bekende data te schaden.

Haonan Xu, Yang Yang2026-03-10🤖 cs.LG

A Dual-Graph Spatiotemporal GNN Surrogate for Nonlinear Response Prediction of Reinforced Concrete Beams under Four-Point Bending

Deze paper introduceert een dual-graph spatiotemporeel GNN-surrogaatmodel dat de niet-lineaire respons van gewapend betonnen balken onder vierpuntbending efficiënt voorspelt door kinematische en geschiedenisafhankelijke variabelen via gescheiden grafische takken te koppelen, waardoor kostbare eindige-elementensimulaties voor parametrisch ontwerp kunnen worden vervangen.

Zhaoyang Ren, Qilin Li2026-03-10🤖 cs.LG

wDPO: Winsorized Direct Preference Optimization for Robust LLM Alignment

Deze paper introduceert wDPO, een robuuste variant van Direct Preference Optimization die door middel van hiërarchische winsorisatie en gerichte interventies op data- en gradiëntniveau effectief omgaat met verschillende soorten ruis in voorkeursdata voor betere LLM-uitlijning.

Jilong Liu, Yonghui Yang, Pengyang Shao, Haokai Ma, Wei Qin, Richang Hong2026-03-10🤖 cs.LG

Towards Objective Gastrointestinal Auscultation: Automated Segmentation and Annotation of Bowel Sound Patterns

Deze studie presenteert een geautomatiseerd systeem voor het segmenteren en classificeren van darmgeluiden met behulp van een draagbare sensor en een AI-model, wat leidt tot objectieve diagnostiek en een aanzienlijke reductie van de tijd voor handmatige annotatie.

Zahra Mansour, Verena Uslar, Dirk Weyhe, Danilo Hollosi, Nils Strodthoff2026-03-10🤖 cs.LG

Margin in Abstract Spaces

Dit artikel toont aan dat margin-based learning in willekeurige metrische ruimten mogelijk is zonder lineaire structuur, zolang de marge voldoende groot is, en ontkracht het idee dat dergelijke leerbaarheid altijd via een inbedding in een Banachruimte kan worden gereduceerd tot lineaire classificatie.

Yair Ashlagi, Roi Livni, Shay Moran, Tom Waknine2026-03-10🤖 cs.LG

Unlocking Data Value in Finance: A Study on Distillation and Difficulty-Aware Training

Dit artikel introduceert ODA-Fin, een data-gedreven aanpak voor financiële taalmodellen die door middel van hoogwaardige distillatie en difficulty-aware training prestaties verbetert en nieuwe state-of-the-art benchmarks bereikt op diverse financiële taken.

Chuxue Cao, Honglin Lin, Zhanping Zhong, Xin Gao, Mengzhang Cai, Conghui He, Sirui Han, Lijun Wu2026-03-10🤖 cs.LG

LightMedSeg: Lightweight 3D Medical Image Segmentation with Learned Spatial Anchors

Het paper introduceert LightMedSeg, een lichtgewicht 3D-medische beeldsegmentatiearchitectuur die anatomische prioren en adaptieve contextmodelling combineert om met slechts 0,48 miljoen parameters een nauwkeurigheid te bereiken die vergelijkbaar is met zware transformer-modellen, terwijl het tegelijkertijd de rekenkosten en geheugeneisen drastisch verlaagt.

Kavyansh Tyagi, Vishwas Rathi, Puneet Goyal2026-03-10🤖 cs.LG

Conditional Rank-Rank Regression via Deep Conditional Transformation Models

Dit artikel introduceert een geavanceerde methode voor conditionele rang-rang-regressie met diepe conditionele transformatiemodellen om intergenerationele mobiliteit nauwkeuriger te meten door covariaten te controleren, wat leidt tot betere prestaties bij niet-lineariteit en discrete uitkomsten en wordt toegepast op inkomensmobiliteit in de VS en onderwijsmobiliteit in India.

Xiaoyi Wang, Long Feng, Zhaojun Wang2026-03-10🤖 cs.LG

Retrieval-Augmented Generation for Predicting Cellular Responses to Gene Perturbation

Dit artikel introduceert PT-RAG, een nieuw twee-traps framework dat differentieerbare, celtype-bewuste retrieval-augmented generation toepast om de respons van cellen op gen-perturbaties nauwkeuriger te voorspellen dan bestaande methoden.

Andrea Giuseppe Di Francesco, Andrea Rubbi, Pietro Liò2026-03-10🤖 cs.LG

Rethinking Deep Research from the Perspective of Web Content Distribution Matching

Het paper introduceert WeDas, een plug-and-play framework dat de prestaties van diepe zoekagenten verbetert door de zoekruimte-structuur van het web te integreren en een few-shot probeermethode te gebruiken om zoekopdrachten dynamisch af te stemmen op de lokale inhoudsverdeling.

Zixuan Yu, Zhenheng Tang, Tongliang Liu, Chengqi Zhang, Xiaowen Chu, Bo Han2026-03-10🤖 cs.LG

LF2L: Loss Fusion Horizontal Federated Learning Across Heterogeneous Feature Spaces Using External Datasets Effectively: A Case Study in Second Primary Cancer Prediction

Deze studie introduceert het LF2L-framework, een methode voor horizontale federated learning die door het fusioneren van verliezen effectief externe SEER-gegevens combineert met lokale Taiwanese data om de voorspelling van tweede primaire longkanker te verbeteren zonder privacy te schenden.

Chia-Fu Lin, Yi-Ju Tseng2026-03-10🤖 cs.LG

Turning Time Series into Algebraic Equations: Symbolic Machine Learning for Interpretable Modeling of Chaotic Time Series

Dit artikel introduceert twee symbolische machine learning-methoden, SyNF en SyTF, die interpreteerbare algebraïsche vergelijkingen leren uit chaotische tijdreeksen om zowel nauwkeurige voorspellingen te maken als inzicht te geven in de onderliggende dynamica.

Madhurima Panja, Grace Younes, Tanujit Chakraborty2026-03-10🤖 cs.LG

Adaptive Double-Booking Strategy for Outpatient Scheduling Using Multi-Objective Reinforcement Learning

Deze paper stelt een adaptief raamwerk voor dat individuele no-show-prognoses combineert met multi-objectief versterkend leren om dynamische beslissingen te nemen over het enkel- of dubbelboeken van afspraken in poliklinieken, waardoor wachttijden en congestie worden geminimaliseerd.

Ninda Nurseha Amalina, Heungjo An2026-03-10🤖 cs.LG

Variational Flow Maps: Make Some Noise for One-Step Conditional Generation

Dit paper introduceert Variational Flow Maps, een raamwerk dat voorwaardelijke generatie en inverse problemen oplost door in plaats van een iteratief pad te volgen, een 'noise adapter' te leren die de juiste initiële ruis genereert voor hoogwaardige, één-staps steekproeven.

Abbas Mammadov, So Takao, Bohan Chen, Ricardo Baptista, Morteza Mardani, Yee Whye Teh, Julius Berner2026-03-10🤖 cs.LG

Fast and Flexible Audio Bandwidth Extension via Vocos

Dit paper introduceert een snelle en flexibele bandwidth extension-methode op basis van Vocos die ontbrekende hoge frequenties genereert om audio van 8-48 kHz te verbeteren, met een lichtgewicht refiner voor naadloze samenvoeging en uitzonderlijk hoge doorvoer op zowel GPU als CPU.

Yatharth Sharma2026-03-10🤖 cs.LG

Spectral Discovery of Continuous Symmetries via Generalized Fourier Transforms

Deze paper introduceert een spectrale framework dat continue symmetrieën ontdekt door geïnduceerde sparsiteit in de spectrale decompositie via de Generalized Fourier Transform te analyseren, wat een interpreteerbaar alternatief biedt voor bestaande generator-gebaseerde methoden.

Pavan Karjol, Kumar Shubham, Prathosh AP2026-03-10🤖 cs.LG

AutoResearch-RL: Perpetual Self-Evaluating Reinforcement Learning Agents for Autonomous Neural Architecture Discovery

Dit paper introduceert AutoResearch-RL, een framework waarin een reinforcement learning-agent zonder menselijke tussenkomst continu neurale architecturen en hyperparameters optimaliseert door code-modificaties voor te stellen en te evalueren totdat een convergentie- of resource-oracle het proces beëindigt.

Nilesh Jain, Rohit Yadav, Sagar Kotian, Claude AI2026-03-10🤖 cs.LG

Retrieval-Augmented Multi-scale Framework for County-Level Crop Yield Prediction Across Large Regions

Dit artikel introduceert een nieuw retrieval-versterkt multi-schaal kader dat korte- en langetermijntemporele patronen combineert met ruimtelijke aanpassing om de nauwkeurigheid en robuustheid van op county-niveau gebaseerde oogstopbrengstvoorspellingen in grote regio's te verbeteren.

Yiming Sun, Qi Cheng, Licheng Liu, Runlong Yu, Yiqun Xie, Xiaowei Jia2026-03-10🤖 cs.LG

StructSAM: Structure- and Spectrum-Preserving Token Merging for Segment Anything Models

Het paper introduceert StructSAM, een nieuw token-merging-framework dat de structuur en het spectrum behoudt om de Segment Anything Model (SAM) efficiënter te maken zonder de precisie van randen of prompt-informatie te verliezen.

Duy M. H. Nguyen, Tuan A. Tran, Duong Nguyen, Siwei Xie, Trung Q. Nguyen, Mai T. N. Truong, Daniel Palenicek, An T. Le, Michael Barz, TrungTin Nguyen, Tuan Dam, Ngan Le, Minh Vu, Khoa Doan, Vien Ngo, Pengtao Xie, James Zou, Daniel Sonntag, Jan Peters, Mathias Niepert2026-03-10🤖 cs.LG

← Vorige Volgende →