cs.LG papers | Gist.Science

Chart Deep Research in LVLMs via Parallel Relative Policy Optimization

Dit paper introduceert PRPO, een trainingsmethode die conflicten tussen beloningssignalen en data oplost, en MCDR-Bench, een objectieve evaluatiebenchmark, om de diepe analysecapaciteiten van LVLMs voor diagrammen systematisch te verbeteren.

Jiajin Tang, Gaoyang, Wenjie Wang, Sibei Yang, Xing Chen2026-03-10🤖 cs.LG

One step further with Monte-Carlo sampler to guide diffusion better

Deze paper introduceert een plug-and-play strategie die Monte-Carlo-steekproeven en een extra achterwaartse stap combineert om de schattingsfouten bij stochastische differentiaalvergelijkingen te verminderen, waardoor de geleide generatie van afbeeldingen en andere data in diverse toepassingen significant verbetert.

Minsi Ren, Wenhao Deng, Ruiqi Feng, Tailin Wu2026-03-10🤖 cs.LG

High-Resolution Image Reconstruction with Unsupervised Learning and Noisy Data Applied to Ion-Beam Dynamics for Particle Accelerators

Dit artikel introduceert een nieuw, onbewaakt leerframework dat convolutiefilters en neurale netwerken gebruikt om ruisige ionenstraalbeelden te reconstrueeren en zo de resolutie van straalhalo's aanzienlijk verbetert zonder trainingsdata.

Francis Osswald (IPHC), Mohammed Chahbaoui (UNISTRA), Xinyi Liang (SU)2026-03-10🤖 cs.LG

Soft Equivariance Regularization for Invariant Self-Supervised Learning

Dit artikel introduceert Soft Equivariance Regularization (SER), een plug-in regularisatiemethode die invariance en equivariantie in zelftoezichtend leren ontkoppelt door equivariantie op een tussenlaag af te dwingen, wat leidt tot verbeterde prestaties op ImageNet en robuustheid tegen geometrische verstoringen zonder extra voorspellingskoppen.

Joohyung Lee, Changhun Kim, Hyunsu Kim, Kwanhyung Lee, Juho Lee2026-03-10🤖 cs.LG

On the Generalization Capacities of MLLMs for Spatial Intelligence

Dit paper stelt dat MLLMs die alleen RGB-gegevens verwerken fundamenteel tekortschieten in ruimtelijk inzicht door camera-parameters te negeren, en introduceert daarom een camera-bewust raamwerk dat door het integreren van camera-intrinsieke parameters en data-augmentatie zorgt voor robuustere en generaliseerbare ruimtelijke redeneerfähigheden.

Gongjie Zhang, Wenhao Li, Quanhao Qian, Jiuniu Wang, Deli Zhao, Shijian Lu, Ran Xu2026-03-10🤖 cs.LG

Uncertainty-Aware Solar Flare Regression

Dit artikel toont aan dat het toepassen van conformalized quantile regression op deep learning-modellen voor het voorspellen van zonnevlammen uit magnetische veldkaarten leidt tot betrouwbaardere voorspellingen met nauwkeurigere betrouwbaarheidsintervallen dan andere methoden.

Jinsu Hong, Chetraj Pandey, Berkay Aydin2026-03-10🔭 astro-ph

Scaling Agentic Capabilities, Not Context: Efficient Reinforcement Finetuning for Large Toolspaces

Dit paper introduceert ATLAS, een reinforcement finetuning-framework dat kleine taalmodellen in staat stelt om effectief te opereren in grote tool-ecosystemen door contextbeheer en uitvoering als leerbare beslissingen te behandelen, waardoor ze met beperkte middelen prestaties kunnen bereiken die dicht bij die van geavanceerde agenten liggen.

Karan Gupta, Pranav Vajreshwari, Yash Pandya, Raghav Magazine, Akshay Nambi, Ahmed Awadallah2026-03-10🤖 cs.LG

From Statistical Fidelity to Clinical Consistency: Scalable Generation and Auditing of Synthetic Patient Trajectories

Deze studie presenteert een schaalbaar proces voor het genereren van klinisch consistente synthetische patiënttrajecten door een kennisgebaseerd generatief model te combineren met een geautomatiseerde auditmodule op basis van grote taalmodellen, wat resulteert in data die statistisch en klinisch betrouwbaar is voor downstream-toepassingen zonder privacyrisico's.

Guanglin Zhou, Armin Catic, Motahare Shabestari, Matthew Young, Chaiquan Li, Katrina Poppe, Sebastiano Barbieri2026-03-10🤖 cs.LG

ProtAlign: Contrastive learning paradigm for Sequence and structure alignment

Dit paper introduceert ProtAlign, een contrastief leerframework dat een gedeelde inbeddingsruimte creëert voor eiwitsequenties en -structuren, waardoor cross-modale zoekopdrachten worden verbeterd en downstream-taken zoals functietoewijzing en stabiliteitsschatting worden versterkt.

Aditya Ranganath, Hasin Us Sami, Kowshik Thopalli, Bhavya Kailkhura, Wesam Sakla2026-03-10🤖 cs.LG

Bi Directional Feedback Fusion for Activity Aware Forecasting of Indoor CO2 and PM2.5

Dit artikel introduceert een tweestroms bi-directioneel feedbackfusieframework dat menselijke activiteiten en omgevingsfactoren integreert om de voorspelling van binnenluchtkwaliteit (CO2 en PM2.5) significant te verbeteren ten opzichte van bestaande methoden.

Harshala Gammulle, Lidia Morawska, Sridha Sridharan, Clinton Fookes2026-03-10🤖 cs.LG

Regression Models Meet Foundation Models: A Hybrid-AI Approach to Practical Electricity Price Forecasting

Dit paper introduceert FutureBoosting, een hybride AI-ramenwerk dat de voorspellingsnauwkeurigheid van elektriciteitsprijzen aanzienlijk verbetert door forecasted features van een gefrozen tijdsreeks-foundation model te integreren in een regressiemodel, wat resulteert in een reductie van de gemiddelde absolute fout van meer dan 30%.

Yunzhong Qiu, Binzhu Li, Hao Wei, Shenglin Weng, Chen Wang, Zhongyi Pei, Mingsheng Long, Jianmin Wang2026-03-10🤖 cs.LG

Safe Transformer: An Explicit Safety Bit For Interpretable And Controllable Alignment

Het paper introduceert de Safe Transformer, een modulaire aanpak die een expliciete veiligheidsbit in taalmodellen integreert om zowel de interpretatie van veiligheidsbeslissingen als de controle over het gedrag van het model te verbeteren zonder volledige hertraining.

Jingyuan Feng, Andrew Gambardella, Gouki Minegishi, Takeshi Kojima, Yusuke Iwasawa, Yutaka Matsuo2026-03-10🤖 cs.LG

Orion: Characterizing and Programming Apple's Neural Engine for LLM Training and Inference

Orion is het eerste open end-to-end systeem dat de Apple Neural Engine direct aanstuurt via private API's om zowel stabiel on-device training als snelle inferentie van grote taalmodellen mogelijk te maken door CoreML te omzeilen en recompilatie-tijd tijdens training drastisch te reduceren.

Ramchand Kumaresan2026-03-10🤖 cs.LG

Don't Freeze, Don't Crash: Extending the Safe Operating Range of Neural Navigation in Dense Crowds

Dit paper introduceert een versterkingsleerbenadering die door middel van dichtheidsinvariante observatiecodering en trainingsrandomisatie veilige navigatie in dichte menigten mogelijk maakt zonder te bevriezen of te crashen, zelfs bij onbekende, hogere dichtheden dan tijdens de training.

Jiefu Zhang, Yang Xu, Vaneet Aggarwal2026-03-10🤖 cs.LG

PolyBlocks: A Compiler Infrastructure for AI Chips and Programming Frameworks

Dit paper introduceert PolyBlocks, een modulaire MLIR-gebaseerde compilerinfrastructuur voor AI-chips en -frameworks die via geautomatiseerde optimalisaties en analytische kostenmodellen prestaties levert die concurreren met of zelfs de beste vendor-bibliotheken en bestaande compilatoren zoals Torch Inductor en XLA overtreffen.

Uday Bondhugula, Akshay Baviskar, Navdeep Katel, Vimal Patel, Anoop JS, Arnab Dutta2026-03-10🤖 cs.LG

Calibrated Credit Intelligence: Shift-Robust and Fair Risk Scoring with Bayesian Uncertainty and Gradient Boosting

Dit paper introduceert Calibrated Credit Intelligence (CCI), een deploymentgericht framework dat Bayesiaanse onzekerheid, fairness-beperkte gradient boosting en shift-bewuste fusie combineert om credit risk scores te leveren die onder tijdsafhankelijke verschuivingen nauwkeurig, goed gekalibreerd en eerlijk blijven.

Srikumar Nayak2026-03-10🤖 cs.LG

Rank-Factorized Implicit Neural Bias: Scaling Super-Resolution Transformer with FlashAttention

Deze paper introduceert Rank-Factorized Implicit Neural Bias (RIB), een methode die Super-Resolution Transformers compatibel maakt met FlashAttention door relatieve positionele bias te vervangen, waardoor de trainings- en inferentiesnelheid aanzienlijk wordt verbeterd en grotere venstergroottes mogelijk worden voor superieure prestaties.

Dongheon Lee, Seokju Yun, Jaegyun Im, Youngmin Ro2026-03-10🤖 cs.LG

Heterogeneous Decentralized Diffusion Models

Deze paper introduceert een efficiënt raamwerk voor heterogene decentrale diffusiemodellen dat de trainingskosten aanzienlijk verlaagt en diverse trainingsdoelen (DDPM en Flow Matching) mogelijk maakt, wat resulteert in een 16-voudige reductie in rekenkracht en een 14-voudige reductie in data ten opzichte van eerdere methoden.

Zhiying Jiang, Raihan Seraj, Marcos Villagra, Bidhan Roy2026-03-10🤖 cs.LG

Improved Constrained Generation by Bridging Pretrained Generative Models

Deze paper introduceert een raamwerk dat een vooraf getraind generatief model fijntuint om samples direct binnen complexe, realistische beperkte gebieden te genereren, waardoor een nieuw compromis wordt gevonden tussen het naleven van constraints en de kwaliteit van de generatie.

Xiaoxuan Liang, Saeid Naderiparizi, Yunpeng Liu, Berend Zwartsenberg, Frank Wood2026-03-10🤖 cs.LG

Stabilizing Reinforcement Learning for Diffusion Language Models

Deze paper introduceert StableDRL, een gestabiliseerde variant van Group Relative Policy Optimization (GRPO) die specifiek is ontworpen om reward collapse te voorkomen bij het toepassen van versterkingslering op diffusie-taalmodellen door onbetrouwbare schattingen van waarschijnlijkheidsverhoudingen aan te pakken via onvoorwaardelijke clipping en zelf-normalisatie.

Jianyuan Zhong, Kaibo Wang, Ding Ding, Zijin Feng, Haoli Bai, Yang Xiang, Jiacheng Sun, Qiang Xu2026-03-10🤖 cs.LG

← Vorige Volgende →