cs.LG papers | Gist.Science

ROSE: Reordered SparseGPT for More Accurate One-Shot Large Language Models Pruning

Dit paper introduceert ROSE, een geoptimaliseerde versie van SparseGPT die door middel van een twee-niveau herschikking van de pruning-sequentie gebaseerd op geschatte verlieswaarden, de prestaties van één-slag (one-shot) pruning van grote taalmodellen aanzienlijk verbetert.

Mingluo Su, Huan Wang2026-03-09🤖 cs.LG

PixARMesh: Autoregressive Mesh-Native Single-View Scene Reconstruction

PixARMesh is een autoregressieve methode die vanuit één RGB-afbeelding complete, artistiek bruikbare 3D-interieurscènes reconstrueert door objectindeling en geometrie direct in een unifyd model te voorspellen, zonder afhankelijkheid van impliciete afstandsvelden of latere optimalisatie.

Xiang Zhang, Sohyun Yoo, Hongrui Wu, Chuan Li, Jianwen Xie, Zhuowen Tu2026-03-09🤖 cs.LG

Mitigating Bias in Concept Bottleneck Models for Fair and Interpretable Image Classification

Dit paper introduceert drie technieken om bias in Concept Bottleneck Models te verminderen, waardoor deze modellen zowel eerlijker als interpreteerbaarder worden voor beeldclassificatie.

Schrasing Tong, Antoine Salaun, Vincent Yuan, Annabel Adeyeri, Lalana Kagal2026-03-09🤖 cs.LG

Reference-guided Policy Optimization for Molecular Optimization via LLM Reasoning

Dit paper introduceert Reference-guided Policy Optimization (RePO), een nieuwe methode die de zwaktes van bestaande technieken oplost door het combineren van verifieerbare beloningen voor exploratie en referentiesturing voor exploitatie, waardoor Large Language Models effectiever kunnen worden getraind voor moleculaire optimalisatie zonder stap-voor-stap trainingsdata.

Xuan Li, Zhanke Zhou, Zongze Li, Jiangchao Yao, Yu Rong, Lu Zhang, Bo Han2026-03-09🤖 cs.AI

Stock Market Prediction Using Node Transformer Architecture Integrated with BERT Sentiment Analysis

Dit artikel introduceert een geïntegreerd kader dat een node-transformerarchitectuur combineert met BERT-gebaseerde sentimentanalyse om de aandelenmarkt als een graaf te modelleren, wat resulteert in een significante verbetering van de voorspellingsnauwkeurigheid en richtingsefficiëntie voor S&P 500-aandelen ten opzichte van traditionele methoden.

Mohammad Al Ridhawi, Mahtab Haj Ali, Hussein Al Osman2026-03-09🤖 cs.AI

Design Experiments to Compare Multi-armed Bandit Algorithms

Deze paper introduceert 'Artificial Replay', een nieuw experimenteel ontwerp dat de kosten van het vergelijken van multi-armed bandit-algoritmen halveert door bestaande trajecten opnieuw te gebruiken, terwijl het tegelijkertijd een onbevooroordeelde schatter biedt met een sublineaire variantie.

Huiling Meng, Ningyuan Chen, Xuefeng Gao2026-03-09🤖 cs.LG

Weak-SIGReg: Covariance Regularization for Stable Deep Learning

Dit paper introduceert Weak-SIGReg, een efficiëntere variant van SIGReg die de covariance-matrix regulariseert via random sketching om het instabiele trainen van diepe netwerken, zoals Vision Transformers zonder architecturale hacks, te stabiliseren en representatie-ineenstorting te voorkomen.

Habibullah Akbar2026-03-09🤖 cs.LG

Addressing the Ecological Fallacy in Larger LMs with Human Context

Dit onderzoek toont aan dat het modelleren van de auteurscontext, een oplossing voor de ecologische valkuil, de prestaties van een groter 8B Llama-model significant verbetert, zowel tijdens het fine-tunen met QLoRA als bij voortgezette pre-training via de HuLM-opdracht.

Nikita Soni, Dhruv Vijay Kunjadiya, Pratham Piyush Shah, Dikshya Mohanty, H. Andrew Schwartz, Niranjan Balasubramanian2026-03-09🤖 cs.AI

A Persistent-State Dataflow Accelerator for Memory-Bound Linear Attention Decode on FPGA

Deze paper presenteert een FPGA-versneller die de geheugengebonden bottleneck van de Gated DeltaNet-decode oplost door de recurrente toestand persistent in on-chip BRAM te houden, waardoor een 4,5x hogere snelheid en tot 60x betere energie-efficiëntie wordt bereikt vergeleken met een NVIDIA H100 GPU.

Neelesh Gupta, Peter Wang, Rajgopal Kannan, Viktor K. Prasanna2026-03-09🤖 cs.LG

Implicit Style Conditioning: A Structured Style-Rewrite Framework for Low-Resource Character Modeling

Dit paper introduceert een gestructureerd herschrijvingskader met impliciete stijlvorming dat kleine taalmodellen in staat stelt om met weinig data en zonder extra inferentie-tokenen hoogwaardige, consistent gestileerde rollenspellen te genereren, zelfs op consumenthardware.

Chanhui Zhu2026-03-09🤖 cs.LG

Who We Are, Where We Are: Mental Health at the Intersection of Person, Situation, and Large Language Models

Dit artikel presenteert een interpreteerbaar model dat psychologische theorieën combineert met taaldata van sociale media om dynamische mentale gezondheid te voorspellen door individuele eigenschappen en situationele context te integreren, waarbij theoriegedreven kenmerken concurrerende prestaties leveren met een hogere begrijpelijkheid dan pure taalembeddings.

Nikita Soni, August Håkan Nilsson, Syeda Mahwish, Vasudha Varadarajan, H. Andrew Schwartz, Ryan L. Boyd2026-03-09🤖 cs.AI

Omni-Masked Gradient Descent: Memory-Efficient Optimization via Mask Traversal with Improved Convergence

Dit paper introduceert Omni-Masked Gradient Descent (OMGD), een geheugenefficiënte optimalisatiemethode voor het trainen van grote taalmodellen die niet alleen naadloos integreert met bestaande optimalisatoren, maar ook wiskundig bewezen een verbeterde convergentiecomplexiteit van $\tilde{\mathcal{O}}(\epsilon^{-3})$ biedt in niet-convexe settings.

Hui Yang, Tao Ren, Jinyang Jiang, Wan Tian, Yijie Peng2026-03-09🤖 cs.LG

TADPO: Reinforcement Learning Goes Off-road

Dit paper introduceert TADPO, een nieuwe versterkingsleerbenadering die PPO uitbreidt met off-policy trajecten voor begeleiding en on-policy trajecten voor exploratie, waarmee voor het eerst een op visie gebaseerd RL-systeem succesvol is ingezet voor hoogwaardig off-road rijden op een volledig schaalvoertuig via zero-shot sim-naar-real-overdracht.

Zhouchonghao Wu, Raymond Song, Vedant Mundheda, Luis E. Navarro-Serment, Christof Schoenborn, Jeff Schneider2026-03-09🤖 cs.AI

EvoESAP: Non-Uniform Expert Pruning for Sparse MoE

Het artikel introduceert EvoESAP, een evolutionair zoekraamwerk dat een niet-uniforme, laag-specifieke expert-pruning toepast op Sparse Mixture-of-Experts-modellen via de ESAP-metriek, waardoor de prestaties bij open-ended generatie aanzienlijk worden verbeterd zonder de meerkeuze-accuraatheid te verliezen.

Zongfang Liu, Shengkun Tang, Boyang Sun, Zhiqiang Shen, Xin Yuan2026-03-09🤖 cs.LG

Preventing Learning Stagnation in PPO by Scaling to 1 Million Parallel Environments

Deze paper toont aan dat het schalen van PPO naar meer dan één miljoen parallelle omgevingen, in combinatie met een zorgvuldige aanpassing van de hyperparameters, het probleem van leerstagnatie door slechte schattingen van de loss-functie oplost en monotoon prestatieverbetering mogelijk maakt tot een biljoen transities.

Michael Beukman, Khimya Khetarpal, Zeyu Zheng, Will Dabney, Jakob Foerster, Michael Dennis, Clare Lyle2026-03-09🤖 cs.LG

Agnostic learning in (almost) optimal time via Gaussian surface area

Dit artikel verbetert de bestaande analyse voor agnostisch leren onder Gaussische marginals door aan te tonen dat een polynoomgraad van $\tilde O(\Gamma^2 / \varepsilon^2)$ voldoende is voor een $\varepsilon$ -benadering, wat leidt tot (bijna) optimale complexiteitsgrenzen voor het leren van polynoomdrempelfuncties.

Lucas Pesenti, Lucas Slot, Manuel Wiedmer2026-03-09🤖 cs.LG

Improved high-dimensional estimation with Langevin dynamics and stochastic weight averaging

Dit artikel toont aan dat Langevin-dynamica, wanneer gecombineerd met het middelen van iteraties, de informatie-exponent-schaal $n \gtrsim d^{k^\star/2}$ kan bereiken voor het schatten van een verborgen richting in hoge dimensies, zonder dat expliciete gladmaking van het landschap nodig is.

Stanley Wei, Alex Damian, Jason D. Lee2026-03-09🤖 cs.LG

TempoSyncDiff: Distilled Temporally-Consistent Diffusion for Low-Latency Audio-Driven Talking Head Generation

Dit paper introduceert TempoSyncDiff, een lichtgewicht latent diffusion-framework dat via kennisdistillatie en tijdsregulatie realistische, stabiele en spraakgestuurde praatkop-generatie mogelijk maakt met een zeer lage latentie, zelfs op randapparatuur.

Soumya Mazumdar, Vineet Kumar Rakesh2026-03-09🤖 cs.AI

Latent Diffusion-Based 3D Molecular Recovery from Vibrational Spectra

In dit werk introduceren de auteurs IR-GeoDiff, een latente diffusiemodel dat driedimensionale moleculaire structuren kan herstellen uit infraroodspectra door spectraal informatie te integreren in de voorstelling van moleculaire structuren.

Wenjin Wu, Aleš Leonardis, Linjiang Chen, Jianbo Jiao2026-03-09🤖 cs.LG

Dynamic Momentum Recalibration in Online Gradient Learning

Deze paper introduceert SGDF, een nieuwe optimizer die online momentumcoëfficiënten dynamisch aanpast via principes van optimaal lineair filteren om de balans tussen bias en variantie te optimaliseren en zo de prestaties van bestaande methoden te overtreffen.

Zhipeng Yao, Rui Yu, Guisong Chang, Ying Li, Yu Zhang, Dazhou Li2026-03-09🤖 cs.LG

← Vorige Volgende →