cs.LG papers | Gist.Science

Bridging Domains through Subspace-Aware Model Merging

Dit paper introduceert SCORE, een methode die subruimte-conflicten tussen modellen op verschillende domeinen oplost door een gedeelde orthogonale basis te vinden en diagonale componenten te verwijderen, waardoor de domein-generalisatie aanzienlijk wordt verbeterd ten opzichte van bestaande modelmerging-technieken.

Levy Chaves, Chao Zhou, Rebekka Burkholz, Eduardo Valle, Sandra Avila2026-03-09🤖 cs.AI

Knowing without Acting: The Disentangled Geometry of Safety Mechanisms in Large Language Models

Deze paper introduceert het Disentangled Safety Hypothesis (DSH), dat aantoont dat veiligheidsmechanismen in grote taalmodellen bestaan uit gescheiden 'herkennings-' en 'uitvoeringsassen', en gebruikt deze inzichten om een nieuwe aanvalsmethode te ontwikkelen die weigeringen effectief kan uitschakelen zonder de kennis van het model te beïnvloeden.

Jinman Wu, Yi Xie, Shen Lin, Shiqian Zhao, Xiaofeng Chen2026-03-09🤖 cs.AI

First-Order Softmax Weighted Switching Gradient Method for Distributed Stochastic Minimax Optimization with Stochastic Constraints

Dit paper introduceert een nieuwe eerste-orde Softmax-gewichtsschakelgradientmethode voor gedistribueerde stochastische minimax-optimalisatie met stochastische beperkingen, die een stabiele single-loop oplossing biedt voor federated learning met bewezen convergentie en verbeterde prestaties op taken zoals Neyman-Pearson-classificatie.

Zhankun Luo, Antesh Upadhyay, Sang Bin Moon, Abolfazl Hashemi2026-03-09🤖 cs.LG

The Coordination Gap: Alternation Metrics for Temporal Dynamics in Multi-Agent Battle of the Exes

Deze paper introduceert nieuwe, tijdsgevoelige alternatiemetrics om de beperkingen van traditionele, tijdsblinde maatstaven aan te tonen bij het evalueren van multi-agent coördinatie, waarbij blijkt dat agenten met hoge traditionele scores in feite slechter presteren dan willekeurige baselines in termen van daadwerkelijke coördinatiekwaliteit.

Nikolaos Al. Papadopoulos, Konstantinos Psannis2026-03-09🤖 cs.LG

Sparse Crosscoders for diffing MoEs and Dense models

Dit artikel vergelijkt de interne representaties van Mixture-of-Experts (MoE) en dichte modellen met behulp van crosscoders en toont aan dat MoE's minder unieke, maar meer gespecialiseerde en actieve features ontwikkelen, terwijl dichte modellen informatie verspreiden over bredere, algemene features.

Marmik Chaudhari, Nishkal Hundia, Idhant Gulati2026-03-09🤖 cs.LG

MoE Lens -- An Expert Is All You Need

Dit paper analyseert het specialisatiegedrag van Mixture of Experts-modellen en toont aan dat een klein aantal experts de meeste taken uitvoert, wat aanzienlijke kansen biedt voor inferentie-optimalisatie via gerichte expert-pruning zonder prestatieverlies.

Marmik Chaudhari, Idhant Gulati, Nishkal Hundia, Pranav Karra, Shivam Raval2026-03-09🤖 cs.LG

Margin and Consistency Supervision for Calibrated and Robust Vision Models

Dit paper introduceert MaCS, een eenvoudige en architectuuronafhankelijke regularisatiemethode die de kalibratie en robuustheid van diepe visiemodellen verbetert door logit-marges te vergroten en voorspellingconsistentie onder lichte verstoringen te handhaven, zonder extra data of architecturale wijzigingen.

Salim Khazem2026-03-09🤖 cs.AI

Self-Auditing Parameter-Efficient Fine-Tuning for Few-Shot 3D Medical Image Segmentation

Dit paper introduceert SEA-PEFT, een methode voor zelfauditerende, parameter-efficiënte fine-tuning die adapterconfiguratie automatiseert via een zoek-keuze-toewijzingscyclus om de prestaties van 3D-medische beeldsegmentatie in few-shot scenario's aanzienlijk te verbeteren zonder de noodzaak van handmatige aanpassingen.

Son Thai Ly, Hien V. Nguyen2026-03-09🤖 cs.LG

Test-Time Adaptation via Many-Shot Prompting: Benefits, Limits, and Pitfalls

Dit artikel onderzoekt de effectiviteit, beperkingen en valkuilen van testtijd-adaptatie via veel-shot prompting bij grote taalmodellen, en concludeert dat deze methode vooral nuttig is voor gestructureerde taken maar gevoelig is voor de selectiestrategie en vaak beperkt baat biedt bij open-ended generatie.

Shubhangi Upasani, Chen Wu, Jay Rainton, Bo Li, Changran Hu, Qizheng Zhang, Urmish Thakker2026-03-09🤖 cs.LG

ReflexiCoder: Teaching Large Language Models to Self-Reflect on Generated Code and Self-Correct It via Reinforcement Learning

ReflexiCoder is een nieuw reinforcement learning-framework dat grote taalmodellen leert om code autonoom te genereren, te reflecteren op fouten en zichzelf te corrigeren zonder externe hulp, wat leidt tot state-of-the-art prestaties en een aanzienlijke vermindering van de inferentie-overhead.

Juyong Jiang, Jiasi Shen, Sunghun Kim, Kang Min Yoo, Jeonghoon Kim, Sungju Kim2026-03-09🤖 cs.LG

Stochastic Event Prediction via Temporal Motif Transitions

Deze paper introduceert STEP, een raamwerk dat temporele linkpredictie hervormt als een sequentiële voorspellingsopdracht in continue tijd door gebeurtenisdynamiek te modelleren via Poisson-processen over temporele motieven, wat leidt tot aanzienlijk betere prestaties en lagere rekentijd dan bestaande methoden.

\.Ibrahim Bahadır Altun, Ahmet Erdem Sarıyüce2026-03-09🤖 cs.LG

ROSE: Reordered SparseGPT for More Accurate One-Shot Large Language Models Pruning

Dit paper introduceert ROSE, een geoptimaliseerde versie van SparseGPT die door middel van een twee-niveau herschikking van de pruning-sequentie gebaseerd op geschatte verlieswaarden, de prestaties van één-slag (one-shot) pruning van grote taalmodellen aanzienlijk verbetert.

Mingluo Su, Huan Wang2026-03-09🤖 cs.LG

PixARMesh: Autoregressive Mesh-Native Single-View Scene Reconstruction

PixARMesh is een autoregressieve methode die vanuit één RGB-afbeelding complete, artistiek bruikbare 3D-interieurscènes reconstrueert door objectindeling en geometrie direct in een unifyd model te voorspellen, zonder afhankelijkheid van impliciete afstandsvelden of latere optimalisatie.

Xiang Zhang, Sohyun Yoo, Hongrui Wu, Chuan Li, Jianwen Xie, Zhuowen Tu2026-03-09🤖 cs.LG

Mitigating Bias in Concept Bottleneck Models for Fair and Interpretable Image Classification

Dit paper introduceert drie technieken om bias in Concept Bottleneck Models te verminderen, waardoor deze modellen zowel eerlijker als interpreteerbaarder worden voor beeldclassificatie.

Schrasing Tong, Antoine Salaun, Vincent Yuan, Annabel Adeyeri, Lalana Kagal2026-03-09🤖 cs.LG

Reference-guided Policy Optimization for Molecular Optimization via LLM Reasoning

Dit paper introduceert Reference-guided Policy Optimization (RePO), een nieuwe methode die de zwaktes van bestaande technieken oplost door het combineren van verifieerbare beloningen voor exploratie en referentiesturing voor exploitatie, waardoor Large Language Models effectiever kunnen worden getraind voor moleculaire optimalisatie zonder stap-voor-stap trainingsdata.

Xuan Li, Zhanke Zhou, Zongze Li, Jiangchao Yao, Yu Rong, Lu Zhang, Bo Han2026-03-09🤖 cs.AI

Stock Market Prediction Using Node Transformer Architecture Integrated with BERT Sentiment Analysis

Dit artikel introduceert een geïntegreerd kader dat een node-transformerarchitectuur combineert met BERT-gebaseerde sentimentanalyse om de aandelenmarkt als een graaf te modelleren, wat resulteert in een significante verbetering van de voorspellingsnauwkeurigheid en richtingsefficiëntie voor S&P 500-aandelen ten opzichte van traditionele methoden.

Mohammad Al Ridhawi, Mahtab Haj Ali, Hussein Al Osman2026-03-09🤖 cs.AI

Design Experiments to Compare Multi-armed Bandit Algorithms

Deze paper introduceert 'Artificial Replay', een nieuw experimenteel ontwerp dat de kosten van het vergelijken van multi-armed bandit-algoritmen halveert door bestaande trajecten opnieuw te gebruiken, terwijl het tegelijkertijd een onbevooroordeelde schatter biedt met een sublineaire variantie.

Huiling Meng, Ningyuan Chen, Xuefeng Gao2026-03-09🤖 cs.LG

Weak-SIGReg: Covariance Regularization for Stable Deep Learning

Dit paper introduceert Weak-SIGReg, een efficiëntere variant van SIGReg die de covariance-matrix regulariseert via random sketching om het instabiele trainen van diepe netwerken, zoals Vision Transformers zonder architecturale hacks, te stabiliseren en representatie-ineenstorting te voorkomen.

Habibullah Akbar2026-03-09🤖 cs.LG

Addressing the Ecological Fallacy in Larger LMs with Human Context

Dit onderzoek toont aan dat het modelleren van de auteurscontext, een oplossing voor de ecologische valkuil, de prestaties van een groter 8B Llama-model significant verbetert, zowel tijdens het fine-tunen met QLoRA als bij voortgezette pre-training via de HuLM-opdracht.

Nikita Soni, Dhruv Vijay Kunjadiya, Pratham Piyush Shah, Dikshya Mohanty, H. Andrew Schwartz, Niranjan Balasubramanian2026-03-09🤖 cs.AI

A Persistent-State Dataflow Accelerator for Memory-Bound Linear Attention Decode on FPGA

Deze paper presenteert een FPGA-versneller die de geheugengebonden bottleneck van de Gated DeltaNet-decode oplost door de recurrente toestand persistent in on-chip BRAM te houden, waardoor een 4,5x hogere snelheid en tot 60x betere energie-efficiëntie wordt bereikt vergeleken met een NVIDIA H100 GPU.

Neelesh Gupta, Peter Wang, Rajgopal Kannan, Viktor K. Prasanna2026-03-09🤖 cs.LG

← Vorige Volgende →