cs.LG papers | Gist.Science

Deterministic Differentiable Structured Pruning for Large Language Models

Dit paper introduceert Deterministic Differentiable Pruning (DDP), een methode die stochastische elementen uit de gestructureerde pruning van grote taalmodellen verwijdert door een deterministische zachte surrogate te optimaliseren, wat leidt tot snellere convergentie, minder discrepantie tussen training en test, en betere prestaties bij hoge sparsiteit.

Weiyu Huang, Pengle Zhang, Xiaolu Zhang, Jun Zhou, Jun Zhu, Jianfei Chen2026-03-10🤖 cs.LG

Hybrid Quantum Neural Network for Multivariate Clinical Time Series Forecasting

Dit artikel introduceert een hybride quantum-klassiek neurale netwerk dat variabele quantumkringen integreert in een GRU-architectuur voor het nauwkeurig en robuust voorspellen van multivariate fysiologische tijdsreeksen in klinische settings.

Irene Iele, Floriano Caprio, Paolo Soda, Matteo Tortora2026-03-10🤖 cs.LG

Tiny Autoregressive Recursive Models

Hoewel het autoregressieve TRM-model geen betrouwbare prestatieverbeteringen bood ten opzichte van standaardmodellen, tonen de resultaten aan dat twee-staps verfijningsmechanismen in het algemeen veelbelovend zijn voor kleine autoregressieve taken.

Paulius Rauba, Claudio Fanconi, Mihaela van der Schaar2026-03-10🤖 cs.LG

EAGLE-Pangu: Accelerator-Safe Tree Speculative Decoding on Ascend NPUs

Dit paper introduceert EAGLE-Pangu, een reproduceerbaar systeem dat boomgestructureerde speculatieve decoding op Ascend NPUs veilig implementeert voor Pangu-modellen, waardoor de doorvoersnelheid aanzienlijk wordt verbeterd ten opzichte van traditionele methoden.

Chang Han, Yijie Hu, Jingling Liu2026-03-10🤖 cs.LG

DC-W2S: Dual-Consensus Weak-to-Strong Training for Reliable Process Reward Modeling in Biological Reasoning

Dit paper introduceert het DC-W2S-framework, dat door middel van dubbele consensus-metingen en een slimme trainingscurriculum betrouwbare Procesbeloningsmodellen voor biologisch redeneren mogelijk maakt met behulp van ruwe, zwakke supervisie zonder de noodzaak van uitgebreide expertannotatie.

Chi-Min Chan, Ehsan Hajiramezanali, Xiner Li, Edward De Brouwer, Carl Edwards, Wei Xue, Sirui Han, Yike Guo, Gabriele Scalia2026-03-10🤖 cs.LG

Invisible Safety Threat: Malicious Finetuning for LLM via Steganography

Dit paper schetst een nieuwe veiligheidsbedreiging waarbij een LLM via steganografie en finetuning schadelijke inhoud kan genereren die voor menselijke waarnemers en automatische filters onzichtbaar blijft, terwijl de interactie er volledig onschuldig uitziet.

Guangnian Wan, Xinyin Ma, Gongfan Fang, Xinchao Wang2026-03-10🤖 cs.LG

Tau-BNO: Brain Neural Operator for Tau Transport Model

Deze studie introduceert Tau-BNO, een snel en nauwkeurig neuronaal operator-surrogaatmodel dat de computationele barrières van het Network Transport Model voor tau-transport overbrugt door microscopische reactiekinetiek en anisotrope netwerkvervoer te simuleren, waardoor parameterinferentie en mechanistisch onderzoek in Alzheimer-onderzoek aanzienlijk worden versneld.

Nuutti Barron, Heng Rao, Urmi Saha, Yu Gu, Zhenghao Liu, Ge Yu, Defu Yang, Ashish Raj, Minghan Chen2026-03-10🤖 cs.LG

Model-based Offline RL via Robust Value-Aware Model Learning with Implicitly Differentiable Adaptive Weighting

Dit paper introduceert ROMI, een nieuwe methode voor model-based offline versterkend leren die de instabiliteit en overmatige conservatisme van RAMBO oplost door robuuste waarde-bewuste modelleertechnieken en impliciet differentieerbare adaptieve weging te combineren voor betere prestaties op uitdagingrijke datasets.

Zhongjian Qiao, Jiafei Lyu, Boxiang Lyu, Yao Shu, Siyang Gao, Shuang Qiu2026-03-10🤖 cs.LG

SaiVLA-0: Cerebrum--Pons--Cerebellum Tripartite Architecture for Compute-Aware Vision-Language-Action

Dit paper introduceert SaiVLA-0, een neurobiologisch geïnspireerd Vision-Language-Action-model met een driepartite architectuur (Cerebrum, Pons, Cerebellum) die berekeningsbewust is, modulaire upgrades mogelijk maakt en aanzienlijke verbeteringen in trainingssnelheid en succespercentages toont.

Xiang Shi, Wenlong Huang, Menglin Zou, Xinhai Sun2026-03-10🤖 cs.LG

Foley-Flow: Coordinated Video-to-Audio Generation with Masked Audio-Visual Alignment and Dynamic Conditional Flows

FoleyFlow introduceert een gecoördineerde video-naar-audio generatiemethode die via gemaskeerde audio-visuele uitlijning en dynamische conditionele flows zowel semantische als ritmische synchronisatie tussen video en gegenereerde audio verbetert.

Shentong Mo, Yibing Song2026-03-10🤖 cs.LG

TRIAGE: Type-Routed Interventions via Aleatoric-Epistemic Gated Estimation in Robotic Manipulation and Adaptive Perception -- Don't Treat All Uncertainty the Same

Dit paper introduceert TRIAGE, een lichtgewicht framework dat onzekerheid in robotmanipulatie en adaptieve perceptie ontleedt in aleatorische en epistemische componenten om gerichte correcties te triggeren, wat leidt tot aanzienlijke verbeteringen in taaksucces en rekenefficiëntie.

Divake Kumar, Sina Tayebati, Devashri Naik, Patrick Poggi, Amanda Sofie Rios, Nilesh Ahuja, Amit Ranjan Trivedi2026-03-10🤖 cs.LG

Explainable Condition Monitoring via Probabilistic Anomaly Detection Applied to Helicopter Transmissions

Dit artikel presenteert een nieuwe, interpreteerbare methode voor conditiemonitoring van helikoptertransmissies die uitsluitend gezonde data gebruikt om via probabilistische afwijkingen en onzekerheidskwantificatie zeldzame storingen te detecteren en te voorspellen.

Aurelio Raffa Ugolini, Jessica Leoni, Valentina Breschi, Damiano Paniccia, Francesco Aldo Tucci, Luigi Capone, Mara Tanelli2026-03-10🤖 cs.LG

Mitigating Homophily Disparity in Graph Anomaly Detection: A Scalable and Adaptive Approach

Dit paper introduceert SAGAD, een schaalbaar en adaptief raamwerk voor het detecteren van anomalieën in grafen dat homofilie-dispariteit op zowel knoop- als class-niveau aanpakt via efficiënte frequentie-extractie en adaptieve fusie, waardoor het superieure nauwkeurigheid en schaalbaarheid biedt ten opzichte van bestaande methoden.

Yunhui Liu, Qizhuo Xie, Yinfeng Chen, Xudong Jin, Tao Zheng, Bin Chong, Tieke He2026-03-10🤖 cs.LG

DARC: Disagreement-Aware Alignment via Risk-Constrained Decoding

Dit paper introduceert DARC, een retraining-vrije inferentiemethode die door middel van risicogebaseerde decodering en verdelingsrobuustheid de gevolgen van menselijke meningsverschillen vermindert en de stabiliteit van gealigneerde taalmodellen verbetert zonder de gemiddelde kwaliteit te verlagen.

Mingxi Zou, Jiaxiang Chen, Junfan Li, Langzhang Liang, Qifan Wang, Xu Yinghui, Zenglin Xu2026-03-10🤖 cs.LG

Training event-based neural networks with exact gradients via Differentiable ODE Solving in JAX

Dit paper introduceert Eventax, een in JAX gebaseerd framework dat differentieerbare numerieke ODE-oplossers combineert met gebeurtenisgebaseerde spike-handling om exacte gradiënten te berekenen voor het trainen van spiking neurale netwerken met complexe neuronmodellen, waardoor de beperkingen van bestaande methoden worden opgeheven.

Lukas König, Manuel Kuhn, David Kappel, Anand Subramoney2026-03-10🤖 cs.LG

C $^2$ FG: Control Classifier-Free Guidance via Score Discrepancy Analysis

Deze paper introduceert C²FG, een trainingsvrije en plug-in methode die de Classifier-Free Guidance versterkt door de geleidingssterkte dynamisch af te stemmen op de diffusieprocessen via een exponentiële afname, gebaseerd op een theoretische analyse van de score-discrepantie.

Jiayang Gao, Tianyi Zheng, Jiayang Zou, Fengxiang Yang, Shice Liu, Luyao Fan, Zheyu Zhang, Hao Zhang, Jinwei Chen, Peng-Tao Jiang, Bo Li, Jia Wang2026-03-10🤖 cs.LG

Are We Winning the Wrong Game? Revisiting Evaluation Practices for Long-Term Time Series Forecasting

Dit artikel betoogt dat de huidige evaluatiepraktijken voor langetermijnvoorspelling van tijdreeksen te zeer gefocust zijn op marginale verbeteringen in puntsgewijze foutmaten, en pleit voor een meerdimensionale benadering die statistische nauwkeurigheid, structurele coherentie en besluitvormingsrelevantie integreert om de aandacht te verschuiven van het winnen van benchmarks naar het bevorderen van zinvolle voorspellingen.

Thanapol Phungtua-eng, Yoshitaka Yamamoto2026-03-10🤖 cs.LG

Outlier-robust Autocovariance Least Square Estimation via Iteratively Reweighted Least Square

Dit artikel introduceert ALS-IRLS, een robuust algoritme dat de autocovariantie-kleinstekwadratenmethode voor Kalman-filterruis schatting uitbreidt met een tweestaps-strategie op basis van iteratief hergewogen kleinstekwadraten en Huber-kostfuncties om extreme uitbijters effectief te filteren en de schattingsnauwkeurigheid aanzienlijk te verbeteren.

Jiahong Li, Fang Deng2026-03-10🤖 cs.LG

Learning Hierarchical Knowledge in Text-Rich Networks with Taxonomy-Informed Representation Learning

Dit paper introduceert TIER, een methode die een impliciete hiërarchische taxonomie bouwt en integreert in de representatieleren van tekstrijke netwerken om zowel grove als fijne semantische structuren effectiever te modelleren dan bestaande methoden.

Yunhui Liu, Yongchao Liu, Yinfeng Chen, Chuntao Hong, Tao Zheng, Tieke He2026-03-10🤖 cs.LG

Covenant-72B: Pre-Training a 72B LLM with Trustless Peers Over-the-Internet

Dit paper introduceert Covenant-72B, een 72B-parameter taalmodel dat succesvol is voorafgetraind via de grootste tot nu toe uitgevoerde wereldwijde, gedecentraliseerde training met onbeperkte deelname via een live blockchain-protocol, waarbij het presteert op hetzelfde niveau als gecentraliseerde modellen.

Joel Lidin, Amir Sarfi, Erfan Miahi, Quentin Anthony, Shivam Chauhan, Evangelos Pappas, Benjamin Thérien, Eugene Belilovsky, Samuel Dare2026-03-10🤖 cs.LG

← Vorige Volgende →

cs.LG