cs.LG papers | Gist.Science

Invisible Safety Threat: Malicious Finetuning for LLM via Steganography

Dit paper schetst een nieuwe veiligheidsbedreiging waarbij een LLM via steganografie en finetuning schadelijke inhoud kan genereren die voor menselijke waarnemers en automatische filters onzichtbaar blijft, terwijl de interactie er volledig onschuldig uitziet.

Guangnian Wan, Xinyin Ma, Gongfan Fang, Xinchao Wang2026-03-10🤖 cs.LG

Tau-BNO: Brain Neural Operator for Tau Transport Model

Deze studie introduceert Tau-BNO, een snel en nauwkeurig neuronaal operator-surrogaatmodel dat de computationele barrières van het Network Transport Model voor tau-transport overbrugt door microscopische reactiekinetiek en anisotrope netwerkvervoer te simuleren, waardoor parameterinferentie en mechanistisch onderzoek in Alzheimer-onderzoek aanzienlijk worden versneld.

Nuutti Barron, Heng Rao, Urmi Saha, Yu Gu, Zhenghao Liu, Ge Yu, Defu Yang, Ashish Raj, Minghan Chen2026-03-10🤖 cs.LG

Model-based Offline RL via Robust Value-Aware Model Learning with Implicitly Differentiable Adaptive Weighting

Dit paper introduceert ROMI, een nieuwe methode voor model-based offline versterkend leren die de instabiliteit en overmatige conservatisme van RAMBO oplost door robuuste waarde-bewuste modelleertechnieken en impliciet differentieerbare adaptieve weging te combineren voor betere prestaties op uitdagingrijke datasets.

Zhongjian Qiao, Jiafei Lyu, Boxiang Lyu, Yao Shu, Siyang Gao, Shuang Qiu2026-03-10🤖 cs.LG

SaiVLA-0: Cerebrum--Pons--Cerebellum Tripartite Architecture for Compute-Aware Vision-Language-Action

Dit paper introduceert SaiVLA-0, een neurobiologisch geïnspireerd Vision-Language-Action-model met een driepartite architectuur (Cerebrum, Pons, Cerebellum) die berekeningsbewust is, modulaire upgrades mogelijk maakt en aanzienlijke verbeteringen in trainingssnelheid en succespercentages toont.

Xiang Shi, Wenlong Huang, Menglin Zou, Xinhai Sun2026-03-10🤖 cs.LG

Foley-Flow: Coordinated Video-to-Audio Generation with Masked Audio-Visual Alignment and Dynamic Conditional Flows

FoleyFlow introduceert een gecoördineerde video-naar-audio generatiemethode die via gemaskeerde audio-visuele uitlijning en dynamische conditionele flows zowel semantische als ritmische synchronisatie tussen video en gegenereerde audio verbetert.

Shentong Mo, Yibing Song2026-03-10🤖 cs.LG

TRIAGE: Type-Routed Interventions via Aleatoric-Epistemic Gated Estimation in Robotic Manipulation and Adaptive Perception -- Don't Treat All Uncertainty the Same

Dit paper introduceert TRIAGE, een lichtgewicht framework dat onzekerheid in robotmanipulatie en adaptieve perceptie ontleedt in aleatorische en epistemische componenten om gerichte correcties te triggeren, wat leidt tot aanzienlijke verbeteringen in taaksucces en rekenefficiëntie.

Divake Kumar, Sina Tayebati, Devashri Naik, Patrick Poggi, Amanda Sofie Rios, Nilesh Ahuja, Amit Ranjan Trivedi2026-03-10🤖 cs.LG

Explainable Condition Monitoring via Probabilistic Anomaly Detection Applied to Helicopter Transmissions

Dit artikel presenteert een nieuwe, interpreteerbare methode voor conditiemonitoring van helikoptertransmissies die uitsluitend gezonde data gebruikt om via probabilistische afwijkingen en onzekerheidskwantificatie zeldzame storingen te detecteren en te voorspellen.

Aurelio Raffa Ugolini, Jessica Leoni, Valentina Breschi, Damiano Paniccia, Francesco Aldo Tucci, Luigi Capone, Mara Tanelli2026-03-10🤖 cs.LG

Mitigating Homophily Disparity in Graph Anomaly Detection: A Scalable and Adaptive Approach

Dit paper introduceert SAGAD, een schaalbaar en adaptief raamwerk voor het detecteren van anomalieën in grafen dat homofilie-dispariteit op zowel knoop- als class-niveau aanpakt via efficiënte frequentie-extractie en adaptieve fusie, waardoor het superieure nauwkeurigheid en schaalbaarheid biedt ten opzichte van bestaande methoden.

Yunhui Liu, Qizhuo Xie, Yinfeng Chen, Xudong Jin, Tao Zheng, Bin Chong, Tieke He2026-03-10🤖 cs.LG

DARC: Disagreement-Aware Alignment via Risk-Constrained Decoding

Dit paper introduceert DARC, een retraining-vrije inferentiemethode die door middel van risicogebaseerde decodering en verdelingsrobuustheid de gevolgen van menselijke meningsverschillen vermindert en de stabiliteit van gealigneerde taalmodellen verbetert zonder de gemiddelde kwaliteit te verlagen.

Mingxi Zou, Jiaxiang Chen, Junfan Li, Langzhang Liang, Qifan Wang, Xu Yinghui, Zenglin Xu2026-03-10🤖 cs.LG

Training event-based neural networks with exact gradients via Differentiable ODE Solving in JAX

Dit paper introduceert Eventax, een in JAX gebaseerd framework dat differentieerbare numerieke ODE-oplossers combineert met gebeurtenisgebaseerde spike-handling om exacte gradiënten te berekenen voor het trainen van spiking neurale netwerken met complexe neuronmodellen, waardoor de beperkingen van bestaande methoden worden opgeheven.

Lukas König, Manuel Kuhn, David Kappel, Anand Subramoney2026-03-10🤖 cs.LG

C $^2$ FG: Control Classifier-Free Guidance via Score Discrepancy Analysis

Deze paper introduceert C²FG, een trainingsvrije en plug-in methode die de Classifier-Free Guidance versterkt door de geleidingssterkte dynamisch af te stemmen op de diffusieprocessen via een exponentiële afname, gebaseerd op een theoretische analyse van de score-discrepantie.

Jiayang Gao, Tianyi Zheng, Jiayang Zou, Fengxiang Yang, Shice Liu, Luyao Fan, Zheyu Zhang, Hao Zhang, Jinwei Chen, Peng-Tao Jiang, Bo Li, Jia Wang2026-03-10🤖 cs.LG

Are We Winning the Wrong Game? Revisiting Evaluation Practices for Long-Term Time Series Forecasting

Dit artikel betoogt dat de huidige evaluatiepraktijken voor langetermijnvoorspelling van tijdreeksen te zeer gefocust zijn op marginale verbeteringen in puntsgewijze foutmaten, en pleit voor een meerdimensionale benadering die statistische nauwkeurigheid, structurele coherentie en besluitvormingsrelevantie integreert om de aandacht te verschuiven van het winnen van benchmarks naar het bevorderen van zinvolle voorspellingen.

Thanapol Phungtua-eng, Yoshitaka Yamamoto2026-03-10🤖 cs.LG

Outlier-robust Autocovariance Least Square Estimation via Iteratively Reweighted Least Square

Dit artikel introduceert ALS-IRLS, een robuust algoritme dat de autocovariantie-kleinstekwadratenmethode voor Kalman-filterruis schatting uitbreidt met een tweestaps-strategie op basis van iteratief hergewogen kleinstekwadraten en Huber-kostfuncties om extreme uitbijters effectief te filteren en de schattingsnauwkeurigheid aanzienlijk te verbeteren.

Jiahong Li, Fang Deng2026-03-10🤖 cs.LG

Learning Hierarchical Knowledge in Text-Rich Networks with Taxonomy-Informed Representation Learning

Dit paper introduceert TIER, een methode die een impliciete hiërarchische taxonomie bouwt en integreert in de representatieleren van tekstrijke netwerken om zowel grove als fijne semantische structuren effectiever te modelleren dan bestaande methoden.

Yunhui Liu, Yongchao Liu, Yinfeng Chen, Chuntao Hong, Tao Zheng, Tieke He2026-03-10🤖 cs.LG

Covenant-72B: Pre-Training a 72B LLM with Trustless Peers Over-the-Internet

Dit paper introduceert Covenant-72B, een 72B-parameter taalmodel dat succesvol is voorafgetraind via de grootste tot nu toe uitgevoerde wereldwijde, gedecentraliseerde training met onbeperkte deelname via een live blockchain-protocol, waarbij het presteert op hetzelfde niveau als gecentraliseerde modellen.

Joel Lidin, Amir Sarfi, Erfan Miahi, Quentin Anthony, Shivam Chauhan, Evangelos Pappas, Benjamin Thérien, Eugene Belilovsky, Samuel Dare2026-03-10🤖 cs.LG

Is continuous CoT better suited for multi-lingual reasoning?

Dit onderzoek toont aan dat continu redeneren in een latente ruimte, in tegenstelling tot expliciete Chain-of-Thought, aanzienlijk robuustere en efficiëntere meertalige redeneercapaciteiten biedt, vooral voor taakgebieden met beperkte bronnen en in zero-shot scenario's.

Ali Hamza Bashir, Behzad Shomali, Markus Frey, Mehdi Ali, Rafet Sifa, David Berghaus2026-03-10🤖 cs.LG

ALOOD: Exploiting Language Representations for LiDAR-based Out-of-Distribution Object Detection

Dit paper introduceert ALOOD, een nieuwe methode die taalrepresentaties van een vision-language model gebruikt om LiDAR-gebaseerde 3D-objectdetectiesystemen in staat te stellen onbekende (out-of-distribution) objecten te herkennen als een zero-shot classificatietask, waardoor de veiligheidsrisico's van verkeerd vertrouwen in autonome rijsystemen worden verminderd.

Michael Kösel, Marcel Schreiber, Michael Ulrich, Claudius Gläser, Klaus Dietmayer2026-03-10🤖 cs.LG

AutoAdapt: An Automated Domain Adaptation Framework for LLMs

Het artikel introduceert AutoAdapt, een geautomatiseerd end-to-end framework dat gebruikmaakt van een multi-agent debatsysteem en een LLM-gebaseerde surrogate (AutoRefine) om de complexe en kostbare handmatige domeinadaptatie van grote taalmodellen te stroomlijnen en de nauwkeurigheid aanzienlijk te verbeteren.

Sidharth Sinha, Anson Bastos, Xuchao Zhang, Akshay Nambi, Chetan Bansal, Saravan Rajmohan2026-03-10🤖 cs.LG

SERQ: Saliency-Aware Low-Rank Error Reconstruction for LLM Quantization

In dit artikel wordt SERQ voorgesteld, een methode voor post-training kwantisatie van grote taalmodellen die gebruikmaakt van salientie-bewuste foutreconstructie met een enkele laag-rang compensatiematrix om de nauwkeurigheid bij 4-bit inferentie aanzienlijk te verbeteren zonder de inferentielatentie significant te verhogen.

Yeonsik Park, Hyeonseong Kim, Seungkyu Choi2026-03-10🤖 cs.LG

Sequential Service Region Design with Capacity-Constrained Investment and Spillover Effect

Dit artikel introduceert een hybride oplossingframework dat Real Options Analysis combineert met een Transformer-gebaseerde Proximal Policy Optimization-algoritme om onder onzekerheid en met spillovereffecten de optimale sequentiële uitbreiding van dienstgebieden te bepalen binnen capaciteitsbeperkingen.

Tingting Chen, Feng Chu, Jiantong Zhang2026-03-10🤖 cs.LG

← Vorige Volgende →

cs.LG