cs.LG papers | Gist.Science

Foley-Flow: Coordinated Video-to-Audio Generation with Masked Audio-Visual Alignment and Dynamic Conditional Flows

FoleyFlow introduceert een gecoördineerde video-naar-audio generatiemethode die via gemaskeerde audio-visuele uitlijning en dynamische conditionele flows zowel semantische als ritmische synchronisatie tussen video en gegenereerde audio verbetert.

Shentong Mo, Yibing Song2026-03-10🤖 cs.LG

TRIAGE: Type-Routed Interventions via Aleatoric-Epistemic Gated Estimation in Robotic Manipulation and Adaptive Perception -- Don't Treat All Uncertainty the Same

Dit paper introduceert TRIAGE, een lichtgewicht framework dat onzekerheid in robotmanipulatie en adaptieve perceptie ontleedt in aleatorische en epistemische componenten om gerichte correcties te triggeren, wat leidt tot aanzienlijke verbeteringen in taaksucces en rekenefficiëntie.

Divake Kumar, Sina Tayebati, Devashri Naik, Patrick Poggi, Amanda Sofie Rios, Nilesh Ahuja, Amit Ranjan Trivedi2026-03-10🤖 cs.LG

Explainable Condition Monitoring via Probabilistic Anomaly Detection Applied to Helicopter Transmissions

Dit artikel presenteert een nieuwe, interpreteerbare methode voor conditiemonitoring van helikoptertransmissies die uitsluitend gezonde data gebruikt om via probabilistische afwijkingen en onzekerheidskwantificatie zeldzame storingen te detecteren en te voorspellen.

Aurelio Raffa Ugolini, Jessica Leoni, Valentina Breschi, Damiano Paniccia, Francesco Aldo Tucci, Luigi Capone, Mara Tanelli2026-03-10🤖 cs.LG

Mitigating Homophily Disparity in Graph Anomaly Detection: A Scalable and Adaptive Approach

Dit paper introduceert SAGAD, een schaalbaar en adaptief raamwerk voor het detecteren van anomalieën in grafen dat homofilie-dispariteit op zowel knoop- als class-niveau aanpakt via efficiënte frequentie-extractie en adaptieve fusie, waardoor het superieure nauwkeurigheid en schaalbaarheid biedt ten opzichte van bestaande methoden.

Yunhui Liu, Qizhuo Xie, Yinfeng Chen, Xudong Jin, Tao Zheng, Bin Chong, Tieke He2026-03-10🤖 cs.LG

DARC: Disagreement-Aware Alignment via Risk-Constrained Decoding

Dit paper introduceert DARC, een retraining-vrije inferentiemethode die door middel van risicogebaseerde decodering en verdelingsrobuustheid de gevolgen van menselijke meningsverschillen vermindert en de stabiliteit van gealigneerde taalmodellen verbetert zonder de gemiddelde kwaliteit te verlagen.

Mingxi Zou, Jiaxiang Chen, Junfan Li, Langzhang Liang, Qifan Wang, Xu Yinghui, Zenglin Xu2026-03-10🤖 cs.LG

Training event-based neural networks with exact gradients via Differentiable ODE Solving in JAX

Dit paper introduceert Eventax, een in JAX gebaseerd framework dat differentieerbare numerieke ODE-oplossers combineert met gebeurtenisgebaseerde spike-handling om exacte gradiënten te berekenen voor het trainen van spiking neurale netwerken met complexe neuronmodellen, waardoor de beperkingen van bestaande methoden worden opgeheven.

Lukas König, Manuel Kuhn, David Kappel, Anand Subramoney2026-03-10🤖 cs.LG

C $^2$ FG: Control Classifier-Free Guidance via Score Discrepancy Analysis

Deze paper introduceert C²FG, een trainingsvrije en plug-in methode die de Classifier-Free Guidance versterkt door de geleidingssterkte dynamisch af te stemmen op de diffusieprocessen via een exponentiële afname, gebaseerd op een theoretische analyse van de score-discrepantie.

Jiayang Gao, Tianyi Zheng, Jiayang Zou, Fengxiang Yang, Shice Liu, Luyao Fan, Zheyu Zhang, Hao Zhang, Jinwei Chen, Peng-Tao Jiang, Bo Li, Jia Wang2026-03-10🤖 cs.LG

Are We Winning the Wrong Game? Revisiting Evaluation Practices for Long-Term Time Series Forecasting

Dit artikel betoogt dat de huidige evaluatiepraktijken voor langetermijnvoorspelling van tijdreeksen te zeer gefocust zijn op marginale verbeteringen in puntsgewijze foutmaten, en pleit voor een meerdimensionale benadering die statistische nauwkeurigheid, structurele coherentie en besluitvormingsrelevantie integreert om de aandacht te verschuiven van het winnen van benchmarks naar het bevorderen van zinvolle voorspellingen.

Thanapol Phungtua-eng, Yoshitaka Yamamoto2026-03-10🤖 cs.LG

Outlier-robust Autocovariance Least Square Estimation via Iteratively Reweighted Least Square

Dit artikel introduceert ALS-IRLS, een robuust algoritme dat de autocovariantie-kleinstekwadratenmethode voor Kalman-filterruis schatting uitbreidt met een tweestaps-strategie op basis van iteratief hergewogen kleinstekwadraten en Huber-kostfuncties om extreme uitbijters effectief te filteren en de schattingsnauwkeurigheid aanzienlijk te verbeteren.

Jiahong Li, Fang Deng2026-03-10🤖 cs.LG

Learning Hierarchical Knowledge in Text-Rich Networks with Taxonomy-Informed Representation Learning

Dit paper introduceert TIER, een methode die een impliciete hiërarchische taxonomie bouwt en integreert in de representatieleren van tekstrijke netwerken om zowel grove als fijne semantische structuren effectiever te modelleren dan bestaande methoden.

Yunhui Liu, Yongchao Liu, Yinfeng Chen, Chuntao Hong, Tao Zheng, Tieke He2026-03-10🤖 cs.LG

Covenant-72B: Pre-Training a 72B LLM with Trustless Peers Over-the-Internet

Dit paper introduceert Covenant-72B, een 72B-parameter taalmodel dat succesvol is voorafgetraind via de grootste tot nu toe uitgevoerde wereldwijde, gedecentraliseerde training met onbeperkte deelname via een live blockchain-protocol, waarbij het presteert op hetzelfde niveau als gecentraliseerde modellen.

Joel Lidin, Amir Sarfi, Erfan Miahi, Quentin Anthony, Shivam Chauhan, Evangelos Pappas, Benjamin Thérien, Eugene Belilovsky, Samuel Dare2026-03-10🤖 cs.LG

Is continuous CoT better suited for multi-lingual reasoning?

Dit onderzoek toont aan dat continu redeneren in een latente ruimte, in tegenstelling tot expliciete Chain-of-Thought, aanzienlijk robuustere en efficiëntere meertalige redeneercapaciteiten biedt, vooral voor taakgebieden met beperkte bronnen en in zero-shot scenario's.

Ali Hamza Bashir, Behzad Shomali, Markus Frey, Mehdi Ali, Rafet Sifa, David Berghaus2026-03-10🤖 cs.LG

ALOOD: Exploiting Language Representations for LiDAR-based Out-of-Distribution Object Detection

Dit paper introduceert ALOOD, een nieuwe methode die taalrepresentaties van een vision-language model gebruikt om LiDAR-gebaseerde 3D-objectdetectiesystemen in staat te stellen onbekende (out-of-distribution) objecten te herkennen als een zero-shot classificatietask, waardoor de veiligheidsrisico's van verkeerd vertrouwen in autonome rijsystemen worden verminderd.

Michael Kösel, Marcel Schreiber, Michael Ulrich, Claudius Gläser, Klaus Dietmayer2026-03-10🤖 cs.LG

AutoAdapt: An Automated Domain Adaptation Framework for LLMs

Het artikel introduceert AutoAdapt, een geautomatiseerd end-to-end framework dat gebruikmaakt van een multi-agent debatsysteem en een LLM-gebaseerde surrogate (AutoRefine) om de complexe en kostbare handmatige domeinadaptatie van grote taalmodellen te stroomlijnen en de nauwkeurigheid aanzienlijk te verbeteren.

Sidharth Sinha, Anson Bastos, Xuchao Zhang, Akshay Nambi, Chetan Bansal, Saravan Rajmohan2026-03-10🤖 cs.LG

SERQ: Saliency-Aware Low-Rank Error Reconstruction for LLM Quantization

In dit artikel wordt SERQ voorgesteld, een methode voor post-training kwantisatie van grote taalmodellen die gebruikmaakt van salientie-bewuste foutreconstructie met een enkele laag-rang compensatiematrix om de nauwkeurigheid bij 4-bit inferentie aanzienlijk te verbeteren zonder de inferentielatentie significant te verhogen.

Yeonsik Park, Hyeonseong Kim, Seungkyu Choi2026-03-10🤖 cs.LG

Sequential Service Region Design with Capacity-Constrained Investment and Spillover Effect

Dit artikel introduceert een hybride oplossingframework dat Real Options Analysis combineert met een Transformer-gebaseerde Proximal Policy Optimization-algoritme om onder onzekerheid en met spillovereffecten de optimale sequentiële uitbreiding van dienstgebieden te bepalen binnen capaciteitsbeperkingen.

Tingting Chen, Feng Chu, Jiantong Zhang2026-03-10🤖 cs.LG

Distributional Regression with Tabular Foundation Models: Evaluating Probabilistic Predictions via Proper Scoring Rules

Dit artikel pleit voor het verbeteren van bestaande benchmarks voor tabulaire foundation-modellen door het gebruik van proper scoring rules, zoals de CRPS, om probabilistische regressie te evalueren in plaats van alleen puntenschattingen, en benadrukt het belang van het afstemmen van deze modellen op de gekozen scorefunctie.

Jonas Landsgesell, Pascal Knoll2026-03-10🤖 cs.LG

Revisiting Gradient Staleness: Evaluating Distance Metrics for Asynchronous Federated Learning Aggregation

Dit onderzoek vergelijkt verschillende afstandsmetingen om verouderde gradiënten in asynchrone federatief leren beter te detecteren en te aggregeren, wat leidt tot robuustere en efficiëntere modeltraining onder heterogene en niet-IID-omstandigheden.

Patrick Wilhelm, Odej Kao2026-03-10🤖 cs.LG

Wiener Chaos Expansion based Neural Operator for Singular Stochastic Partial Differential Equations

Dit artikel introduceert een Wiener Chaos Expansion-gebaseerde neurale operator met FiLM-modulatie die singulariteit in stochastische partiële differentiaalvergelijkingen, zoals het dynamische $\boldsymbol{\Phi}^4_2$ - en $\boldsymbol{\Phi}^4_3$ -model, nauwkeurig simuleert zonder renormalisatiefactoren.

Dai Shi, Luke Thompson, Andi Han, Peiyan Hu, Junbin Gao, José Miguel Hernández-Lobato2026-03-10🤖 cs.LG

The Struggle Between Continuation and Refusal: A Mechanistic Analysis of the Continuation-Triggered Jailbreak in LLMs

Deze studie onthult dat jailbreaks in grote taalmodellen voortkomen uit een mechanische strijd tussen de inherente neiging van het model om tekst voort te zetten en de veiligheidsverdedigingen die door training zijn opgebouwd, waarbij de verplaatsing van een voortzettingstrigger de succeskans aanzienlijk vergroot.

Yonghong Deng, Zhen Yang, Ping Jian, Xinyue Zhang, Zhongbin Guo, Chengzhi Li2026-03-10🤖 cs.LG

← Vorige Volgende →

cs.LG