cs.LG papers | Gist.Science

The Struggle Between Continuation and Refusal: A Mechanistic Analysis of the Continuation-Triggered Jailbreak in LLMs

Deze studie onthult dat jailbreaks in grote taalmodellen voortkomen uit een mechanische strijd tussen de inherente neiging van het model om tekst voort te zetten en de veiligheidsverdedigingen die door training zijn opgebouwd, waarbij de verplaatsing van een voortzettingstrigger de succeskans aanzienlijk vergroot.

Yonghong Deng, Zhen Yang, Ping Jian, Xinyue Zhang, Zhongbin Guo, Chengzhi Li2026-03-10🤖 cs.LG

Fibration Policy Optimization

Dit paper introduceert Fibration Policy Optimization (FiberPO), een unificerend framework dat trust-region theorie en een algebraïsche fibratiestructuur combineert om multi-schaal stabiliteitscontrole en verbeterde token-efficiëntie te bieden voor de optimalisatie van grote taalmodellen.

Chang Li, Tshihao Tsu, Yaren Zhang, Chao Xue, Xiaodong He2026-03-10🤖 cs.LG

Optimising antibiotic switching via forecasting of patient physiology

Dit artikel presenteert een interpreteerbaar systeem dat neurale processen gebruikt om de fysiologische ontwikkeling van patiënten te voorspellen en zo de overgang van intraveneuze naar orale antibiotica te optimaliseren door patiënten te prioriteren op basis van klinische richtlijnen in plaats van historische beslissingen.

Magnus Ross, Nel Swanepoel, Akish Luintel, Emma McGuire, Ingemar J. Cox, Steve Harris, Vasileios Lampos2026-03-10🤖 cs.LG

FedPrism: Adaptive Personalized Federated Learning under Non-IID Data

FedPrism is een adaptief framework voor federatief leren dat prestaties onder niet-IID-omstandigheden verbetert door middel van prismadecompositie voor dynamische clientgroepering en een dubbelstroomontwerp dat voorspellingen baseert op het vertrouwen van lokale specialisten.

Prakash Kumbhakar, Shrey Srivastava, Haroon R Lone2026-03-10🤖 cs.LG

FlowTouch: View-Invariant Visuo-Tactile Prediction

FlowTouch is een nieuw model dat visuele informatie omzet in voorspelde tactiele patronen via een object's lokale 3D-mesh, waardoor het de beperkingen van camera-afhankelijkheid overbrugt, de sim-naar-real-kloof dicht en toepasbaar is voor het voorspellen van grijpstabiliteit.

Seongjin Bien, Carlo Kneissl, Tobias Jülg, Frank Fundel, Thomas Ressler-Antal, Florian Walter, Björn Ommer, Gitta Kutyniok, Wolfram Burgard2026-03-10🤖 cs.LG

Beyond ReinMax: Low-Variance Gradient Estimators for Discrete Latent Variables

Deze paper introduceert de ReinMax-Rao en ReinMax-CV schatters, die Rao-Blackwellisatie en controlevariatietechnieken toepassen op de ReinMax-methode om de hoge variantie bij het trainen van modellen met discrete latente variabelen te verminderen en zo de prestaties te verbeteren.

Daniel Wang, Thang D. Bui2026-03-10🤖 cs.LG

Airborne Magnetic Anomaly Navigation with Neural-Network-Augmented Online Calibration

Deze paper introduceert een volledig adaptief MagNav-systeem dat met behulp van een uitgebreide Kalman-filter en een beperkt neurale netwerk de magnetische interferentie van een vliegtuig tijdens de vlucht in real-time kalibreert, waardoor nauwkeurige navigatie mogelijk wordt zonder voorafgaande kalibratievluchten.

Antonia Hager, Sven Nebendahl, Alexej Klushyn, Jasper Krauser, Torleiv H. Bryne, Tor Arne Johansen2026-03-10🤖 cs.LG

Towards a more efficient bias detection in financial language models

Dit onderzoek toont aan dat cross-model geleide bias-detectie de kosten voor het identificeren van vooroordelen in financiële taalmodellen aanzienlijk kan verlagen door gebruik te maken van consistente patronen in bias-revelerende inputs tussen verschillende modellen.

Firas Hadj Kacem, Ahmed Khanfir, Mike Papadakis2026-03-10🤖 cs.LG

SCL-GNN: Towards Generalizable Graph Neural Networks via Spurious Correlation Learning

Deze paper introduceert SCL-GNN, een nieuw raamwerk dat de generalisatie van Graph Neural Networks verbetert door het identificeren en mitigeren van spurious correlaties via de Hilbert-Schmidt Independence Criterion (HSIC) en een efficiënte bi-level optimalisatiestrategie.

Yuxiang Zhang, Enyan Dai2026-03-10🤖 cs.LG

TA-RNN-Medical-Hybrid: A Time-Aware and Interpretable Framework for Mortality Risk Prediction

Dit paper introduceert TA-RNN-Medical-Hybrid, een interpreteerbaar en tijdbewust deep learning-framework dat onregelmatige klinische data en medische concepten combineert om de mortaliteitsrisicovoorspelling op de IC te verbeteren en transparante inzichten te bieden.

Zahra Jafari, Azadeh Zamanifar, Amirfarhad Farhadi2026-03-10🤖 cs.LG

PolyFormer: learning efficient reformulations for scalable optimization under complex physical constraints

Het artikel introduceert PolyFormer, een physics-informed machine learning-model dat complexe fysische beperkingen omzet in efficiënte polytopische herschrijvingen, waardoor schaalbare optimalisatieproblemen tot 6.400 keer sneller kunnen worden opgelost met behoud van hoge oplossingskwaliteit.

Yilin Wen, Yi Guo, Bo Zhao, Wei Qi, Zechun Hu, Colin Jones, Jian Sun2026-03-10🤖 cs.LG

Posterior Sampling Reinforcement Learning with Gaussian Processes for Continuous Control: Sublinear Regret Bounds for Unbounded State Spaces

Dit artikel presenteert een sublineaire Bayesiaanse regret-begrenzing voor het GP-PSRL-algoritme in continue besturingsproblemen met onbegrensde toestanden, waarbij wordt aangetoond dat bezochte toestanden met hoge waarschijnlijkheid binnen een bijna constante straal blijven en een strakke afhankelijkheid van de maximale informatiewinst wordt bereikt.

Hamish Flynn, Joe Watson, Ingmar Posner, Jan Peters2026-03-10🤖 cs.LG

Minor First, Major Last: A Depth-Induced Implicit Bias of Sharpness-Aware Minimization

Dit paper toont aan dat Sharpness-Aware Minimization (SAM) bij diepe lineaire netwerken een dieptegedreven impliciete bias vertoont die fundamenteel verschilt van gradient descent, waarbij $\ell_\infty$ -SAM gevoelig is voor initialisatie en $\ell_2$ -SAM een uniek fenomeen van sequentiële kenversterking vertoont dat de beperkingen van onbeperkte impliciete-biasanalyses blootlegt.

Chaewon Moon, Dongkuk Si, Chulhee Yun2026-03-10🤖 cs.LG

Graph-Instructed Neural Networks for parametric problems with varying boundary conditions

Deze studie introduceert Graph-Instructed Neural Networks (GINNs) als een robuust en schaalbaar alternatief voor klassieke methoden om parametrische partiële differentiaalvergelijkingen met variërende randvoorwaarden efficiënt en nauwkeurig te simuleren.

Francesco Della Santa, Sandra Pieraccini, Maria Strazzullo2026-03-10🤖 cs.LG

Concept-Guided Fine-Tuning: Steering ViTs away from Spurious Correlations to Improve Robustness

Deze paper introduceert een concept-gestuurd fijntuning-framework dat Vision Transformers robuuster maakt tegen distributieveranderingen door hun interne relevantiekaarten automatisch uit te lijnen met semantische objectconcepten, afgeleid van een LLM en VLM, in plaats van te vertrouwen op spurious correlaties zoals achtergronden.

Yehonatan Elisha, Oren Barkan, Noam Koenigstein2026-03-10🤖 cs.LG

Sign Identifiability of Causal Effects in Stationary Stochastic Dynamical Systems

Dit artikel introduceert het concept van sign-identificeerbaarheid voor driftcoëfficiënten in stationaire stochastische differentiaalvergelijkingen met een bekende causale structuur maar onbekende diffusiematrix, en levert criteria om te bepalen of de tekens van causale effecten uniek kunnen worden afgeleid uit observationele covariantiematrices.

Gijs van Seeventer, Saber Salehkaleybar2026-03-10🤖 cs.LG

Beyond Attention Heatmaps: How to Get Better Explanations for Multiple Instance Learning Models in Histopathology

Dit artikel introduceert een algemeen framework voor het evalueren van de kwaliteit van warmtekaarten in multiple instance learning-modellen voor histopathologie, waarbij wordt aangetoond dat methoden zoals perturbation en LRP betrouwbaardere verklaringen bieden dan traditionele attention-mechanismen, wat leidt tot betere modelvalidatie en biologische inzichten.

Mina Jamshidi Idaji, Julius Hense, Tom Neuhäuser, Augustin Krause, Yanqing Luo, Oliver Eberle, Thomas Schnake, Laure Ciernik, Farnoush Rezaei Jafari, Reza Vahidimajd, Jonas Dippel, Christoph Walz, Frederick Klauschen, Andreas Mock, Klaus-Robert Müller2026-03-10🤖 cs.LG

Electrocardiogram Classification with Transformers Using Koopman and Wavelet Features

Dit onderzoek toont aan dat het combineren van met de Koopman-operator afgeleide kenmerken (via EDMD met een gespecialiseerd RBD-woordenboek) en transformatoren superieure prestaties levert voor meerklassige ECG-classificatie vergeleken met wavelet-kenmerken of een eenvoudige hybride aanpak.

Sucheta Ghosh, Zahra Monfared2026-03-10🤖 cs.LG

Rethinking Attention Output Projection: Structured Hadamard Transforms for Efficient Transformers

Dit paper introduceert een efficiëntere Transformer-architectuur die de dichte output-projectie in multi-head attention vervangt door een vaste Walsh-Hadamard-transformatie gecombineerd met een lichte affiene herschaling, wat resulteert in een aanzienlijke vermindering van parameters, geheugengebruik en inferentiekosten zonder in te leveren op prestaties.

Shubham Aggarwal, Lokendra Kumar2026-03-10🤖 cs.LG

Towards plausibility in time series counterfactual explanations

Deze paper introduceert een nieuwe methode voor het genereren van plausibele tegenfeitelijke verklaringen voor tijdreeksclassificatie door middel van gradiëntgebaseerde optimalisatie en soft-DTW-alignment, wat resulteert in verklaringen die niet alleen geldig zijn maar ook een realistische temporele structuur behouden die beter aansluit bij de doelklasse dan bestaande methoden.

Marcin Kostrzewa, Krzysztof Galus, Maciej Zi\k{e}ba2026-03-10🤖 cs.LG

← Vorige Volgende →