cs.AI papers | Gist.Science

Safe Transformer: An Explicit Safety Bit For Interpretable And Controllable Alignment

Het paper introduceert de Safe Transformer, een modulaire aanpak die een expliciete veiligheidsbit in taalmodellen integreert om zowel de interpretatie van veiligheidsbeslissingen als de controle over het gedrag van het model te verbeteren zonder volledige hertraining.

Jingyuan Feng, Andrew Gambardella, Gouki Minegishi, Takeshi Kojima, Yusuke Iwasawa, Yutaka Matsuo2026-03-10🤖 cs.LG

Don't Freeze, Don't Crash: Extending the Safe Operating Range of Neural Navigation in Dense Crowds

Dit paper introduceert een versterkingsleerbenadering die door middel van dichtheidsinvariante observatiecodering en trainingsrandomisatie veilige navigatie in dichte menigten mogelijk maakt zonder te bevriezen of te crashen, zelfs bij onbekende, hogere dichtheden dan tijdens de training.

Jiefu Zhang, Yang Xu, Vaneet Aggarwal2026-03-10🤖 cs.LG

Calibrated Credit Intelligence: Shift-Robust and Fair Risk Scoring with Bayesian Uncertainty and Gradient Boosting

Dit paper introduceert Calibrated Credit Intelligence (CCI), een deploymentgericht framework dat Bayesiaanse onzekerheid, fairness-beperkte gradient boosting en shift-bewuste fusie combineert om credit risk scores te leveren die onder tijdsafhankelijke verschuivingen nauwkeurig, goed gekalibreerd en eerlijk blijven.

Srikumar Nayak2026-03-10🤖 cs.LG

Agent Hunt: Bounty Based Collaborative Autoformalization With LLM Agents

Dit paper beschrijft een experiment waarbij meerdere LLM-agenten in een interactief bewijssysteem samenwerken via een dynamisch bounty-marktmechanisme om algebraïsche topologie te formaliseren en te bewijzen.

Chad E. Brown, Cezary Kaliszyk, Josef Urban2026-03-10💻 cs

Rank-Factorized Implicit Neural Bias: Scaling Super-Resolution Transformer with FlashAttention

Deze paper introduceert Rank-Factorized Implicit Neural Bias (RIB), een methode die Super-Resolution Transformers compatibel maakt met FlashAttention door relatieve positionele bias te vervangen, waardoor de trainings- en inferentiesnelheid aanzienlijk wordt verbeterd en grotere venstergroottes mogelijk worden voor superieure prestaties.

Dongheon Lee, Seokju Yun, Jaegyun Im, Youngmin Ro2026-03-10🤖 cs.LG

ResearchEnvBench: Benchmarking Agents on Environment Synthesis for Research Code Execution

Deze paper introduceert ResearchEnvBench, een benchmark die de aanzienlijke beperkingen van huidige autonome agents blootlegt bij het synthetiseren van uitvoeringsomgevingen voor onderzoekscodes, een cruciale stap voor reproduceerbaar wetenschappelijk werk.

Yubang Wang, Chenxi Zhang, Bowen Chen, Zezheng Huai, Zihao Dai, Xinchi Chen, Yuxin Wang, Yining Zheng, Jingjing Gong, Xipeng Qiu2026-03-10💻 cs

ViroGym: Realistic Large-Scale Benchmarks for Evaluating Viral Proteins

Dit paper introduceert ViroGym, een uitgebreid benchmarkkader dat 79 diepe mutatiescanningsassays en diverse virale taken combineert om de prestaties van eiwit-taalmodellen bij het voorspellen van varianteffecten te evalueren en zo de selectie van rationele antigeenkandidaten voor vaccins te ondersteunen.

Yichen Zhou, Jonathan Golob, Amir Karimi, Stefan Bauer, Patrick Schwab2026-03-10💻 cs

Heterogeneous Decentralized Diffusion Models

Deze paper introduceert een efficiënt raamwerk voor heterogene decentrale diffusiemodellen dat de trainingskosten aanzienlijk verlaagt en diverse trainingsdoelen (DDPM en Flow Matching) mogelijk maakt, wat resulteert in een 16-voudige reductie in rekenkracht en een 14-voudige reductie in data ten opzichte van eerdere methoden.

Zhiying Jiang, Raihan Seraj, Marcos Villagra, Bidhan Roy2026-03-10🤖 cs.LG

Improved Constrained Generation by Bridging Pretrained Generative Models

Deze paper introduceert een raamwerk dat een vooraf getraind generatief model fijntuint om samples direct binnen complexe, realistische beperkte gebieden te genereren, waardoor een nieuw compromis wordt gevonden tussen het naleven van constraints en de kwaliteit van de generatie.

Xiaoxuan Liang, Saeid Naderiparizi, Yunpeng Liu, Berend Zwartsenberg, Frank Wood2026-03-10🤖 cs.LG

Stabilizing Reinforcement Learning for Diffusion Language Models

Deze paper introduceert StableDRL, een gestabiliseerde variant van Group Relative Policy Optimization (GRPO) die specifiek is ontworpen om reward collapse te voorkomen bij het toepassen van versterkingslering op diffusie-taalmodellen door onbetrouwbare schattingen van waarschijnlijkheidsverhoudingen aan te pakken via onvoorwaardelijke clipping en zelf-normalisatie.

Jianyuan Zhong, Kaibo Wang, Ding Ding, Zijin Feng, Haoli Bai, Yang Xiang, Jiacheng Sun, Qiang Xu2026-03-10🤖 cs.LG

Enhancing Instruction Following of LLMs via Activation Steering with Dynamic Rejection

Dit paper introduceert DIRECTER, een nieuwe activatiesturingstechniek die dynamisch de stuurkracht aanpast op basis van plausibiliteit en een eenmalige attentie-analyse om de instructievolgingscapaciteit van grote taalmodellen te verbeteren zonder de kwaliteit van de gegenereerde tekst te schaden.

Minjae Kang, Jaehyung Kim2026-03-10🤖 cs.LG

ButterflyViT: 354 $\times$ Expert Compression for Edge Vision Transformers

ButterflyViT is een nieuwe methode die Vision Transformers voor randapparatuur mogelijk maakt door experts te behandelen als geometrische herschikkingen van een gedeelde quantized substraat, wat resulteert in een 354-voudige vermindering van het geheugengebruik bij 64 experts met verwaarloosbaar verlies aan nauwkeurigheid.

Aryan Karmore2026-03-10💻 cs

Property-driven Protein Inverse Folding With Multi-Objective Preference Alignment

In dit paper wordt ProtAlign geïntroduceerd, een multi-objectief voorkeursuitlijningsframework dat voorgeöefende inverse vouwmodellen fijnstelt om diverse ontwikkelbaarheidseigenschappen te optimaliseren zonder de structurele integriteit te schaden, wat resulteert in het model MoMPNN dat een verbeterde balans biedt tussen ontvouwbaarheid en ontwikkelbaarheid.

Xiaoyang Hou, Junqi Liu, Chence Shi, Xin Liu, Zhi Yang, Jian Tang2026-03-10🤖 cs.LG

Robotic Foundation Models for Industrial Control: A Comprehensive Survey and Readiness Assessment Framework

Deze studie biedt een uitgebreid overzicht van robotische foundation-modellen voor industriële toepassingen en introduceert een beoordelingsframework dat aantoont dat de huidige modellen nog onvoldoende zijn voor industriële inzet, omdat ze vooral beperkte pieken vertonen in plaats van een geïntegreerde dekking van veiligheids-, real-time en integratie-eisen.

David Kube, Simon Hadwiger, Tobias Meisen2026-03-10💻 cs

XMACNet: An Explainable Lightweight Attention based CNN with Multi Modal Fusion for Chili Disease Classification

Deze paper introduceert XMACNet, een lichtgewicht en verklaarbaar CNN-model dat zichtbare beelden en vegetatie-indexen combineert via zelf-attention en multi-modale fusie om chili-ziekten nauwkeurig te detecteren en te visualiseren voor toepassing in de precisielandbouw.

Tapon Kumer Ray, Rajkumar Y, Shalini R, Srigayathri K, Jayashree S, Lokeswari P2026-03-10💻 cs

Learning Unbiased Cluster Descriptors for Interpretable Imbalanced Concept Drift Detection

Deze paper introduceert ICD3, een nieuwe aanpak voor het detecteren van conceptdrift in onevenwichtige stromende data die het 'maskeringseffect' van grote clusters omzeilt door onbevooroordeelde clusterbeschrijvers te gebruiken om drift in kleine concepten nauwkeurig en interpreteerbaar te lokaliseren.

Yiqun Zhang, Zhanpei Huang, Mingjie Zhao, Chuyao Zhang, Yang Lu, Yuzhu Ji, Fangqing Gu, An Zeng2026-03-10🤖 cs.LG

Enhancing SHAP Explainability for Diagnostic and Prognostic ML Models in Alzheimer Disease

Dit paper introduceert een multi-niveau framework om de robuustheid en consistentie van SHAP-verklaringen voor diagnostische en prognostische machine learning-modellen bij Alzheimer te valideren, waarbij wordt aangetoond dat cognitieve en functionele markers stabiel blijven over verschillende ziektestadia en modelarchitecturen heen.

Pablo Guillén, Enrique Frias-Martinez2026-03-10🤖 cs.LG

Gradient-based Nested Co-Design of Aerodynamic Shape and Control for Winged Robots

Dit artikel introduceert een algemeen, op gradiënten gebaseerd, genesterd co-designkader dat aerodynamische vormgeving en besturing voor vleugelrobots gelijktijdig optimaliseert door gebruik te maken van een neuronaal surrogaatmodel voor complexe stroming, wat leidt tot superieure prestaties bij taken als perchen en kort landen in vergelijking met bestaande methoden.

Daniele Affinita, Mingda Xu, Benoît Valentin Gherardi, Pascal Fua2026-03-10💻 cs

Diversity-Aware Adaptive Collocation for Physics-Informed Neural Networks via Sparse QUBO Optimization and Hybrid Coresets

Dit paper introduceert een diversiteitsbewuste, adaptieve selectiemethode voor collocatiepunten in Physics-Informed Neural Networks (PINNs) die het probleem omzet in een sparse QUBO-optimalisatie met hybride coreset-anchors, waardoor de trainingskosten worden verlaagd en de nauwkeurigheid voor PDE's zoals de viskeuze Burgers-vergelijking wordt verbeterd.

Hadi Salloum, Maximilian Mifsud Bonici, Sinan Ibrahim, Pavel Osinenko, Alexei Kornaev2026-03-10🤖 cs.LG

Failure Detection in Chemical Processes using Symbolic Machine Learning: A Case Study on Ethylene Oxidation

Dit artikel toont aan dat symbolisch machine learning, in tegenstelling tot minder interpreteerbare neurale netwerken, effectief en uitlegbaar faaldetectie kan uitvoeren in chemische processen zoals ethyleenoxidatie, zelfs wanneer het trainen gebeurt op gesimuleerde data vanwege het gebrek aan historische real-world foutgegevens.

Julien Amblard, Niklas Groll, Matthew Tait, Mark Law, Gürkan Sin, Alessandra Russo2026-03-10🤖 cs.LG

← Vorige Volgende →

cs.AI