cs.AI papers | Gist.Science

Interpretable Motion-Attentive Maps: Spatio-Temporally Localizing Concepts in Video Diffusion Transformers

Deze paper introduceert GramCol en een Interpretable Motion-Attentive Map (IMAP) om zonder gradiëntberekening ruimtelijk en temporeel te lokaliseren hoe Video Diffusion Transformers bewegingsconcepten vertalen naar video's.

Youngjun Jun, Seil Kang, Woojung Han, Seong Jae Hwang2026-03-10🤖 cs.LG

Why Adam Can Beat SGD: Second-Moment Normalization Yields Sharper Tails

Dit paper biedt de eerste theoretische scheiding tussen Adam en SGD door aan te tonen dat de tweede-momentnormalisatie in Adam zorgt voor een scherpere staart in de convergentie, met een afhankelijkheid van $\delta^{-1/2}$ in plaats van de noodzakelijke $\delta^{-1}$ bij SGD.

Ruinan Jin, Yingbin Liang, Shaofeng Zou2026-03-10🤖 cs.LG

Information Routing in Atomistic Foundation Models: How Task Alignment and Equivariance Shape Linear Disentanglement

Deze studie introduceert Compositional Probe Decomposition (CPD) om aan te tonen dat taakalignatie, meer dan de modelarchitectuur, bepaalt in hoeverre atomaire foundation models geometrische en compositie-informatie lineair ontkoppelen, waarbij symmetrie-gebaseerde routepatronen en een waarschuwing tegen niet-lineaire probes worden geïdentificeerd.

Joshua Steier2026-03-10🤖 cs.LG

No Memorization, No Detection: Output Distribution-Based Contamination Detection in Small Language Models

Dit onderzoek concludeert dat de methode CDD voor het detecteren van datacontaminatie in kleine taalmodellen (70M-410M parameters) over het algemeen niet effectiever is dan willekeur en dat probabilistische methoden zoals perplexiteit en Min-k% Prob in alle geteste scenario's superieure resultaten leveren.

Omer Sela (Tel Aviv University)2026-03-10💬 cs.CL

Agentic SPARQL: Evaluating SPARQL-MCP-powered Intelligent Agents on the Federated KGQA Benchmark

Dit artikel onderzoekt de potentie van SPARQL-MCP-gebaseerde intelligente agenten voor federatieve kennisgrafiekvraagbeantwoording door een bestaand benchmark uit te breiden en verschillende architecturale opties te evalueren voor de integratie van SPARQL-federatie met LLM-agenten.

Daniel Dobriy, Frederik Bauer, Amr Azzam + 2 more2026-03-10🤖 cs.AI

Right Move, Right Time: Multi-Sport Space Evaluation Platform for Ultimate Frisbee, Basketball, and Soccer

Dit artikel introduceert een open, sport-agnostisch platform dat trackingdata omzet in vergelijkbare ruimtelijke maatstaven voor Ultimate Frisbee, basketbal en voetbal, waarmee coaches de beschikbare ruimte en het juiste moment voor bewegingen zonder bal kunnen analyseren.

Shunsuke Iwashita, Titouan Jeannot, Braden Eberhard + 4 more2026-03-10🤖 cs.AI

Autonomous AI Agents for Option Hedging: Enhancing Financial Stability through Shortfall Aware Reinforcement Learning

Dit artikel introduceert twee versterkte leerframeworks, RLOP en QLBS, die autonome AI-agenten voor optiemanagement verbeteren door tekortkomingen te minimaliseren en zo de financiële stabiliteit te vergroten, zoals aangetoond door empirische tests met SPY- en XOP-opties.

Minxuan Hu, Ziheng Chen, Jiayu Yi + 1 more2026-03-10💰 q-fin

Isotonic Layer: A Universal Framework for Generic Recommendation Debiasing

Dit paper introduceert de Isotonic Layer, een nieuw differentieerbaar raamwerk dat via monotoon geconstrueerde segmenten en leerbare embeddings systematische vertekeningen in aanbevelingssystemen corrigeert, wat resulteert in betere kalibratie, eerlijkheid en prestaties in productieomgevingen.

Hailing Cheng, Yafang Yang, Hemeng Tao, Fengyu Zhang2026-03-10🤖 cs.LG

ARC-AGI-2 Technical Report

Dit paper introduceert een transformer-gebaseerd systeem dat de prestaties op ARC-AGI-2 aanzienlijk verbetert door neurale inferentie te combineren met structurele priors, test-tijd training en symmetrie-bewuste decoding om generalisatie buiten patroonherkenning te bereiken.

Wallyson Lemes de Oliveira, Mekhron Bobokhonov, Matteo Caorsi, Aldo Podestà, Gabriele Beltramo, Luca Crosato, Matteo Bonotto, Federica Cecchetto, Hadrien Espic, Dan Titus Salajan, Stefan Taga, Luca Pana, Joe Carthy2026-03-10💬 cs.CL

A Coin Flip for Safety: LLM Judges Fail to Reliably Measure Adversarial Robustness

Deze studie toont aan dat bestaande LLM-judges de robuustheid van AI-veiligheid tegen adversariale aanvallen onbetrouwbaar meten door distributieveranderingen en semantische ambiguïteit, waardoor veel succespercentages kunstmatig worden opgeblazen in plaats van echte schadelijkheid weer te geven.

Leo Schwinn, Moritz Ladenburger, Tim Beyer, Mehrnaz Mofakhami, Gauthier Gidel, Stephan Günnemann2026-03-10💬 cs.CL

Distributionally Robust Geometric Joint Chance-Constrained Optimization: Neurodynamic Approaches

Dit artikel introduceert een tweestaps neurodynamische aanpak op basis van projectievergelijkingen om distributie-robuste geometrische gezamenlijke kansbeperkte optimalisatieproblemen op te lossen, waarbij onbekende verdelingen binnen onzekerheidssets worden behandeld en convergentie naar het globale optimum wordt gegarandeerd zonder gebruik van traditionele methoden.

Ange Valli (L2S), Siham Tassouli (OPTIM), Abdel Lisser (L2S)2026-03-10🔢 math

Building the ethical AI framework of the future: from philosophy to practice

Dit paper introduceert een ethiek-van-ontwerp besturingsarchitectuur die een drievoudige poortstructuur (metrisch, bestuurlijk en ecologisch) implementeert in de volledige AI-levenscyclus om ethische risico's om te zetten in afdwingbare en testbare controles die compatibel zijn met bestaande MLOps-pipelines en regelgeving zoals de EU AI Act.

Jasper Kyle Catapang2026-03-10💻 cs

FuzzingRL: Reinforcement Fuzz-Testing for Revealing VLM Failures

Dit paper introduceert FuzzingRL, een methode die fuzzing en versterkingsfinetuning combineert om automatisch uitdagende vragen te genereren die de kwetsbaarheden van Vision Language Models onthullen en hun prestaties aanzienlijk verminderen.

Jiajun Xu, Jiageng Mao, Ang Qi, Weiduo Yuan, Alexander Romanus, Helen Xia, Vitor Campagnolo Guizilini, Yue Wang2026-03-10🤖 cs.LG

Scale Dependent Data Duplication

Dit artikel toont aan dat data-duplicatie bij het voorbewerken van taalmodellen schaalafhankelijk is, waarbij semantische duplicaten bij grotere modellen steeds meer als exacte duplicaten fungeren en leiden tot verslechterende generalisatie en afwijkende schaalwetten.

Joshua Kazdan, Noam Levi, Rylan Schaeffer, Jessica Chudnovsky, Abhay Puri, Bo He, Mehmet Donmez, Sanmi Koyejo, David Donoho2026-03-10🤖 cs.LG

Multi-Agent DRL for V2X Resource Allocation: Disentangling Challenges and Benchmarking Solutions

Deze paper introduceert een gestructureerd benchmarkkader met geïsoleerde interferentiegames en uitgebreide datasets om de specifieke uitdagingen van multi-agent deep reinforcement learning voor C-V2X-resourceallocatie te ontrafelen, waarbij blijkt dat robustheid en generalisatie over diverse voertuigtopologieën de grootste obstakels vormen.

Siyuan Wang, Lei Lei, Pranav Maheshwari, Sam Bellefeuille, Kan Zheng, Dusit Niyato2026-03-10🤖 cs.LG

Scaling Strategy, Not Compute: A Stand-Alone, Open-Source StarCraft II Benchmark for Accessible Reinforcement Learning Research

Deze paper introduceert de Two-Bridge Map Suite, een open-source benchmark voor StarCraft II die als tussenliggend niveau fungeert tussen de volledige game en mini-games, waardoor onderzoekers tactische vaardigheden kunnen bestuderen zonder de hoge rekenkosten van de volledige game.

Sourav Panda, Shreyash Kale, Tanmay Ambadkar, Abhinav Verma, Jonathan Dodge2026-03-10🤖 cs.LG

Consensus is Not Verification: Why Crowd Wisdom Strategies Fail for LLM Truthfulness

Dit paper concludeert dat het vermeerderen van inferentieberekeningen via crowd-wisdom-strategieën de waarheidsgetrouwheid van taalmodellen in niet-verifieerbare domeinen niet verbetert, omdat de fouten van modellen sterk gecorreleerd zijn en aggregatie vaak gedeelde misvattingen versterkt in plaats van de waarheid te onthullen.

Yegor Denisov-Blanch, Joshua Kazdan, Jessica Chudnovsky, Rylan Schaeffer, Sheng Guan, Soji Adeshina, Sanmi Koyejo2026-03-10🤖 cs.LG

OptiRoulette Optimizer: A New Stochastic Meta-Optimizer for up to 5.3x Faster Convergence

Dit paper introduceert OptiRoulette, een nieuwe stochastische meta-optimizer die tijdens het trainen dynamisch update-regels selecteert en hiermee de convergentie tot 5,3 keer versnelt en de testnauwkeurigheid op diverse beeldclassificatiedatasets aanzienlijk verbetert ten opzichte van de standaard AdamW-baseline.

Stamatis Mastromichalakis2026-03-10🤖 cs.LG

Annealed Co-Generation: Disentangling Variables via Progressive Pairwise Modeling

Dit paper introduceert het Annealed Co-Generation (ACG)-framework, dat multivariate co-generatie in wetenschappelijke toepassingen efficiënter maakt door complexe gezamenlijke modellering te vervangen door een samenstellende reeks van laag-dimensionale, paarsgewijze diffusiemodellen die via een drie-fase-annealingsproces worden gekoppeld.

Hantao Zhang, Jieke Wu, Mingda Xu, Xiao Hu, Yingxuan You, Pascal Fua2026-03-10🤖 cs.LG

RACER: Risk-Aware Calibrated Efficient Routing for Large Language Models

Dit paper introduceert RACER, een risicobewuste en gekalibreerde routeringsmethode voor grote taalmodellen die query's naar sets van modellen routeert om de misroutingrisico's te beheersen en de downstream-nauwkeurigheid te verbeteren zonder afhankelijk te zijn van specifieke verdelingsaannames.

Sai Hao, Hao Zeng, Hongxin Wei, Bingyi Jing2026-03-10🤖 cs.LG

← Vorige Volgende →