cs.AI papers | Gist.Science

Beyond Scaling: Assessing Strategic Reasoning and Rapid Decision-Making Capability of LLMs in Zero-sum Environments

Dit paper introduceert de STAR-benchmark, een multi-agent evaluatiekader dat het strategische redeneren en snelle besluitvorming van grote taalmodellen in nul-som omgevingen test, waarbij een significante kloof wordt blootgelegd tussen diep redeneren en effectieve uitvoering onder tijdsdruk.

Yang Li, Xing Chen, Yutao Liu, Gege Qi, Yanxian BI, Zizhe Wang, Yunjian Zhang, Yao Zhu2026-03-11🤖 cs.AI

TaSR-RAG: Taxonomy-guided Structured Reasoning for Retrieval-Augmented Generation

Dit paper introduceert TaSR-RAG, een framework dat taxonomie-gestuurde gestructureerde redenering toepast door queries en documenten om te zetten in relationele triples, waardoor de precisie en betrouwbaarheid van Retrieval-Augmented Generation voor complexe meerstapsvragen aanzienlijk wordt verbeterd zonder zware grafconstructie.

Jiashuo Sun, Yixuan Xie, Jimeng Shi, Shaowen Wang, Jiawei Han2026-03-11🤖 cs.AI

Robust Regularized Policy Iteration under Transition Uncertainty

Deze paper introduceert Robust Regularized Policy Iteration (RRPI), een methode voor offline versterkend leren die prestatie-degradatie door verdelingsverschuiving en transitie-onzekerheid aanpakt door het leerproces te formuleren als robuuste optimalisatie tegenover de slechtst mogelijke dynamica binnen een onzekerheidsset, wat resulteert in een efficiënt iteratief algoritme met theoretische convergentiegaranties en superieure prestaties op D4RL-benchmarks.

Hongqiang Lin, Zhenghui Fu, Weihao Tang, Pengfei Wang, Yiding Sun, Qixian Huang, Dongxu Zhang2026-03-11🤖 cs.AI

TA-GGAD: Testing-time Adaptive Graph Model for Generalist Graph Anomaly Detection

Dit paper introduceert TA-GGAD, een adaptief grafmodel dat het 'Anomaly Disassortativity'-probleem aanpakt om generalistische, domeinonafhankelijke anomaliedetectie te realiseren met state-of-the-art prestaties op diverse real-world grafen.

Xiong Zhang, Hong Peng, Changlong Fu, Xin Jin, Yun Yang, Cheng Xie2026-03-11🤖 cs.AI

Democratising Clinical AI through Dataset Condensation for Classical Clinical Models

Dit artikel introduceert een differentieel-private, nulde-orde optimalisatieframework dat datasetcondensatie mogelijk maakt voor niet-differentieerbare klinische modellen, zoals beslisbomen en Cox-regressie, waardoor veilige en modelonafhankelijke datauitwisseling voor klinische voorspellingsopdrachten wordt gerealiseerd zonder de privacy van patiënten te schaden.

Anshul Thakur, Soheila Molaei, Pafue Christy Nganjimi, Joshua Fieggen, Andrew A. S. Soltan, Danielle Belgrave, Lei Clifton, David A. Clifton2026-03-11🤖 cs.AI

M3GCLR: Multi-View Mini-Max Infinite Skeleton-Data Game Contrastive Learning For Skeleton-Based Action Recognition

Dit paper introduceert M3GCLR, een speltheoretisch contrastief leerframework dat een oneindig skelet-data-spel en een dual-loss optimizer gebruikt om de beperkingen van bestaande zelftoezichtmethoden voor skeletgebaseerde actieherkenning te overwinnen en state-of-the-art prestaties op meerdere benchmarks te bereiken.

Yanshan Li, Ke Ma, Miaomiao Wei, Linhui Dai2026-03-11🤖 cs.AI

MIL-PF: Multiple Instance Learning on Precomputed Features for Mammography Classification

Deze paper introduceert MIL-PF, een schaalbaar framework dat voorgecomputeerde features van gefixeerde foundation-modellen combineert met een lichtgewicht Multiple Instance Learning-kop om mammografie-classificatie efficiënt en nauwkeurig te maken zonder de zware backbones opnieuw te hoeven trainen.

Nikola Jovišic, Milica Škipina, Nicola Dall'Asen, Dubravko Culibrk2026-03-11🤖 cs.AI

SPAARS: Safer RL Policy Alignment through Abstract Exploration and Refined Exploitation of Action Space

SPAARS is een curriculumleerframework voor offline-naar-online versterkingsleer dat veilig online verkenning eerst beperkt tot een laagdimensionale latente ruimte om vervolgens naadloos over te schakelen naar de ruwe actieruimte, waardoor de prestatieplafond van decoder-bottlenecks wordt doorbroken en aanzienlijk betere sample-efficiëntie en prestaties worden bereikt.

Swaminathan S K, Aritra Hazra2026-03-11🤖 cs.AI

Physics-Informed Neural Engine Sound Modeling with Differentiable Pulse-Train Synthesis

Dit paper introduceert de Pulse-Train-Resonator (PTR), een differentieerbaar synthesemodel dat motorgeluiden nauwkeuriger nabootst door fysisch geïnformeerde pulsreeksen en resonatoren te gebruiken in plaats van traditionele harmonische benaderingen, wat resulteert in een significante verbetering in reconstructiekwaliteit en interpreteerbare parameters.

Robin Doerfler, Lonce Wyse2026-03-11🤖 cs.AI

ICDAR 2025 Competition on End-to-End Document Image Machine Translation Towards Complex Layouts

Dit rapport presenteert de ICDAR 2025 competitie voor end-to-end machinevertaling van documentafbeeldingen met complexe lay-outs, waarbij 69 teams deelnamen aan twee tracks (OCR-vrij en OCR-gebaseerd) en de resultaten aantonen dat grote modellen een veelbelovend paradigma vormen voor dit domein.

Yaping Zhang, Yupu Liang, Zhiyang Zhang, Zhiyuan Chen, Lu Xiang, Yang Zhao, Yu Zhou, Chengqing Zong2026-03-11🤖 cs.AI

Reviving ConvNeXt for Efficient Convolutional Diffusion Models

Dit paper introduceert FCDM, een volledig convolutiegebaseerd diffusiemodel dat ConvNeXt herintroduceert als een uiterst efficiënt alternatief voor Transformer-architecturen, waarbij het met slechts 50% van de FLOPs en aanzienlijk minder trainingsstappen vergelijkbare prestaties levert.

Taesung Kwon, Lorenzo Bianchi, Lennart Wittke, Felix Watine, Fabio Carrara, Jong Chul Ye, Romann Weber, Vinicius Azevedo2026-03-11🤖 cs.AI

PromptDLA: A Domain-aware Prompt Document Layout Analysis Framework with Descriptive Knowledge as a Cue

Dit paper introduceert PromptDLA, een domeinbewust raamwerk voor documentlay-outanalyse dat beschrijvende kennis gebruikt als aanwijzingen om domeinspecifieke priors te integreren en zo de generalisatie en prestaties op diverse datasets te verbeteren.

Zirui Zhang, Yaping Zhang, Lu Xiang, Yang Zhao, Feifei Zhai, Yu Zhou, Chengqing Zong2026-03-11🤖 cs.AI

From Flow to One Step: Real-Time Multi-Modal Trajectory Policies via Implicit Maximum Likelihood Estimation-based Distribution Distillation

Dit artikel introduceert een framework dat een Conditional Flow Matching-expert distilleert naar een snelle, single-step student via Implicit Maximum Likelihood Estimation, waardoor real-time, multi-modale robotcontrole met behoud van multi-modaal gedrag mogelijk wordt zonder de latentie van iteratieve integratie.

Ju Dong, Liding Zhang, Lei Zhang, Yu Fu, Kaixin Bai, Zoltan-Csaba Marton, Zhenshan Bing, Zhaopeng Chen, Alois Christian Knoll, Jianwei Zhang2026-03-11🤖 cs.AI

Investigating Gender Stereotypes in Large Language Models via Social Determinants of Health

Deze studie toont aan dat Large Language Models in het Frans gebaseerde gezondheidsdomein genderstereotypen vertonen die worden versterkt door interacties met andere sociale determinanten van gezondheid, wat aangeeft dat het evalueren van deze interacties essentieel is voor een nauwkeurige bias-analyse.

Trung Hieu Ngo, Adrien Bazoge, Solen Quiniou, Pierre-Antoine Gourraud, Emmanuel Morin2026-03-11🤖 cs.AI

Open-World Motion Forecasting

Dit paper introduceert 'open-world motion forecasting', een nieuw kader dat autonome voertuigen in staat stelt om continu nieuwe objectklassen te leren en hun bewegingen te voorspellen vanuit camera-beelden zonder vergeten van eerder geleerde kennis, door middel van een end-to-end class-incremental framework met pseudo-labeling en een innovatieve replay-samplingstrategie.

Nicolas Schischka, Nikhil Gosala, B Ravi Kiran, Senthil Yogamani, Abhinav Valada2026-03-11🤖 cs.AI

CERES: A Probabilistic Early Warning System for Acute Food Insecurity

Dit artikel presenteert CERES, een geautomatiseerd, openbaar en continu werkend probabilistisch systeem dat wekelijks 90-daagse voorspellingen genereert voor acute voedselonzekerheid in 43 risicolanden door zes datastromen te combineren en elke voorspelling cryptografisch te archiveren voor openbare verificatie.

Tom Danny S. Pedersen2026-03-11🤖 cs.AI

Common Sense vs. Morality: The Curious Case of Narrative Focus Bias in LLMs

Dit onderzoek onthult dat grote taalmodellen morele redenering vaak boven gezond verstand plaatsen en een vooroordelen vertonen waarbij ze tegenstrijdigheden in gezond verstand makkelijker herkennen bij secundaire personages dan bij de hoofdpersoon, wat wijst op de noodzaak van verbeterde trainingsmethoden.

Saugata Purkayastha, Pranav Kushare, Pragya Paramita Pal, Sukannya Purkayastha2026-03-11🤖 cs.AI

AI Act Evaluation Benchmark: An Open, Transparent, and Reproducible Evaluation Dataset for NLP and RAG Systems

Dit paper introduceert een open en reproduceerbare dataset voor het evalueren van NLP- en RAG-systemen op naleving van de EU-AI-wet, die door middel van een combinatie van domeinkennis en grote taalmodellen is opgezet om taken zoals risicoclassificatie en artikelretrieval te ondersteunen.

Athanasios Davvetas, Michael Papademas, Xenia Ziouvelou, Vangelis Karkaletsis2026-03-11🤖 cs.AI

A Guideline-Aware AI Agent for Zero-Shot Target Volume Auto-Delineation

Dit paper introduceert OncoAgent, een nieuw AI-agentkader dat klinische richtlijnen direct omzet in 3D-stralingsvolumes zonder training, waardoor het in een zero-shot setting presteert die vergelijkbaar is met toezichtmodellen en door artsen wordt geprefereerd vanwege zijn superioriteit in richtlijncompliance en aanpasbaarheid.

Yoon Jo Kim, Wonyoung Cho, Jongmin Lee, Han Joo Chae, Hyunki Park, Sang Hoon Seo, Noh Jae Myung, Kyungmi Yang, Dongryul Oh, Jin Sung Kim2026-03-11🤖 cs.AI

Variational Routing: A Scalable Bayesian Framework for Calibrated Mixture-of-Experts Transformers

Dit paper introduceert VMoER, een schaalbaar Bayesiaans framework dat variational inference toepast op de routering in Mixture-of-Experts Transformers om zo met minimale rekentijd gecalibreerde onzekerheidsschattingen te bieden voor foundation modellen.

Albus Yizhuo Li, Matthew Wicker2026-03-11🤖 cs.AI

← Vorige Volgende →