cs.AI papers | Gist.Science

ARLArena: A Unified Framework for Stable Agentic Reinforcement Learning

Dit paper introduceert ARLArena, een gestructureerd raamwerk voor het analyseren van trainingsstabiliteit in agentic reinforcement learning, en presenteert SAMPO, een nieuwe methode die instabiliteit aanpakt en robuuste prestaties garandeert voor LLM-gebaseerde agenten.

Xiaoxuan Wang, Han Zhang, Haixin Wang, Yidan Shi, Ruoyan Li, Kaiqiao Han, Chenyi Tong, Haoran Deng, Renliang Sun, Alexander Taylor, Yanqiao Zhu, Jason Cong, Yizhou Sun, Wei Wang2026-03-10💻 cs

CryoNet.Refine: A One-step Diffusion Model for Rapid Refinement of Structural Models with Cryo-EM Density Map Restraints

CryoNet.Refine is een geautomatiseerd, één-staps diffusiemodel dat de verfijning van atomaire structuren op basis van cryo-EM-dichtheidskaarten aanzienlijk versnelt en verbetert ten opzichte van traditionele methoden.

Fuyao Huang, Xiaozhu Yu, Kui Xu, Qiangfeng Cliff Zhang2026-03-10💻 cs

Vibe Researching as Wolf Coming: Can AI Agents with Skills Replace or Augment Social Scientists?

Dit artikel introduceert het concept 'vibe researching' en analyseert hoe AI-agenten met gespecialiseerde vaardigheden, zoals de scholar-skill-plugin, sociale wetenschappers kunnen versterken door repetitieve taken te automatiseren, terwijl ze beperkt blijven in theoretische originaliteit en tacite kennis, wat leidt tot nieuwe professionele uitdagingen en pedagogische crises.

Yongjun Zhang2026-03-10💻 cs

A Mathematical Theory of Agency and Intelligence

Dit artikel introduceert een wiskundige theorie die 'bipredictability' (P) als fundamentele maatstaf voor interactie definieert, waarbij wordt aangetoond dat huidige AI-systemen weliswaar handelen kunnen (agency), maar door het ontbreken van zelfmonitoring en adaptieve leercapaciteit nog geen ware intelligentie bezitten.

Wael Hafez, Chenan Wei, Rodrigo Pena, Amir Nazeri, Cameron Reid2026-03-10🔢 math

Autoregressive Visual Decoding from EEG Signals

Dit paper introduceert AVDE, een lichtgewicht en efficiënt autoregressief framework dat EEG-signalen gebruikt om beelden te decoderen door LaBraM en een multi-scale token-predictiestrategie te combineren, waardoor het de prestaties van bestaande methoden verbetert met slechts 10% van de parameters.

Sicheng Dai, Hongwang Xiao, Shan Yu, Qiwei Ye2026-03-10🤖 cs.LG

Decomposing Physician Disagreement in HealthBench

Deze studie onthult dat de meeste discrepanties tussen artsen in de HealthBench-evaluatie structureel zijn en niet door bestaande metadata verklaard kunnen worden, maar wel dat het onderscheid tussen herleidbare en onherleidbare onzekerheid inzicht biedt in hoe evaluatieontwerp kan worden verbeterd.

Satya Borgohain, Roy Mariathas2026-03-10💻 cs

CeRA: Breaking the Linear Ceiling of Low-Rank Adaptation via Manifold Expansion

Dit paper introduceert CeRA, een parameter-efficiënte fine-tuning-methode die door middel van SiLU-gating en structurele dropout de lineaire beperkingen van LoRA doorbreekt en zo superieure prestaties bereikt op complexe redeneertaken door de dormantie van het singuliere waarden-spectrum te activeren.

Hung-Hsuan Chen2026-03-10🤖 cs.LG

On Sample-Efficient Generalized Planning via Learned Transition Models

Deze paper toont aan dat het formuleren van gegeneraliseerd plannen als het leren van een expliciet transitiemodel, in plaats van directe actie-voorspelling, leidt tot betere generalisatie en hogere sample-efficiëntie met kleinere modellen.

Nitin Gupta, Vishal Pallagani, John A. Aydin, Biplav Srivastava2026-03-10💻 cs

Scaling Search Relevance: Augmenting App Store Ranking with LLM-Generated Judgments

Dit paper beschrijft hoe het gebruik van een gespecialiseerd, fijngefineerd LLM om schaalbare tekstuele relevantielabels te genereren, de App Store-rangschikking verbetert door zowel gedrags- als tekstuele relevantie te optimaliseren, wat resulteert in een statistisch significant toename van de conversie, vooral voor zeldzame zoekopdrachten.

Evangelia Christakopoulou, Vivekkumar Patel, Hemanth Velaga, Sandip Gaikwad, Sean Suchter, Venkat Sundaranatha2026-03-10🤖 cs.LG

Attn-QAT: 4-Bit Attention With Quantization-Aware Training

Dit paper introduceert Attn-QAT, een kwantiseringsbewuste trainingsmethode die stabiele 4-bit attention mogelijk maakt op FP4-GPU's door de backward pass aan te passen, waardoor de kwaliteit van modellen behouden blijft en er tot 1,5x snelheidswinst wordt geboekt.

Peiyuan Zhang, Matthew Noto, Wenxuan Tan, Chengquan Jiang, Will Lin, Wei Zhou, Hao Zhang2026-03-10🤖 cs.LG

PEPA: a Persistently Autonomous Embodied Agent with Personalities

Dit artikel introduceert PEPA, een cognitieve architectuur voor een fysieke agent die door middel van persoonlijkheidstrekken en een driedelig systeem autonoom doelen genereert en gedrag aanpast, waardoor het zonder externe instructies langdurig en zelfstandig kan opereren in dynamische omgevingen.

Kaige Liu, Yang Li, Lijun Zhu, Weinan Zhang2026-03-10💻 cs

How Well Do Multimodal Models Reason on ECG Signals?

Deze paper introduceert een reproduceerbaar kader voor het evalueren van het redeneervermogen van multimodale modellen op ECG-signalen door het redeneren te ontleden in perceptie en deductie, waarbij respectievelijk code-generatie en een klinische criteria-database worden gebruikt voor schaalbare en semantisch accurate verificatie.

Maxwell A. Xu, Harish Haresamudram, Catherine W. Liu, Patrick Langer, Jathurshan Pradeepkumar, Wanting Mao, Sunita J. Ferns, Aradhana Verma, Jimeng Sun, Paul Schmiedmayer, Xin Liu, Daniel McDuff, Emily B. Fox, James M. Rehg2026-03-10🤖 cs.LG

Conformal Prediction for Risk-Controlled Medical Entity Extraction Across Clinical Domains

Deze studie introduceert een conformal prediction-framework dat, ondanks variaties in modelkalibratie tussen gestructureerde FDA-documenten en vrije radiologieteksten, betrouwbare coverage-garanties biedt voor veilige medische entiteitsextractie met grote taalmodellen in klinische toepassingen.

Manil Shrestha, Edward Kim2026-03-10💬 cs.CL

Extended Empirical Validation of the Explainability Solution Space

Dit technische rapport bevestigt de generaliseerbaarheid van het Explainability Solution Space (ESS)-kader door middel van een uitgebreide cross-domein validatie die de oorspronkelijke toepassing op personeelsverloop uitbreidt naar een heterogeen intelligent stedelijk hulpbronnensysteem, waarbij wordt aangetoond dat ESS-rangschikkingen systematisch aanpassen aan governance-rollen en stakeholderconfiguraties in plaats van domeinspecifiek te zijn.

Antoni Mestre, Manoli Albert, Miriam Gil, Vicente Pelechano2026-03-10💻 cs

Opponent State Inference Under Partial Observability: An HMM-POMDP Framework for 2026 Formula 1 Energy Strategy

Dit paper presenteert een tweelaags HMM-POMDP-raamwerk dat, door rivaliserende auto's' verborgen energiestatus te infereren uit waarneembare telemetrie, de optimale energie-inzetstrategie voor de 2026 Formule 1-reglementen bepaalt en valstrikken zoals de 'counter-harvest trap' effectief detecteert.

Kalliopi Kleisarchaki2026-03-10🤖 cs.LG

HarmonyCell: Automating Single-Cell Perturbation Modeling under Semantic and Distribution Shifts

HarmonyCell is een end-to-end agentframework dat single-cell perturbatiestudies automatiseert door semantische heterogeniteit op te lossen met een door LLM-aangedreven semantic unifier en statistische heterogeniteit aan te pakken met een adaptieve Monte Carlo Tree Search-engine, waardoor schaalbaar virtueel celmodelleren mogelijk wordt zonder dataset-specifieke engineering.

Wenxuan Huang, Mingyu Tsoi, Yanhao Huang, Xinjie Mao, Xue Xia, Hao Wu, Jiaqi Wei, Yuejin Yang, Lang Yu, Cheng Tan, Xiang Zhang, Zhangyang Gao, Siqi Sun2026-03-10💻 cs

LLM-assisted Semantic Option Discovery for Facilitating Adaptive Deep Reinforcement Learning

Dit paper introduceert een nieuw LLM-gedreven raamwerk dat semantische opties ontdekt om de data-efficiëntie, interpreteerbaarheid en overdraagbaarheid van Deep Reinforcement Learning te verbeteren door natuurlijke taal instructies om te zetten in uitvoerbare regels.

Chang Yao, Jinghui Qin, Kebing Jin, Hankz Hankui Zhuo2026-03-10💻 cs

A Detection-Gated Pipeline for Robust Glottal Area Waveform Extraction and Clinical Pathology Assessment

Dit paper introduceert een detectie-gestuurde pipeline die robuuste glottale segmentatie en klinische pathologie-evaluatie mogelijk maakt door een lokale detector te combineren met een segmentatiemodel, waardoor state-of-the-art prestaties en cross-dataset generalisatie worden bereikt voor real-time klinisch gebruik.

Harikrishnan Unnikrishnan2026-03-10🤖 cs.LG

Leveraging Model Soups to Classify Intangible Cultural Heritage Images from the Mekong Delta

Dit artikel presenteert een robuust classificatiekader voor beelden van het immaterieel cultureel erfgoed in de Mekongdelta, waarbij de CoAtNet-architectuur wordt gecombineerd met modelsoepen om de generalisatie te verbeteren door de variantie te verminderen in een data-schaarste omgeving.

Quoc-Khang Tran, Minh-Thien Nguyen, Nguyen-Khang Pham2026-03-10🤖 cs.LG

Diagnosing Retrieval vs. Utilization Bottlenecks in LLM Agent Memory

Deze studie toont aan dat bij geheugenverrijkte LLM-agenten de kwaliteit van de ophaalstrategie een veel grotere impact heeft op de prestaties dan de schrijfstijl, waarbij ruwe opslag vaak superieur is aan duurere, samenvattende methoden omdat de huidige ophaalmechanismen nuttige context uit verloren gegane informatie niet kunnen compenseren.

Boqin Yuan, Yue Su, Kun Yao2026-03-10🤖 cs.AI

← Vorige Volgende →