cs.AI papers | Gist.Science

From Phase Prediction to Phase Design: A ReAct Agent Framework for High-Entropy Alloy Discovery

Deze studie introduceert een ReAct-agentframework dat gebruikmaakt van een kalibrerend XGBoost-model en domeinkennis om hoog-entropie legeringen autonoom te ontwerpen voor specifieke kristalfasen, waarbij het significant beter presteert dan traditionele methoden zoals Bayesiaanse optimalisatie en willekeurige zoekopdrachten.

Iman Peivaste, Salim Belouettar2026-03-13🔬 cond-mat.mtrl-sci

OA-NBV: Occlusion-Aware Next-Best-View Planning for Human-Centered Active Perception on Mobile Robots

Dit artikel introduceert OA-NBV, een occlusiebewuste planningssysteem voor mobiele robots dat automatisch het beste volgende gezichtspunt kiest om een gedeeltelijk geblokkeerde mens volledig en effectief waar te nemen, zelfs in rommelige omgevingen.

Boxun Hu, Chang Chang, Jiawei Ge, Man Namgung, Xiaomin Lin, Axel Krieger, Tinoosh Mohsenin2026-03-13🤖 cs.AI

Unifying Logical and Physical Layout Representations via Heterogeneous Graphs for Circuit Congestion Prediction

Dit paper introduceert VeriHGN, een verificatieframework dat logische en fysische lay-outrepresentaties verenigt via een heterogeen graafmodel om de nauwkeurigheid van congestievoorspelling in VLSI-ontwerpen te verbeteren.

Runbang Hu, Bo Fang, Bingzhe Li, Yuede Ji2026-03-13🤖 cs.AI

DIVE: Scaling Diversity in Agentic Task Synthesis for Generalizable Tool Use

Het paper introduceert DIVE, een bewijsgedreven methode die de volgorde van taaksynthese omkeert door eerst diverse real-world tool-uitvoeringen te genereren en daarop gebaseerde taken af te leiden, wat leidt tot een aanzienlijke verbetering in de generalisatie van tool-gebruikende LLM's op onbekende taken en toolsets.

Aili Chen, Chi Zhang, Junteng Liu, Jiangjie Chen, Chengyu Du, Yunji Li, Ming Zhong, Qin Wang, Zhengmao Zhu, Jiayuan Song, Ke Ji, Junxian He, Pengyu Zhao, Yanghua Xiao2026-03-13🤖 cs.AI

CR-Bench: Evaluating the Real-World Utility of AI Code Review Agents

Dit paper introduceert CR-Bench en CR-Evaluator om de real-world prestaties van AI-code-reviewagents te evalueren, waarbij wordt aangetoond dat een focus op het vinden van alle problemen vaak leidt tot veel valse positieven die de daadwerkelijke productiviteit en vooruitgang verbergen.

Kristen Pereira, Neelabh Sinha, Rajat Ghosh, Debojyoti Dutta2026-03-13💬 cs.CL

Quality-Driven Agentic Reasoning for LLM-Assisted Software Design: Questions-of-Thoughts (QoT) as a Time-Series Self-QA Chain

Dit paper introduceert Questions-of-Thoughts (QoT), een kwaliteitsgestuurde redeneermethode die de prestaties van LLM's bij softwareontwerp verbetert door gestructureerde stappen en zelfvragen te gebruiken om fouten te verminderen, met name bij complexere taken en grotere modellen.

Yen-Ku Liu, Yun-Cheng Tsai2026-03-13🤖 cs.AI

The Attack and Defense Landscape of Agentic AI: A Comprehensive Survey

Dit artikel biedt de eerste systematische survey naar de beveiliging van AI-agenten, waarin een nieuw raamwerk wordt gepresenteerd voor het analyseren van hun ontwerpruimte, aanvalslandschap en verdedigingsmechanismen, terwijl bestaande gaten en open uitdagingen worden geïdentificeerd.

Juhee Kim, Xiaoyuan Liu, Zhun Wang, Shi Qiu, Bo Li, Wenbo Guo, Dawn Song2026-03-13🤖 cs.AI

A Survey of Reasoning in Autonomous Driving Systems: Open Challenges and Emerging Paradigms

Deze survey analyseert de verschuiving van perceptie-gebaseerde naar redeneringscentrale autonome voertuigen, introduceert een cognitieve hiërarchie en identificeert kritieke uitdagingen zoals de spanning tussen deliberatieve taalmodellen en real-time veiligheidsvereisten voor het ontwikkelen van verifieerbare, neuro-symbolische architecturen.

Kejin Yu, Yuhan Sun, Taiqiang Wu, Ruixu Zhang, Zhiqiang Lin, Yuxin Meng, Junjie Wang, Yujiu Yang2026-03-13🤖 cs.AI

Graph Tokenization for Bridging Graphs and Transformers

Dit artikel introduceert een nieuw framework voor het tokeniseren van grafen dat reversibele serialisatie combineert met Byte Pair Encoding, waardoor standaard Transformers zonder aanpassingen direct op grafdata kunnen worden toegepast en state-of-the-art resultaten behalen op diverse benchmarks.

Zeyuan Guo, Enmao Diao, Cheng Yang, Chuan Shi2026-03-13🤖 cs.LG

Thousand-GPU Large-Scale Training and Optimization Recipe for AI-Native Cloud Embodied Intelligence Infrastructure

Dit paper introduceert een cloudgebaseerd, duizend-GPU trainingsplatform voor embodied intelligence dat, door optimalisaties op het gebied van data, training, modelarchitectuur en infrastructuur, de trainingstijd van het GR00T-N1.5-model met een factor 40 heeft verkort en zo een cruciale basis legt voor de ontwikkeling van autonome robots.

Chen Zhou, Haoran Sun, Hedan Yang, Jing Long, Junwu Xiong, Luqiao Wang, Mingxi Luo, Qiming Yang, Shuai Di, Song Wang, Tianyun Zhao, Wanting Xu, Wen Huang, Xiaodong Bai, Xiaomeng Tian, Xiaolong Xiang, Yicheng Gong, Yongjian Guo, Yucheng Guo, Yunxuan Ma, Yu Wei, Zhong Guan, Zhen Sun2026-03-13🤖 cs.AI

ResWM: Residual-Action World Model for Visual RL

Het artikel introduceert ResWM, een wereldmodel dat in plaats van absolute acties gebruikmaakt van residuale acties (incrementele aanpassingen) om de stabiliteit en sample-efficiëntie van visuele versterkingsleer voor robotica aanzienlijk te verbeteren.

Jseen Zhang, Gabriel Adineera, Jinzhou Tan, Jinoh Kim2026-03-13🤖 cs.AI

Task-Conditioned Routing Signatures in Sparse Mixture-of-Experts Transformers

Deze studie introduceert 'routing signatures' om aan te tonen dat de routeringsmechanismen in Sparse Mixture-of-Experts Transformers taakafhankelijke structuren vertonen die aanzienlijk beter zijn dan willekeurige patronen, en presenteert het MOE-XRAY toolkit voor verdere analyse.

Mynampati Sri Ranganadha Avinash2026-03-13🤖 cs.LG

WebWeaver: Breaking Topology Confidentiality in LLM Multi-Agent Systems with Stealthy Context-Based Inference

Dit paper introduceert WebWeaver, een stealthy aanvalskader dat de geheime communicatietopologie van LLM-meeragentensystemen reconstrueert door slechts één willekeurige agent te compromitteren en contextgebaseerde inferentie te gebruiken in plaats van kwetsbare identiteitsqueries.

Zixun Xiong, Gaoyi Wu, Lingfeng Yao, Miao Pan, Xiaojiang Du, Hao Wang2026-03-13🤖 cs.AI

Procedural Fairness via Group Counterfactual Explanation

Dit paper introduceert GCIG, een regularisatieframework dat procedurele eerlijkheid bevordert door tijdens het trainen de variatie in modelverklaringen tussen beschermde groepen te minimaliseren, waardoor het vertrouwen in eerlijke machine learning-systemen wordt versterkt.

Gideon Popoola, John Sheppard2026-03-13🤖 cs.LG

Attention Gathers, MLPs Compose: A Causal Analysis of an Action-Outcome Circuit in VideoViT

Dit onderzoek onthult via causale analyse dat VideoViT-modellen een robuust, geredundant circuit bezitten waarbij attention-heads als 'evidence gatherers' en MLP-blokken als 'concept composers' fungeren om een verborgen 'succes versus falen'-signaal te synthetiseren, wat de noodzaak onderstreept van mechanistische interpretatie voor betrouwbare AI-systemen.

Sai V R Chereddy2026-03-13🤖 cs.LG

PACED: Distillation at the Frontier of Student Competence

Het paper introduceert Paced, een distillatieframework dat de leerdoelen van een studentmodel strategisch beperkt tot de 'zone van naaste ontwikkeling' door een theoretisch onderbouwde gewichtsfunctie toe te passen die de gradienten-optimalisatie maximaliseert en zo de rekenkracht efficiënter benut dan standaardmethoden.

Yuanda Xu, Hejian Sang, Zhengze Zhou, Ran He, Zhipeng Wang2026-03-13🤖 cs.AI

Representation Finetuning for Continual Learning

Dit paper introduceert CoRe, een nieuw kader voor continu leren dat het fijne afstemmen van modellen verschuift van de gewicht-ruimte naar de representatie-ruimte door taakspecifieke ingrepen in een laag-rang lineaire deelruimte, waardoor zowel stabiliteit voor eerdere taken als plasticiteit voor nieuwe taken wordt gewaarborgd met uitzonderlijke parameter-efficiëntie.

Haihua Luo, Xuming Ran, Tommi Kärkkäinen, Huiyan Xue, Zhonghua Chen, Qi Xu, Fengyu Cong2026-03-13🤖 cs.LG

A Simple Efficiency Incremental Learning Framework via Vision-Language Model with Nonlinear Multi-Adapters

Deze paper introduceert SimE, een eenvoudig en efficiënt raamwerk voor incrementeel leren dat gebruikmaakt van een visueel-taalmodel met niet-lineaire multi-adapters om de prestaties aanzienlijk te verbeteren zonder een geheugenbank of een sterke backbone.

Haihua Luo, Xuming Ran, Jiangrong Shen, Timo Hämäläinen, Zhonghua Chen, Qi Xu, Fengyu Cong2026-03-13🤖 cs.AI

Measuring AI Agents' Progress on Multi-Step Cyber Attack Scenarios

Deze studie evalueert de autonome cyberaanvalscapaciteiten van zeven AI-modellen tussen augustus 2024 en februari 2026 op twee complexe netwerkranges en concludeert dat de prestaties log-lineair schalen met rekentijd, waarbij de nieuwste modellen aanzienlijke vooruitgang boeken, hoewel ze nog beperkt blijven bij industriële besturingssystemen.

Linus Folkerts, Will Payne, Simon Inman, Philippos Giavridis, Joe Skinner, Sam Deverett, James Aung, Ekin Zorer, Michael Schmatz, Mahmoud Ghanem, John Wilkinson, Alan Steer, Vy Hong, Jessica Wang2026-03-13🤖 cs.AI

MDER-DR: Multi-Hop Question Answering with Entity-Centric Summaries

Dit paper introduceert MDER-DR, een nieuw framework voor meerhop-vraagbeantwoording dat de beperkingen van traditionele RAG-systemen op kennisgrafieken overwint door een nieuwe indexeringsmethode (MDER) en een decompositie-retrievalmechanisme (DR) te combineren, wat leidt tot aanzienlijk betere prestaties dan bestaande baselines.

Riccardo Campi, Nicolò Oreste Pinciroli Vago, Mathyas Giudici, Marco Brambilla, Piero Fraternali2026-03-13💬 cs.CL

← Vorige Volgende →