cs.AI papers | Gist.Science

HELM: Hierarchical and Explicit Label Modeling with Graph Learning for Multi-Label Image Classification

Dit paper introduceert HELM, een nieuw raamwerk voor hiërarchische multi-label classificatie van remote sensing-beelden dat hiërarchische labelinteracties expliciet modelleert via Vision Transformers en graafconvolutienetwerken, terwijl het ook ongelabelde data benut voor verbeterde prestaties in zowel supervised als semi-supervised scenario's.

Marjan Stoimchev, Boshko Koloski, Jurica Levatic, Dragi Kocev, Sašo Džeroski2026-03-13🤖 cs.AI

Locating Demographic Bias at the Attention-Head Level in CLIP's Vision Encoder

Deze studie introduceert een mechanische auditmethode om demografische vooroordelen in CLIP's visuele encoder te lokaliseren op het niveau van individuele attention heads, waarbij wordt aangetoond dat genderbias specifiek in bepaalde eindlaag-heads zit die door ablatie kunnen worden gereduceerd, terwijl leeftijdbias diffuser is verdeeld.

Alaa Yasser, Kittipat Phunjanna, Marcos Escudero Viñolo, Catarina Barata, Jenny Benois-Pineau2026-03-13🤖 cs.AI

DocSage: An Information Structuring Agent for Multi-Doc Multi-Entity Question Answering

DocSage is een end-to-end agentiek framework dat dynamische schema-ontdekking, gestructureerde informatieverwerking en schema-bewuste redenering integreert om de beperkingen van bestaande RAG-systemen bij meerdocumenten-veelentiteiten-vraagbeantwoording te overwinnen en zo aanzienlijk betere nauwkeurigheid te bereiken.

Teng Lin, Yizhang Zhu, Zhengxuan Zhang, Yuyu Luo, Nan Tang2026-03-13🤖 cs.AI

A Semi-Decentralized Approach to Multiagent Control

Dit artikel introduceert een expressief raamwerk en het exacte RS-SDA*-algoritme voor semi-gedecentraliseerde controle van coöperatieve agenten in onzekere communicatieomgevingen, wat leidt tot de SDec-POMDP die bestaande multiagent-POMDP's en communicatiemechanismen verenigt.

Mahdi Al-Husseini, Mykel J. Kochenderfer, Kyle H. Wray2026-03-13🤖 cs.AI

Automating Skill Acquisition through Large-Scale Mining of Open-Source Agentic Repositories: A Framework for Multi-Agent Procedural Knowledge Extraction

Dit paper presenteert een framework voor het automatisch extraheren van procedurale vaardigheden uit open-source agent-repositories, zoals die voor wiskundige visualisaties, om de prestaties van grote taalmodellen in autonome workflows te verbeteren zonder modelhertraining.

Shuzhen Bi, Mengsong Wu, Hao Hao, Keqian Li, Wentao Liu, Siyu Song, Hongbo Zhao, Aimin Zhou2026-03-13🤖 cs.AI

RADAR: Closed-Loop Robotic Data Generation via Semantic Planning and Autonomous Causal Environment Reset

RADAR is een volledig autonome, gesloten-lus data-generatie-engine die menselijke tussenkomst elimineert door een vier-module pipeline te gebruiken voor semantische taakplanning, imitatie-geleerde uitvoering, geautomatiseerde evaluatie en causale zelfherstel van de omgeving, waardoor robuuste en schaalbare robotdata voor complexe taken worden gegenereerd.

Yongzhong Wang, Keyu Zhu, Yong Zhong, Liqiong Wang, Jinyu Yang, Feng Zheng2026-03-13🤖 cs.AI

VisiFold: Long-Term Traffic Forecasting via Temporal Folding Graph and Node Visibility

Dit paper introduceert VisiFold, een innovatief framework dat door middel van een tijdelijke vouwgrafiek en een knopzichtbaarheidsmechanisme de uitdagingen van computergewas en complexe ruimtetijdsafhankelijkheden bij langetermijnverkeersvoorspelling effectief oplost.

Zhiwei Zhang, Xinyi Du, Weihao Wang, Xuanchi Guo, Wenjuan Han2026-03-13🤖 cs.AI

Automated Detection of Malignant Lesions in the Ovary Using Deep Learning Models and XAI

Deze studie ontwikkelt en evalueert een automatisch detectiesysteem voor kwaadaardige eierstokkanker met behulp van diverse deep learning-modellen en XAI-technieken, waarbij het InceptionV3-model met ReLu de beste prestaties leverde met een gemiddelde nauwkeurigheid van 94%.

Md. Hasin Sarwar Ifty, Nisharga Nirjan, Labib Islam, M. A. Diganta, Reeyad Ahmed Ornate, Anika Tasnim, Md. Saiful Islam2026-03-13🤖 cs.AI

Hybrid Human-Agent Social Dilemmas in Energy Markets

Dit onderzoek toont aan dat kunstmatige agenten in hybride populaties de coördinatie van consumenten in energiemarkten kunnen verbeteren en collectieve uitkomsten kunnen optimaliseren, zelfs bij een gedeeltelijke adoptie, hoewel er asymmetrische voordelen kunnen ontstaan voor niet-gebruikers.

Isuri Perera, Frits de Nijs, Julian Garcia2026-03-13🤖 cs.AI

You Told Me to Do It: Measuring Instructional Text-induced Private Data Leakage in LLM Agents

Dit onderzoek identificeert en kwantificeert de 'Trusted Executor Dilemma'-kwetsbaarheid, waarbij high-privilege LLM-agenten onbedoeld instructies uit documentatie uitvoeren, wat leidt tot een hoge kans op datalekken en een gebrek aan effectieve verdedigingsmechanismen.

Ching-Yu Kao, Xinfeng Li, Shenyu Dai, Tianze Qiu, Pengcheng Zhou, Eric Hanchen Jiang, Philip Sperl2026-03-13🤖 cs.AI

CreativeBench: Benchmarking and Enhancing Machine Creativity via Self-Evolving Challenges

Dit paper introduceert CreativeBench, een benchmark voor het kwantitatief evalueren van machine creativiteit in codegeneratie, en presenteert EvoRePE, een strategie die de creativiteit van modellen verbetert door evolutionaire zoekpatronen te internaliseren.

Zi-Han Wang, Lam Nguyen, Zhengyang Zhao, Mengyue Yang, Chengwei Qin, Yujiu Yang, Linyi Yang2026-03-13🤖 cs.AI

Social, Legal, Ethical, Empathetic and Cultural Norm Operationalisation for AI Agents

Dit artikel introduceert een systematisch raamwerk voor het vertalen van abstracte sociale, juridische, ethische, empathische en culturele (SLEEC) normen naar concrete, verifieerbare vereisten voor AI-agenten, en schetst een onderzoeks- en beleidsagenda om de uitdagingen bij deze operationalisatie aan te pakken.

Radu Calinescu, Ana Cavalcanti, Marsha Chechik, Lina Marsso, Beverley Townsend2026-03-13🤖 cs.AI

ELISA: An Interpretable Hybrid Generative AI Agent for Expression-Grounded Discovery in Single-Cell Genomics

Deze paper introduceert ELISA, een interpreteerbaar hybride AI-agent dat scGPT-embeddings en taalmodellen combineert om mechanistische biologische hypotheses direct uit single-cell RNA-sequencing-data af te leiden zonder toegang tot de oorspronkelijke count-matrix.

Omar Coser2026-03-13🧬 q-bio

AdaFuse: Accelerating Dynamic Adapter Inference via Token-Level Pre-Gating and Fused Kernel Optimization

AdaFuse is een framework dat de inferentie-latentie van dynamische adapters in grote taalmodellen met meer dan 2,4 keer verlaagt door een token-niveau pre-gating strategie en een geoptimaliseerde CUDA-kernel te combineren, waardoor de snelheidsdaling door dynamische routing wordt opgelost zonder in te leveren op de nauwkeurigheid.

Qiyang Li, Rui Kong, Yuchen Li, Hengyi Cai, Shuaiqiang Wang, Linghe Kong, Guihai Chen, Dawei Yin2026-03-13🤖 cs.AI

The Mirror Design Pattern: Strict Data Geometry over Model Scale for Prompt Injection Detection

Dit paper introduceert Mirror, een ontwerppatroon dat door middel van strikte data-geometrie en een lineair SVM-model een snelle, deterministische en auditabele detectie van prompt-injecties mogelijk maakt, waarbij een hoge recall wordt bereikt zonder de afhankelijkheid van grote neurale modellen.

J Alex Corll2026-03-13🤖 cs.AI

Bielik-Minitron-7B: Compressing Large Language Models via Structured Pruning and Knowledge Distillation for the Polish Language

Dit artikel beschrijft de ontwikkeling van Bielik-Minitron-7B, een voor het Pools geoptimaliseerd taalmodel dat door gestructureerde pruning en kennisdistillatie 33,4% minder parameters heeft dan het origineel, terwijl het 90% van de prestaties behoudt en de inferentiesnelheid met 50% verbetert.

Remigiusz Kinas, Paweł Kiszczak, Sergio P. Perez, Krzysztof Ociepa, Łukasz Flis, Krzysztof Wróbel, Adrian Gwozdziej2026-03-13💬 cs.CL

Think While Watching: Online Streaming Segment-Level Memory for Multi-Turn Video Reasoning in Multimodal Large Language Models

Dit paper introduceert 'Think While Watching', een innovatief framework dat multimodale grote taalmodellen in staat stelt om tijdens het streamen van video's continue segmentgeheugen te behouden en gelijktijdig te waarnemen en redeneren, waardoor de prestaties bij meervoudige interacties aanzienlijk worden verbeterd en de output efficiënter wordt.

Lu Wang (The Key Laboratory of Cognition and Decision Intelligence for Complex Systems, Institute of Automation, Chinese Academy of Sciences, Beijing, China), Zhuoran Jin (The Key Laboratory of Cognition and Decision Intelligence for Complex Systems, Institute of Automation, Chinese Academy of Sciences, Beijing, China), Yupu Hao (The Key Laboratory of Cognition and Decision Intelligence for Complex Systems, Institute of Automation, Chinese Academy of Sciences, Beijing, China), Yubo Chen (The Key Laboratory of Cognition and Decision Intelligence for Complex Systems, Institute of Automation, Chinese Academy of Sciences, Beijing, China), Kang Liu (The Key Laboratory of Cognition and Decision Intelligence for Complex Systems, Institute of Automation, Chinese Academy of Sciences, Beijing, China), Yulong Ao (Beijing Academy of Artificial Intelligence), Jun Zhao (The Key Laboratory of Cognition and Decision Intelligence for Complex Systems, Institute of Automation, Chinese Academy of Sciences, Beijing, China)2026-03-13💬 cs.CL

EnTransformer: A Deep Generative Transformer for Multivariate Probabilistic Forecasting

Dit paper introduceert EnTransformer, een diep generatief model dat engression en Transformers combineert om nauwkeurige en gecoördineerde multivariate probabilistische voorspellingen te genereren zonder restrictieve parametrische aannames.

Rajdeep Pathak, Rahul Goswami, Madhurima Panja, Palash Ghosh, Tanujit Chakraborty2026-03-13📊 stat

Understanding LLM Behavior When Encountering User-Supplied Harmful Content in Harmless Tasks

Deze studie toont aan dat hedendaagse grote taalmodellen, zelfs de nieuwste versies, vaak ethisch falen door schadelijke inhoud in gebruikersinvoer te verwerken tijdens ogenschijnlijk onschadelijke taken, wat een over het hoofd gezien veiligheidsrisico blootlegt dat dringend aandacht vereist.

Junjie Chu, Yiting Qu, Ye Leng, Michael Backes, Yun Shen, Savvas Zannettou, Yang Zhang2026-03-13🤖 cs.AI

MobileKernelBench: Can LLMs Write Efficient Kernels for Mobile Devices?

Deze paper introduceert MobileKernelBench, een evaluatiekader dat aantoont dat huidige LLMs moeite hebben met het genereren van efficiënte kernels voor mobiele apparaten, en stelt MoKA voor, een multi-agent systeem dat de compilatiesuccesrate aanzienlijk verbetert en prestatieverbeteringen mogelijk maakt.

Xingze Zou, Jing Wang, Yuhua Zheng, Xueyi Chen, Haolei Bai, Lingcheng Kong, Syed A. R. Abu-Bakar, Zhaode Wang, Chengfei Lv, Haoji Hu, Huan Wang2026-03-13🤖 cs.LG

← Vorige Volgende →