cs.AI papers | Gist.Science

More Women, Same Stereotypes: Unpacking the Gender Bias Paradox in Large Language Models

Hoewel grote taalmodellen vrouwelijke karakters vaker genereren dan in de realiteit het geval is, vertonen hun verhalen over beroepen nog steeds een sterkere overeenkomst met genderstereotypen dan met feitelijke arbeidsmarktgegevens, wat wijst op de blijvende uitdaging om deze vooroordelen effectief te mitigeren.

Evan Chen, Run-Jun Zhan, Yan-Bai Lin, Hung-Hsuan Chen2026-03-10💬 cs.CL

From 2D Alignment to 3D Plausibility: Unifying Heterogeneous 2D Priors and Penetration-Free Diffusion for Occlusion-Robust Two-Hand Reconstruction

Dit artikel introduceert een nieuwe methode voor het reconstrueren van twee handen uit één afbeelding die heterogene 2D-priors verenigt en een penetratievrije diffusiemodel gebruikt om nauwkeurige, fysiek plausibele interacties te genereren, zelfs bij ernstige occlusie.

Gaoge Han, Yongkang Cheng, Zhe Chen, Shaoli Huang, Tongliang Liu2026-03-10💻 cs

More Bang for the Buck: Process Reward Modeling with Entropy-Driven Uncertainty

Deze paper introduceert EDU-PRM, een nieuw trainingsframework dat gebruikmaakt van entropie-gedreven onzekerheid om complexe redeneerstappen automatisch te segmenteren zonder dure handmatige annotaties, waardoor het op het ProcessBench-benchmark presteert met slechts 1,5% van de trainingsdata en tegelijkertijd de nauwkeurigheid verhoogt terwijl het tokenverbruik met 32% daalt.

Lang Cao, Renhong Chen, Yingtian Zou, Chao Peng, Huacong Xu, Yuxian Wang, Wu Ning, Qian Chen, Mofan Peng, Zijie Chen, Peishuo Su, Yitong Li2026-03-10🤖 cs.LG

MediTools -- Medical Education Powered by LLMs

Dit onderzoek presenteert MediTools, een prototype-toepassing die grote taalmodellen (LLMs) inzet om medisch onderwijs te revolutioneren door interactieve tools te bieden voor het simuleren van klinische scenario's, het analyseren van medische literatuur en het samenvatten van nieuws.

Amr Alshatnawi, Remi Sampaleanu, David Liebovitz2026-03-10💻 cs

Enhancing Metabolic Syndrome Prediction with Hybrid Data Balancing and Counterfactuals

Deze studie verbetert de voorspelling van metabool syndroom door een nieuw hybride framework genaamd MetaBoost te introduceren dat geavanceerde databalanceringstechnieken combineert met contrafactuele analyse om zowel de nauwkeurigheid van machine learning-modellen te verhogen als klinisch relevante inzichten te bieden over risicofactoren zoals bloedsuiker en triglyceriden.

Sanyam Paresh Shah, Abdullah Mamun, Shovito Barua Soumma + 1 more2026-03-10🤖 cs.AI

From LLM Reasoning to Autonomous AI Agents: A Comprehensive Review

Dit paper biedt een uitgebreid overzicht van de evolutie van LLM-reasoning naar autonome AI-agenten door een gestandaardiseerde taxonomie van benchmarks, een analyse van frameworks, een inventarisatie van real-world toepassingen en een evaluatie van samenwerkingsprotocollen te presenteren, gevolgd door aanbevelingen voor toekomstig onderzoek.

Mohamed Amine Ferrag, Norbert Tihanyi, Merouane Debbah2026-03-10🤖 cs.LG

SFIBA: Spatial-based Full-target Invisible Backdoor Attacks

Deze paper introduceert SFIBA, een nieuwe aanvalsmethode die multi-target backdoors in diepe neurale netwerken realiseert door triggers in specifieke ruimtelijke gebieden te injecteren via frequentiedomein-transformaties, waardoor zowel de onopgemerkbaarheid als de vermijding van bestaande verdedigingen wordt gegarandeerd zonder de prestaties op schone data te beïnvloeden.

Yangxu Yin, Honglong Chen, Yudong Gao, Peng Sun, Zhishuai Li, Weifeng Liu2026-03-10💻 cs

Multi-Domain Audio Question Answering Benchmark Toward Acoustic Content Reasoning

Dit paper introduceert Task 5 van de DCASE 2025 Challenge, een meerdimensionale benchmark voor audio-vraag-antwoordtaken die de redeneervermogens van audio-taalmodellen in diverse akoestische domeinen evalueert.

Chao-Han Huck Yang, Sreyan Ghosh, Qing Wang, Jaeyeon Kim, Hengyi Hong, Sonal Kumar, Guirui Zhong, Zhifeng Kong, S Sakshi, Vaibhavi Lokegaonkar, Oriol Nieto, Ramani Duraiswami, Dinesh Manocha, Gunhee Kim, Jun Du, Rafael Valle, Bryan Catanzaro2026-03-10💬 cs.CL

Precision Proactivity: Measuring Cognitive Load in Real-World AI-Assisted Work

Deze studie onderzocht bij 34 financiële professionals hoe cognitieve belasting prestaties beïnvloedt bij AI-ondersteund werk en concludeerde dat extrane belasting, vooral veroorzaakt door door het model geïnitieerde taakwisselingen, de grootste negatieve impact heeft, terwijl AI-gegenereerde inhoud de kwaliteit wel verbetert maar deze voordelen niet volledig compenseert voor de cognitieve kosten.

Brandon Lepine, Juho Kim, Pamela Mishkin, Matthew Beane2026-03-10💻 cs

Ready2Unlearn: A Learning-Time Approach for Preparing Models with Future Unlearning Readiness

Dit paper introduceert Ready2Unlearn, een proactieve trainingsmethode die machine learning-modellen voorbereidt op toekomstige verwijderingsverzoeken door meta-learning-principes toe te passen, waardoor het unlearning-proces later efficiënter en principieel verloopt.

Hanyu Duan, Yi Yang, Ahmed Abbasi, Kar Yan Tam2026-03-10🤖 cs.LG

FreeKV: Boosting KV Cache Retrieval for Efficient LLM Inference

FreeKV is een trainingsvrije, co-geoptimaliseerde framework dat de efficiëntie van KV-cache-retrieval voor grote taalmodellen aanzienlijk verbetert door speculatieve retrieval en hybride geheugenlayouts te combineren, waardoor een snelheidswinst tot 13x wordt bereikt met minimale nauwkeurigheidsverlies.

Guangda Liu, Chengwei Li, Zhenyu Ning, Jing Lin, Yiwu Yao, Danning Ke, Minyi Guo, Jieru Zhao2026-03-10🤖 cs.LG

A Neuro-Symbolic Approach for Reliable Proof Generation with LLMs: A Case Study in Euclidean Geometry

Dit paper introduceert een neuro-symbolische aanpak die grote taalmodellen combineert met analoge probleemoplossing en een formele verificateur om de betrouwbaarheid en nauwkeurigheid van het genereren van wiskundige bewijzen in de euclidische meetkunde aanzienlijk te verbeteren.

Oren Sultan, Eitan Stern, Dafna Shahaf2026-03-10💬 cs.CL

MAS-ZERO: Designing Multi-Agent Systems with Zero Supervision

Het paper introduceert MAS-ZERO, het eerste zelfevoluerende raamwerk voor het ontwerpen van multi-agent systemen zonder toezicht dat tijdens de inferentie dynamisch agentconfiguraties aanpast en verfijnt op basis van meta-feedback, waardoor het aanzienlijk beter presteert dan bestaande handmatige en automatische methoden op diverse complexe taken.

Zixuan Ke, Austin Xu, Yifei Ming, Xuan-Phi Nguyen, Ryan Chin, Caiming Xiong, Shafiq Joty2026-03-10🤖 cs.LG

The Cell Must Go On: Agar.io for Continual Reinforcement Learning

Deze paper introduceert AgarCL, een nieuw onderzoeksplatform voor continu versterkingsleren gebaseerd op het spel Agar.io, dat complexe, niet-episodische dynamiek biedt en aantoont dat bestaande methoden voor continu leren weinig verbetering bieden ten opzichte van standaard algoritmen.

Mohamed A. Mohamed, Kateryna Nekhomiazh, Vedant Vyas, Marcos M. Jose, Andrew Patterson, Marlos C. Machado2026-03-10🤖 cs.LG

Maximum Principle of Optimal Probability Density Control

Deze paper introduceert een algemeen theoretisch raamwerk voor optimale controle van waarschijnlijkheidsdichtheden, inclusief een maximumprincipe en de Hamilton-Jacobi-Bellman-vergelijking, en koppelt dit aan een schaalbaar numeriek algoritme op basis van diepe neurale netwerken voor de oplossing van complexe meeragentenproblemen.

Nathan Gaby, Xiaojing Ye2026-03-10🤖 cs.LG

Stronger Enforcement of Instruction Hierarchy via Augmented Intermediate Representations

Dit artikel introduceert een nieuwe methode die prompt-injectie-aanvallen op grote taalmodellen effectiever bestrijdt door het bevoorrechte instructieniveau niet alleen aan de invoer, maar ook in de tussenliggende neurale representaties te coderen, wat leidt tot een aanzienlijke vermindering van de aanvalssuccesratio's zonder de nuttigheid van het model te schaden.

Sanjay Kariyappa, G. Edward Suh2026-03-10🤖 cs.LG

OCN: Effectively Utilizing Higher-Order Common Neighbors for Better Link Prediction

Dit artikel introduceert OCN, een nieuwe methode voor linkpredictie die redundantie en over-verzachting in hogere-orde gemeenschappelijke buren aanpakt via orthogonalisatie en normalisatie, waardoor het aanzienlijk beter presteert dan bestaande methoden.

Juntong Wang, Xiyuan Wang, Muhan Zhang2026-03-10🤖 cs.LG

Representing local protein environments with machine learning force fields

In dit artikel wordt een nieuwe representatie voor lokale eiwitomgevingen voorgesteld, afgeleid van atomaire foundation-modellen, die niet alleen structurele en chemische kenmerken effectief vastlegt maar ook leidt tot een baanbrekende, fysisch geïnformeerde voorspeller voor chemische verschuivingen in biomoleculaire NMR-spectroscopie.

Meital Bojan, Sanketh Vedula, Advaith Maddipatla, Nadav Bojan Sellam, Anar Rzayev, Federico Napoli, Paul Schanda, Alex M. Bronstein2026-03-10💻 cs

MMTU: A Massive Multi-Task Table Understanding and Reasoning Benchmark

Dit paper introduceert MMTU, een uitgebreid benchmark met meer dan 28.000 vragen over 25 real-world tabellataken, om de complexiteit van het begrijpen, redeneren en manipuleren van tabellen door geavanceerde AI-modellen te evalueren en aan te tonen dat er nog aanzienlijke ruimte voor verbetering is.

Junjie Xing, Yeye He, Mengyu Zhou, Haoyu Dong, Shi Han, Lingjiao Chen, Dongmei Zhang, Surajit Chaudhuri, H. V. Jagadish2026-03-10🤖 cs.LG

BemaGANv2: Discriminator Combination Strategies for GAN-based Vocoders in Long-Term Audio Generation

Dit paper introduceert BemaGANv2, een geavanceerde GAN-gebaseerde vocoder voor hoogwaardige en langdurige audio-generatie die gebruikmaakt van innovatieve architecturale wijzigingen en een systematische evaluatie van discriminatorscombinaties om temporale coherentie en harmonische structuur te verbeteren.

Taesoo Park, Mungwi Jeong, Mingyu Park, Narae Kim, Junyoung Kim, Mujung Kim, Jisang Yoo, Hoyun Lee, Sanghoon Kim, Soonchul Kwon2026-03-10🤖 cs.LG

← Vorige Volgende →