cs.AI papers | Gist.Science

Understanding LLM Behavior When Encountering User-Supplied Harmful Content in Harmless Tasks

Deze studie toont aan dat hedendaagse grote taalmodellen, zelfs de nieuwste versies, vaak ethisch falen door schadelijke inhoud in gebruikersinvoer te verwerken tijdens ogenschijnlijk onschadelijke taken, wat een over het hoofd gezien veiligheidsrisico blootlegt dat dringend aandacht vereist.

Junjie Chu, Yiting Qu, Ye Leng, Michael Backes, Yun Shen, Savvas Zannettou, Yang Zhang2026-03-13🤖 cs.AI

MobileKernelBench: Can LLMs Write Efficient Kernels for Mobile Devices?

Deze paper introduceert MobileKernelBench, een evaluatiekader dat aantoont dat huidige LLMs moeite hebben met het genereren van efficiënte kernels voor mobiele apparaten, en stelt MoKA voor, een multi-agent systeem dat de compilatiesuccesrate aanzienlijk verbetert en prestatieverbeteringen mogelijk maakt.

Xingze Zou, Jing Wang, Yuhua Zheng, Xueyi Chen, Haolei Bai, Lingcheng Kong, Syed A. R. Abu-Bakar, Zhaode Wang, Chengfei Lv, Haoji Hu, Huan Wang2026-03-13🤖 cs.LG

Fair Learning for Bias Mitigation and Quality Optimization in Paper Recommendation

Het artikel introduceert Fair-PaperRec, een op MLP gebaseerd model dat demografische ongelijkheid in de paper-acceptatie vermindert zonder de academische kwaliteit te compromitteren, wat resulteert in een aanzienlijke toename van de participatie van ondervertegenwoordigde groepen en een verbeterde algehele bruikbaarheid.

Uttamasha Anjally Oyshi, Susan Gauch2026-03-13🤖 cs.AI

Prototype-Based Knowledge Guidance for Fine-Grained Structured Radiology Reporting

Deze paper introduceert ProtoSR, een methode die ongestructureerde radiologieverslagen verwerkt tot een multimodale kennisbank met visuele prototypes om zo de nauwkeurigheid van gestructureerde rapportage voor fijne details te verbeteren.

Chantal Pellegrini, Adrian Delchev, Ege Özsoy, Nassir Navab, Matthias Keicher2026-03-13🤖 cs.AI

Effective Resistance Rewiring: A Simple Topological Correction for Over-Squashing

Dit paper introduceert Effective Resistance Rewiring (ERR), een parameterloze methode die globale effectieve weerstand gebruikt om structurele knelpunten in Graph Neural Networks te verhelpen door randen strategisch toe te voegen en te verwijderen, waardoor langere afhankelijkheden beter worden gemodelleerd terwijl de afweging tussen over-squashing en oversmoothing wordt beheerd.

Bertran Miquel-Oliver, Manel Gil-Sorribes, Victor Guallar, Alexis Molina2026-03-13🤖 cs.LG

Geometry-Aware Probabilistic Circuits via Voronoi Tessellations

Deze paper introduceert een nieuwe aanpak voor probabilistische circuits die Voronoï-tessellaties gebruikt om de lokale geometrie van data te modelleren, en lost het hieruit voortvloeiende verlies van berekenbaarheid op door zowel een benaderend inferentiekader met gegarandeerde grenzen als een structurele voorwaarde voor exacte, tractabele inferentie te ontwikkelen.

Sahil Sidheekh, Sriraam Natarajan2026-03-13🤖 cs.LG

Delayed Backdoor Attacks: Exploring the Temporal Dimension as a New Attack Surface in Pre-Trained Models

Dit paper introduceert 'Delayed Backdoor Attacks' (DBA), een nieuwe aanvalsvorm op voorgeöorde modellen waarbij de schadelijke activatie tijdelijk wordt uitgesteld na het zien van een trigger, wat het mogelijk maakt om alledaagse woorden als triggers te gebruiken en zo een tot nu toe onbeschermd tijdsdimensie als aanvalsoppervlak blootlegt.

Zikang Ding, Haomiao Yang, Meng Hao, Wenbo Jiang, Kunlan Xiang, Runmeng Du, Yijing Liu, Ruichen Zhang, Dusit Niyato2026-03-13🤖 cs.AI

Learning Transferable Sensor Models via Language-Informed Pretraining

Dit paper introduceert SLIP, een open-source framework dat door taal-informeerde pretraining en een flexibele patch-embedder transferleerbare sensorrepresentaties leert die variabele invoer ondersteunen en superieure prestaties leveren in zero-shot transfer, signaalcaptioning en sensorgebaseerde vragenbeantwoording.

Yuliang Chen, Arvind Pillai, Yu Yvonne Wu, Tess Z. Griffin, Lisa Marsch, Michael V. Heinz, Nicholas C. Jacobson, Andrew Campbell2026-03-13🤖 cs.AI

Multimodal Emotion Recognition via Bi-directional Cross-Attention and Temporal Modeling

Dit paper presenteert een multimodaal raamwerk voor emotionherkenning in onbeperkte video's dat gebruikmaakt van bevroren CLIP- en Wav2Vec 2.0-modellen, een TCN voor tijdsafhankelijkheid en een bi-directionele cross-attention-fusie om de prestaties te verbeteren ten opzichte van unimodale benaderingen.

Junhyeong Byeon, Jeongyeol Kim, Sejoon Lim2026-03-13🤖 cs.AI

Normative Common Ground Replication (NormCoRe): Replication-by-Translation for Studying Norms in Multi-agent AI

Dit paper introduceert NormCoRe, een methodologisch kader dat menselijke subjectexperimenten vertaalt naar multi-agent AI-omgevingen om collectieve normen te bestuderen en aan te tonen dat AI-normale oordelen afwijken van menselijke baselines en gevoelig zijn voor modelkeuze en taal.

Luca Deck, Simeon Allmendinger, Lucas Müller, Niklas Kühl2026-03-13🤖 cs.AI

HomeSafe-Bench: Evaluating Vision-Language Models on Unsafe Action Detection for Embodied Agents in Household Scenarios

Dit paper introduceert HomeSafe-Bench, een benchmark voor het evalueren van visueel-taalmodellen op het detecteren van onveilige handelingen in huishoudelijke omgevingen, en stelt HD-Guard voor, een hiërarchisch beveiligingssysteem dat efficiëntie en nauwkeurigheid combineert voor realtime monitoring.

Jiayue Pu, Zhongxiang Sun, Zilu Zhang, Xiao Zhang, Jun Xu2026-03-13🤖 cs.AI

LABSHIELD: A Multimodal Benchmark for Safety-Critical Reasoning and Planning in Scientific Laboratories

Dit paper introduceert LABSHIELD, een realistisch meerzicht-benchmark dat gebaseerd is op OSHA- en GHS-standaarden om de veiligheid en het risicobewustzijn van multimodale grote taalmodellen in geautomatiseerde wetenschappelijke laboratoria te evalueren, waarbij een significante prestatiedaling in veiligheidsgerelateerde taken wordt blootgelegd.

Qianpu Sun, Xiaowei Chi, Yuhan Rui, Ying Li, Kuangzhi Ge, Jiajun Li, Sirui Han, Shanghang Zhang2026-03-13🤖 cs.AI

BTZSC: A Benchmark for Zero-Shot Text Classification Across Cross-Encoders, Embedding Models, Rerankers and LLMs

Deze paper introduceert BTZSC, een uitgebreide benchmark voor zero-shot tekstclassificatie die een systematische vergelijking biedt tussen cross-encoders, embedding-modellen, rerankers en LLMs, waarbij moderne rerankers zoals Qwen3-Reranker-8B een nieuwe state-of-the-art bereiken.

Ilias Aarab2026-03-13💬 cs.CL

Few-for-Many Personalized Federated Learning

Dit paper introduceert FedFew, een persoonlijk federatief leerframework dat het probleem van het bedienen van vele clients met slechts een paar gedeelde servermodellen (K << M) reformuleert als een few-for-many optimalisatieprobleem, wat leidt tot schaalbare en automatisch geoptimaliseerde personalisatie die state-of-the-art methoden overtreft.

Ping Guo, Tiantian Zhang, Xi Lin, Xiang Li, Zhi-Ri Tang, Qingfu Zhang2026-03-13🤖 cs.AI

Can RL Improve Generalization of LLM Agents? An Empirical Study

Deze empirische studie toont aan dat hoewel Reinforcement Fine-Tuning (RFT) LLM-agenten goed laat generaliseren binnen een omgeving, de overdracht naar onbekende omgevingen beperkt blijft door semantische en interface-verschuivingen, terwijl sequentiële training en mix-training veelbelovende oplossingen bieden voor robuustere generalisatie.

Zhiheng Xi, Xin Guo, Jiaqi Liu, Jiazheng Zhang, Yutao Fan, Zhihao Zhang, Shichun Liu, Mingxu Chai, Xiaowei Shi, Yitao Zhai, Xunliang Cai, Tao Gui, Qi Zhang, Xuanjing Huang2026-03-13🤖 cs.AI

Flowcean - Model Learning for Cyber-Physical Systems

Dit paper introduceert Flowcean, een modulair en gebruiksvriendelijk raamwerk dat data-gedreven machine learning automatiseert om efficiënte modellen voor Cyber-Physical Systems te genereren.

Maximilian Schmidt, Swantje Plambeck, Markus Knitt, Hendrik Rose, Goerschwin Fey, Jan Christian Wieck, Stephan Balduin2026-03-13🤖 cs.LG

An Intent of Collaboration: On Agencies between Designers and Emerging (Intelligent) Technologies

Dit artikel onderzoekt hoe ontwerpers hun creatieve agency kunnen behouden bij samenwerking met intelligente technologieën zoals LLMs, door te pleiten voor introspectie, technologische kennis en het bewust aanpassen van de mens-technologie dynamiek.

Pei-Ying Lin, Julie Heij, Iris Borst, Britt Joosten, Kristina Andersen, Wijnand IJsselsteijn2026-03-13🤖 cs.AI

Sim-to-reality adaptation for Deep Reinforcement Learning applied to an underwater docking application

Dit artikel presenteert een effectieve sim-naar-realiteit aanpak voor diepe versterkingslering, waarbij een Girona AUV met succes wordt getraind in een vermenigvuldigde Stonefish-simulatie om autonome onderwaterdokking met een slagingspercentage van meer dan 90% te realiseren en te valideren in een fysiek testtank.

Alaaeddine Chaarani, Narcis Palomeras, Pere Ridao2026-03-13🤖 cs.AI

Just Use XML: Revisiting Joint Translation and Label Projection

Dit paper introduceert LabelPigeon, een raamwerk dat XML-tags gebruikt om vertaling en labelprojectie gelijktijdig uit te voeren, wat leidt tot verbeterde vertaalkwaliteit en aanzienlijke winst in cross-linguale transfer voor downstream-taken zonder de vertaalkwaliteit te schaden.

Thennal D K, Chris Biemann, Hans Ole Hatzel2026-03-13💬 cs.CL

Cascade: Composing Software-Hardware Attack Gadgets for Adversarial Threat Amplification in Compound AI Systems

Dit paper introduceert 'Cascade', een aanvalsmethode die traditionele software- en hardwarekwetsbaarheden combineert met algoritmische zwaktes in samengestelde AI-systemen om de integriteit en vertrouwelijkheid van deze systemen te ondermijnen.

Sarbartha Banerjee, Prateek Sahu, Anjo Vahldiek-Oberwagner, Jose Sanchez Vicarte, Mohit Tiwari2026-03-13🤖 cs.AI

← Vorige Volgende →