cs.AI papers | Gist.Science

Compose by Focus: Scene Graph-based Atomic Skills

Dit artikel introduceert een robuust raamwerk voor compositional generalisatie in algemene robots dat scene graphs combineert met diffusie-imitatieleren en een vision-language model om complexe, langdurige taken succesvoller uit te voeren dan bestaande methoden.

Han Qi, Changhe Chen, Heng Yang2026-03-10💻 cs

Efficient Construction of Implicit Surface Models From a Single Image for Motion Generation

Dit paper introduceert FINS, een lichtgewicht framework dat met behulp van een enkele afbeelding en vooraf getrainde fundamentele modellen binnen enkele seconden hoogwaardige impliciete oppervlakken en SDF-velden reconstrueert voor robottoepassingen zoals bewegingsgeneratie.

Wei-Teng Chu, Tianyi Zhang, Matthew Johnson-Roberson, Weiming Zhi2026-03-10💻 cs

Linear probes rely on textual evidence: Results from leakage mitigation studies in language models

Deze studie toont aan dat lineaire probes voor het detecteren van schadelijk gedrag in taalmodellen sterk afhankelijk zijn van tekstuele aanwijzingen en aanzienlijk minder effectief worden zodra deze expliciete teksten worden gefilterd of afwezig zijn.

Gerard Boxo, Aman Neelappa, Shivam Raval2026-03-10🤖 cs.LG

Towards Strategic Persuasion with Language Models

Deze paper introduceert een op Bayesiaanse overtuigingsleer gebaseerd raamwerk om de strategische overtuigingskracht van taalmodellen te evalueren en te trainen, waarbij blijkt dat zowel geavanceerde als kleinere modellen door versterkingslering aanzienlijke verbeteringen in overtuigingsresultaten kunnen boeken.

Zirui Cheng, Jiaxuan You2026-03-10💻 cs

Generative Evolutionary Meta-Solver (GEMS): Scalable Surrogate-Free Multi-Agent Reinforcement Learning

Het artikel introduceert GEMS, een schaalbaar, surrogaatvrij multi-agent versterkingsleringsframework dat de inefficiënties van PSRO overwint door expliciete populaties te vervangen door een compacte generator, waardoor het aanzienlijk sneller en minder geheugenintensief is terwijl het hogere beloningen behaalt.

Alakh Sharma, Gaurish Trivedi, Kartikey Singh Bhandari, Yash Sinha, Dhruv Kumar, Pratik Narang, Jagat Sesh Challa2026-03-10🤖 cs.LG

Mapping Overlaps in Benchmarks through Perplexity in the Wild

Deze paper introduceert 'benchmark-signatures', gebaseerd op de perplexiteit van saliente tokens in natuurlijke corpora, om de overlappende capaciteitsbehoeften van LLM-benchmarks nauwkeuriger te analyseren dan traditionele prestatiecorrelaties, waardoor inzicht wordt verkregen in de complexe relaties tussen kennis, redeneren en andere vaardigheden.

Siyang Wu, Honglin Bao, Sida Li, Ari Holtzman, James A. Evans2026-03-10💬 cs.CL

ELHPlan: Efficient Long-Horizon Task Planning for Multi-Agent Collaboration

Dit paper introduceert ELHPlan, een nieuw framework voor efficiënte langetermijntaakplanning in multi-agent systemen dat door middel van intentie-gebonden actieketens een evenwicht vindt tussen aanpassingsvermogen en rekenefficiëntie, wat resulteert in vergelijkbare succespercentages met slechts 30-40% van de tokens van bestaande methoden.

Shaobin Ling, Yun Wang, Chenyou Fan, Tin Lun Lam, Junjie Hu2026-03-10💻 cs

Cold-Start Active Correlation Clustering

Dit paper introduceert een nieuwe, diversiteitsgerichte methode voor actief correlatieclustering die specifiek is ontworpen om het uitdaging van de 'cold-start' situatie aan te pakken, waarbij geen vooraf bekende gelijkenissen beschikbaar zijn.

Linus Aronsson, Han Wu, Morteza Haghir Chehreghani2026-03-10🤖 cs.LG

Your Agent May Misevolve: Emergent Risks in Self-evolving LLM Agents

Dit paper introduceert het concept van 'misevolving' als een systematisch risico waarbij zelfevoluerende LLM-agenten door onbedoelde afwijkingen in hun evolutiepaden (zoals model, geheugen, tools en workflow) schadelijke of onveilige gedragingen ontwikkelen, zelfs bij gebruik van toonaangevende modellen.

Shuai Shao, Qihan Ren, Chen Qian, Boyi Wei, Dadi Guo, Jingyi Yang, Xinhao Song, Linfeng Zhang, Weinan Zhang, Dongrui Liu, Jing Shao2026-03-10🤖 cs.LG

CroSTAta: Cross-State Transition Attention Transformer for Robotic Manipulation

Deze paper introduceert CroSTAta, een transformer-architectuur met een nieuwe State Transition Attention-mechanisme die door het modelleren van tijdsafhankelijke overgangspatronen en het gebruik van temporale masking de robuustheid van robotmanipulatiepoliën aanzienlijk verbetert, zelfs bij uitvoeringsvariaties die niet tijdens het trainen zijn gezien.

Giovanni Minelli, Giulio Turrisi, Victor Barasuol, Claudio Semini2026-03-10🤖 cs.LG

Automated Extraction of Material Properties using LLM-based AI Agents

Deze studie presenteert een geautomatiseerde, LLM-gestuurde workflow die duizenden wetenschappelijke artikelen analyseert om het grootste tot nu toe bestaande dataset van thermoelektrische eigenschappen en structurele kenmerken te creëren, waarmee de weg vrijgemaakt wordt voor schaalbare, datagedreven materiaalontdekking.

Subham Ghosh, Abhishek Tewari2026-03-10🔬 cond-mat.mtrl-sci

FOR-Prompting: From Objection to Revision via an Asymmetric Prompting Protocol

Dit paper introduceert FOR-Prompting, een asymmetrisch promptprotocol dat zonder extra training de prestaties van taalmodellen verbetert door een Defender, een Debater die kritische vragen stelt zonder directe oplossingen, en een Host te laten samenwerken voor iteratieve zelfherziening.

He Zhang, Anzhou Zhang, Jian Dai2026-03-10💬 cs.CL

Tree-based Dialogue Reinforced Policy Optimization for Red-Teaming Attacks

Dit paper introduceert DialTree, een op-beleid versterkte leerframework geïntegreerd met boomzoektechnieken dat autonoom diverse multi-turn aanvalstrategieën ontdekt om de kwetsbaarheid van grote taalmodellen voor geavanceerde red-teaming-aanvallen significant te vergroten.

Ruohao Guo, Afshin Oroojlooy, Roshan Sridhar, Miguel Ballesteros, Alan Ritter, Dan Roth2026-03-10🤖 cs.LG

Wasserstein Gradient Flows for Scalable and Regularized Barycenter Computation

Deze paper introduceert een schaalbaar en geregulariseerd algoritme voor het berekenen van Wasserstein-barycentra via gradiëntstromen, dat mini-batch optimal transport combineert met modulair regularisatie en toezicht-informatie om state-of-the-art resultaten te behalen op domeinadaptatie-benchmarks.

Eduardo Fernandes Montesuma, Yassir Bendou, Mike Gartrell2026-03-10🤖 cs.LG

Tiny but Mighty: A Software-Hardware Co-Design Approach for Efficient Multimodal Inference on Battery-Powered Small Devices

Dit paper introduceert NANOMIND, een hardware-software co-design raamwerk dat grote multimodale modellen op batterij-aangedreven apparaten efficiënt uitvoert door modulaire componenten dynamisch toe te wijzen aan de meest geschikte versnellers, wat resulteert in een aanzienlijke verbetering van energie-efficiëntie en doorvoersnelheid zonder netwerkverbinding.

Yilong Li, Shuai Zhang, Yijing Zeng, Hao Zhang, Xinmiao Xiong, Jingyu Liu, Pan Hu, Suman Banerjee2026-03-10💬 cs.CL

Membership Inference Attacks on Tokenizers of Large Language Models

Deze studie introduceert tokenizers als een nieuw en kwetsbaar aanvalsvector voor lidmaatschapsinference-aanvallen op grote taalmodellen, onthult privacylekken in bestaande systemen en stelt een adaptieve verdediging voor om dit risico te mitigeren.

Meng Tong, Yuntao Du, Kejiang Chen, Weiming Zhang, Ninghui Li2026-03-10💻 cs

Deliberative Dynamics and Value Alignment in LLM Debates

Dit onderzoek analyseert hoe verschillende grote taalmodellen in meertrapsdebatten over morele dilemma's omgaan met waarde-uitlijning en oordeelsherziening, waarbij het significant verschillende gedragspatronen en conformiteitsneigingen blootlegt afhankelijk van het gebruikte deliberatieprotocol (synchroon versus sequentieel).

Pratik S. Sachdeva, Tom van Nuenen2026-03-10💻 cs

Reallocating Attention Across Layers to Reduce Multimodal Hallucination

Deze paper introduceert een trainingsvrije plugin die hallucinaties in multimodale redeneringsmodellen vermindert door de aandacht tussen perceptie- en redeneerlagen dynamisch te herverdelen, wat leidt tot een verbeterde consistentie en visuele betrouwbaarheid zonder extra training of architecturale wijzigingen.

Haolang Lu, Bolun Chu, WeiYe Fu, Guoshun Nan, Junning Liu, Minghui Pan, Qiankun Li, Yi Yu, Hua Wang, Kun Wang2026-03-10💻 cs

DropVLA: An Action-Level Backdoor Attack on Vision-Language-Action Models

Dit artikel introduceert DropVLA, een actie-gerichte backdoor-aanval op Vision-Language-Action-modellen die, met minimale data-vergiftiging en zonder merkbare prestatieverlies, specifieke robotacties kan forceren bij geselecteerde beslispunten.

Zonghuan Xu, Jiayu Li, Yunhan Zhao, Xiang Zheng, Xingjun Ma, Yu-Gang Jiang2026-03-10💻 cs

Ego-Vision World Model for Humanoid Contact Planning

Dit artikel presenteert een framework dat een geleerde wereldmodel combineert met modelvoorspellende regeling om mensachtige robots in staat te stellen robuust fysiek contact te plannen in ongestructureerde omgevingen, wat leidt tot verbeterde sample-efficiëntie en multi-taakcapaciteit vergeleken met traditionele methoden.

Hang Liu, Yuman Gao, Sangli Teng, Yufeng Chi, Yakun Sophia Shao, Zhongyu Li, Maani Ghaffari, Koushil Sreenath2026-03-10💻 cs

← Vorige Volgende →