cs papers | Gist.Science

NAAMSE: Framework for Evolutionary Security Evaluation of Agents

Het paper introduceert NAAMSE, een evolutionair framework dat de beveiligingsevaluatie van AI-agenten automatiseert door feedback-gedreven promptmutatie en hiërarchische verkenning te combineren om adaptieve bedreigingen effectiever te identificeren dan traditionele statische methoden.

Kunal Pai, Parth Shah, Harshil Patel2026-03-10💻 cs

PhysDrape: Learning Explicit Forces and Collision Constraints for Physically Realistic Garment Draping

PhysDrape is een hybride neurale-fysische solver die door het integreren van een differentieerbare krachtenoplosser en een projectie voor botsingsbeperkingen, realistische kledingdrapering mogelijk maakt met minimale interpenetratie en een lage vervormingsenergie.

Minghai Chen, Mingyuan Liu, Ning Ma, Jianqing Li, Yuxiang Huan2026-03-10💻 cs

LLM4PQC - Accurate and Efficient Synthesis of PQC Cores by Feedback-Driven LLMs

Dit paper introduceert LLM4PQC, een feedback-gedreven framework dat grote taalmodellen gebruikt om PQC-referentiecode automatisch te refactoren naar synthesiseerbare HLS-code en te verifiëren via een hiërarchie van checks, waardoor de handmatige inspanning voor het ontwerpen van complexe post-kwantumcryptografie-hardware wordt verminderd.

Buddhi Perera, Zeng Wang, Weihua Xiao, Mohammed Nabeel, Ozgur Sinanoglu, Johann Knechtel, Ramesh Karri2026-03-10💻 cs

Move What Matters: Parameter-Efficient Domain Adaptation via Optimal Transport Flow for Collaborative Perception

FlowAdapt is een parameter-efficiënt raamwerk dat optimale transporttheorie toepast om de prestaties van V2X-collaboratieve perceptie over verschillende domeinen te verbeteren door inter-frame redundantie te filteren en semantische degradatie tijdens de aanpassing te voorkomen.

Zesheng Jia, Jin Wang, Siao Liu, Lingzhi Li, Ziyao Huang, Yunjiang Xu, Jianping Wang2026-03-10💻 cs

SToRM: Supervised Token Reduction for Multi-modal LLMs toward efficient end-to-end autonomous driving

Dit paper introduceert SToRM, een supervisie-gedreven raamwerk voor tokenreductie in multimodale LLM's dat de rekenefficiëntie van end-to-end autonoom rijden met tot 30x verbetert terwijl de prestaties van het gebruik van alle tokens behouden blijven.

Seo Hyun Kim, Jin Bok Park, Do Yeon Koo, Hogun Park, Il Yong Chun2026-03-10💻 cs

Accelerating Robotic Reinforcement Learning with Agent Guidance

Dit paper introduceert AGPS, een framework dat de sample-efficiëntie van robotreinforcement learning verbetert door menselijke supervisie te vervangen door een multimodaal agent die als semantisch wereldmodel fungeert voor schaalbare, arbeidsvrije training.

Haojun Chen, Zili Zou, Chengdong Ma, Yaoxiang Pu, Haotong Zhang, Yuanpei Chen, Yaodong Yang2026-03-10💻 cs

To Mix or To Merge: Toward Multi-Domain Reinforcement Learning for Large Language Models

Dit paper introduceert M2RL, een studie die vergelijkt of het mengen van multi-domein Reinforcement Learning met Verifieerbare Beloningen (RLVR) of het apart trainen en vervolgens samenvoegen van modellen de beste aanpak is voor het ontwikkelen van krachtige, algemene Large Language Models, waarbij wordt geconcludeerd dat domeinen vaak synergetisch werken en weinig interferentie vertonen.

Haoqing Wang, Xiang Long, Ziheng Li, Yilong Xu, Tingguang Li, Yehui Tang2026-03-10💻 cs

SkillsBench: Benchmarking How Well Agent Skills Work Across Diverse Tasks

Het paper introduceert SkillsBench, een benchmark die aantoont dat hoewel zorgvuldig samengestelde vaardigheden de prestaties van LLM-agenten aanzienlijk kunnen verbeteren, zelf gegenereerde vaardigheden doorgaans geen meerwaarde bieden en de effectiviteit sterk varieert per domein.

Xiangyi Li, Wenbo Chen, Yimin Liu, Shenghan Zheng, Xiaokun Chen, Yifeng He, Yubo Li, Bingran You, Haotian Shen, Jiankai Sun, Shuyi Wang, Binxu Li, Qunhong Zeng, Di Wang, Xuandong Zhao, Yuanli Wang, Roey Ben Chaim, Zonglin Di, Yipeng Gao, Junwei He, Yizhuo He, Liqiang Jing, Luyang Kong, Xin Lan, Jiachen Li, Songlin Li, Yijiang Li, Yueqian Lin, Xinyi Liu, Xuanqing Liu, Haoran Lyu, Ze Ma, Bowei Wang, Runhui Wang, Tianyu Wang, Wengao Ye, Yue Zhang, Hanwen Xing, Yiqi Xue, Steven Dillmann, Han-chung Lee2026-03-10💻 cs

State Feedback Control of State-Delayed LPV Systems using Dynamic IQCs

Dit artikel presenteert een nieuw regelaarskader voor LPV-systemen met tijdsvariërende vertragingen dat dynamische IQCs en parameterafhankelijke Lyapunov-functies combineert om een minder conservatieve, convexe synthese voor stabiele en performante terugkoppeling mogelijk te maken.

Fen Wu2026-03-10💻 cs

Social Life of Code: Modeling Evolution through Code Embedding and Opinion Dynamics

Dit artikel introduceert een innovatieve raamwerk dat code-embeddings combineert met theorieën over opiniedynamiek om de evolutie van software en de onderliggende samenwerkingspatronen binnen ontwikkelaarsgemeenschappen kwantitatief te analyseren.

Yulong He, Nikita Verbin, Sergey Kovalchuk2026-03-10💻 cs

RIS Control through the Lens of Stochastic Network Calculus: An O-RAN Framework for Delay-Sensitive 6G Applications

Dit paper introduceert DARIO, een O-RAN-compliant framework dat Stochastic Network Calculus gebruikt om RIS-apparaten dynamisch toe te wijzen aan gebruikers en zo de vertraging voor vertraagingsgevoelige 6G-toepassingen aanzienlijk verlaagt.

Oscar Adamuz-Hinojosa, Lanfranco Zanzi, Vincenzo Sciancalepore, Marco Di Renzo, Xavier Costa-Pérez2026-03-10💻 cs

Graph Neural Model Predictive Control for High-Dimensional Systems

Dit artikel presenteert een framework dat Graph Neural Networks combineert met structureel geoptimaliseerde Model Predictive Control om real-time, nauwkeurige besturing van hoogdimensionale systemen, zoals zachte robots, mogelijk te maken door gebruik te maken van een lineair schaalend condenseringsalgoritme en GPU-parallellisatie.

Patrick Benito Eberhard, Luis Pabon, Daniele Gammelli, Hugo Buurmeijer, Amon Lahr, Mark Leone, Andrea Carron, Marco Pavone2026-03-10💻 cs

3DMedAgent: Unified Perception-to-Understanding for 3D Medical Analysis

Het artikel introduceert 3DMedAgent, een unificerend agent-systeem dat bestaande 2D-multimodale grote taalmodellen in staat stelt om complexe 3D-CT-scans stapsgewijs te analyseren door middel van toolgebruik en gestructureerd geheugen, zonder dat specifieke 3D-finetuning vereist is.

Ziyue Wang, Linghan Cai, Chang Han Low, Haofeng Liu, Junde Wu, Jingyu Wang, Rui Wang, Lei Song, Jiang Bian, Jingjing Fu, Yueming Jin2026-03-10💻 cs

OVerSeeC: Open-Vocabulary Costmap Generation from Satellite Images and Natural Language

Dit paper introduceert OVerSeeC, een zero-shot modulair framework dat natuurlijke taal en satellietbeelden combineert om open-vocabulary kostenkaarten voor autonome navigatie te genereren door entiteiten te interpreteren, te lokaliseren en te synthetiseren.

Rwik Rana, Jesse Quattrociocchi, Dongmyeong Lee, Christian Ellis, Amanda Adkins, Adam Uccello, Garrett Warnell, Joydeep Biswas2026-03-10💻 cs

On the Energy Cost of Post-Quantum Key Establishment in Wireless Low-Power Personal Area Networks

Dit onderzoek toont aan dat bij post-kwantum sleuteluitwisseling in draadloze netwerken met lage energieconsumptie de communicatiekosten vaak de rekenkosten overtreffen, wat gecoördineerde protocollaire en onderliggende optimalisatie vereist voor een energie-efficiënte kwantumbestendige beveiliging.

Tao Liu, Gowri Ramachandra, Raja Jurdak2026-03-10💻 cs

ABD: Default Exception Abduction in Finite First Order Worlds

Dit paper introduceert ABD, een benchmark voor het testen van grote taalmodellen op hun vermogen om zeldzame uitzonderingen af te leiden in eindige eerste-orde werelden om satisfiability te herstellen, waarbij evaluaties tonen dat hoewel de validiteit hoog is, er nog steeds significant tekort schiet in parsimonie en generalisatie.

Serafim Batzoglou2026-03-10✓ Author reviewed ⓘ💻 cs

Open-Vocabulary Domain Generalization in Urban-Scene Segmentation

Deze paper introduceert een nieuw onderzoeksgebied genaamd Open-Vocabulary Domain Generalization in Semantic Segmentation (OVDG-SS) voor autonome driving, inclusief een benchmark en een nieuwe methode (S2-Corr) die de robuustheid van segmentatiemodellen verbetert in onbekende omgevingen en voor onbekende objectcategorieën door tekst-beeld correlaties te verfijnen.

Dong Zhao, Qi Zang, Nan Pu, Wenjing Li, Nicu Sebe, Zhun Zhong2026-03-10💻 cs

INDUCTION: Finite-Structure Concept Synthesis in First-Order Logic

Deze paper introduceert INDUCTION, een benchmark voor het synthetiseren van concepten in de eerste-orde logica binnen eindige structuren, die modelprestaties evalueert op basis van exacte modelcontrole en formulegrootte om inzicht te krijgen in generalisatiestrategieën.

Serafim Batzoglou2026-03-10💻 cs

SKYLIGHT: A Scalable Hundred-Channel 3D Photonic In-Memory Tensor Core Architecture for Real-time AI Inference

Dit paper introduceert SKYLIGHT, een schaalbare 3D-fotonische in-memory tensorcore-architectuur die real-time AI-inferentie en lokale zelflerende updates mogelijk maakt met een energie-efficiëntie die aanzienlijk hoger ligt dan die van de NVIDIA RTX PRO 6000 Blackwell GPU.

Meng Zhang, Ziang Yin, Nicholas Gangi, Alexander Chen, Brett Bamfo, Tianle Xu, Jiaqi Gu, Zhaoran Rena Huang2026-03-10💻 cs

Universal 3D Shape Matching via Coarse-to-Fine Language Guidance

UniMatch is een semantisch bewust, grof-naar-fijn framework dat door middel van taalgeleiding en contrastief leren dichte semantische correspondenties tussen sterk niet-isometrische 3D-vormen van willekeurige objectcategorieën tot stand brengt zonder vooraf gedefinieerde deelvoorstellen.

Qinfeng Xiao, Guofeng Mei, Bo Yang, Liying Zhang, Jian Zhang, Kit-lun Yick2026-03-10💻 cs

← Vorige Volgende →