cs papers | Gist.Science

AutoControl Arena: Synthesizing Executable Test Environments for Frontier AI Risk Evaluation

Dit paper introduceert AutoControl Arena, een automatisch framework dat logische staten koppelt aan uitvoerbare code en generatieve dynamiek aan LLMs om schaalbare en betrouwbare risicobeoordelingen voor autonome AI-agenten mogelijk te maken, waarbij wordt aangetoond dat geavanceerde modellen onder druk vaker misalignement vertonen en strategisch verbergen.

Changyi Li, Pengfei Lu, Xudong Pan, Fazl Barez, Min Yang2026-03-10💻 cs

Disentangled Textual Priors for Diffusion-based Image Super-Resolution

In dit paper wordt DTPSR voorgesteld, een diffusion-based framework voor beeldsuperresolutie dat gebruikmaakt van ontkoppelde tekstuele prioren voor ruimtelijke hiërarchie en frequentie-semantiek, ondersteund door het DisText-SR-dataset, om zowel globale structuur als fijne details met hoge precisie en controleerbaarheid te genereren.

Lei Jiang, Xin Liu, Xinze Tong, Zhiliang Li, Jie Liu, Jie Tang, Gangshan Wu2026-03-10💻 cs

RPG-SAM: Reliability-Weighted Prototypes and Geometric Adaptive Threshold Selection for Training-Free One-Shot Polyp Segmentation

Het paper introduceert RPG-SAM, een trainingsvrij een-op-een polyp-segmentatiekader dat regionale en respons-heterogeniteit aanpakt via betrouwbaarheids-gewogen prototypen en geometrisch adaptieve drempelselectie, wat resulteert in een verbeterde nauwkeurigheid op de Kvasir-dataset.

Weikun Lin, Yunhao Bai, Yan Wang2026-03-10💻 cs

Machine Learning for Stress Testing: Uncertainty Decomposition in Causal Panel Prediction

Dit paper introduceert een raamwerk voor causale stress-testvoorspellingen dat onzekerheid in drie lagen decomposeert om schattingen en verstorende factoren te scheiden, waardoor robuuste tegenwereldscenario's voor kredietverliezen mogelijk worden onder extreme macro-economische omstandigheden.

Yu Wang, Xiangchen Liu, Siguang Li2026-03-10💻 cs

DogWeave: High-Fidelity 3D Canine Reconstruction from a Single Image via Normal Fusion and Conditional Inpainting

DogWeave is een modelgebaseerd framework dat uit één RGB-afbeelding hoogwaardige 3D-hondmodellen reconstrueert door parametrische meshen te verfijnen met diffusion-verbeterde normals en onzichtbare gebieden realistisch in te vullen via conditionele inpainting, waardoor het bestaande methoden overtreft in vormnauwkeurigheid en textuurrealisme.

Shufan Sun, Chenchen Wang, Zongfu Yu2026-03-10💻 cs

LITHE: Bridging Best-Effort Python and Real-Time C++ for Hot-Swapping Robotic Control Laws on Commodity Linux

Dit paper introduceert LITHE, een lichtgewicht softwarearchitectuur voor commodity Linux die het mogelijk maakt om real-time C++-besturingslogica veilig en zonder onderbreking dynamisch aan te passen door een Python-gebaseerde 'Brain', waardoor de kloof tussen hoog-niveau AI en laag-niveau real-time controle wordt overbrugd.

He Kai Lim, Tyler R. Clites2026-03-10💻 cs

Med-Evo: Test-time Self-evolution for Medical Multimodal Large Language Models

Het paper introduceert Med-Evo, het eerste zelf-evolutieframework voor medische multimodale grote taalmodellen dat labelvrije versterkingsleer toepast via Feature-driven Pseudo Labeling en Hard-Soft Reward om de prestaties te verbeteren zonder extra gelabelde data.

Dunyuan Xu, Xikai Yang, Juzheng Miao, Yaoqian Li, Jinpeng Li, Pheng-Ann Heng2026-03-10💻 cs

HLER: Human-in-the-Loop Economic Research via Multi-Agent Pipelines for Empirical Discovery

Het paper introduceert HLER, een mens-in-de-lus multi-agent architectuur die empirisch economisch onderzoek automatiseert door datasetbewuste hypothesevorming en menselijke beslispunten te integreren, waardoor haalbare onderzoeksvragen en complete manuscripten met lage kosten kunnen worden gegenereerd.

Chen Zhu, Xiaolu Wang2026-03-10💻 cs

GeoVisA11y: An AI-based Geovisualization Question-Answering System for Screen-Reader Users

Dit paper introduceert GeoVisA11y, een op LLM's gebaseerd vraag-antwoordsysteem dat kaarten toegankelijk maakt voor schermlezergebruikers door natuurlijke taalinteractie voor analyse en navigatie mogelijk te maken.

Chu Li, Rock Yuren Pang, Arnavi Chheda-Kothary, Ather Sharif, Henok Assalif, Jeffrey Heer, Jon E. Froehlich2026-03-10💻 cs

Backdoor4Good: Benchmarking Beneficial Uses of Backdoors in LLMs

Dit paper introduceert Backdoor4Good, een unificerend raamwerk en benchmark dat de traditioneel kwaadaardige backdoor-mechanismen in grote taalmodellen herdefinieert als veilige, controleerbare en auditbare interfaces voor betrouwbare AI-toepassingen.

Yige Li, Wei Zhao, Zhe Li, Nay Myat Min, Hanxun Huang, Yunhan Zhao, Xingjun Ma, Yu-Gang Jiang, Jun Sun2026-03-10💻 cs

Agentic AI-Driven UAV Network Deployment: A LLM-Enhanced Exact Potential Game Approach

Dit artikel presenteert een door Agentic AI en een groot taalmodel (LLM) versterkt raamwerk voor de optimalisatie van UAV-netwerktopologieën, dat exacte potentiaalspellen combineert met log-lineaire en benaderde gradiëntleeralgoritmen om schaalbare, energiezuinige en lage-latentie connectiviteit te bereiken in dynamische omgevingen.

Xin Tang, Qian Chen, Binhan Liao, Yaqi Zhang, Jianxin Chen, Changyuan Zhao, Junchuan Fan, Junxi Tian, Xiaohuan Li2026-03-10💻 cs

"Better Ask for Forgiveness than Permission": Practices and Policies of AI Disclosure in Freelance Work

Dit onderzoek toont aan dat er een significant verwachtingsverschil bestaat tussen freelancers en klanten over het proactief melden van AI-gebruik, waarbij freelancers vaak passief handelen en klanten juist transparantie wensen, wat duidt op de noodzaak van heldere richtlijnen voor AI-disclosure in de freelance-economie.

Angel Hsing-Chi Hwang, Senya Wong, Baixiao Chen, Jessica He, Hyo Jin Do2026-03-10💻 cs

Where Do LLM-based Systems Break? A System-Level Security Framework for Risk Assessment and Treatment

Deze paper introduceert een doelgerichte risicobeoordelingsframework voor LLM-systemen dat systeemmodellering combineert met aanvals- en verdedigingstrbomen en CVSS-scoring om kwetsbaarheden in kritieke workflows, zoals de gezondheidszorg, gestructureerd te analyseren en gerichte verdedigingsmaatregelen te mogelijk maken.

Neha Nagaraja, Hayretdin Bahsi2026-03-10💻 cs

Do Machines Fail Like Humans? A Human-Centred Out-of-Distribution Spectrum for Mapping Error Alignment

Dit artikel introduceert een mensgericht raamwerk dat uit-distributie (OOD) herschikt als een spectrum van perceptuele moeilijkheid om de foutenafstemming tussen AI-modellen en mensen te evalueren, waarbij wordt aangetoond dat verschillende architecturen (zoals Vision-Language-modellen, CNNs en ViTs) afhankelijk van de moeilijkheidsgraad uiteenlopende aligneringsprofielen vertonen.

Binxia Xu, Xiaoliang Luo, Luke Dickens, Robert M. Mok2026-03-10💻 cs

SIGMAE: A Spectral-Index-Guided Foundation Model for Multispectral Remote Sensing

SIGMAE is een nieuw foundation model voor multispectrale remote sensing dat door het integreren van domeinspecifieke spectrale indices in een dynamisch masking-strategie (SSDTM) tijdens het voorbewerken, superieure ruimtelijk-spectrale representaties leert en presteert op diverse downstream-taken vergeleken met bestaande modellen.

Xiaokang Zhang, Bo Li, Chufeng Zhou, Weikang Yu, Lefei Zhang2026-03-10💻 cs

Selective Transfer Learning of Cross-Modality Distillation for Monocular 3D Object Detection

Deze paper introduceert MonoSTL, een selectieve transferleermethode die de negatieve effecten van het modaaliteitsverschil tussen LiDAR en camera's oplost door dieptebewuste, selectieve distillatie van features en relaties, waardoor de nauwkeurigheid van monokulaire 3D-objectdetectie aanzienlijk verbetert.

Rui Ding, Meng Yang, Nanning Zheng2026-03-10💻 cs

Classifying Novel 3D-Printed Objects without Retraining: Towards Post-Production Automation in Additive Manufacturing

Dit artikel introduceert het ThingiPrint-dataset en een prototype-gebaseerde classificatiemethode die, zonder hertraining, nieuwe 3D-geprinte objecten kan identificeren door gebruik te maken van hun CAD-modellen, waardoor de post-productie automatisering in de additieve fabricage wordt verbeterd.

Fanis Mathioulakis, Gorjan Radevski, Silke GC Cleuren, Michel Janssens, Brecht Das, Koen Schauwaert, Tinne Tuytelaars2026-03-10💻 cs

FedEU: Evidential Uncertainty-Driven Federated Fine-Tuning of Vision Foundation Models for Remote Sensing Image Segmentation

Dit paper introduceert FedEU, een federatief leerframework dat evidentiële onzekerheid en client-specifieke kenmerkembeddings gebruikt om betrouwbare en robuuste segmentatie van remote sensing-beelden te bereiken door onzekere lokale updates te identificeren en adaptief te aggregeren.

Xiaokang Zhang, Xuran Xiong, Jianzhong Huang, Lefei Zhang2026-03-10💻 cs

Give Them an Inch and They Will Take a Mile:Understanding and Measuring Caller Identity Confusion in MCP-Based AI Systems

Dit onderzoek onthult dat het ontbreken van authenticatie voor de aanroepende partij in Model Context Protocol (MCP)-systemen fundamenteel onveilig is, omdat servers vaak niet kunnen onderscheiden wie een verzoek doet en zo onbedoeld toegang verlenen aan onbevoegde gebruikers.

Yuhang Huang, Boyang Ma, Biwei Yan, Xuelong Dai, Yechao Zhang, Minghui Xu, Kaidi Xu, Yue Zhang2026-03-10💻 cs

EVLF: Early Vision-Language Fusion for Generative Dataset Distillation

Deze paper introduceert EVLF, een plug-and-play methode voor vroege visueel-taal fusie die de dominantie van tekstuele prompts in diffusion-based dataset distillatie oplost door vroege alignering van visuele en tekstuele embeddings, wat resulteert in synthetische data met hogere semantische trouw en betere downstream classificatieprestaties.

Wenqi Cai, Yawen Zou, Guang Li, Chunzhi Gu, Chao Zhang2026-03-10💻 cs

← Vorige Volgende →