cs papers | Gist.Science

Towards Human-Like Manipulation through RL-Augmented Teleoperation and Mixture-of-Dexterous-Experts VLA

Deze paper introduceert een geïntegreerd framework dat RL-getrainde teleoperatiehulp (IMCopilot) en een Mixture-of-Dexterous-Experts VLA-architectuur (MoDE-VLA) combineert om mensachtige, contactrijke bimanuele manipulatie mogelijk te maken door kracht- en tactiele sensoren naadloos te integreren.

Tutian Tang, Xingyu Ji, Wanli Xing, Ce Hao, Wenqiang Xu, Lin Shao, Cewu Lu, Qiaojun Yu, Jiangmiao Pang, Kaifeng Zhang2026-03-10💻 cs

UniGround: Universal 3D Visual Grounding via Training-Free Scene Parsing

Dit paper introduceert UniGround, een training-vrije methode voor universele 3D-visual grounding die door middel van visuele en geometrische redenering objecten in willekeurige 3D-scènes lokaliseert zonder afhankelijk te zijn van vooraf getrainde modellen, waardoor robuustheid en generalisatie naar ongeziene ruimtelijke relaties en domeinen worden bereikt.

Jiaxi Zhang, Yunheng Wang, Wei Lu, Taowen Wang, Weisheng Xu, Shuning Zhang, Yixiao Feng, Yuetong Fang, Renjing Xu2026-03-10💻 cs

Fast Low-light Enhancement and Deblurring for 3D Dark Scenes

FLED-GS is een nieuw, snel framework dat 3D-scènes met weinig licht, ruis en bewegingsonscherpte herstelt door een cyclisch proces van versterking en reconstructie te gebruiken, waardoor het aanzienlijk sneller is dan bestaande methoden zoals LuSh-NeRF.

Feng Zhang, Jinglong Wang, Ze Li, Yanghong Zhou, Yang Chen, Lei Chen, Xiatian Zhu2026-03-10💻 cs

Forgetting Event Order in Higher-Dimensional Automata

Dit paper lost de fundamentele mismatch in hogere-dimensionale automaten op door een orde-onafhankelijke semantiek te ontwikkelen die gebaseerd is op interval-ipomsets, waardoor een verenigde en zuivere grondslag voor concurrentiemodellen wordt geboden die vrij is van kunstmatige totale ordening.

Safa Zouari2026-03-10💻 cs

VesselFusion: Diffusion Models for Vessel Centerline Extraction from 3D CT Images

Dit paper introduceert VesselFusion, een diffusiemodel dat 3D CT-beelden gebruikt om op een natuurlijke en stabiele manier bloedvatcentrumlijnen te extraheren via een ruw-naar-fijn representatie en stemmingsgebaseerde aggregatie, wat leidt tot hogere nauwkeurigheid dan traditionele methoden.

Soichi Mita, Shumpei Takezaki, Ryoma Bise2026-03-10💻 cs

POIROT: Investigating Direct Tangible vs. Digitally Mediated Interaction and Attitude Moderation in Multi-party Murder Mystery Games

Deze studie toont aan dat de effectiviteit van fysieke interactie met een robot als spelmeester in moordmysterie-spellen afhankelijk is van de houding van de gebruiker, waarbij personen met een negatieve robotattitude (NARS) juist baat hebben bij een digitale interface om hun immersie te behouden.

Wen Chen, Rongxi Chen, Shankai Chen, Huiyang Gong, Minghui Guo, Yingri Xu, Xintong Wu, Xinyi Fu2026-03-10💻 cs

Toward Governing Perception in Safety-Critical Mediated Reality on the Move

Dit position paper pleit voor de ontwikkeling van bestuurbare Mediated Reality-systemen voor veiligheidskritische situaties onderweg, waarbij gebruikers mechanismen nodig hebben om perceptie te configureren en te begrijpen zonder de veiligheid te compromitteren.

Pascal Jansen2026-03-10💻 cs

Multifingered force-aware control for humanoid robots

Dit artikel presenteert een krachtbewust besturingssysteem voor humanoïde robots met meerdere vingers dat, gebaseerd op geschatte krachten uit tactiele sensoren, de beweging van het lichaam en de handen aanpast om stabiel contact met objecten te behouden door de drukpunt en het contactpolygon van de vingers op elkaar af te stemmen.

Pasquale Marra, Gabriele M. Caddeo, Ugo Pattacini, Lorenzo Natale2026-03-10💻 cs

MV-Fashion: Towards Enabling Virtual Try-On and Size Estimation with Multi-View Paired Data

Dit paper introduceert MV-Fashion, een groot meerkijkend video-dataset met 3.273 sequenties en gedetailleerde annotaties, dat is ontworpen om de kloof te overbruggen tussen synthetische en realistische data voor taken zoals virtueel passen en kledinggrootte-schatting.

Hunor Laczkó, Libang Jia, Loc-Phat Truong, Diego Hernández, Sergio Escalera, Jordi Gonzalez, Meysam Madadi2026-03-10💻 cs

Edged USLAM: Edge-Aware Event-Based SLAM with Learning-Based Depth Priors

Dit paper introduceert Edged USLAM, een hybride visueel-inertiaal systeem dat gebeurtenisgebaseerde camera's combineert met een randgevoelige front-end en een leergerichte dieptemodule om robuuste localisatie en mapping te realiseren onder uitdagende omstandigheden zoals snelle beweging en extreme verlichting.

Sebnem Sarıözkan, Hürkan Sahin, Olaya Álvarez-Tuñón, Erdal Kayacan2026-03-10💻 cs

Soundscapes in Spectrograms: Pioneering Multilabel Classification for South Asian Sounds

Deze studie introduceert een spectrogram-gebaseerde CNN-methode die MFCC-technieken overtreft bij het uitvoeren van multilabel-classificatie van complexe Zuid-Aziatische geluiden, zoals aangetoond op de SAS-KIIT- en UrbanSound8K-datasets.

Sudip Chakrabarty, Pappu Bishwas, Rajdeep Chatterjee, Tathagata Bandyopadhyay, Digonto Biswas, Bibek Howlader2026-03-10💻 cs

The Differential Effects of Agreeableness and Extraversion on Older Adults' Perceptions of Conversational AI Explanations in Assistive Settings

Deze studie toont aan dat bij ouderen de persoonlijkheid van een spraakassistent (met name hoge vriendelijkheid) hun empathie- en sympathiepercepties beïnvloedt zonder hun oordeel over intelligentie te veranderen, terwijl contextuele verklaringen in noodsituaties effectiever zijn dan die op basis van gespreksgeschiedenis.

Niharika Mathur, Hasibur Rahman, Smit Desai2026-03-10💻 cs

An explainable hybrid deep learning-enabled intelligent fault detection and diagnosis approach for automotive software systems validation

Dit artikel presenteert een hybride, interpreteerbare deep learning-methode die 1D-CNN en GRU combineert met XAI-technieken om de betrouwbaarheid en root-cause-analyse van foutdetectie in automotive softwaresystemen tijdens validatie te verbeteren.

Mohammad Abboush, Ehab Ghannoum, Andreas Rausch2026-03-10💻 cs

Evidence-Driven Reasoning for Industrial Maintenance Using Heterogeneous Data

Dit artikel introduceert de Condition Insight Agent, een besluitvormingsframework dat heterogene onderhoudsdata integreert via een bewijsgedreven, regelgebaseerde redeneermethode om betrouwbare, verklaarbare aanbevelingen te genereren voor industriële onderhoudsprocessen.

Fearghal O'Donncha, Nianjun Zhou, Natalia Martinez, James T Rayfield, Fenno F. Heath III, Abigail Langbridge, Roman Vaculin2026-03-10💻 cs

Evolution Strategy-Based Calibration for Low-Bit Quantization of Speech Models

Deze paper introduceert ESC, een kalibratiemethode gebaseerd op evolutiestrategieën die specifiek is ontworpen voor spraakmodellen om near-lossless prestaties te bereiken bij low-bit (INT4 en INT8) kwantisatie door de unieke uitdagingen van audioactivaties aan te pakken.

Lucas Rakotoarivony2026-03-10💻 cs

MERLIN: Building Low-SNR Robust Multimodal LLMs for Electromagnetic Signals

Dit paper introduceert MERLIN, een robuust multimodaal groot taalmodel voor elektromagnetische signalen dat de uitdagingen van data-schaarste, benchmark-tekort en lage signaal-ruisverhoudingen aanpakt door middel van de nieuwe datasets EM-100k, de benchmark EM-Bench en een geavanceerd trainingsframework.

Junyu Shen, Zhendong She, Chenghanyu Zhang, Yuchuang Sun, Luqing Luo, Dingwei Tan, Zonghao Guo, Bo Guo, Zehua Han, Wupeng Xie, Yaxin Mu, Peng Zhang, Peipei Li, Fengxiang Wang, Yangang Sun, Maosong Sun2026-03-10💻 cs

Privacy-Preserving End-to-End Full-Duplex Speech Dialogue Models

Deze studie toont aan dat end-to-end full-duplex spraakmodellen zoals SALM-Duplex en Moshi gevoelige sprekeridentiteitsinformatie lekken in hun verborgen representaties, en presenteert twee streaming-anonimisatiemethoden die de herkenbaarheid van sprekers aanzienlijk verminderen terwijl de responslatentie onder de seconde blijft.

Nikita Kuzmin, Tao Zhong, Jiajun Deng, Yingke Zhu, Tristan Tsoi, Tianxiang Cao, Simon Lui, Kong Aik Lee, Eng Siong Chng2026-03-10💻 cs

Modeling the Senegalese artisanal fisheries migrations

Dit onderzoek presenteert een multi-agent simulatiemodel dat aantoont dat, ondanks een beperkte impact van klimaatverandering, een vermindering van de visserijinspanning essentieel is om een duurzame evenwichtstoestand in de Senegalese artisanale visserij te bereiken en massale migratie van vissers te voorkomen.

Alassane Bah (ESP, UMMISCO), Timothée Brochier (UMMISCO, IRD [Ile-de-France])2026-03-10💻 cs

Human-AI Collaboration for Scaling Agile Regression Testing: An Agentic-AI Teammate from Manual to Automated Testing

Dit paper presenteert een agentic-AI-systeem dat in samenwerking met Hacon (Siemens) automatisch testscripts genereert op basis van specificaties, waardoor de regressietestcapaciteit in agile omgevingen aanzienlijk wordt verhoogd terwijl menselijke toezicht en kwaliteit behouden blijven.

Moustapha El Outmani, Manthan Venkataramana Shenoy, Ahmad Hatahet, Andreas Rausch, Tim Niklas Kniep, Thomas Raddatz, Benjamin King2026-03-10💻 cs

A Hodge-Based Framework for Service Operational Analysis in Serverless Platforms

Dit paper stelt een topologisch raamwerk voor op basis van Hodge-decompositie om operationele flows in serverless platforms te analyseren, waarbij structurele inefficiënties worden geïdentificeerd en getransformeerd naar actievere herstelstrategieën zonder de volledige architectuur te moeten herstructureren.

Gianluca Reali, Mauro Femminella2026-03-10💻 cs

← Vorige Volgende →