cs papers | Gist.Science

Fusion-Poly: A Polyhedral Framework Based on Spatial-Temporal Fusion for 3D Multi-Object Tracking

Fusion-Poly is een nieuw polyhedraal raamwerk dat asynchrone LiDAR- en cameradata integreert via ruimtelijk-temporale fusie om de 3D multi-object tracking op het nuScenes-benchmark te verbeteren tot een state-of-the-art AMOTA van 76,5%.

Xian Wu, Yitao Wu, Xiaoyu Li, Zijia Li, Lijun Zhao, Lining Sun2026-03-10💻 cs

Experience on Automatically Converting a C++ Monolith to Java EE

Dit rapport beschrijft de ervaringen en technieken bij het automatisch converteren van een 800.000 regels tellende C++ monoliet naar een Java EE-architectuur, inclusief het oplossen van veelvoorkomende taalverschillen en het gebruik van een clang-tool voor continue regeneratie van de code.

Andre Vehreschild, Lexi Pimenidis2026-03-10💻 cs

MM-TS: Multi-Modal Temperature and Margin Schedules for Contrastive Learning with Long-Tail Data

Dit paper introduceert MM-TS, een methode voor multi-modale contrastieve learning die dynamische temperatuur- en margeschema's gebruikt om de prestaties op langstaartdata te verbeteren en InfoNCE-loss met max-margin-objectieven te verenigen, wat leidt tot nieuwe state-of-the-art resultaten op diverse beeld- en video-taalkundige datasets.

Siarhei Sheludzko, Dhimitrios Duka, Bernt Schiele, Hilde Kuehne, Anna Kukleva2026-03-10💻 cs

Alignment-Aware and Reliability-Gated Multimodal Fusion for Unmanned Aerial Vehicle Detection Across Heterogeneous Thermal-Visual Sensors

Deze studie introduceert twee nieuwe fusiestrategieën, RGIF en RGMAF, die registratiebewustzijn en betrouwbaarheidsgebaseerde aandacht gebruiken om de prestaties van UAV-detectie in heterogene thermische en visuele sensoren aanzienlijk te verbeteren.

Ishrat Jahan, Molla E Majid, M Murugappan, Muhammad E. H. Chowdhury, N. B. Prakash, Saad Bin Abul Kashem, Balamurugan Balusamy, Amith Khandakar2026-03-10💻 cs

Multi-Objective Evolutionary Optimization of Chance-Constrained Multiple-Choice Knapsack Problems with Implicit Probability Distributions

Dit paper introduceert NHILS, een hybride evolutionair algoritme dat een efficiënte Monte Carlo-methode (OPERA-MC) combineert met NSGA-II om het meerdoelige kansbeperkte multiple-choice knapsack-probleem met impliciete verdelingen op te lossen, wat leidt tot superieure prestaties bij het optimaliseren van 5G-netwerkconfiguraties.

Xuanfeng Li, Shengcai Liu, Wenjie Chen, Yew-Soon Ong, Ke Tang2026-03-10💻 cs

Video2LoRA: Unified Semantic-Controlled Video Generation via Per-Reference-Video LoRA

Video2LoRA is een schaalbaar en efficiënt framework dat een lichtgewicht hypernetwerk gebruikt om gepersonaliseerde LoRA-weights te genereren voor referentievideo's, waardoor semantisch gecontroleerde videoproduktie mogelijk is zonder per-conditie training en met een modelgrootte van minder dan 150MB.

Zexi Wu, Qinghe Wang, Jing Dai, Baolu Li, Yiming Zhang, Yue Ma, Xu Jia, Hongming Xu2026-03-10💻 cs

Re-evaluating Position and Velocity Decoding for Hand Pose Estimation with Surface Electromyography

Dit paper herbeoordeelt de conclusies van het emg2pose-benchmark en toont aan dat positie-decodering, bij gebruik van een stabielere trainingsaanpak en een aangepaste filter, beter presteert dan snelheids-decodering voor handpose-schatting op basis van sEMG.

Nima Hadidi, Johannes Lee, Ebrahim Feghhi, Michael Yuan, Jonathan C. Kao2026-03-10💻 cs

A Comparative Study of Recent Advances in Internet of Intrusion Detection Things

Dit artikel biedt een uitgebreide vergelijkende studie van geavanceerde technieken en typen voor intrusiedetectiesystemen (IDS) in het Internet of Things, met inbegrip van hun architecturen, classificaties en evaluatiemethoden.

Marianna Rezk (IRIMAS), Hassan Harb (IRIMAS), Ismail Bennis (IRIMAS), Sebastien Bindel (IRIMAS), Hafid Abouaissa (IRIMAS)2026-03-10💻 cs

SplitAgent: A Privacy-Preserving Distributed Architecture for Enterprise-Cloud Agent Collaboration

SplitAgent introduceert een nieuw gedistribueerd architectuurmodel dat privacybehoudende samenwerking tussen enterprise- en cloud-gebaseerde AI-agenten mogelijk maakt door contextbewuste dynamische sanitisering te combineren met differentieel privacy, waardoor bedrijven gevoelige data kunnen beschermen zonder in te leveren op taaknauwkeurigheid.

Jianshu She2026-03-10💻 cs

SAVE: Speech-Aware Video Representation Learning for Video-Text Retrieval

Het paper introduceert SAVE, een nieuwe methode voor video-tekstretrieval die de prestaties van de huidige staat van de kunst (AVIGATE) significant verbetert door een speciale spraaktak en een zachte vroege visueel-audiatieve uitlijning (soft-ALBEF) te gebruiken om de vaak genegeerde audio-informatie effectiever te benutten.

Ruixiang Zhao, Zhihao Xu, Bangxiang Lan, Zijie Xin, Jingyu Liu, Xirong Li2026-03-10💻 cs

Practical Type Inference: High-Throughput Recovery of Real-World Structures and Function Signatures

Dit paper introduceert XTRIDE, een geoptimaliseerde n-gram-methode die de type-inferentie van gesterpte binaries aanzienlijk versnelt en nauwkeuriger maakt dan bestaande technieken, waardoor deze geschikt is voor geautomatiseerde reverse-engineering-pipelines.

Lukas Seidel, Sam Thomas, Konrad Rieck2026-03-10💻 cs

SRNeRV: A Scale-wise Recursive Framework for Neural Video Representation

Deze paper introduceert SRNeRV, een nieuw recursief raamwerk voor neurale videorepresentatie dat door middel van een hybride delingsschema de parameterredundantie van bestaande multi-schaalgeneratoren oplost en zo de prestaties aanzienlijk verbetert.

Jia Wang, Jun Zhu, Xinfeng Zhang2026-03-10💻 cs

GarmentPainter: Efficient 3D Garment Texture Synthesis with Character-Guided Diffusion Model

GarmentPainter is een efficiënt raamwerk dat een karaktergeleid diffusiemodel en UV-positiekaarten gebruikt om hoogwaardige, 3D-consistente textuurpatronen voor kleding te genereren zonder strikte ruimtelijke uitlijning tussen referentieafbeeldingen en 3D-meshes.

Jinbo Wu, Xiaobo Gao, Xing Liu, Chen Zhao, Jialun Liu2026-03-10💻 cs

Disentangling Reasoning in Large Audio-Language Models for Ambiguous Emotion Prediction

Dit artikel introduceert een raamwerk voor grote audio-taalmodellen dat dubbelzinnige spraakemotieherkenning behandelt als een distributief redeneerprobleem door een ambiguiteitsbewust doel en gestructureerde chain-of-thought-supervisie te combineren, wat leidt tot consistente prestatieverbeteringen op benchmarkdatasets.

Xiaofeng Yu, Jiaheng Dong, Jean Honorio, Abhirup Ghosh, Hong Jia, Ting Dang2026-03-10💻 cs

A General Lie-Group Framework for Continuum Soft Robot Modeling

Dit artikel introduceert een algemeen Lie-groepkader op basis van Cosserat-staarttheorie en cumulatieve parametrisering op SE(3) voor het modelleren van continue zachte robots, wat een verenigde, efficiënte en flexibele aanpak biedt voor kinematica, statica en dynamica van diverse complexe structuren.

Lingxiao Xun, Benoît Rosa, Jérôme Szewczyk, Brahim Tamadazte2026-03-10💻 cs

Exploring Deep Learning and Ultra-Widefield Imaging for Diabetic Retinopathy and Macular Edema

Dit onderzoek toont aan dat state-of-the-art deep learning-modellen, waaronder vision transformers en foundation modellen, in combinatie met ultra-widefield imaging en frequentiedomeinrepresentaties, zeer effectief zijn voor het beoordelen van beeldkwaliteit, het detecteren van referabele diabetische retinopathie en diabetisch maculair oedeem, waarbij feature-level fusion en Grad-CAM-analyse de robuustheid en uitlegbaarheid verder verbeteren.

Pablo Jimenez-Lizcano, Sergio Romero-Tapiador, Ruben Tolosana, Aythami Morales, Guillermo González de Rivera, Ruben Vera-Rodriguez, Julian Fierrez2026-03-10💻 cs

Why Learn What Physics Already Knows? Realizing Agile mmWave-based Human Pose Estimation via Physics-Guided Preprocessing

Dit paper introduceert een fysica-gestuurde voorverwerkingsmethode voor millimetergolf-gebaseerde menselijke pose-schatting die, door expliciete fysieke priors te gebruiken in plaats van data-gedreven modules, de modelgrootte met 55,7-88,9% verkleint en real-time implementatie op Raspberry Pi mogelijk maakt zonder in te leveren op nauwkeurigheid.

Shuntian Zheng, Jiaqi Li, Minzhe Ni, Xiaoman Lu, Yu Guan2026-03-10💻 cs

SiMO: Single-Modality-Operable Multimodal Collaborative Perception

Dit paper introduceert SiMO, een nieuw systeem voor collaboratieve waarneming dat door middel van Length-Adaptive Multi-Modal Fusion (LAMMA) en een unieke trainingsstrategie modale uitval effectief opvangt en semantische consistentie behoudt, waardoor het prestaties optimaliseert ongeacht welke sensoren beschikbaar zijn.

Jiageng Wen, Shengjie Zhao, Bing Li, Jiafeng Huang, Kenan Ye, Hao Deng2026-03-10💻 cs

Topologically Stable Hough Transform

Deze paper introduceert een topologisch stabiele variant van de Hough-transformatie die, in plaats van een gediscrétiseerde stemming, een continue scorefunctie en persistente homologie gebruikt om lijnen in puntwolken te detecteren, vergezeld van een efficiënt algoritme voor de berekening van deze kandidaatlijnen.

Stefan Huber, Kristóf Huszár, Michael Kerber, Martin Uray2026-03-10💻 cs

Coupling Europe's Capacity Markets

Dit paper stelt een nieuw concept voor voor een gekoppelde Europese capaciteitsmarkt die, door gebruik te maken van flow-based marktgekoppeling, de systeemkosten verlaagt en de leveringszekerheid waarborgt door beschikbare capaciteit in buurlanden efficiënter te benutten dan bestaande nationale mechanismen.

Kamal Adekola, Laurens de Vries, Kenneth Bruninx2026-03-10💻 cs

← Vorige Volgende →