cs.AI papers | Gist.Science

Federated Hierarchical Clustering with Automatic Selection of Optimal Cluster Numbers

Dit paper introduceert Fed- $k^*$ -HC, een nieuw federatief hiërarchisch clusteringkader dat automatisch de optimale aantallen clusters bepaalt en om kan gaan met onbalans in clustergroottes, zelfs onder privacybeperkingen.

Yue Zhang, Chuanlong Qiu, Xinfa Liao, Yiqun Zhang2026-03-16🤖 cs.LG

HSEmotion Team at ABAW-10 Competition: Facial Expression Recognition, Valence-Arousal Estimation, Action Unit Detection and Fine-Grained Violence Classification

Dit artikel presenteert de resultaten van het HSEmotion-team bij de 10e ABAW-competitie, waarbij een efficiënte aanpak met vooraf getrainde EfficientNet-modellen en een MLP voor gezichtsemotieherkenning, waarden-arousal-schatting, actie-eu-detectie en fijnmazige geweldclassificatie aanzienlijk betere validatiemetrics oplevert dan bestaande baselines.

Andrey V. Savchenko, Kseniia Tsypliakova2026-03-16🤖 cs.AI

Seeing Eye to Eye: Enabling Cognitive Alignment Through Shared First-Person Perspective in Human-AI Collaboration

Dit paper introduceert Eye2Eye, een AR-framework dat gebruikmaakt van een gedeeld eerstepersoonsperspectief om de communicatie- en begripsgaten tussen mens en AI te overbruggen, wat resulteert in snellere taakvoltooiing, minder interactielast en meer vertrouwen.

Zhuyu Teng, Pei Chen, Yichen Cai, Ruoqing Lu, Zhaoqu Jiang, Jiayang Li, Weitao You, Lingyun Sun2026-03-16🤖 cs.AI

Cost-Efficient Multimodal LLM Inference via Cross-Tier GPU Heterogeneity

Dit paper introduceert HeteroServe, een kostenefficiënte runtime die multimodale LLM-inferentie optimaliseert door visuele en taalkenmerken te scheiden en te distribueren over heterogene GPU-tier-systemen via PCIe, wat aanzienlijke kostenbesparingen en hogere doorvoersnelheden mogelijk maakt zonder de latentie te beïnvloeden.

Donglin Yu2026-03-16🤖 cs.LG

AI Planning Framework for LLM-Based Web Agents

Dit paper introduceert een AI-planningsframework dat webagenten-klassen koppelt aan traditionele zoekalgoritmen en nieuwe evaluatiemetrics voorstelt om het falen en de prestaties van LLM-agenten op het web systematisch te analyseren.

Orit Shahnovsky, Rotem Dror2026-03-16🤖 cs.AI

Altered Thoughts, Altered Actions: Probing Chain-of-Thought Vulnerabilities in VLA Robotic Manipulation

Dit onderzoek toont aan dat Vision-Language-Action-robots kwetsbaar zijn voor specifieke manipulaties van hun interne chain-of-thought-tekst, waarbij het vervangen van objectnamen de prestaties drastisch vermindert terwijl andere vormen van corruptie weinig effect hebben, wat aantoont dat de actie-decoder afhankelijk is van entiteitsreferenties in plaats van de redeneerkwaliteit.

Tuan Duong Trinh, Naveed Akhtar, Basim Azam2026-03-16🤖 cs.AI

IGASA: Integrated Geometry-Aware and Skip-Attention Modules for Enhanced Point Cloud Registration

Dit paper introduceert IGASA, een nieuw puntwolkregistratiekader dat een hiërarchische pyramide-architectuur combineert met een kruislaag-attentie- en een iteratieve geometrie-bewuste verfijningsmodule om robuustheid en nauwkeurigheid te verbeteren in uitdagende real-world scenario's zoals ruis en occlusie.

Dongxu Zhang, Jihua Zhu, Shiqi Li, Wenbiao Yan, Haoran Xu, Peilin Fan, Huimin Lu2026-03-16🤖 cs.AI

CMHANet: A Cross-Modal Hybrid Attention Network for Point Cloud Registration

In dit paper wordt CMHANet voorgesteld, een nieuw cross-modaal hybride attentienetwerk dat 2D-beeldcontext en 3D-puntenwolkgeometrie combineert met contrastief leren om de robuustheid en nauwkeurigheid van puntwolkregistratie in complexe, realistische scenario's aanzienlijk te verbeteren.

Dongxu Zhang, Yingsen Wang, Yiding Sun, Haoran Xu, Peilin Fan, Jihua Zhu2026-03-16🤖 cs.AI

Graph In-Context Operator Networks for Generalizable Spatiotemporal Prediction

Dit paper introduceert GICON, een graf-gebaseerd in-context operator netwerk dat door middel van gecontroleerde experimenten aantoont dat in-context operator learning superieur is aan klassieke operator learning voor generaliseerbare ruimtetijdvoorspellingen, zoals bij luchtvervuiling.

Chenghan Wu, Zongmin Yu, Boai Sun, Liu Yang2026-03-16🤖 cs.LG

On Using Machine Learning to Early Detect Catastrophic Failures in Marine Diesel Engines

Dit paper presenteert een nieuwe methode voor het vroegtijdig detecteren van catastrofale storingen in maritieme dieselmotoren door gebruik te maken van de afgeleiden van afwijkingen in sensorsignalen, verwerkt door een Random Forest-algoritme, wat een snellere waarschuwing mogelijk maakt dan traditionele drempelwaarde-alarmen.

Francesco Maione, Paolo Lino, Giuseppe Giannino, Guido Maione2026-03-16🤖 cs.AI

ToolTree: Efficient LLM Agent Tool Planning via Dual-Feedback Monte Carlo Tree Search and Bidirectional Pruning

Dit paper introduceert ToolTree, een nieuw Monte Carlo-baasplanningsparadigma voor LLM-agenten dat gebruikmaakt van dubbele feedback en bidirectionele pruning om de prestaties bij complexe tool-planningstaken met ongeveer 10% te verbeteren ten opzichte van de huidige state-of-the-art.

Shuo Yang, Soyeon Caren Han, Yihao Ding, Shuhe Wang, Eduard Hoy2026-03-16🤖 cs.AI

MoKus: Leveraging Cross-Modal Knowledge Transfer for Knowledge-Aware Concept Customization

Dit paper introduceert MoKus, een nieuw raamwerk voor kennisbewuste conceptaanpassing dat gebruikmaakt van cross-modale kennisoverdracht om visuele concepten te koppelen aan diverse tekstuele kennis, vergezeld van de eerste benchmark voor deze taak, KnowCusBench.

Chenyang Zhu, Hongxiang Li, Xiu Li, Long Chen2026-03-16💬 cs.CL

TaoBench: Do Automated Theorem Prover LLMs Generalize Beyond MathLib?

Dit paper introduceert TaoBench, een nieuw benchmark dat de beperkte generalisatie van geautomatiseerde stellingbewijzers naar niet-standaard wiskundige definities blootlegt, waarbij de prestaties van state-of-the-art modellen gemiddeld met 26% dalen wanneer ze worden getest op een zelfstandig opgebouwd raamwerk uit Terence Tao's Analysis I in plaats van op de gebruikelijke MathLib-bibliotheek.

Alexander K Taylor, Junyi Zhang, Ethan Ji, Vigyan Sahai, Haikang Deng, Yuanzhou Chen, Yifan Yuan, Di Wu, Jia-Chen Gu, Kai-Wei Chang, Nanyun Peng, Amit Sahai, Wei Wang2026-03-16🤖 cs.LG

AI Model Modulation with Logits Redistribution

Dit paper introduceert AIM, een trainingsvrije methode die logit-herspreiding gebruikt om één enkel AI-model dynamisch aan te passen aan uiteenlopende behoeften qua outputkwaliteit en focus, zonder dat meerdere gespecialiseerde versies nodig zijn.

Zihan Wang, Zhongkui Ma, Xinguo Feng, Zhiyang Mei, Ethan Ma, Derui Wang, Minhui Xue, Guangdong Bai2026-03-16🤖 cs.AI

Empowering Semantic-Sensitive Underwater Image Enhancement with VLM

Deze paper introduceert een nieuwe leermechanisme dat Vision-Language Models (VLMs) gebruikt om onderwaterbeeldverbetering semantisch bewust te maken, waardoor de kwaliteit van visuele taken zoals detectie en segmentatie aanzienlijk verbetert door de restauratie te richten op belangrijke objecten in plaats van op een uniforme verbetering.

Guodong Fan, Shengning Zhou, Genji Yuan, Huiyu Li, Jingchun Zhou, Jinjiang Li2026-03-16⚡ eess

Cheers: Decoupling Patch Details from Semantic Representations Enables Unified Multimodal Comprehension and Generation

Dit paper introduceert Cheers, een unificerend multimodaal model dat patchdetails ontkoppelt van semantische representaties om zowel visueel begrip als beeldgeneratie te verbeteren via een gedeelde architectuur die 4x tokencompressie bereikt en betere prestaties levert dan bestaande modellen met slechts 20% van de trainingskosten.

Yichen Zhang, Da Peng, Zonghao Guo + 19 more2026-03-16🤖 cs.AI

Context is all you need: Towards autonomous model-based process design using agentic AI in flowsheet simulations

Dit artikel introduceert een multi-agent AI-framework dat grote taalmodellen combineert met technische documentatie om autonome en correcte code te genereren voor industriële procesflowsheet-simulaties in de in-house tool Chemasim.

Pascal Schäfer, Lukas J. Krinke, Martin Wlotzka, Norbert Asprion2026-03-16🤖 cs.AI

Residual SODAP: Residual Self-Organizing Domain-Adaptive Prompting with Structural Knowledge Preservation for Continual Learning

Het paper introduceert Residual SODAP, een nieuw framework voor continu leren dat door middel van een combinatie van $\alpha$ -entmax prompt-selectie, residuale aggregatie en data-vrije distillatie catastrofisch vergeten effectief aanpakt in domein-incrementele leeropdrachten zonder toegang tot task-identificatoren of historische data.

Gyutae Oh, Jungwoo Bae, Jitae Shin2026-03-16🤖 cs.LG

Hierarchical Dual-Change Collaborative Learning for UAV Scene Change Captioning

Dit paper introduceert de nieuwe taak UAV-scenewijzigingcaptioning voor dynamische luchtfoto's en stelt een hiërarchisch dubbel-veranderend collaboratief leermodel voor, aangevuld met een nieuw dataset, om semantische veranderingen in beelden met verschuivende perspectieven nauwkeurig te beschrijven.

Fuhai Chen, Pengpeng Huang, Junwen Wu + 4 more2026-03-16🤖 cs.AI

Mask2Flow-TSE: Two-Stage Target Speaker Extraction with Masking and Flow Matching

Het artikel introduceert Mask2Flow-TSE, een tweestapsframework dat discriminatieve masking combineert met flow matching om spraak van een doel spreker te extraheren met hoge kwaliteit en snellere inferentie dan bestaande generatieve methoden.

Junwon Moon, Hyunjin Choi, Hansol Park + 2 more2026-03-16🤖 cs.AI

← Vorige Volgende →