cs Arbeiten | Gist.Science

Unsupervised Discovery of Failure Taxonomies from Deployment Logs

Diese Arbeit stellt einen unüberwachten Ansatz vor, der mittels multimodaler Vision-Sprache-Argumentation und Clustering aus großen Mengen an Roboter-Deployments-Logs semantisch kohärente und handlungsrelevante Fehlertaxonomien automatisch entdeckt, um die Systemrobustheit durch gezielte Datensammlung und verbessertes Fehlermonitoring zu steigern.

Aryaman Gupta, Yusuf Umut Ciftci, Somil Bansal2026-03-10💻 cs

Assigning Multi-Robot Tasks to Multitasking Robots

Dieses Paper stellt ein neuartiges Rahmenwerk zur Zuweisung von Aufgaben an multitaskingfähige Roboter vor, das physische Einschränkungen berücksichtigt und durch einen MAX-SAT-basierten Ansatz sowie einen effizienten Greedy-Heuristik-Algorithmus die Aufgabenallokation im Vergleich zu herkömmlichen Ein-Aufgaben-Methoden optimiert.

Winston Smith, Yu Zhang2026-03-10💻 cs

Context Matters! Relaxing Goals with LLMs for Feasible 3D Scene Planning

Die Arbeit stellt ContextMatters vor, ein Framework, das Large Language Models und klassische Planung kombiniert, um durch kontextabhängige Ziellockerung auf 3D-Scene-Graphen die Erfolgsrate von Embodied Agents in komplexen Umgebungen signifikant zu steigern.

Emanuele Musumeci, Michele Brienza, Francesco Argenziano, Abdel Hakim Drid, Vincenzo Suriani, Daniele Nardi, Domenico D. Bloisi2026-03-10💻 cs

Transforming H&E images into IHC: A Variance-Penalized GAN for Precision Oncology

Diese Studie stellt einen varianzgesteuerten GAN-basierten Ansatz vor, der aus kostengünstigen H&E-Färbungen hochpräzise HER2-IHC-Bilder generiert und durch die Vermeidung von Mode Collapse sowie die Verbesserung der strukturellen Vielfalt die Genauigkeit der Brustkrebsdiagnostik signifikant steigert.

Sara Rehmat, Hafeez Ur Rehman, Byeong-Gwon Kang, Sarra Ayouni, Yunyoung Nam2026-03-10💻 cs

Light of Normals: Unified Feature Representation for Universal Photometric Stereo

Die Arbeit stellt LINO UniPS vor, ein universelles photometrisches Stereo-System, das durch Light Register Tokens und Interleaved Attention Blocks eine Entkopplung von Beleuchtung und Oberflächennormals erreicht, während eine waveletbasierte Architektur und ein spezieller Verlustbegriff feine geometrische Details bewahren, was in Kombination mit dem neuen PS-Verse-Datensatz zu neuen State-of-the-Art-Ergebnissen führt.

Houyuan Chen, Hong Li, Chongjie Ye + 11 more2026-03-10💻 cs

Open-Vocabulary Camouflaged Object Segmentation with Cascaded Vision Language Models

Diese Arbeit stellt ein neuartiges, von Vision-Language-Modellen (VLMs) geführtes kaskadiertes Framework für die Open-Vocabulary-Tarnobjektsegmentierung vor, das durch die Nutzung von VLM-Features als explizite Prompts für das Segment Anything Model (SAM) und die Einbeziehung des Segmentierungsergebnisses als weicher räumlicher Prior die Herausforderungen der visuellen Ambiguität und des Domänenunterschieds bei der Segmentierung und Klassifizierung von Tarnobjekten überwindet.

Kai Zhao, Wubang Yuan, Zheng Wang, Guanyi Li, Xiaoqiang Zhu, Deng-ping Fan, Dan Zeng2026-03-10💻 cs

WaLi: Can Pressure Sensors in HVAC Systems Capture Human Speech?

Die Studie stellt WaLi vor, ein System, das mithilfe eines komplexwertigen Conformer-Modells und einer globalen Aufmerksamkeitskomponente vertrauliche Sprache aus den oft vernachlässigten Druckdaten von HVAC-Sensoren rekonstruiert und damit eine bisher unbeachtete, erhebliche Privatsphärenbedrohung aufzeigt.

Tarikul Islam Tamiti, Biraj Joshi, Rida Hasan, Anomadarshi Barua2026-03-10💻 cs

SUBARU: A Practical Approach to Power Saving in Hearables Using SUB-Nyquist Audio Resolution Upsampling

Die SUBARU-Methode ermöglicht eine signifikante Stromreduzierung bei Hörgeräten durch den gezielten Einsatz von Sub-Nyquist-Abtastung und niedriger Bitauflösung in Kombination mit einem effizienten Upsampling-Verfahren, das dennoch eine hochwertige Sprachverbesserung in Echtzeit gewährleistet.

Tarikul Islam Tamiti, Sajid Fardin Dipto, Luke Benjamin Baja-Ricketts, David C Vergano, Anomadarshi Barua2026-03-10💻 cs

Autonomous Vision-Aided UAV Positioning for Obstacle-Aware Wireless Connectivity

Die Studie stellt VTOPA vor, einen visuell gestützten Algorithmus zur autonomen Positionierung von UAVs in städtischen Umgebungen, der durch die Echtzeiterkennung von Hindernissen und Nutzerstandorten die Sichtverbindung sicherstellt und so die aggregierte Durchsatzrate um bis zu 50 % steigert sowie die Latenz um 50 % senkt.

Kamran Shafafi, Manuel Ricardo, Rui Campos2026-03-10💻 cs

LD-RPS: Zero-Shot Unified Image Restoration via Latent Diffusion Recurrent Posterior Sampling

Das Paper stellt LD-RPS vor, eine datasetfreie, einheitliche Methode zur Bildwiederherstellung, die durch rekurrentes Posterior-Sampling mit einem vortrainierten latenten Diffusionsmodell und multimodalen semantischen Priors verschiedene Degradationen ohne spezifisches Training bewältigt.

Huaqiu Li, Yong Wang, Tongwen Huang, Hailang Huang, Haoqian Wang, Xiangxiang Chu2026-03-10💻 cs

Query-Based Adaptive Aggregation for Multi-Dataset Joint Training Toward Universal Visual Place Recognition

Die Arbeit stellt Query-based Adaptive Aggregation (QAA) vor, eine neuartige Merkmalsaggregationsmethode, die durch lernbare Abfragen als Referenzcodebücher die Generalisierungsfähigkeit von Modellen für das universelle visuelle Ortserkennungsproblem (VPR) über mehrere Datensätze hinweg verbessert und dabei den Zustand der Technik übertrifft.

Jiuhong Xiao, Yang Zhou, Giuseppe Loianno2026-03-10💻 cs

Hybrid Diffusion Policies with Projective Geometric Algebra for Efficient Robot Manipulation Learning

Die vorgestellte Arbeit stellt hPGA-DP vor, eine hybride Diffusionsrichtlinie, die durch die Integration von Projective Geometric Algebra in die Netzarchitektur die Trainingsineffizienz herkömmlicher robotischer Lernmethoden überwindet und so eine deutlich schnellere Konvergenz sowie verbesserte Manipulationsleistung in simulierten und realen Umgebungen erreicht.

Xiatao Sun, Yuxuan Wang, Shuo Yang, Yinxing Chen, Daniel Rakita2026-03-10💻 cs

A Robust Incomplete Multimodal Low-Rank Adaptation Approach for Emotion Recognition

Die Arbeit stellt MCULoRA vor, einen neuen Parameter-effizienten Ansatz für die unvollständige multimodale Emotionserkennung, der durch die Entkopplung gemeinsamer Informationen und eine dynamische Feinabstimmung der Trainingsverhältnisse die Konflikte zwischen Gradienten verschiedener Modalitätskombinationen überwindet und damit die Vorhersagegenauigkeit signifikant verbessert.

Xinkui Zhao, Jinsong Shu, Yangyang Wu, Guanjie Cheng, Zihe Liu, Naibo Wang, Shuiguang Deng, Zhongle Xie, Jianwei Yin2026-03-10💻 cs

Unified Medical Image Segmentation with State Space Modeling Snake

Die Arbeit stellt „Mamba Snake" vor, ein neuartiges Deep-Snake-Framework, das State-Space-Modelle nutzt, um durch die Modellierung interner topologischer Beziehungen und adaptiver Konturverfeinerung die Herausforderungen der einheitlichen medizinischen Bildsegmentierung zu meistern und dabei die Leistung gegenüber aktuellen Methoden signifikant zu steigern.

Ruicheng Zhang, Haowei Guo, Kanghui Tian, Jun Zhou, Mingliang Yan, Zeyu Zhang, Shen Zhao2026-03-10💻 cs

$\pi^3$ : Permutation-Equivariant Visual Geometry Learning

Die Arbeit stellt $Ï^3$ vor, ein feed-forward neuronales Netzwerk mit vollständig permutationsäquivarianter Architektur, das durch den Verzicht auf feste Referenzansichten robustere und genauere Ergebnisse bei Aufgaben der visuellen Geometrie wie Kamerapose-Schätzung und Tiefenrekonstruktion erzielt.

Yifan Wang, Jianjun Zhou, Haoyi Zhu, Wenzheng Chang, Yang Zhou, Zizun Li, Junyi Chen, Jiangmiao Pang, Chunhua Shen, Tong He2026-03-10💻 cs

Post-Disaster Affected Area Segmentation with a Vision Transformer (ViT)-based EVAP Model using Sentinel-2 and Formosat-5 Imagery

Die Studie stellt ein auf Vision Transformern (ViT) basierendes Deep-Learning-Framework vor, das mithilfe von Sentinel-2- und Formosat-5-Bilddaten sowie einer schwach überwachten Trainingsstrategie die Segmentierung von Katastrophengebieten für das EVAP-Programm der Taiwan Space Agency verbessert und dabei die Zuverlässigkeit und räumliche Kohärenz der Ergebnisse erhöht.

Yi-Shan Chu, Hsuan-Cheng Wei2026-03-10💻 cs

Auto-scaling Approaches for Microservice Applications: A Survey and Taxonomy

Diese Arbeit bietet eine umfassende Übersicht und Taxonomie von Auto-Scaling-Ansätzen für Microservice-Anwendungen seit 2018, die fünf Dimensionen beleuchten und darauf abzielen, Ressourceneffizienz, Kosteneffizienz und SLA-Einhaltung durch service-spezifische, dependency-bewusste Strategien zu optimieren.

Minxian Xu, Junhan Liao, Linfeng Wen, Huaming Wu, Kejiang Ye, Rajkumar Buyya, Chengzhong Xu2026-03-10💻 cs

BrownoutServe: SLO-Aware Inference Serving under Bursty Workloads for MoE-based LLMs

Die Arbeit stellt BrownoutServe vor, ein neuartiges Serving-Framework für MoE-basierte LLMs, das durch die Einführung von „united experts" und einen dynamischen Brownout-Mechanismus die Inference-Effizienz unter schwankenden Lasten optimiert, den Durchsatz im Vergleich zu vLLM um das 2,07-Fache steigert und SLO-Verletzungen um 90,28 % reduziert.

Jianmin Hu, Minxian Xu, Kejiang Ye + 1 more2026-03-10💻 cs

C-Koordinator: Interference-aware Management for Large-scale and Co-located Microservice Clusters

Die Arbeit stellt C-Koordinator vor, eine von Alibaba entwickelte Open-Source-Plattform, die durch die Nutzung von CPI-basierten Interferenzvorhersagemodellen mit über 90,3 % Genauigkeit die Ressourcennutzung in großskaligen, gemeinsam genutzten Microservice-Clustern optimiert und dabei die Antwortzeiten im Vergleich zu bestehenden Systemen um 16,7 % bis 36,1 % verbessert.

Shengye Song, Minxian Xu, Zuowei Zhang + 5 more2026-03-10💻 cs

They See Me Rolling: High-Speed Event Vision-Based Tactile Roller Sensor for Large Surface Inspection

Diese Arbeit stellt einen neuartigen, rollenden taktilen Sensor vor, der eine neuromorphe Kamera mit einer ereignisbasierten 3D-Rekonstruktion kombiniert, um große Industrieflächen wie Flugzeugrümpfe bei bis zu 0,5 m/s mit einer Genauigkeit unter 100 Mikrometern elfmal schneller als bisherige kontinuierliche Methoden zu inspizieren.

Akram Khairi, Hussain Sajwani, Abdallah Mohammad Alkilany, Laith AbuAssi, Mohamad Halwani, Islam Mohamed Zaid, Ahmed Awadalla, Dewald Swart, Abdulla Ayyad, Yahya Zweiri2026-03-10💻 cs

← Zurück Weiter →

cs