cs Arbeiten | Gist.Science

LangSurf: Language-Embedded Surface Gaussians for 3D Scene Understanding

Der Artikel stellt LangSurf vor, eine Methode, die durch eine gemeinsame Trainingsstrategie und ein hierarchisches Kontextbewusstseinsmodul präzise sprachbasierte 3D-Segmentierung und -Bearbeitung ermöglicht, indem sie Sprach-Gaussians exakt mit den Objektoberflächen ausrichtet und so die Grenzen bestehender Ansätze wie LangSplat überwindet.

Hao Li, Minghan Qin, Zhengyu Zou, Diqi He, Xinhao Ji, Bohan Li, Bingquan Dai, Dingewn Zhang, Junwei Han2026-03-10💻 cs

A Deep Learning-Based Method for Power System Resilience Evaluation

Diese Arbeit stellt ein Deep-Learning-Framework vor, das historische Ausfall- und Wetterdaten nutzt, um die Resilienz von Stromnetzen auf Ereignisebene zu prognostizieren und damit gezielte Investitionen in verteilte Energiequellen zur Stärkung besonders gefährdeter Regionen zu ermöglichen.

Xuesong Wang, Caisheng Wang2026-03-10💻 cs

IoT Firmware Version Identification Using Transfer Learning with Twin Neural Networks

Diese Studie stellt eine Methode zur Identifizierung von IoT-Firmware-Versionen mittels Transferlernen und Twin Neural Networks vor, die durch die Analyse von Paketfluss-Statistiken als Graustufenbilder Versionenänderungen mit hoher Genauigkeit erkennt und dabei nur geringe Trainingsdaten benötigt.

Ashley Andrews, George Oikonomou, Simon Armour + 2 more2026-03-10💻 cs

The Impact of AI-Driven Tools on Student Writing Development: A Case Study From The CGScholar AI Helper Project

Diese Fallstudie untersucht die positiven Auswirkungen des KI-gestützten CGScholar AI Helper auf die Schreibentwicklung von elften Klassen-Schülern in einem einkommensschwachen Umfeld und liefert gleichzeitig Verbesserungsvorschläge für das noch in Entwicklung befindliche Tool.

Raigul Zheldibayeva, Ana Karina de Oliveira Nascimento, Vania Castro + 2 more2026-03-10💻 cs

Taint Analysis for Graph APIs Focusing on Broken Access Control

Die Autoren stellen einen systematischen Ansatz zur statischen und dynamischen Taint-Analyse von Graph-APIs vor, der mithilfe von Graphtransformation und kritischer Paaranalyse Broken Access Control-Schwachstellen identifiziert und durch Anwendung auf die GitHub GraphQL-API sowohl unzulässige Zugriffe als auch ungerechtfertigte Zugriffsbeschränkungen aufdeckt.

Leen Lambers, Lucas Sakizloglou, Taisiya Khakharova, Fernando Orejas2026-03-10💻 cs

MAP-based Problem-Agnostic diffusion model for Inverse Problems

Die Autoren stellen ein problemagnostisches, auf dem Maximum-a-Posteriori-Prinzip basiertes Diffusionsmodell vor, das durch die Schätzung eines geführten Terms unbedingte vortrainierte Modelle für inverse Bildprobleme wie Super-Resolution und Inpainting verbessert und dabei die strukturelle Kohärenz der Ergebnisse signifikant erhöht.

Pingping Tao, Haixia Liu, Jing Su2026-03-10💻 cs

VL-Nav: A Neuro-Symbolic Approach for Reasoning-based Vision-Language Navigation

Das Paper stellt VL-Nav vor, ein neuro-symbolisches System, das neuronale Schlussfolgerungen mit symbolischer Führung kombiniert, um autonome Roboter bei der Navigation in komplexen, unbekannten Umgebungen basierend auf abstrakten Sprachanweisungen zu ermöglichen und dabei hohe Erfolgsraten in Simulationen und realen Tests zu erzielen.

Yi Du, Taimeng Fu, Zhipeng Zhao, Shaoshu Su, Zitong Zhan, Zhuoqun Chen, Bowen Li, Chen Wang2026-03-10💻 cs

SoK: "Interoperability vs Security" Arguments: A Technical Framework

Diese Arbeit entwickelt ein technisches Rahmenwerk und eine Taxonomie, um die in EU-Wettbewerbsverfahren häufig vorgebrachten Sicherheitsbedenken gegen Interoperabilitätsforderungen systematisch zu analysieren und kritisch zu bewerten.

Daji Landis, Elettra Bietti, Sunoo Park2026-03-10💻 cs

Prompt-SID: Learning Structural Representation Prompt via Latent Diffusion for Single-Image Denoising

Die Arbeit stellt Prompt-SID vor, ein selbstüberwachtes Framework für die Einzelbild-Denoising, das mittels latenten Diffusionsprozessen strukturelle Prompts generiert und über einen Transformer-basierten Aufmerksamkeitsmechanismus integriert, um strukturelle Details zu bewahren und die Effizienz gegenüber bestehenden blind-spot-basierten Methoden zu steigern.

Huaqiu Li, Wang Zhang, Xiaowan Hu, Tao Jiang, Zikang Chen, Haoqian Wang2026-03-10💻 cs

Who is Responsible? The Data, Models, Users or Regulations? A Comprehensive Survey on Responsible Generative AI for a Sustainable Future

Diese umfassende PRISMA-gestützte Übersicht analysiert 232 Studien zu verantwortungsvoller generativer KI, identifiziert Lücken in aktuellen Sicherheitsbenchmarks und regulatorischen Abdeckungen sowie in der Evaluierung dynamischer Agentensysteme und schlägt einen strukturierten Forschungsrahmen mit neuen Metriken und Richtlinien vor, um die Entwicklung sicherer und rechenschaftspflichtiger KI-Systeme für eine nachhaltige Zukunft zu gewährleisten.

Shaina Raza, Rizwan Qureshi, Anam Zahid + 14 more2026-03-10💻 cs

Subclass Classification of Gliomas Using MRI Fusion Technique

Diese Studie stellt einen Algorithmus vor, der durch die Fusion von segmentierten T1-, T2-, T1ce- und FLAIR-MRT-Bildern mittels UNET und gewichteter Durchschnittsbildung sowie deren Klassifizierung mit einem ResNet50-Modell eine Genauigkeit von 99,25 % bei der Untergruppenklassifizierung von Gliomen erreicht.

Kiranmayee Janardhan, Christy Bobby Thomas2026-03-10💻 cs

Deep Learning-Based Approach for Automatic 2D and 3D MRI Segmentation of Gliomas

Diese Studie stellt einen tiefenlernbasierten Ansatz vor, der auf UNET-, Inception- und ResNet-Architekturen aufbaut, um durch eine ausgewogene Kombination von 2D- und 3D-Faltungsschichten eine automatisierte und präzise Gliom-Segmentierung in MRT-Bildern zu ermöglichen, wobei das ResNet-Modell auf den BraTS-Datensätzen mit einer 3D-Dice-Bewertung von 0,9888 die besten Ergebnisse erzielte.

Kiranmayee Janardhan, Christy Bobby T2026-03-10💻 cs

Pricing for Routing and Flow-Control in Payment Channel Networks

Die Arbeit stellt DEBT control vor, ein Protokoll für Routing und Flusskontrolle in Zahlungsnetzwerken, das durch preisbasierte Mechanismen und Gradientenabstieg eine optimale Betriebszustandskonvergenz für stabile Nachfragemuster gewährleistet.

Suryanarayana Sankagiri, Bruce Hajek2026-03-10💻 cs

Diffusion Stabilizer Policy for Automated Surgical Robot Manipulations

Die vorgestellte Arbeit stellt die Diffusion Stabilizer Policy (DSP) vor, ein zweistufiges Lernframework für chirurgische Roboter, das durch den Einsatz von Diffusionsmodellen und einem Filtermechanismus für Aktionsvorhersagefehler erfolgreich auch mit unvollkommenen oder gestörten Demonstrationsdaten trainiert werden kann.

Chonlam Ho, Jianshu Hu, Lei Song, Hesheng Wang, Qi Dou, Yutong Ban2026-03-10💻 cs

Parallelized Planning-Acting for Efficient LLM-based Multi-Agent Systems in Minecraft

Diese Arbeit stellt ein neuartiges, paralleles Planungs-Aktions-Framework für LLM-basierte Multi-Agenten-Systeme in Minecraft vor, das durch eine duale Thread-Architektur mit unterbrechbarer Ausführung die bisherige sequenzielle Beschränkung überwindet und so eine Echtzeit-Reaktionsfähigkeit in dynamischen Umgebungen ermöglicht.

Yaoru Li, Shunyu Liu, Tongya Zheng, Li Sun, Mingli Song2026-03-10💻 cs

Enhancing Alzheimer's Diagnosis: Leveraging Anatomical Landmarks in Graph Convolutional Neural Networks on Tetrahedral Meshes

Die vorgestellte Arbeit verbessert die Alzheimer-Diagnose und die Vorhersage von Amyloid-Positivität bei Mittelrisiko-Patienten durch ein skalierbares, auf Transformer-Architekturen basierendes geometrisches Deep-Learning-Modell, das Tetraedermeshes mit anatomischen Landmarken verarbeitet und damit teure PET-Scans teilweise ersetzt.

Yanxi Chen, Mohammad Farazi, Zhangsihao Yang, Yonghui Fan, Nicholas Ashton, Eric M Reiman, Yi Su, Yalin Wang2026-03-10💻 cs

ViLAM: Distilling Vision-Language Reasoning into Attention Maps for Social Robot Navigation

Das Paper stellt ViLAM vor, eine Methode, die durch Wissensdistillation von großen Vision-Sprach-Modellen in räumliche Aufmerksamkeitskarten soziale Navigationsfähigkeiten in Roboter integriert und damit die Erfolgswahrscheinlichkeit bei der sozialen Roboternavigation im Vergleich zu bestehenden Methoden um 14,2 % bis 50 % steigert.

Mohamed Elnoor, Kasun Weerakoon, Gershom Seneviratne, Jing Liang, Vignesh Rajagopal, Dinesh Manocha2026-03-10💻 cs

Snapmoji: Instant Generation of Animatable Dual-Stylized Avatars

Die Arbeit stellt Snapmoji vor, ein System zur sofortigen Generierung animierbarer 3D-Avatare aus Selfies, das durch eine neuartige Gaußsche Domänenanpassung und einen Dual-Stylisierungsprozess die Identität des Nutzers bewahrt und eine effiziente mobile Darstellung ermöglicht.

Eric M. Chen, Di Liu, Sizhuo Ma, Michael Vasilkovsky, Bing Zhou, Qiang Gao, Wenzhou Wang, Jiahao Luo, Dimitris N. Metaxas, Vincent Sitzmann, Jian Wang2026-03-10💻 cs

Engineering Systems for Data Analysis Using Interactive Structured Inductive Programming

Das Paper stellt iProg vor, ein Werkzeug für interaktives strukturiertes induktives Programmieren, das durch eine zweistufige Kollaboration zwischen Mensch und KI (Zerlegung in Datenflussdiagramme und Codegenerierung) unter Nutzung eines Intelligibilitätsprotokolls wissenschaftliche Datenanalysesysteme schneller, qualitativ hochwertiger und zuverlässiger entwickelt als herkömmliche Low-Code- oder No-Code-Ansätze.

Shraddha Surana, Ashwin Srinivasan, Michael Bain2026-03-10💻 cs

SceneEval: Evaluating Semantic Coherence in Text-Conditioned 3D Indoor Scene Synthesis

Die Arbeit stellt SceneEval vor, ein Evaluierungsframework mit einem neuen Benchmark und feinkörnigen Metriken, das die semantische Kohärenz und Plausibilität textbasiert generierter 3D-Innenszenen umfassend bewertet und dabei sowohl explizite Benutzeranforderungen als auch implizite Erwartungen wie Stabilität und Navigierbarkeit berücksichtigt.

Hou In Ivan Tam, Hou In Derek Pun, Austin T. Wang, Angel X. Chang, Manolis Savva2026-03-10💻 cs

← Zurück Weiter →