cs Arbeiten | Gist.Science

Self-Supervised Multi-Modal World Model with 4D Space-Time Embedding

Die Arbeit stellt DeepEarth vor, ein selbstüberwachtes multimodales Weltmodell, das den neuartigen 4D-Raumzeit-Positionscodierer Earth4D nutzt, um durch submetergenaue und subsekundenscharfe planetare Vorhersagen über Jahrhunderte hinweg ökologische Prognosen mit State-of-the-Art-Leistung zu ermöglichen.

Lance Legel, Qin Huang, Brandon Voelker, Daniel Neamati, Patrick Alan Johnson, Favyen Bastani, Jeff Rose, James Ryan Hennessy, Robert Guralnick, Douglas Soltis, Pamela Soltis, Shaowen Wang2026-03-10💻 cs

TacDexGrasp: Compliant and Robust Dexterous Grasping with Tactile Feedback

Die Arbeit TacDexGrasp stellt einen Ansatz für robustes und nachgiebiges dexteres Greifen vor, der mittels taktiler Rückmeldung und eines auf Second-Order Cone Programming basierenden Reglers die Kraftverteilung und das Gleitverhalten ohne explizite Drehmomentmodellierung steuert.

Yubin Ke, Jiayi Chen, Hang Lv, Xiao Zhou, He Wang2026-03-10💻 cs

AIReSim: A Discrete Event Simulator for Large-scale AI Cluster Reliability Modeling

Das Paper stellt AIReSim vor, einen diskreten Ereignissimulator zur Bewertung und Optimierung von Zuverlässigkeitsstrategien, Parametern und Kapazitätsplanungen in großen KI-Clustern, um die Auswirkungen von Ausfällen und die Effizienz von Wiederherstellungsprozessen zu analysieren.

Karthik Pattabiraman, Mihir Patel, Fred Lin2026-03-10💻 cs

Fine-Grained 3D Facial Reconstruction for Micro-Expressions

Die vorgestellte Arbeit entwickelt eine neuartige Methode zur feinkörnigen 3D-Gesichtswiederherstellung von Mikroexpressionen, die durch die Integration globaler dynamischer Merkmale und lokal angereicherter Hinweise aus 2D-Bewegungen, Gesichtspriors und 3D-Geometrie die bisherige Lücke bei der Rekonstruktion subtiler, flüchtiger Gesichtsausdrücke schließt und dabei den Mangel an Trainingsdaten durch die Nutzung von Makroexpressionen-Kenntnissen überwindet.

Che Sun, Xinjie Zhang, Rui Gao, Xu Chen, Yuwei Wu, Yunde Jia2026-03-10💻 cs

Understanding User Requirements for Creating Sensor-Powered Smart Car Cabins Through Retrofitting

Diese Studie untersucht durch Interviews und partizipatives Design, wie Nachrüstlösungen die Grenzen herkömmlicher Smart-Cabin-Sensoren überwinden können, und leitet daraus konkrete Gestaltungsrichtlinien für die Entwicklung sensorbasierter intelligenter Fahrzeugkabinen ab.

Bofan Yu, Borui Li, Tingyu Zhang, Xing-Dong Yang2026-03-10💻 cs

Looking Back and Forth: Cross-Image Attention Calibration and Attentive Preference Learning for Multi-Image Hallucination Mitigation

Die Arbeit stellt CAPL vor, ein Framework zur Reduzierung von Halluzinationen in Large Vision-Language Models bei Multi-Image-Aufgaben, das durch eine kalibrierte Cross-Image-Attention und eine präferenzbasierte Lernstrategie die modellübergreifende Interaktion verbessert und die Modellierung auf echte visuelle Evidenz statt auf textuelle Priors ausrichtet.

Xiaochen Yang, Hao Fang, Jiawei Kong, Yaoxin Mao, Bin Chen, Shu-Tao Xia2026-03-10💻 cs

Communication Network-Aware Missing Data Recovery for Enhanced Distribution Grid Visibility

Diese Arbeit stellt einen kommunikationsbewussten Rahmen vor, der Routing-Beschränkungen mit einer Matrix-Vervollständigungsmethode kombiniert, um die Genauigkeit der Wiederherstellung fehlender Messdaten in Verteilungsnetzen unter Kommunikationsausfällen signifikant zu verbessern.

Biswas Rudra Jyoti Arka, Md Zahidul Islam, Yuzhang Lin, Vinod M. Vokkarane, Junbo Zhao2026-03-10💻 cs

Leveraging Large Language Models for Automated Scalable Development of Open Scientific Databases

Die vorgestellte Arbeit stellt ein skalierbares, domänenunabhängiges Web-Tool vor, das Large Language Models (LLMs) mit parallelen Suchtechniken kombiniert, um manuelle Datenbeschaffung für offene wissenschaftliche Datenbanken zu automatisieren und dabei eine hohe Übereinstimmung mit von Experten kuratierten Datensätzen zu erreichen.

Nikita Gautam, Doina Caragea, Ignacio Ciampitti, Federico Gomez2026-03-10💻 cs

Animating Petascale Time-varying Data on Commodity Hardware with LLM-assisted Scripting

Diese Arbeit stellt ein benutzerfreundliches Framework vor, das es Wissenschaftlern ermöglicht, mit Hilfe von LLM-gestützter Skripterstellung auf handelsüblicher Hardware animierte 3D-Darstellungen petaskaliger, zeitvariabler Klimadaten zu erzeugen und dabei die Abhängigkeit von spezialisierten Infrastrukturen sowie die Datenübertragungszeiten erheblich zu reduzieren.

Ishrat Jahan Eliza, Xuan Huang, Aashish Panta, Alper Sahistan, Zhimin Li, Amy A. Gooch, Valerio Pascucci2026-03-10💻 cs

Bi-directional digital twin prototype anchoring with multi-periodicity learning for few-shot fault diagnosis

Der vorgestellte Ansatz verbessert die Few-Shot-Fehlerdiagnose in industriellen Maschinen durch einen bidirektionalen Digital-Twin-Prototypen-Anker mit Multi-Periodizitäts-Lernen, der Meta-Training im virtuellen Raum und Testzeit-Anpassung im physikalischen Raum kombiniert, um auch bei extrem wenigen gelabelten Daten robuste Diagnosen zu ermöglichen.

Pengcheng Xia, Zhichao Dong, Yixiang Huang, Chengjin Qin, Qun Chao, Chengliang Liu2026-03-10💻 cs

SODA: Sensitivity-Oriented Dynamic Acceleration for Diffusion Transformer

Die Arbeit stellt SODA vor, eine Sensitivitätsorientierte, dynamische Beschleunigungsmethode für Diffusion-Transformer, die durch adaptive Caching- und Pruning-Strategien auf Basis feinkörniger Sensitivitätsmodelle eine überlegene Generierungsqualität bei kontrollierten Beschleunigungsverhältnissen erreicht.

Tong Shao, Yusen Fu, Guoying Sun, Jingde Kong, Zhuotao Tian, Jingyong Su2026-03-10💻 cs

GuideTWSI: A Diverse Tactile Walking Surface Indicator Dataset from Synthetic and Real-World Images for Blind and Low-Vision Navigation

Das Paper stellt GuideTWSI vor, einen umfassenden Datensatz für taktile Leit- und Warnsysteme, der synthetische und reale Bilder kombiniert, um die geografischen und geometrischen Beschränkungen bestehender Daten zu überwinden und so eine zuverlässige Navigation für blinde und sehbehinderte Menschen zu ermöglichen.

Hochul Hwang, Soowan Yang, Anh N. H. Nguyen, Parth Goel, Krisha Adhikari, Sunghoon I. Lee, Joydeep Biswas, Nicholas A. Giudice, Donghyun Kim2026-03-10💻 cs

A Declarative Framework for Hand-Crafted Mutation Analysis and Management

Die Autoren stellen mit Marauder ein deklaratives Framework vor, das durch die Definition einer Mutationsalgebra und eine verlustfreie Konversionspipeline die Verwaltung und Analyse handgefertigter Mutationen über verschiedene Repräsentationen hinweg vereinheitlicht und so die Effizienz sowie Ausdruckskraft von Mutationsexperimenten verbessert.

Alperen Keles2026-03-10💻 cs

MedSteer: Counterfactual Endoscopic Synthesis via Training-Free Activation Steering

Das Paper stellt MedSteer vor, ein training-freies Framework zur Erzeugung kausaler, kontrastiver endoskopischer Bildpaare durch Aktivitätssteuerung in Diffusionsmodellen, das im Vergleich zu bestehenden Methoden eine überlegene strukturelle Konsistenz und Wirksamkeit für die Datenvermehrung in der medizinischen Bildanalyse demonstriert.

Trong-Thang Pham, Loc Nguyen, Anh Nguyen, Hien Nguyen, Ngan Le2026-03-10💻 cs

Geometry and design of popup structures

Dieser Artikel entwickelt eine geometrische Beschreibung und einen Entwurfsprozess für Popup-Strukturen, die durch die Kombination von Origami und Kirigami entstehen, um maßgeschneiderte Formen mit variierender Krümmung für Anwendungen wie Strömungswiderstandsreduktion, Verpackung und Architektur zu ermöglichen.

Jay Jayeshbhai Chavda, S Ganga Prasath2026-03-10✓ Author reviewed ⓘ💻 cs

Morphology-Independent Facial Expression Imitation for Human-Face Robots

Dieses Paper stellt eine morphologieunabhängige Methode zur Gesichtsausdrucksimulation für humanoide Roboter vor, die durch die Entkopplung von Ausdruckssemantik und Gesichtsform sowie den Einsatz eines speziell entwickelten Roboters namens Pengrui realistischere und morphologieunabhängige Imitationen ermöglicht.

Xu Chen, Rui Gao, Che Sun, Zhehang Liu, Yuwei Wu, Shuo Yang, Yunde Jia2026-03-10💻 cs

User Review Writing via Interview with Dialogue Systems

Diese Studie stellt ein neuartiges System vor, das mittels GPT-4-gestützter Dialoge mit Nutzern detaillierte Produktbewertungen erstellt, die von Lesern als hilfreicher empfunden werden und weniger Nachbearbeitung erfordern als menschlich verfasste Texte.

Yoshiki Tanaka, Michimasa Inaba2026-03-10💻 cs

VirtueBench: Evaluating Trustworthiness under Uncertainty in Long Video Understanding

Die Studie stellt VirtueBench vor, einen neuen Benchmark, der die Zuverlässigkeit von Vision-Language-Modellen bei der Analyse langer Videos bewertet, indem sie deren Fähigkeit misst, unter Unsicherheit ehrlich zu verweigern, anstatt raten, um so irreführende Evaluierungsergebnisse zu vermeiden.

Xueqing Yu, Bohan Li, Yan Li, Zhenheng Yang2026-03-10💻 cs

Physics-Guided VLM Priors for All-Cloud Removal

Die vorgestellte Methode PhyVLM-CR integriert semantisches Wissen aus Vision-Language-Modellen in physikalische Restaurierungsmodelle, um eine einheitliche und hochpräzise Entfernung sowohl dünner als auch dicker Wolken aus optischen Fernerkundungsdaten zu ermöglichen, ohne dass eine explizite Trennung der Wolkenarten erforderlich ist.

Liying Xu, Huifang Li, Huanfeng Shen2026-03-10💻 cs

Retinex Meets Language: A Physics-Semantics-Guided Underwater Image Enhancement Network

Die Studie stellt PSG-UIENet vor, ein neuartiges Unterwasser-Bildverbesserungsnetzwerk, das physikalische Retinex-Prinzipien mit semantischen Textführungen durch CLIP kombiniert und dabei einen neuen multimodalen Datensatz sowie eine spezielle Verlustfunktion einführt, um die Generalisierungsfähigkeit und semantische Konsistenz zu verbessern.

Shixuan Xu, Yabo Liu, Junyu Dong, Xinghui Dong2026-03-10💻 cs

← Zurück Weiter →