cs Arbeiten | Gist.Science

A Declarative Framework for Hand-Crafted Mutation Analysis and Management

Die Autoren stellen mit Marauder ein deklaratives Framework vor, das durch die Definition einer Mutationsalgebra und eine verlustfreie Konversionspipeline die Verwaltung und Analyse handgefertigter Mutationen über verschiedene Repräsentationen hinweg vereinheitlicht und so die Effizienz sowie Ausdruckskraft von Mutationsexperimenten verbessert.

Alperen Keles2026-03-10💻 cs

MedSteer: Counterfactual Endoscopic Synthesis via Training-Free Activation Steering

Das Paper stellt MedSteer vor, ein training-freies Framework zur Erzeugung kausaler, kontrastiver endoskopischer Bildpaare durch Aktivitätssteuerung in Diffusionsmodellen, das im Vergleich zu bestehenden Methoden eine überlegene strukturelle Konsistenz und Wirksamkeit für die Datenvermehrung in der medizinischen Bildanalyse demonstriert.

Trong-Thang Pham, Loc Nguyen, Anh Nguyen, Hien Nguyen, Ngan Le2026-03-10💻 cs

Geometry and design of popup structures

Dieser Artikel entwickelt eine geometrische Beschreibung und einen Entwurfsprozess für Popup-Strukturen, die durch die Kombination von Origami und Kirigami entstehen, um maßgeschneiderte Formen mit variierender Krümmung für Anwendungen wie Strömungswiderstandsreduktion, Verpackung und Architektur zu ermöglichen.

Jay Jayeshbhai Chavda, S Ganga Prasath2026-03-10✓ Author reviewed ⓘ💻 cs

Morphology-Independent Facial Expression Imitation for Human-Face Robots

Dieses Paper stellt eine morphologieunabhängige Methode zur Gesichtsausdrucksimulation für humanoide Roboter vor, die durch die Entkopplung von Ausdruckssemantik und Gesichtsform sowie den Einsatz eines speziell entwickelten Roboters namens Pengrui realistischere und morphologieunabhängige Imitationen ermöglicht.

Xu Chen, Rui Gao, Che Sun, Zhehang Liu, Yuwei Wu, Shuo Yang, Yunde Jia2026-03-10💻 cs

User Review Writing via Interview with Dialogue Systems

Diese Studie stellt ein neuartiges System vor, das mittels GPT-4-gestützter Dialoge mit Nutzern detaillierte Produktbewertungen erstellt, die von Lesern als hilfreicher empfunden werden und weniger Nachbearbeitung erfordern als menschlich verfasste Texte.

Yoshiki Tanaka, Michimasa Inaba2026-03-10💻 cs

VirtueBench: Evaluating Trustworthiness under Uncertainty in Long Video Understanding

Die Studie stellt VirtueBench vor, einen neuen Benchmark, der die Zuverlässigkeit von Vision-Language-Modellen bei der Analyse langer Videos bewertet, indem sie deren Fähigkeit misst, unter Unsicherheit ehrlich zu verweigern, anstatt raten, um so irreführende Evaluierungsergebnisse zu vermeiden.

Xueqing Yu, Bohan Li, Yan Li, Zhenheng Yang2026-03-10💻 cs

Physics-Guided VLM Priors for All-Cloud Removal

Die vorgestellte Methode PhyVLM-CR integriert semantisches Wissen aus Vision-Language-Modellen in physikalische Restaurierungsmodelle, um eine einheitliche und hochpräzise Entfernung sowohl dünner als auch dicker Wolken aus optischen Fernerkundungsdaten zu ermöglichen, ohne dass eine explizite Trennung der Wolkenarten erforderlich ist.

Liying Xu, Huifang Li, Huanfeng Shen2026-03-10💻 cs

Retinex Meets Language: A Physics-Semantics-Guided Underwater Image Enhancement Network

Die Studie stellt PSG-UIENet vor, ein neuartiges Unterwasser-Bildverbesserungsnetzwerk, das physikalische Retinex-Prinzipien mit semantischen Textführungen durch CLIP kombiniert und dabei einen neuen multimodalen Datensatz sowie eine spezielle Verlustfunktion einführt, um die Generalisierungsfähigkeit und semantische Konsistenz zu verbessern.

Shixuan Xu, Yabo Liu, Junyu Dong, Xinghui Dong2026-03-10💻 cs

Aligning What EEG Can See: Structural Representations for Brain-Vision Matching

Die vorgestellte Arbeit verbessert die visuelle Dekodierung aus EEG-Signalen durch die Einführung des Konzepts der „Neural Visibility" und einer hierarchischen Fusionsstrategie, die eine bessere Abstimmung zwischen Gehirnaktivität und visuellen Merkmalen ermöglicht und damit neue State-of-the-Art-Ergebnisse auf dem THINGS-EEG-Datensatz erzielt.

Jingyi Tang, Shuai Jiang, Fei Su, Zhicheng Zhao2026-03-10💻 cs

Multi-TAP: Multi-criteria Target Adaptive Persona Modeling for Cross-Domain Recommendation

Das Paper stellt Multi-TAP vor, ein neuartiges Framework für die cross-domain-Empfehlung, das durch semantisches Persona-Modelling und zieladaptive Übertragung von Quell-Daten die Heterogenität von Nutzerpräferenzen erfasst und so die Leistung bestehender Methoden übertrifft.

Daehee Kang, Yeon-Chang Lee2026-03-10💻 cs

mAVE: A Watermark for Joint Audio-Visual Generation Models

Die Arbeit stellt mAVE vor, ein neuartiges Wasserzeichen-Verfahren für gemeinsame Audio-Visual-Generierungsmodelle, das durch kryptografische Verschränkung der latenten Räume von Audio und Video eine robuste Abwehr gegen Swap-Angriffe gewährleistet und dabei die Modellleistung vollständig erhält.

Luyang Si, Leyi Pan, Lijie Wen2026-03-10💻 cs

Exploring the Reasoning Depth of Small Language Models in Software Architecture: A Multidimensional Evaluation Framework Towards Software Engineering 2.0

Diese Studie stellt einen multidimensionalen Evaluierungsrahmen vor, der zeigt, dass zwar Small Language Models unter 3 Milliarden Parametern für die Generierung von Architekturentscheidungen stark von Fine-Tuning profitieren, jedoch erst Modelle oberhalb dieser Schwelle robuste Zero-Shot-Fähigkeiten aufweisen und eine hohe semantische Vielfalt oft mit Halluzinationen einhergeht.

Ha Vo, Nhut Tran, Khang Vo, Phat T. Tran-Truong, Son Ha2026-03-10💻 cs

Facial Expression Generation Aligned with Human Preference for Natural Dyadic Interaction

Die Autoren stellen eine Methode vor, die durch die Kombination von überwachtem Fine-Tuning eines Vision-Language-Action-Modells und einer menschlichen Feedback-Reinforcement-Learning-Strategie natürliche, kontextangepasste Gesichtsausdrücke für dyadische Interaktionen erzeugt, die menschlichen Präferenzen entsprechen.

Xu Chen, Rui Gao, Xinjie Zhang, Haoyu Zhang, Che Sun, Zhi Gao, Yuwei Wu, Yunde Jia2026-03-10💻 cs

Randomise Alone, Reach as a Team

Diese Arbeit untersucht kooperative Graphspiele mit verteiltem Zufall, bei denen Spieler keine gemeinsame Zufallsquelle teilen, und zeigt, dass für das Schwellenwertproblem memoryless Strategien ausreichen, während das fast-sichere Erreichbarkeitsproblem NP-vollständig ist, was zur Entwicklung der Logik IRATL und eines entsprechenden Löser-Algorithmus führt.

Léonard Brice, Thomas A. Henzinger, Alipasha Montaseri, Ali Shafiee, K. S. Thejaswini2026-03-10💻 cs

ACLM: ADMM-Based Distributed Model Predictive Control for Collaborative Loco-Manipulation

Diese Arbeit stellt einen auf dem ADMM-Verfahren basierenden verteilten modellprädiktiven Regelungsansatz vor, der die kollaborative Fortbewegung und Manipulation schwerer Lasten durch ein Team von Laufrobotern mit Manipulatoren in komplexen Umgebungen durch effiziente Zerlegung des globalen Optimierungsproblems in parallele Teilprobleme ermöglicht.

Ziyi Zhou, Pengyuan Shu, Ruize Cao, Yuntian Zhao, Ye Zhao2026-03-10💻 cs

Towards Scalable Probabilistic Human Motion Prediction with Gaussian Processes for Safe Human-Robot Collaboration

Die vorgestellte Arbeit präsentiert einen skalierbaren, probabilistischen Ansatz zur Vorhersage menschlicher Bewegungen mittels strukturierter Multi-Task-Variations-Gaußscher Prozesse, der auf dem Human3.6M-Datensatz eine hohe Genauigkeit bei gleichzeitig zuverlässiger Unsicherheitsquantifizierung und effizientem Ressourceneinsatz für den Echtzeit-Einsatz in der sicheren Mensch-Roboter-Kollaboration erreicht.

Jinger Chong, Xiaotong Zhang, Kamal Youcef-Toumi2026-03-10💻 cs

NuNext: Reframing Nucleus Detection as Next-Point Detection

Der Artikel stellt NuNext vor, eine neue Methode, die die Nukleusdetektion in der Histopathologie durch Umformulierung als Next-Point-Detektion mittels eines multimodalen Large Language Models mit zweistufigem Training (überwachtes Lernen mit räumlich bewusster weicher Supervision und Verstärkungslernen) löst und dabei bestehende Probleme wie komplexe Nachverarbeitung und Klassenungleichgewicht überwindet.

Zhongyi Shui, Honglin Li, Xiaozhong Ji, Ye Zhang, Zijiang Yang, Chenglu Zhu, Yuxuan Sun, Kai Yao, Conghui He, Cheng Tan2026-03-10💻 cs

Grounding Machine Creativity in Game Design Knowledge Representations: Empirical Probing of LLM-Based Executable Synthesis of Goal Playable Patterns under Structural Constraints

Diese Studie untersucht, ob große Sprachmodelle in der Lage sind, unter Berücksichtigung von Strukturkonstrukten des Unity-Engines und auf Basis von Ziel-spielbaren Mustern (Goal Playable Patterns) spielbare Spiele zu synthetisieren, und identifiziert dabei insbesondere Probleme der semantischen Verankerung und Code-Hygiene als Hauptengpässe für den Erfolg.

Hugh Xuechen Liu, Kıvanç Tatar2026-03-10💻 cs

AutoUE: Automated Generation of 3D Games in Unreal Engine via Multi-Agent Systems

Das Paper stellt AutoUE vor, ein Multi-Agenten-System, das mithilfe von Retrieval-Augmented Generation und automatisierten Testpipelines komplexe 3D-Spiele in Unreal Engine end-to-end generiert und dabei Tool-Halluzinationen minimiert sowie die Code-Robustheit sicherstellt.

Lei Yin, Wentao Cheng, Zhida Qin, Tianyu Huang, Yidong Li, Gangyi Ding2026-03-10💻 cs

Efficient Personalized Reranking with Semi-Autoregressive Generation and Online Knowledge Distillation

Die Arbeit stellt den PSAD-Framework vor, der durch eine semi-autoregressive Generierung, Online-Wissensdestillation und ein Benutzerprofil-Netzwerk sowohl die Effizienz als auch die Leistung personalisierter Reranking-Modelle in Empfehlungssystemen verbessert.

Kai Cheng, Hao Wang, Wei Guo, Weiwen Liu, Yong Liu, Yawen Li, Enhong Chen2026-03-10💻 cs

← Zurück Weiter →