cs Arbeiten | Gist.Science

DOPD: A Dynamic PD-Disaggregation Architecture for Maximizing Goodput in LLM Inference Serving

Das Paper stellt DOPD vor, ein dynamisches System zur Entkopplung von Prefill- und Decoding-Phasen bei LLM-Inferenz, das durch lastabhängige Ressourcenanpassung und optimierte Scheduling-Strategien die Systemeffizienz und die Einhaltung von Service-Level-Zielen im Vergleich zu bestehenden Ansätzen wie vLLM und DistServe signifikant verbessert.

Junhan Liao, Minxian Xu, Wanyi Zheng, Yan Wang, Kejiang Ye, Rajkumar Buyya, Chengzhong Xu2026-03-10💻 cs

Sublinear Edge Fault Tolerant Spanners for Hypergraphs

Diese Arbeit initiiert die Untersuchung von fehlertoleranten Spannern in Hypergraphen, indem sie einen effizienten Clustering-basierten Algorithmus für sublineare EFT-Hyperspanner vorstellt und eine untere Schranke für deren Größe etabliert.

Jialin He, Nicholas Popescu, Chunjiang Zhu2026-03-10💻 cs

An LLM-Assisted Multi-Agent Control Framework for Roll-to-Roll Manufacturing Systems

Diese Arbeit stellt ein von einem Large Language Model unterstütztes Multi-Agenten-Framework vor, das den Entwurf und die Anpassung von Regelsystemen für Roll-zu-Roll-Fertigungsanlagen automatisiert, um durch iterative Simulation-zu-Realität-Adaption und Sicherheitsverifikation die Produktqualität zu gewährleisten und den manuellen Aufwand für die Inbetriebnahme zu reduzieren.

Jiachen Li, Shihao Li, Christopher Martin, Zijun Chen, Dongmei Chen, Wei Li2026-03-10💻 cs

RadDiff: Retrieval-Augmented Denoising Diffusion for Protein Inverse Folding

Die Arbeit stellt RadDiff vor, eine neuartige Methode für das inverse Proteinfalten, die durch eine retrieval-augmentierte Denoising-Diffusion externe Proteinwissen effizient integriert und damit bestehende Ansätze in Bezug auf Sequenzwiederherstellungsrate und Skalierbarkeit deutlich übertrifft.

Jin Han, Tianfan Fu, Wu-Jun Li2026-03-10💻 cs

Integrating a Causal Foundation Model into a Prescriptive Maintenance Framework for Optimising Production-Line OEE

Diese Arbeit stellt einen Ansatz vor, der einen kausalen Foundation-Modell in ein präskriptives Wartungsframework integriert, um durch die Simulation von „Was-wäre-wenn"-Szenarien auf Produktionslinien die Ursachen von Ausfällen zu identifizieren und die Gesamtanlageneffektivität (OEE) durch datengestützte Handlungsempfehlungen zu optimieren.

Felix Saretzky, Lucas Andersen, Thomas Engel, Fazel Ansari2026-03-10💻 cs

S2AM3D: Scale-controllable Part Segmentation of 3D Point Cloud

Die Arbeit stellt S2AM3D vor, ein skalierbares Verfahren zur Partsegmentierung von 3D-Punktwolken, das durch die Kombination von 2D-Segmentierungsprioritäten mit 3D-konsistentem Lernen und einem neuen großen Datensatz robuste und granularitätssteuerbare Ergebnisse erzielt.

Han Su, Tianyu Huang, Zichen Wan, Xiaohe Wu, Wangmeng Zuo2026-03-10💻 cs

Confidential, Attestable, and Efficient Inter-CVM Communication with Arm CCA

Die Arbeit stellt CAEC vor, ein System, das auf der Arm Confidential Compute Architecture (CCA) aufbaut und durch die Einführung von vertraulichem gemeinsam genutztem Speicher (CSM) eine effiziente, attesterbare und isolierte Datenübertragung zwischen Confidential Virtual Machines ermöglicht, ohne dass die Hypervisor-Ebene Zugriff hat.

Sina Abdollahi, Amir Al Sadi, Marios Kogias, David Kotz, Hamed Haddadi2026-03-10💻 cs

HiconAgent: History Context-aware Policy Optimization for GUI Agents

HiconAgent ist ein GUI-Agent, der durch History Context-aware Policy Optimization (HCPO) mit dynamischer Kontextauswahl und ankergeführter Historienkomprimierung historische Informationen effizient nutzt und dabei trotz geringerer Modellgröße die Leistung führender Modelle übertrifft.

Xurui Zhou, Gongwei Chen, Yuquan Xie, Zaijing Li, Kaiwen Zhou, Shuai Wang, Shuo Yang, Zhuotao Tian, Rui Shao2026-03-10💻 cs

MAViD: A Multimodal Framework for Audio-Visual Dialogue Understanding and Generation

Die Arbeit stellt MAViD vor, ein multimodales Framework mit einer Conductor-Creator-Architektur, das durch die Kombination von autoregressiven und Diffusionsmodellen sowie einem neuartigen Fusionsmodul realistische, langandauernde und multimodal konsistente Audio-Visual-Dialoge versteht und generiert.

Youxin Pang, Jiajun Liu, Lingfeng Tan, Yong Zhang, Feng Gao, Xiang Deng, Zhuoliang Kang, Xiaoming Wei, Yebin Liu2026-03-10💻 cs

When Token Pruning is Worse than Random: Understanding Visual Token Information in VLLMs

Diese Arbeit identifiziert das Phänomen des „Informationshorizonts", bei dem visuelle Token in tieferen Schichten von Vision Large Language Models ihre Relevanz verlieren, und zeigt, dass eine gezielte Kombination aus existierenden Pruning-Methoden und zufälliger Token-Entfernung in diesen tiefen Schichten die Effizienz steigert, ohne die Leistung signifikant zu beeinträchtigen.

Yahong Wang, Juncheng Wu, Zhangkai Ni, Longzhen Yang, Yihang Liu, Chengmei Yang, Ying Wen, Lianghua He, Xianfeng Tang, Hui Liu, Yuyin Zhou2026-03-10💻 cs

IPPO Learns the Game, Not the Team: A Study on Generalization in Heterogeneous Agent Teams

Die Studie zeigt, dass der IPPO-Baselines in heterogenen Multi-Agenten-Settings trotz fehlender Vielfalt im Training eine Generalisierungsfähigkeit auf neue Teammitglieder zukommt, die mit komplexeren Methoden wie dem vorgeschlagenen Rotating Policy Training (RPT) vergleichbar ist.

Ryan LeRoy, Jack Kolb2026-03-10💻 cs

Beyond Endpoints: Path-Centric Reasoning for Vectorized Off-Road Network Extraction

Diese Arbeit stellt den WildRoad-Datensatz und das path-zentrische MaGRoad-Framework vor, um die Herausforderungen der Vektorisierung von Straßen in unwegsamem Gelände zu lösen und dabei sowohl die Genauigkeit als auch die Inferenzgeschwindigkeit im Vergleich zu bestehenden Methoden zu verbessern.

Wenfei Guan, Jilin Mei, Tong Shen, Xumin Wu, Shuo Wang, Chen Min, Yu Hu2026-03-10💻 cs

ReMeDI: Refined Memory for Disambiguation of Identities with SAM3 in Surgical Segmentation

Die Arbeit stellt ReMeDI-SAM3 vor, eine trainingsfreie Erweiterung von SAM3, die durch relevante Speicherfilterung, eine stückweise Interpolationsschema und ein identitätsbasiertes Re-Identifikationsmodul die Segmentierung chirurgischer Instrumente in Endoskopievideos auch bei Okklusionen und langen Unterbrechungen signifikant verbessert.

Valay Bundele, Mehran Hosseinzadeh, Hendrik P. A. Lensch2026-03-10💻 cs

It is not always greener on the other side: Greenery perception across demographics and personalities in multiple cities

Diese Studie zeigt, dass die Diskrepanz zwischen objektiv gemessener und subjektiv wahrgenommener städtischer Vegetation weltweit ähnlich ist und weniger von demografischen oder persönlichen Faktoren abhängt, sondern maßgeblich vom Wohnort der Betrachter geprägt wird, was kulturelle und erfahrungsbasierte Einflüsse auf die Grünwahrnehmung unterstreicht.

Matias Quintana, Fangqi Liu, Jussi Torkko, Youlong Gu, Xiucheng Liang, Yujun Hou, Koichi Ito, Yihan Zhu, Mahmoud Abdelrahman, Tuuli Toivonen, Yi Lu, Filip Biljecki2026-03-10💻 cs

VOIC: Visible-Occluded Integrated Guidance for 3D Semantic Scene Completion

Die Arbeit stellt VOIC vor, ein neuartiges Dual-Decoder-Framework für die monokulare 3D-semantische Szenenkompletion, das durch eine explizite Trennung von sichtbaren und verdeckten Regionen sowie eine integrierte Interaktion zwischen diesen die Genauigkeit bei der geometrischen Vervollständigung und semantischen Segmentierung in autonomen Fahrszenen signifikant verbessert.

Zaidao Han, Risa Higashita, Jiang Liu2026-03-10💻 cs

Cost Trade-offs of Reasoning and Non-Reasoning Large Language Models in Text-to-SQL

Diese Studie zeigt, dass bei Text-zu-SQL-Anwendungen in der Cloud Reasoning-Modelle trotz ähnlicher Genauigkeit signifikant kosteneffizienter sind als nicht-reasoning-Modelle, da die herkömmliche Optimierung nach Ausführungszeit nicht mit den tatsächlichen Verbrauchsgebühren korreliert und nicht-reasoning-Modelle durch ineffiziente Abfragen zu extremen Kostenvarianzen führen können.

Saurabh Deochake, Debajyoti Mukhopadhyay2026-03-10💻 cs

NashOpt -- A Python Library for Computing Generalized Nash Equilibria

NashOpt ist eine Open-Source-Python-Bibliothek, die unter Verwendung von JAX für automatische Differentiation und gemischt-ganzzahliger linearer Programmierung effizient verallgemeinerte Nash-Gleichgewichte in nichtkooperativen Spielen mit gemeinsamen Nebenbedingungen berechnet und auch inverse sowie Stackelberg-Spiele entwirft.

Alberto Bemporad2026-03-10💻 cs

Toward a Physical Theory of Intelligence

Das vorgestellte Conservation-Congruent-Encoding (CCE)-Framework stellt ein substratneutrales physikalisches Modell dar, das Intelligenz als irreversiblen Informationsprozess beschreibt und durch die Verknüpfung von thermodynamischer Dissipation, Quantenmessung und Raumzeit-Geometrie fundamentale Grenzen für natürliche und künstliche Intelligenz ableitet.

Peter David Fagan2026-03-10💻 cs

DrivingGen: A Comprehensive Benchmark for Generative Video World Models in Autonomous Driving

Das Paper stellt DrivingGen vor, den ersten umfassenden Benchmark für generative Weltmodelle im autonomen Fahren, der durch eine diverse Datensammlung und neue Metriken die Bewertung von visueller Realitätsnähe, Trajektorienplausibilität, zeitlicher Kohärenz und Steuerbarkeit ermöglicht, um die Entwicklung zuverlässiger und einsatzfähiger Simulationswerkzeuge zu fördern.

Yang Zhou, Hao Shao, Letian Wang, Zhuofan Zong, Hongsheng Li, Steven L. Waslander2026-03-10💻 cs

Machine Learning Guided Cooling System Optimization for Data Center

Diese Arbeit stellt ein dreistufiges, physikgestütztes maschinelles Lernframework vor, das auf Daten des Frontier-Exascale-Supercomputers basiert, um durch die Identifizierung von Ineffizienzen und die Berechnung sicherer Gegenmaßnahmen den Energieverbrauch der Kühlsysteme in Rechenzentren signifikant zu senken.

Shrenik Jadhav, Zheng Liu2026-03-10💻 cs

← Zurück Weiter →