cs Arbeiten | Gist.Science

Training-free Motion Factorization for Compositional Video Generation

Dieses Paper stellt einen trainingsfreien Rahmen zur Bewegungszerlegung vor, der komplexe Bewegungen in statische, starre und nicht-starre Kategorien aufteilt und durch eine sequenzielle Planung vor der Generierung sowie modale Entkopplung eine präzise, zusammengesetzte Videogenerierung mit verschiedenen Erscheinungsformen und Bewegungen ermöglicht.

Zixuan Wang, Ziqin Zhou, Feng Chen, Duo Peng, Yixin Hu, Changsheng Li, Yinjie Lei2026-03-11💻 cs

Progressive Representation Learning for Multimodal Sentiment Analysis with Incomplete Modalities

Das Paper stellt PRLF vor, ein Framework für die multimodale Sentiment-Analyse, das durch einen adaptiven Zuverlässigkeitsschätzer und eine progressive Interaktion robust mit unvollständigen Modalitäten umgeht und dabei die Repräsentationen intakter Modalitäten schützt.

Jindi Bao, Jianjun Qian, Mengkai Yan, Jian Yang2026-03-11💻 cs

Nezha: A Key-Value Separated Distributed Store with Optimized Raft Integration

Die Arbeit stellt Nezha vor, ein verteiltes Key-Value-Speichersystem, das durch eine innovative Trennung von Schlüsseln und Werten sowie eine optimierte Raft-Integration die durch überlappende Persistenzvorgänge verursachten I/O-Overheads reduziert und dabei die Durchsatzleistung für Schreib-, Lese- und Scan-Operationen signifikant steigert, ohne die Sicherheitsgarantien von Raft zu beeinträchtigen.

Yangyang Wang, Yucong Dong, Ziqian Cheng, Zichen Xu2026-03-11💻 cs

From Verification to Amplification: Auditing Reverse Image Search as Algorithmic Gatekeeping in Visual Misinformation Fact-checking

Diese Studie zeigt durch eine systematische Prüfung der Google-Rückwärtssuche, dass algorithmisches Gatekeeping die Bekämpfung visueller Falschinformationen erschwert, indem es entlarvende Inhalte oft unter irrelevanten Ergebnissen und wiederholten Falschmeldungen versteckt und dabei ein zeitliches Qualitätsgefälle aufweist.

Cong Lin, Yifei Chen, Jiangyue Chen, Yingdan Lu, Yilang Peng, Cuihua Shen2026-03-11💻 cs

AgenticCyOps: Securing Multi-Agentic AI Integration in Enterprise Cyber Operations

Die Arbeit stellt AgenticCyOps vor, ein Sicherheitsframework für die Integration multi-agentischer KI-Systeme in Unternehmen, das durch die Identifizierung von Werkzeug-Orchestrierung und Speicher-Management als primäre Angriffsflächen sowie die Einführung von fünf defensiven Prinzipien und einer mehrschichtigen Verteidigungsarchitektur die Angriffsfläche im Vergleich zu herkömmlichen Systemen um mindestens 72 % reduziert.

Shaswata Mitra, Raj Patel, Sudip Mittal, Md Rayhanur Rahman, Shahram Rahimi2026-03-11💻 cs

Transformer-Based Multi-Region Segmentation and Radiomic Analysis of HR-pQCT Imaging

Diese Studie stellt einen vollautomatischen, auf Transformer-Architekturen basierenden Ansatz zur Segmentierung von HR-pQCT-Bildern vor, der durch die radiomische Analyse von Weichgewebestrukturen eine präzisere Osteoporose-Diagnose ermöglicht als herkömmliche Knochen-basierte Methoden.

Mohseu Rashid Subah, Mohammed Abdul Gani Zilani, Thomas L. Nickolas, Matthew R. Allen, Stuart J. Warden, Rachel K. Surowiec2026-03-11💻 cs

Rotation Equivariant Mamba for Vision Tasks

Die Arbeit stellt EQ-VMamba vor, die erste rotationsequivariante Mamba-Architektur für visuelle Aufgaben, die durch einen speziell entwickelten Cross-Scan-Mechanismus und theoretisch fundierte Äquivarianz nicht nur eine höhere Robustheit gegenüber Bildrotationen bietet, sondern auch bei überlegener oder vergleichbarer Leistung den Parameterbedarf um etwa 50 % reduziert.

Zhongchen Zhao, Qi Xie, Keyu Huang, Lei Zhang, Deyu Meng, Zongben Xu2026-03-11💻 cs

Agentic AI as a Network Control-Plane Intelligence Layer for Federated Learning over 6G

Die vorgestellte Arbeit schlägt vor, Agentic AI als intelligente Steuerungs-Schicht für 6G-Netzwerke einzusetzen, um durch spezialisierte Agenten und geschlossene Regelkreise das Zusammenspiel von Lernen und Netzwerkmanagement beim Federated Learning zu optimieren und so hohe Leistung trotz strenger Latenz- und Bandbreitenanforderungen zu gewährleisten.

Loc X. Nguyen, Ji Su Yoon, Huy Q. Le, Yu Qiao, Avi Deb Raha, Eui-Nam Huh, Nguyen H. Tran, Choong Seon Hong2026-03-11💻 cs

A PTAS for Weighted Triangle-free 2-Matching

Die Arbeit stellt einen polynomiellen Approximationsschema (PTAS) für das gewichtete triangle-freie 2-Matching-Problem vor, das auf einem einfachen lokalen Suchalgorithmus und einer nicht-trivialen Analyse basiert und damit die bisherige 2/3-Approximation verbessert.

Miguel Bosch-Calvo, Fabrizio Grandoni, Yusuke Kobayashi, Takashi Noguchi2026-03-11💻 cs

Walking on Rough Terrain with Any Number of Legs

Diese Arbeit stellt eine rechnerisch effiziente Kontrollarchitektur für Roboter mit sechs oder mehr Beinen vor, die durch segmentbasierte Zustandsmaschinen und eine Kopplung zwischen den Segmenten sowohl den festen Bodenkontakt auf unebenem Gelände als auch eine fiktive Fortbewegung bei Kontaktverlust ermöglicht und so eine Brücke zwischen Event-Kaskaden- und CPG-Steuerungen schlägt.

Zhuoyang Chen, Xinyuan Wang, Shai Revzen2026-03-11💻 cs

Modeling Trend Dynamics with Variational Neural ODEs for Information Popularity Prediction

Die Arbeit stellt VNOIP vor, eine neuartige Methode auf Basis variationaler neuronaler gewöhnlicher Differentialgleichungen mit bidirektionalen Sprung-ODEs und Aufmerksamkeitsmechanismen, die durch die explizite Modellierung kontinuierlicher Zeitdynamiken und von Trendmustern die Vorhersage der Popularität von Informationen in sozialen Netzwerken verbessert.

Yuchen Wang, Dongpeng Hou, Weikai Jing, Chao Gao, Xianghua Li, Yang Liu2026-03-11💻 cs

RTFDNet: Fusion-Decoupling for Robust RGB-T Segmentation

Das Paper stellt RTFDNet vor, einen dreizweigigen Encoder-Decoder, der durch synergistische Merkmalsfusion und entkoppelnde Regularisierung eine robuste RGB-T-Semantiksegmentierung ermöglicht, die auch bei teilweise fehlenden Sensorsignalen stabil bleibt und effiziente Einzelmodus-Inferenz erlaubt.

Kunyu Tan, Mingjian Liang2026-03-11💻 cs

SPAN-Nav: Generalized Spatial Awareness for Versatile Vision-Language Navigation

Die Arbeit stellt SPAN-Nav vor, ein end-to-end Fundamentmodell, das durch eine neuartige kompakte räumliche Repräsentation und ein CoT-ähnliches Mechanismus robustes räumliches Bewusstsein für die vielseitige vision-sprachbasierte Navigation in komplexen Umgebungen ermöglicht und dabei auf einem massiven Datensatz trainiert wurde, um in verschiedenen Szenarien state-of-the-art Ergebnisse zu erzielen.

Jiahang Liu, Tianyu Xu, Jiawei Chen, Lu Yue, Jiazhao Zhang, Zhiyong Wang, Minghan Li, Qisheng Zhao, Anqi Li, Qi Su, Zhizheng Zhang, He Wang2026-03-11💻 cs

Fast and Optimal Differentially Private Frequent-Substring Mining

Diese Arbeit stellt einen neuen $\varepsilon$ -differenziell privaten Algorithmus vor, der durch innovative Kandidatengenerierung und Suchraum-Bereinigung die bisherige quadratische Komplexität bei der frequenten Teilstring-Mining eliminiert und dabei nahezu optimale Fehlergarantien bei deutlich reduzierter Speicher- und Zeitkomplexität erreicht.

Peaker Guo, Rayne Holland, Hao Wu2026-03-11💻 cs

Optimal partition selection with Rényi differential privacy

Diese Arbeit verallgemeinert den optimalen Algorithmus für die Partitionsauswahl unter $(\varepsilon, \delta)$ -Differential Privacy auf den Rahmen der Rényi-Differential Privacy, stellt eine verbesserte Methode für den Fall mehrerer Partitionen pro Nutzer vor und zeigt auf, dass das gleichzeitige Freigeben von Partitionen und deren Häufigkeiten einen inhärenten Kostenfaktor darstellt.

Charlie Harrison, Pasin Pasin Manurangsi2026-03-11💻 cs

Progressive Split Mamba: Effective State Space Modelling for Image Restoration

Die Arbeit stellt Progressive Split-Mamba (PS-Mamba) vor, ein neuartiges, topologiebewusstes Framework auf Basis von State Space Models, das durch geometrisch konsistente Partitionierung und symmetrische Cross-Scale-Verbindungen die lokalen Strukturen und globale Kohärenz bei der Bildwiederherstellung effizient und präzise erhält.

Mohammed Hassanin, Nour Moustafa, Weijian Deng, Ibrahim Radwan2026-03-11💻 cs

Point Cloud as a Foreign Language for Multi-modal Large Language Model

Die Arbeit stellt SAGE vor, das erste End-to-End-Modell für mehrmodiale große Sprachmodelle, das rohe Punktwolken direkt ohne vortrainierte 3D-Encoder verarbeitet, indem es diese durch einen leichten Tokenizer als „Fremdsprache" in den Wortschatz des LLM integriert und durch eine semantisch ausgerichtete Präferenzoptimierung überlegene Leistung bei 3D-Fragestellungen und Recheneffizienz erzielt.

Sneha Paul, Zachary Patterson, Nizar Bouguila2026-03-11💻 cs

STONE Dataset: A Scalable Multi-Modal Surround-View 3D Traversability Dataset for Off-Road Robot Navigation

Das Paper stellt STONE vor, einen skalierbaren, multimodalen Datensatz für die Off-Road-Navigation, der durch eine vollautomatische, annotierungsfreie Pipeline 3D-Begehbarkeitskarten aus LiDAR-, Kamera- und Radardaten generiert und damit einen Benchmark für die Vorhersage von Begehbarkeit in komplexen Umgebungen schafft.

Konyul Park, Daehun Kim, Jiyong Oh, Seunghoon Yu, Junseo Park, Jaehyun Park, Hongjae Shin, Hyungchan Cho, Jungho Kim, Jun Won Choi2026-03-11💻 cs

Evaluating the Practical Effectiveness of LLM-Driven Index Tuning with Microsoft Database Tuning Advisor

Die Studie stellt fest, dass LLM-gesteuerte Indexoptimierung zwar in bestimmten Fällen die Microsoft DTA-Verfahren übertreffen und menschliche Erkenntnisse liefern kann, ihre direkte Produktionseinführung jedoch aufgrund hoher Varianz, begrenzter Integrationsvorteile und hoher Validierungskosten derzeit noch herausfordernd bleibt.

Xiaoying Wang, Wentao Wu, Vivek Narasayya, Surajit Chaudhuri2026-03-11💻 cs

Robust Spatiotemporal Motion Planning for Multi-Agent Autonomous Racing via Topological Gap Identification and Accelerated MPC

Diese Arbeit stellt einen robusten Rahmen für die räumlich-zeitliche Bewegungsplanung beim autonomen Mehr-Agenten-Rennen vor, der durch die Identifizierung topologischer Lücken mittels SGPs und einen beschleunigten MPC-Lösungsansatz mit Pseudo-Transient-Continuation-Verfahren die Manöverzeit drastisch reduziert, die Überholungsrate in dichten Szenarien erhöht und die Rechenlatenz senkt.

Mingyi Zhang, Cheng Hu, Yiqin Wang, Haotong Qin, Hongye Su, Lei Xie2026-03-11💻 cs

← Zurück Weiter →