cs.AI Arbeiten | Gist.Science

CanvasMAR: Improving Masked Autoregressive Video Prediction With Canvas

Das Paper stellt CanvasMAR vor, ein neuartiges autoregressives Videovorhersagemodell, das durch die Einführung eines globalen „Canvas"-Vorschlags und einer bewegungsbewussten Lernkurve hochqualitative Videos mit weniger Sampling-Schritten erzeugt und dabei diffusionbasierte Methoden auf Benchmarks wie Kinetics-600 konkurrenzfähig ist.

Zian Li, Muhan Zhang2026-03-09🤖 cs.AI

Just-In-Time Objectives: A General Approach for Specialized AI Interactions

Die Arbeit stellt einen Ansatz vor, bei dem durch passives Beobachten des Nutzerverhaltens sofortige, spezifische Ziele abgeleitet werden, um große Sprachmodelle dynamisch auf individuelle Aufgaben zu spezialisieren und dadurch qualitativ überlegene, maßgeschneiderte Tools sowie Antworten zu generieren.

Michelle S. Lam, Omar Shaikh, Hallie Xu, Alice Guo, Diyi Yang, Jeffrey Heer, James A. Landay, Michael S. Bernstein2026-03-09🤖 cs.AI

Think with 3D: Geometric Imagination Grounded Spatial Reasoning from Limited Views

Das Papier stellt 3DThinker vor, ein Framework, das es Vision-Language-Modellen ermöglicht, durch zweistufiges Training ohne explizite 3D-Vorwissen oder -Daten räumliches 3D-Imaginieren zu erlernen und so die räumliche Schlussfolgerung aus begrenzten Ansichten zu verbessern.

Zhangquan Chen, Manyuan Zhang, Xinlei Yu, Xufang Luo, Mingze Sun, Zihao Pan, Xiang An, Yan Feng, Peng Pei, Xunliang Cai, Ruqi Huang2026-03-09🤖 cs.AI

Automated Coding of Communication Data Using ChatGPT: Consistency Across Subgroups

Die Studie zeigt, dass ChatGPT bei der automatisierten Kodierung von Kommunikationsdaten in Bezug auf Geschlecht und ethnische Zugehörigkeit eine mit menschlichen Bewertern vergleichbare Konsistenz aufweist, was seinen Einsatz in groß angelegten Bewertungen von Zusammenarbeit und Kommunikation ermöglicht.

Jiangang Hao, Wenju Cui, Patrick Kyllonen, Emily Kerzabi2026-03-09🤖 cs.AI

Shoot First, Ask Questions Later? Building Rational Agents that Explore and Act Like People

Die Studie stellt fest, dass Sprachmodelle in strategischen Informationsbeschaffungsaufgaben oft hinter menschlichen Fähigkeiten zurückbleiben, und entwickelt darauf aufbauend Monte-Carlo-Inferenzstrategien, die inspiriert von der bayesschen experimentellen Designtheorie die Entscheidungsfindung und Genauigkeit von Agenten signifikant verbessern und sogar schwächere Modelle in der Lage versetzen, menschliche und fortschrittliche KI-Modelle zu übertreffen.

Gabriel Grand, Valerio Pepe, Jacob Andreas, Joshua B. Tenenbaum2026-03-09🤖 cs.AI

REx86: A Local Large Language Model for Assisting in x86 Assembly Reverse Engineering

Die Studie stellt REx86 vor, ein lokal ausführbares, feinabgestimmtes Large Language Model auf Basis von Qwen2.5-Coder-7B, das durch Training auf einem speziellen x86-Assembly-Datensatz die Effizienz und Genauigkeit bei der Reverse Engineering-Analyse von Binärdateien in geschützten Umgebungen signifikant verbessert.

Darrin Lea, James Ghawaly, Golden Richard + 2 more2026-03-09🤖 cs.AI

LA-MARRVEL: A Knowledge-Grounded, Language-Aware LLM Framework for Clinically Robust Rare Disease Gene Prioritization

Das Paper stellt LA-MARRVEL vor, ein wissensbasiertes und sprachbewusstes LLM-Framework, das durch strukturierte, phänotypreiche Prompt-Konstruktion die Genauigkeit der Gen-Priorisierung bei seltenen Erkrankungen signifikant verbessert und dabei klinisch robuste, nachvollziehbare Begründungen liefert.

Jaeyeon Lee, Lin Yao, Hyun-Hwan Jeong, Zhandong Liu2026-03-09🤖 cs.AI

The Persistence of Cultural Memory: Investigating Multimodal Iconicity in Diffusion Models

Diese Arbeit stellt mit dem Cultural Reference Transformation (CRT)-Metrik einen Evaluierungsrahmen vor, der die Unterscheidung zwischen der Erkennung kultureller Referenzen und ihrer visuellen Realisierung in Diffusionsmodellen ermöglicht, um so die Komplexität von Multimodalität und kulturellem Gedächtnis jenseits einfacher Reproduktion zu erfassen.

Maria-Teresa De Rosa Palmini, Eva Cetinic2026-03-09🤖 cs.AI

Diffusion Fine-Tuning via Reparameterized Policy Gradient of the Soft Q-Function

Die Arbeit stellt SQDF vor, eine neuartige KL-regulierte Reinforcement-Learning-Methode zur Feinabstimmung von Diffusionsmodellen, die durch einen reparametrisierten Policy-Gradienten der Soft-Q-Funktion sowie weitere Innovationen wie einen Diskontfaktor und einen Replay-Puffer das Problem der Reward-Überoptimierung löst und gleichzeitig hohe Zielbelohnungen mit natürlicher Vielfalt in der Bildgenerierung vereint.

Hyeongyu Kang, Jaewoo Lee, Woocheol Shin, Kiyoung Om, Jinkyoo Park2026-03-09🤖 cs.AI

XR-DT: Extended Reality-Enhanced Digital Twin for Safe Motion Planning via Human-Aware Model Predictive Path Integral Control

Diese Arbeit stellt XR-DT vor, ein Framework für Extended Reality und Digital Twins, das eine menschenbewusste Modellprädiktive Pfadintegral-Steuerung (HA-MPPI) mit einem Transformer-basierten Vorhersagemodell kombiniert, um sichere und effiziente Navigation von mobilen Robotern in gemeinsamen Arbeitsräumen zu ermöglichen.

Tianyi Wang, Jiseop Byeon, Ahmad Yehia, Yiming Xu, Jihyung Park, Tianyi Zeng, Sikai Chen, Ziran Wang, Junfeng Jiao, Christian Claudel2026-03-09🤖 cs.AI

Whatever Remains Must Be True: Filtering Drives Reasoning in LLMs, Shaping Diversity

Die Arbeit stellt eine Methode vor, die durch die Approximation einer gefilterten Zielverteilung mittels der $\alpha$ -Divergenz-Familie die durch herkömmliches Reinforcement Learning verursachte Diversitätsverlust bei LLMs überwindet und so auf dem Lean-Theorembeweis-Benchmark einen neuen State-of-the-Art in Bezug auf die Abdeckung-Präzision-Pareto-Grenze erreicht.

Germán Kruszewski, Pierre Erbacher, Jos Rozen, Marc Dymetman2026-03-09🤖 cs.AI

Exploiting Spatiotemporal Properties for Efficient Event-Driven Human Pose Estimation

Diese Arbeit stellt ein rechen-effizientes, punktcloud-basiertes Framework für die ereignisgesteuerte menschliche Pose-Schätzung vor, das durch die Ausnutzung räumlich-zeitlicher Eigenschaften von Event-Streams und spezielle Module zur zeitlichen Modellierung sowie zur Kantenverstärkung die Leistung auf dem DHP19-Datensatz im Vergleich zu bestehenden Methoden signifikant verbessert.

Haoxian Zhou, Chuanzhi Xu, Langyi Chen, Pengfei Ye, Haodong Chen, Yuk Ying Chung, Qiang Qu2026-03-09🤖 cs.AI

A-3PO: Accelerating Asynchronous LLM Training with Staleness-aware Proximal Policy Approximation

Das Paper stellt A-3PO vor, eine Methode, die den rechenintensiven zusätzlichen Vorwärtsdurchlauf bei der Decoupled PPO durch eine einfache Interpolation zur Approximation der proximalen Policy ersetzt, wodurch das asynchrone Training von Large Language Models um den Faktor 1,8 beschleunigt wird, ohne die Leistung einzubüßen.

Xiaocan Li, Shiliang Wu, Zheng Shen2026-03-09🤖 cs.AI

Data-Driven Global Sensitivity Analysis for Engineering Design Based on Individual Conditional Expectations

Diese Arbeit stellt eine neue globale Sensitivitätsanalyse vor, die auf Individual Conditional Expectation (ICE)-Kurven basiert, um die durch Mittelwertbildung bei Partial Dependence Plots (PDP) verschleierten Interaktionseffekte in datengetriebenen Ingenieurmodellen, insbesondere im Luft- und Raumfahrtbereich, präziser zu erfassen und zu quantifizieren.

Pramudita Satria Palar, Paul Saves, Rommel G. Regis, Koji Shimoyama, Shigeru Obayashi, Nicolas Verstaevel, Joseph Morlier2026-03-09🤖 cs.AI

Understanding and Improving Hyperbolic Deep Reinforcement Learning

Die Arbeit identifiziert Optimierungsprobleme bei hyperbolischem Deep Reinforcement Learning, die durch große Embedding-Normen verursacht werden, und stellt Hyper++ vor, einen stabilen und effizienten Agenten mit Regularisierung, kategorischem Value-Loss und optimierten Netzwerkschichten, der auf ProcGen und Atari-5 signifikant bessere Ergebnisse als vorherige Ansätze erzielt.

Timo Klein, Thomas Lang, Andrii Shkabrii, Alexander Sturm, Kevin Sidak, Lukas Miklautz, Claudia Plant, Yllka Velaj, Sebastian Tschiatschek2026-03-09🤖 cs.AI

Agent Tools Orchestration Leaks More: Dataset, Benchmark, and Mitigation

Diese Arbeit identifiziert und analysiert das neuartige Risiko der „Tools Orchestration Privacy Risk" (TOP-R), bei dem autonome Agenten durch die Kombination nicht-sensitiver Datenfragmente sensible Informationen ableiten, und stellt mit TOP-Bench, dem H-Score sowie wirksamen Minderungsstrategien einen systematischen Rahmen zur Bewertung und Lösung dieses Problems bereit.

Yuxuan Qiao, Dongqin Liu, Hongchang Yang, Wei Zhou, Songlin Hu2026-03-09🤖 cs.AI

CASA: Cross-Attention over Self-Attention for Efficient Vision-Language Fusion

Das Paper CASA stellt eine effiziente Vision-Language-Architektur vor, die durch die Wiedereinführung und Optimierung von Cross-Attention-Mechanismen anstelle von Token-Einfügung eine signifikante Reduzierung von Speicher- und Rechenaufwand bei gleichzeitig hoher Leistung, insbesondere für Echtzeit-Videoanwendungen, ermöglicht.

Moritz Böhle, Amélie Royer, Juliette Marrie, Edouard Grave, Patrick Pérez2026-03-09🤖 cs.AI

CARE What Fails: Contrastive Anchored-REflection for Verifiable Multimodal

Die Arbeit stellt CARE vor, ein post-training-Framework für multimodales Reasoning, das durch einen kontrastiven, fehlerzentrierten Ansatz und eine selbstkorrigierende Neusampling-Strategie (RGR) aus gescheiterten Rollouts lernbare Signale gewinnt und so die Genauigkeit und Trainingsstabilität im Vergleich zu GRPO signifikant verbessert.

Yongxin Wang, Zhicheng Yang, Meng Cao, Mingfei Han, Haokun Lin, Yingying Zhu, Xiaojun Chang, Xiaodan Liang2026-03-09🤖 cs.AI

LLMTM: Benchmarking and Optimizing LLMs for Temporal Motif Analysis in Dynamic Graphs

Die Arbeit stellt den Benchmark LLMTM vor, um die Leistung von Large Language Models bei der Analyse temporaler Motive in dynamischen Graphen zu evaluieren, und entwickelt darauf aufbauend einen kosteneffizienten, strukturbewussten Dispatcher, der die Genauigkeit eines teuren Tool-Agenten mit der Effizienz direkter Prompting-Methoden intelligent kombiniert.

Bing Hao, Minglai Shao, Zengyi Wo, Yunlong Chu, Yuhang Liu, Ruijie Wang2026-03-09🤖 cs.AI

Window-based Membership Inference Attacks Against Fine-tuned Large Language Models

Die vorgestellte Arbeit führt die Window-Based Comparison (WBC)-Methode ein, die durch die Analyse lokaler Kontextfenster anstelle globaler Durchschnitte die Wirksamkeit von Membership-Inference-Angriffen auf feinabgestimmte Large Language Models erheblich steigert und damit signifikante Datenschutzlücken aufdeckt.

Yuetian Chen, Yuntao Du, Kaiyuan Zhang, Ashish Kundu, Charles Fleming, Bruno Ribeiro, Ninghui Li2026-03-09🤖 cs.AI

← Zurück Weiter →