cs.AI Arbeiten | Gist.Science

GTR-Turbo: Merged Checkpoint is Secretly a Free Teacher for Agentic VLM Training

Das Paper stellt GTR-Turbo vor, eine effiziente Methode zum Training agenter Vision-Language-Modelle, die durch das Zusammenführen von Checkpoints während des Reinforcement-Learning-Prozesses einen kostenlosen Lehrer nutzt, um die Abhängigkeit von teuren Modellen zu beseitigen und gleichzeitig die Genauigkeit zu steigern sowie Trainingszeit und Kosten zu senken.

Tong Wei, Yijun Yang, Changhao Zhang, Junliang Xing, Yuanchun Shi, Zongqing Lu, Deheng Ye2026-03-12🤖 cs.AI

Pretrained battery transformer (PBT): A foundation model for universal battery life prediction

Die Studie stellt den „Pretrained Battery Transformer" (PBT) als ersten universellen Grundmodell für die Vorhersage der Batterielebensdauer vor, der durch den Einsatz von wissenscodierten Mixture-of-Experts-Schichten auf heterogenen Daten trainiert wird und damit den aktuellen Stand der Technik bei der Lebensdauervorhersage verschiedener Batterietypen deutlich übertrifft.

Ruifeng Tan, Weixiang Hong, Jia Li, Jiaqiang Huang, Tong-Yi Zhang2026-03-12🤖 cs.LG

Enhancing Tree Species Classification: Insights from YOLOv8 and Explainable AI Applied to TLS Point Cloud Projections

Diese Studie zeigt, dass ein mit YOLOv8 trainiertes Modell zur Klassifizierung von sieben europäischen Baumarten mittels TLS-Punktwolken eine hohe Genauigkeit von 96 % erreicht und durch den Einsatz von Finer-CAM nachweislich auf strukturelle Merkmale wie Kronen und Stämme für die interpretierbare Entscheidungsfindung zurückgreift.

Adrian Straker, Paul Magdon, Marco Zullich, Maximilian Freudenberg, Christoph Kleinn, Johannes Breidenbach, Stefano Puliti, Nils Noelke2026-03-12🤖 cs.AI

The Bayesian Geometry of Transformer Attention

Die Studie zeigt, dass Transformer-Modelle in kontrollierten „Bayesian Wind Tunnels" durch eine spezifische geometrische Mechanik, bei der Attention-Module als Routing und Feed-Forward-Netze als Posterior-Updates fungieren, exakte Bayes'sche Inferenz durchführen, was ihre Überlegenheit gegenüber flachen Architekturen erklärt.

Naman Agarwal, Siddhartha R. Dalal, Vishal Misra2026-03-12📊 stat

Gradient Dynamics of Attention: How Cross-Entropy Sculpts Bayesian Manifolds

Diese Arbeit zeigt, dass die Gradientendynamik des Cross-Entropy-Trainings in Transformer-Aufmerksamkeitsköpfen durch einen gekoppelten Spezialisationsmechanismus, der einem Zwei-Zeitskalen-EM-Verfahren ähnelt, die interne Geometrie so formt, dass Bayessche Inferenzmanifolde entstehen, welche probabilisches Schlussfolgern im Kontext ermöglichen.

Naman Agarwal, Siddhartha R. Dalal, Vishal Misra2026-03-12📊 stat

Geometric Scaling of Bayesian Inference in LLMs

Die Studie zeigt, dass moderne Sprachmodelle die geometrische Struktur aufweisen, die für die bayessche Inferenz notwendig ist, und dass eine gezielte Manipulation dieser Struktur die Unsicherheitsrepräsentation stört, ohne jedoch eine proportionale Verschlechterung des bayesschen Verhaltens zu verursachen, was darauf hindeutet, dass diese Geometrie eher ein privilegiertes Lesesystem als ein einzelner rechnerischer Engpass ist.

Naman Agarwal, Siddhartha R. Dalal, Vishal Misra2026-03-12🤖 cs.LG

Over-Searching in Search-Augmented Large Language Models

Diese Arbeit untersucht das Problem des übermäßigen Suchens in suchaugmentierten Large Language Models, führt mit „Tokens Per Correctness" eine neue Metrik zur Bewertung des Kosten-Nutzen-Verhältnisses ein und stellt den OverSearchQA-Datensatz sowie Lösungsansätze vor, um die Effizienz und Genauigkeit dieser Systeme zu verbessern.

Roy Xie, Deepak Gopinath, David Qiu, Dong Lin, Haitian Sun, Saloni Potdar, Bhuwan Dhingra2026-03-12🤖 cs.LG

Burn-After-Use for Preventing Data Leakage through a Secure Multi-Tenant Architecture in Enterprise LLM

Diese Studie stellt eine sichere Multi-Tenant-Architektur (SMTA) in Kombination mit einem neuartigen „Burn-After-Use"-Mechanismus vor, der durch strikte Isolation und automatische Vernichtung von Kontextdaten nach der Nutzung das Risiko von Datenlecks in unternehmensinternen LLM-Umgebungen effektiv minimiert.

Qiang Zhang, Elena Emma Wang, Jiaming Li, Xichun Wang2026-03-12🤖 cs.AI

Beyond Max Tokens: Stealthy Resource Amplification via Tool Calling Chains in LLM Agents

Diese Arbeit stellt einen neuen, schwer erkennbaren Denial-of-Service-Angriff auf LLM-Agenten vor, der durch manipulierte Tool-Aufrufketten im Rahmen des Model Context Protocol (MCP) die Kosten und den Ressourcenverbrauch um ein Vielfaches erhöht, ohne dass herkömmliche Filter dies erkennen.

Kaiyu Zhou, Yongsen Zheng, Yicheng He, Meng Xue, Xueluan Gong, Yuji Wang, Xuanye Zhang, Kwok-Yan Lam2026-03-12🤖 cs.AI

Learning Transferable Skills in Action RPGs via Directed Skill Graphs and Selective Adaptation

Diese Arbeit stellt einen Ansatz vor, bei dem ein Agent durch die Zerlegung des Kampfes in einen gerichteten Skill-Graphen mit fünf spezialisierten Fähigkeiten in der realen Zeitsteuerung von Dark Souls III lernfähig wird, was die Probeneffizienz steigert und eine selektive Nachjustierung nur betroffener Fähigkeiten bei Umweltveränderungen ermöglicht.

Ali Najar2026-03-12🤖 cs.AI

MemOCR: Layout-Aware Visual Memory for Efficient Long-Horizon Reasoning

MemOCR ist ein multimodales Agentensystem, das durch die Umwandlung strukturierter Textmemorien in layoutbewusste Bilder und den Einsatz von Reinforcement Learning die Effizienz des langfristigen Schlussfolgerns unter strengen Kontextbudgets signifikant verbessert.

Yaorui Shi, Shugui Liu, Yu Yang, Wenyu Mao, Yuxin Chen, Qi GU, Hui Su, Xunliang Cai, Xiang Wang, An Zhang2026-03-12🤖 cs.AI

MHDash: An Online Platform for Benchmarking Mental Health-Aware AI Assistants

Die Autoren stellen MHDash, eine Open-Source-Plattform vor, die eine feinkörnige, risikobewusste Evaluierung von KI-Assistenten im Bereich der psychischen Gesundheit ermöglicht und dabei aufzeigt, dass herkömmliche Benchmarks für sicherheitskritische Anwendungen unzureichend sind.

Yihe Zhang, Cheyenne N Mohawk, Kaiying Han + 3 more2026-03-12🤖 cs.AI

Hallucination is a Consequence of Space-Optimality: A Rate-Distortion Theorem for Membership Testing

Die Arbeit zeigt, dass Halluzinationen in großen Sprachmodellen eine unvermeidbare Konsequenz der informationstheoretisch optimalen Speichereffizienz bei begrenzter Kapazität sind, da der Zwang zur verlustbehafteten Kompression von Fakten dazu führt, dass auch nicht-zutreffende Aussagen mit hoher Wahrscheinlichkeit bewertet werden.

Anxin Guo, Jingwei Li2026-03-12💬 cs.CL

Evaluating Long-Horizon Memory for Multi-Party Collaborative Dialogues

Die Arbeit stellt EverMemBench vor, den ersten Benchmark zur Evaluierung des Langzeitgedächtnisses von LLMs in realistischen, mehrparteilichen Kollaborationsszenarien, der fundamentale Defizite aktueller Systeme bei der Attribution, zeitlichen Reasoning und kontextuellen Erinnerungsauffrischung aufdeckt.

Chuanrui Hu, Tong Li, Xingze Gao, Hongda Chen, Yi Bai, Dannong Xu, Tianwei Lin, Xiaohong Li, Yunyun Han, Jian Pei, Yafeng Deng2026-03-12💬 cs.CL

Moving On, Even When You're Broken: Fail-Active Trajectory Generation via Diffusion Policies Conditioned on Embodiment and Task

Die Arbeit stellt DEFT vor, einen auf Diffusionsmodellen basierenden Trajektoriengenerator, der Robotern ermöglicht, Aufgaben auch bei beliebigen Aktuatorausfällen erfolgreich abzuschließen und dabei klassische Methoden in Simulation und Realwelt deutlich zu übertreffen.

Gilberto G. Briscoe-Martinez, Yaashia Gautam, Rahul Shetty, Anuj Pasricha, Marco M. Nicotra, Alessandro Roncone2026-03-12🤖 cs.AI

DMS2F-HAD: A Dual-branch Mamba-based Spatial-Spectral Fusion Network for Hyperspectral Anomaly Detection

Die Arbeit stellt DMS2F-HAD vor, ein neuartiges dual-branch Mamba-basiertes Netzwerk zur hyperspektralen Anomalieerkennung, das durch die effiziente Fusion räumlicher und spektraler Merkmale sowohl einen neuen State-of-the-Art bei der Genauigkeit (98,78 % AUC) als auch eine signifikant höhere Inferenzgeschwindigkeit im Vergleich zu bestehenden Deep-Learning-Methoden erreicht.

Aayushma Pant, Lakpa Tamang, Tsz-Kwan Lee + 1 more2026-03-12🤖 cs.AI

Long Chain-of-Thought Compression via Fine-Grained Group Policy Optimization

Die Arbeit stellt Fine-grained Group Policy Optimization (FGO) vor, einen Reinforcement-Learning-Algorithmus, der als effiziente Weiterentwicklung von GRPO übermäßige Chain-of-Thought-Verläufe in großen Sprachmodellen komprimiert und dabei gleichzeitig die Probleme der ineffizienten Datennutzung sowie des Entropie-Kollapses löst, ohne die Leistungsfähigkeit zu beeinträchtigen.

Xinchen Han, Hossam Afifi, Michel Marot, Xilu Wang, Lu Yin2026-03-12🤖 cs.LG

UniWeTok: An Unified Binary Tokenizer with Codebook Size $\mathit{2^{128}}$ for Unified Multimodal Large Language Model

Die Arbeit stellt UniWeTok vor, einen einheitlichen binären Tokenizer mit einem riesigen Codebook der Größe $2^{128}$ und einem innovativen Trainingsframework, der in Unified Multimodal Large Language Models sowohl hochpräzise Bildrekonstruktion als auch überlegene Generationsfähigkeiten bei deutlich geringerem Rechenaufwand ermöglicht.

Shaobin Zhuang, Yuang Ai, Jiaming Han, Weijia Mao, Xiaohui Li, Fangyikang Wang, Xiao Wang, Yan Li, Shanchuan Lin, Kun Xu, Zhenheng Yang, Huaibo Huang, Xiangyu Yue, Hao Chen, Yali Wang2026-03-12🤖 cs.AI

TikArt: Stabilizing Aperture-Guided Fine-Grained Visual Reasoning with Reinforcement Learning

Der Artikel stellt TikArt vor, ein mit Reinforcement Learning trainiertes Agenten-Modell, das durch einen Think–Aperture–Observe-Zyklus mit Zoom- und Segmentierungsfunktionen sowie einem stabilisierenden Belohnungssignal die feingranulare visuelle Schlussfolgerung in multimodalen Sprachmodellen verbessert.

Hao Ding, Zhichuan Yang, Weijie Ge, Ziqin Gao, Chaoyi Lu, Lei Zhao2026-03-12🤖 cs.AI

GOT-JEPA: Generic Object Tracking with Model Adaptation and Occlusion Handling using Joint-Embedding Predictive Architecture

Die Arbeit stellt GOT-JEPA vor, ein Framework zur Vorhersage von Tracking-Modellen mittels Joint-Embedding Predictive Architecture, das in Kombination mit dem OccuSolver-Modul die Generalisierungsfähigkeit und die Verarbeitungsleistung bei Verdeckungen in der generischen Objektverfolgung signifikant verbessert.

Shih-Fang Chen, Jun-Cheng Chen, I-Hong Jhuo, Yen-Yu Lin2026-03-12🤖 cs.AI

← Zurück Weiter →

cs.AI