M3^3-ACE: Rectifying Visual Perception in Multimodal Math Reasoning via Multi-Agentic Context Engineering

Die Arbeit stellt M³-ACE vor, ein Multi-Agenten-Framework, das durch die Entkopplung von Wahrnehmung und Schlussfolgerung sowie den Einsatz spezieller Werkzeuge zur Zusammenfassung und Verfeinerung visuelle Wahrnehmungsfehler in der multimodalen mathematischen Reasoning korrigiert und damit neue State-of-the-Art-Ergebnisse auf Benchmarks wie MathVision erzielt.

Peijin Xie, Zhen Xu, Bingquan Liu, Baoxun Wang2026-03-10💻 cs

A Hierarchical Error-Corrective Graph Framework for Autonomous Agents with LLM-Based Action Generation

Die vorgestellte Arbeit stellt das hierarchische, fehlerkorrigierende Graph-Framework HECG vor, das autonome Agenten durch die Integration multidimensionaler Transferstrategien, eine strukturierte Fehlerklassifizierung und kausal-kontextbasierte Graph-Retrieval-Verfahren befähigt, Aufgaben präziser zu lösen und Fehler systematisch zu korrigieren.

Cong Cao, Jingyao Zhang, Kun Tong2026-03-10💻 cs

Revealing Behavioral Plasticity in Large Language Models: A Token-Conditional Perspective

Die Arbeit stellt das Token-Conditioned Reinforcement Learning (ToCoRL)-Framework vor, das die inhärente Verhaltensplastizität von Large Language Models durch token-bedingte Generierung und Verstärkungslernen nutzt, um präzise Verhaltensanpassungen ohne Kapazitätsverlust zu ermöglichen, wie etwa die Umwandlung von rechenintensiven Modellen in effiziente Faktenfragesteller.

Liyuan Mao, Le Yu, Jing Zhou, Chujie Zheng, Bowen Yu, Chang Gao, Shixuan Liu, An Yang, Weinan Zhang, JunYang Lin2026-03-10🤖 cs.LG

Efficient Policy Learning with Hybrid Evaluation-Based Genetic Programming for Uncertain Agile Earth Observation Satellite Scheduling

Diese Arbeit stellt einen hybriden, bewertungsbasierten genetischen Programmierungsansatz (HE-GP) vor, der durch die dynamische Kombination von exakten und approximativen Evaluierungsmodi die Rechenkosten bei der Lösung des Unsicherheitsproblems der agile Erdbeobachtungssatellitenplanung signifikant senkt und gleichzeitig eine überlegene Planungsleistung im Vergleich zu herkömmlichen Methoden erzielt.

Junhua Xue, Yuning Chen2026-03-10💻 cs

A prospective clinical feasibility study of a conversational diagnostic AI in an ambulatory primary care clinic

Diese prospektive Machbarkeitsstudie zeigt, dass ein konversationsbasiertes KI-System (AMIE) in einer realen ambulanten Umgebung sicher eingesetzt werden kann, von Patienten und Ärzten positiv bewertet wird und in Bezug auf Diagnosequalität und Behandlungspläne mit Hausärzten vergleichbar ist, wenngleich diese bei der praktischen Umsetzbarkeit und Kosteneffizienz überlegen sind.

Peter Brodeur, Jacob M. Koshy, Anil Palepu, Khaled Saab, Ava Homiar, Roma Ruparel, Charles Wu, Ryutaro Tanno, Joseph Xu, Amy Wang, David Stutz, Hannah M. Ferrera, David Barrett, Lindsey Crowley, Jihyeon Lee, Spencer E. Rittner, Ellery Wulczyn, Selena K. Zhang, Elahe Vedadi, Christine G. Kohn, Kavita Kulkarni, Vinay Kadiyala, Sara Mahdavi, Wendy Du, Jessica Williams, David Feinbloom, Renee Wong, Tao Tu, Petar Sirkovic, Alessio Orlandi, Christopher Semturs, Yun Liu, Juraj Gottweis, Dale R. Webster, Joëlle Barral, Katherine Chou, Pushmeet Kohli, Avinatan Hassidim, Yossi Matias, James Manyika, Rob Fields, Jonathan X. Li, Marc L. Cohen, Vivek Natarajan, Mike Schaekermann, Alan Karthikesalingam, Adam Rodman2026-03-10🤖 cs.LG

LycheeCluster: Efficient Long-Context Inference with Structure-Aware Chunking and Hierarchical KV Indexing

LycheeCluster ist eine neuartige Methode zur effizienten Verwaltung des KV-Caches bei Large Language Models, die durch semantisch bewusste Chunking und hierarchische Indizierung die lineare Suchkomplexität in logarithmische Zeit umwandelt und damit eine bis zu 3,6-fache Beschleunigung der Inferenz bei minimalen Leistungseinbußen ermöglicht.

Dongfang Li, Zixuan Liu, Gang Lin, Baotian Hu, Min Zhang2026-03-10🤖 cs.LG