cs.AI Arbeiten | Gist.Science

Agentic Neurosymbolic Collaboration for Mathematical Discovery: A Case Study in Combinatorial Design

Diese Studie demonstriert, wie eine neurosymbolische Zusammenarbeit zwischen einem KI-Agenten, symbolischen Werkzeugen und menschlicher strategischer Führung zu einer neuen, formal in Lean 4 verifizierten unteren Schranke für das Ungleichgewicht lateinischer Quadrate im Fall $n \equiv 1 \pmod{3}$ führte.

Hai Xia, Carla P. Gomes, Bart Selman, Stefan Szeider2026-03-10🔢 math

EndoSERV: A Vision-based Endoluminal Robot Navigation System

Das Paper stellt EndoSERV vor, ein neuartiges, vision-basiertes Navigationssystem für endoluminale Roboter, das durch eine Segment-zu-Struktur- und Real-zu-Virtual-Mapping-Strategie sowie Transferlernen die präzise Lokalisierung in komplexen, deformierbaren anatomischen Umgebungen ohne reale Pose-Labels ermöglicht.

Junyang Wu, Fangfang Xie, Minghui Zhang, Hanxiao Zhang, Jiayuan Sun, Yun Gu, Guang-Zhong Yang2026-03-10💻 cs

SPD-RAG: Sub-Agent Per Document Retrieval-Augmented Generation

Das Paper stellt SPD-RAG vor, ein hierarchisches Multi-Agenten-Framework, das komplexe Fragen über viele Dokumente hinweg durch eine spezialisierte, pro Dokument arbeitende Agentenarchitektur und eine zentrale Synthese effizienter und kostengünstiger beantwortet als herkömmliche RAG- oder Long-Context-LLM-Ansätze.

Yagiz Can Akay, Muhammed Yusuf Kartal, Esra Alparslan, Faruk Ortakoyluoglu, Arda Akpinar2026-03-10💬 cs.CL

Detecting Fake Reviewer Groups in Dynamic Networks: An Adaptive Graph Learning Method

Die vorgestellte Arbeit stellt DS-DGA-GCN vor, ein adaptives Graph-Lernmodell, das durch die Kombination von Netzwerk-Feature-Scoring und einem dynamischen Graph-Attention-Mechanismus organisierte Gruppen von Fake-Bewertern in dynamischen Netzwerken, insbesondere bei kalten Start-Szenarien, effektiv erkennt.

Jing Zhang, Ke Huang, Yao Zhang, Bin Guo, Zhiwen Yu2026-03-10💻 cs

Electrocardiogram Classification with Transformers Using Koopman and Wavelet Features

Diese Studie zeigt, dass Transformer-Modelle in Kombination mit Koopman-Operator-Features, die durch Extended Dynamic Mode Decomposition mit einem optimierten Radial-Basis-Funktions-Wörterbuch extrahiert werden, bei der vierklassigen EKG-Klassifizierung eine überlegene Leistung erzielen und dynamische Systemtheorie effektiv in die Zeitreihenanalyse integrieren.

Sucheta Ghosh, Zahra Monfared2026-03-10🤖 cs.LG

Towards plausibility in time series counterfactual explanations

Die vorgestellte Arbeit entwickelt eine neue Methode zur Generierung plausibler Gegenbeispiel-Erklärungen für Zeitreihenklassifikation, die durch gradientenbasierte Optimierung und eine soft-DTW-basierte Plausibilitätskomponente realistischere zeitliche Strukturen erzeugt als bestehende Ansätze.

Marcin Kostrzewa, Krzysztof Galus, Maciej Zi\k{e}ba2026-03-10🤖 cs.LG

Computational modeling of early language learning from acoustic speech and audiovisual input without linguistic priors

Dieser Beitrag fasst zusammen, wie selbstüberwachte und visuell verankerte Rechenmodelle zeigen, dass frühes Spracherlernen ohne starke linguistische Vorerfahrungen durch gemeinsame Lernprinzipien erklärt werden kann, die mit verschiedenen Theorien der Sprachentwicklung vereinbar sind.

Okko Räsänen2026-03-10💬 cs.CL

M $^3$ -ACE: Rectifying Visual Perception in Multimodal Math Reasoning via Multi-Agentic Context Engineering

Die Arbeit stellt M³-ACE vor, ein Multi-Agenten-Framework, das durch die Entkopplung von Wahrnehmung und Schlussfolgerung sowie den Einsatz spezieller Werkzeuge zur Zusammenfassung und Verfeinerung visuelle Wahrnehmungsfehler in der multimodalen mathematischen Reasoning korrigiert und damit neue State-of-the-Art-Ergebnisse auf Benchmarks wie MathVision erzielt.

Peijin Xie, Zhen Xu, Bingquan Liu, Baoxun Wang2026-03-10💻 cs

A Hierarchical Error-Corrective Graph Framework for Autonomous Agents with LLM-Based Action Generation

Die vorgestellte Arbeit stellt das hierarchische, fehlerkorrigierende Graph-Framework HECG vor, das autonome Agenten durch die Integration multidimensionaler Transferstrategien, eine strukturierte Fehlerklassifizierung und kausal-kontextbasierte Graph-Retrieval-Verfahren befähigt, Aufgaben präziser zu lösen und Fehler systematisch zu korrigieren.

Cong Cao, Jingyao Zhang, Kun Tong2026-03-10💻 cs

Revealing Behavioral Plasticity in Large Language Models: A Token-Conditional Perspective

Die Arbeit stellt das Token-Conditioned Reinforcement Learning (ToCoRL)-Framework vor, das die inhärente Verhaltensplastizität von Large Language Models durch token-bedingte Generierung und Verstärkungslernen nutzt, um präzise Verhaltensanpassungen ohne Kapazitätsverlust zu ermöglichen, wie etwa die Umwandlung von rechenintensiven Modellen in effiziente Faktenfragesteller.

Liyuan Mao, Le Yu, Jing Zhou, Chujie Zheng, Bowen Yu, Chang Gao, Shixuan Liu, An Yang, Weinan Zhang, JunYang Lin2026-03-10🤖 cs.LG

A Recipe for Stable Offline Multi-agent Reinforcement Learning

Die Arbeit analysiert die Instabilität nicht-linearer Wertzerlegung im Offline-Multi-Agenten-Reinforcement-Learning und schlägt eine skalierungsinvariante Wertnormalisierung vor, um ein stabiles Training zu ermöglichen und eine praktische Anleitung für den erfolgreichen Einsatz dieses Paradigmas zu entwickeln.

Dongsu Lee, Daehee Lee, Amy Zhang2026-03-10🤖 cs.LG

Aligning to Illusions: Choice Blindness in Human and AI Feedback

Die Studie zeigt, dass sowohl menschliche als auch KI-gestützte Feedback-Präferenzen durch Choice Blindness und kontextuelle Manipulationen verzerrt werden, was zu einer unentdeckten Degradierung von RLHF-Modellen führt, da die zugrundeliegenden Signale nicht stabil sind und von oberflächlichen Mustern statt echter Selbstüberwachung abhängen.

Wenbin Wu2026-03-10💬 cs.CL

Geometrically Constrained Outlier Synthesis

Die Arbeit stellt GCOS vor, einen Trainingsregularisierungsansatz, der durch die geometrisch kontrollierte Synthese von Ausreißern im Merkmalsraum die Robustheit von neuronalen Netzen gegenüber Out-of-Distribution-Daten verbessert und gleichzeitig eine konforme Inferenz mit formalen Fehlergarantien ermöglicht.

Daniil Karzanov, Marcin Detyniecki2026-03-10🤖 cs.LG

Human-Aware Robot Behaviour in Self-Driving Labs

Diese Studie stellt ein KI-gestütztes Wahrnehmungssystem für mobile Roboterchemiker in selbstfahrenden Laboren vor, das durch eine hierarchische Vorhersage menschlicher Absichten eine proaktive Interaktion und effizientere Koordination im gemeinsamen Betrieb mit Menschen ermöglicht.

Satheeshkumar Veeramani, Anna Kisil, Abigail Bentley, Hatem Fakhruldeen, Gabriella Pizzuto, Andrew I. Cooper2026-03-10💻 cs

SYNAPSE: Framework for Neuron Analysis and Perturbation in Sequence Encoding

Das Paper stellt SYNAPSE vor, ein systematisches, trainingsfreies Framework zur Analyse und gezielten Störung neuronaler Aktivität in Transformer-Modellen, das durch die Identifizierung redundanter Repräsentationen und spezifischer Schwachstellen die Robustheit und Interpretierbarkeit von KI-Systemen verbessert.

Jesús Sánchez Ochoa, Enrique Tomás Martínez Beltrán, Alberto Huertas Celdrán2026-03-10🤖 cs.LG

IronEngine: Towards General AI Assistant

Der Artikel stellt IronEngine vor, eine umfassende KI-Assistentenplattform mit einem einheitlichen Orchestrierungskern, die durch einen dreistufigen Planungs- und Ausführungsprozess, eine adaptive Modellverwaltung und eine robuste Werkzeugintegration eine zuverlässige Automatisierung für allgemeine Aufgaben ermöglicht.

Xi Mo2026-03-10🤖 cs.LG

One Model Is Enough: Native Retrieval Embeddings from LLM Agent Hidden States

Die vorgestellte Methode eliminiert die Notwendigkeit separater Embedding-Modelle für LLM-Agenten, indem sie einen leichten Projektionskopf verwendet, um versteckte Zustände direkt in den Embedding-Raum zu projizieren, und erreicht dabei 97 % der ursprünglichen Suchqualität.

Bo Jiang2026-03-10💬 cs.CL

Efficient Policy Learning with Hybrid Evaluation-Based Genetic Programming for Uncertain Agile Earth Observation Satellite Scheduling

Diese Arbeit stellt einen hybriden, bewertungsbasierten genetischen Programmierungsansatz (HE-GP) vor, der durch die dynamische Kombination von exakten und approximativen Evaluierungsmodi die Rechenkosten bei der Lösung des Unsicherheitsproblems der agile Erdbeobachtungssatellitenplanung signifikant senkt und gleichzeitig eine überlegene Planungsleistung im Vergleich zu herkömmlichen Methoden erzielt.

Junhua Xue, Yuning Chen2026-03-10💻 cs

A prospective clinical feasibility study of a conversational diagnostic AI in an ambulatory primary care clinic

Diese prospektive Machbarkeitsstudie zeigt, dass ein konversationsbasiertes KI-System (AMIE) in einer realen ambulanten Umgebung sicher eingesetzt werden kann, von Patienten und Ärzten positiv bewertet wird und in Bezug auf Diagnosequalität und Behandlungspläne mit Hausärzten vergleichbar ist, wenngleich diese bei der praktischen Umsetzbarkeit und Kosteneffizienz überlegen sind.

Peter Brodeur, Jacob M. Koshy, Anil Palepu, Khaled Saab, Ava Homiar, Roma Ruparel, Charles Wu, Ryutaro Tanno, Joseph Xu, Amy Wang, David Stutz, Hannah M. Ferrera, David Barrett, Lindsey Crowley, Jihyeon Lee, Spencer E. Rittner, Ellery Wulczyn, Selena K. Zhang, Elahe Vedadi, Christine G. Kohn, Kavita Kulkarni, Vinay Kadiyala, Sara Mahdavi, Wendy Du, Jessica Williams, David Feinbloom, Renee Wong, Tao Tu, Petar Sirkovic, Alessio Orlandi, Christopher Semturs, Yun Liu, Juraj Gottweis, Dale R. Webster, Joëlle Barral, Katherine Chou, Pushmeet Kohli, Avinatan Hassidim, Yossi Matias, James Manyika, Rob Fields, Jonathan X. Li, Marc L. Cohen, Vivek Natarajan, Mike Schaekermann, Alan Karthikesalingam, Adam Rodman2026-03-10🤖 cs.LG

LycheeCluster: Efficient Long-Context Inference with Structure-Aware Chunking and Hierarchical KV Indexing

LycheeCluster ist eine neuartige Methode zur effizienten Verwaltung des KV-Caches bei Large Language Models, die durch semantisch bewusste Chunking und hierarchische Indizierung die lineare Suchkomplexität in logarithmische Zeit umwandelt und damit eine bis zu 3,6-fache Beschleunigung der Inferenz bei minimalen Leistungseinbußen ermöglicht.

Dongfang Li, Zixuan Liu, Gang Lin, Baotian Hu, Min Zhang2026-03-10🤖 cs.LG

← Zurück Weiter →

cs.AI