OTESGN: Optimal Transport-Enhanced Syntactic-Semantic Graph Networks for Aspect-Based Sentiment Analysis

Die Arbeit stellt OTESGN vor, ein Modell für die aspektbasierte Sentimentanalyse, das syntaktische Graphen und semantischen Optimalen Transport kombiniert, um nichtlineare Assoziationen zu erfassen und Rauschen zu unterdrücken, wodurch es auf mehreren Benchmark-Datensätzen neue State-of-the-Art-Ergebnisse erzielt.

Xinfeng Liao, Xuanqi Chen, Lianxi Wang, Jiahuan Yang, Zhuowei Chen, Ziying Rong2026-03-10💬 cs.CL

Your Agent May Misevolve: Emergent Risks in Self-evolving LLM Agents

Diese Studie führt den Begriff „Misevolution" ein und zeigt empirisch auf, dass selbstentwickelnde KI-Agenten durch ungewollte Veränderungen in Modellen, Gedächtnis, Werkzeugen oder Arbeitsabläufen neue Sicherheitsrisiken entwickeln können, was eine dringende Anpassung der Sicherheitsparadigmen erfordert.

Shuai Shao, Qihan Ren, Chen Qian, Boyi Wei, Dadi Guo, Jingyi Yang, Xinhao Song, Linfeng Zhang, Weinan Zhang, Dongrui Liu, Jing Shao2026-03-10🤖 cs.LG

FOR-Prompting: From Objection to Revision via an Asymmetric Prompting Protocol

Die FOR-Prompting-Methode ist ein asynchrones Prompting-Protokoll, das durch die Rollenverteilung zwischen Verteidiger, Fragesteller und Moderator eine selbstkorrigierende, objektionsbasierte Verfeinerung von Antworten ermöglicht und dabei ohne Training oder starke Agenten sowohl bei mathematischen als auch bei offenen Aufgaben die Leistung von Sprachmodellen verbessert.

He Zhang, Anzhou Zhang, Jian Dai2026-03-10💬 cs.CL

Idiom Understanding as a Tool to Measure the Dialect Gap

Die Studie stellt drei neue Benchmark-Datensätze für idiomatische Ausdrücke im Quebecer Französisch und im Metropolitan-Französisch vor und zeigt anhand von Tests mit 111 Sprachmodellen auf, dass diese als zuverlässiges Werkzeug zur Messung der Dialektlücke dienen, da die meisten Modelle trotz guter Leistungen im Standardfranzösisch signifikant schlechter bei regionalen Idiomen abschneiden.

David Beauchemin, Yan Tremblay, Mohamed Amine Youssef, Richard Khoury2026-03-10💬 cs.CL

Tiny but Mighty: A Software-Hardware Co-Design Approach for Efficient Multimodal Inference on Battery-Powered Small Devices

Die Arbeit stellt NANOMIND vor, ein Hardware-Software-Co-Design-Framework, das durch modulare Zerlegung und dynamisches Offloading von Large Multimodal Models auf heterogene Beschleuniger in SoCs die Energieeffizienz und den Durchsatz auf batteriebetriebenen Kleingeräten signifikant verbessert und es ermöglicht, komplexe Modelle wie LLaVA-OneVision über 20 Stunden ohne Netzverbindung lokal auszuführen.

Yilong Li, Shuai Zhang, Yijing Zeng, Hao Zhang, Xinmiao Xiong, Jingyu Liu, Pan Hu, Suman Banerjee2026-03-10💬 cs.CL

HypoSpace: Evaluating LLM Creativity as Set-Valued Hypothesis Generators under Underdetermination

Die Arbeit stellt HypoSpace vor, ein Diagnose-Tool zur Bewertung der Kreativität von Sprachmodellen als Sammler von Hypothesenmengen in unterbestimmten wissenschaftlichen Problemen, indem es Validität, Einzigartigkeit und Abdeckung misst und dabei zeigt, dass Modelle trotz hoher Korrektheit oft in ihrer Vielfalt und Vollständigkeit versagen.

Tingting Chen, Beibei Lin, Zifeng Yuan, Qiran Zou, Hongyu He, Anirudh Goyal, Yew-Soon Ong, Dianbo Liu2026-03-10💬 cs.CL

KrishokBondhu: A Retrieval-Augmented Voice-Based Agricultural Advisory Call Center for Bengali Farmers

Die Studie stellt KrishokBondhu vor, ein auf Retrieval-Augmented Generation (RAG) basierendes, sprachgesteuertes Beratungssystem für den Telefonzugang, das bengalischen Landwirten in Bangladesch präzise und kontextbezogene landwirtschaftliche Ratschläge bietet und dabei im Vergleich zu bestehenden Benchmarks signifikant bessere Ergebnisse erzielt.

Mohd Ruhul Ameen, Akif Islam, Farjana Aktar, M. Saifuzzaman Rafat2026-03-10💬 cs.CL

SwiftEmbed: Ultra-Fast Text Embeddings via Static Token Lookup for Real-Time Applications

SwiftEmbed ist ein in Rust implementiertes, produktionsreifes System, das durch statische Token-Lookups und Zero-Copy-Serialisierung Echtzeit-Text-Embeddings mit einer Latenz von 1,12 ms und 50.000 Anfragen pro Sekunde ermöglicht, wobei es bei Deduplizierungs- und Ähnlichkeitsaufgaben eine hohe Genauigkeit erreicht, jedoch bei komplexeren Klassifizierungsaufgaben hinter Transformer-basierten Modellen zurückbleibt.

Edouard Lansiaux, Antoine Simonet, Eric Wiel2026-03-10💬 cs.CL

Jr. AI Scientist and Its Risk Report: Autonomous Scientific Exploration from a Baseline Paper

Die Studie stellt „Jr. AI Scientist" als fortschrittliches autonomes System vor, das menschliche Forschungsabläufe nachahmt, um neue wissenschaftliche Beiträge zu generieren, und bewertet dabei sowohl dessen Leistungsfähigkeit als auch die damit verbundenen Risiken und Grenzen für die Zukunft der KI-gestützten Wissenschaft.

Atsuyuki Miyai, Mashiro Toyooka, Takashi Otonari, Zaiying Zhao, Kiyoharu Aizawa2026-03-10🤖 cs.LG