FOR-Prompting: From Objection to Revision via an Asymmetric Prompting Protocol

Die FOR-Prompting-Methode ist ein asynchrones Prompting-Protokoll, das durch die Rollenverteilung zwischen Verteidiger, Fragesteller und Moderator eine selbstkorrigierende, objektionsbasierte Verfeinerung von Antworten ermöglicht und dabei ohne Training oder starke Agenten sowohl bei mathematischen als auch bei offenen Aufgaben die Leistung von Sprachmodellen verbessert.

He Zhang, Anzhou Zhang, Jian DaiTue, 10 Ma💬 cs.CL

Idiom Understanding as a Tool to Measure the Dialect Gap

Die Studie stellt drei neue Benchmark-Datensätze für idiomatische Ausdrücke im Quebecer Französisch und im Metropolitan-Französisch vor und zeigt anhand von Tests mit 111 Sprachmodellen auf, dass diese als zuverlässiges Werkzeug zur Messung der Dialektlücke dienen, da die meisten Modelle trotz guter Leistungen im Standardfranzösisch signifikant schlechter bei regionalen Idiomen abschneiden.

David Beauchemin, Yan Tremblay, Mohamed Amine Youssef, Richard KhouryTue, 10 Ma💬 cs.CL

Tiny but Mighty: A Software-Hardware Co-Design Approach for Efficient Multimodal Inference on Battery-Powered Small Devices

Die Arbeit stellt NANOMIND vor, ein Hardware-Software-Co-Design-Framework, das durch modulare Zerlegung und dynamisches Offloading von Large Multimodal Models auf heterogene Beschleuniger in SoCs die Energieeffizienz und den Durchsatz auf batteriebetriebenen Kleingeräten signifikant verbessert und es ermöglicht, komplexe Modelle wie LLaVA-OneVision über 20 Stunden ohne Netzverbindung lokal auszuführen.

Yilong Li, Shuai Zhang, Yijing Zeng, Hao Zhang, Xinmiao Xiong, Jingyu Liu, Pan Hu, Suman BanerjeeTue, 10 Ma💬 cs.CL

HypoSpace: Evaluating LLM Creativity as Set-Valued Hypothesis Generators under Underdetermination

Die Arbeit stellt HypoSpace vor, ein Diagnose-Tool zur Bewertung der Kreativität von Sprachmodellen als Sammler von Hypothesenmengen in unterbestimmten wissenschaftlichen Problemen, indem es Validität, Einzigartigkeit und Abdeckung misst und dabei zeigt, dass Modelle trotz hoher Korrektheit oft in ihrer Vielfalt und Vollständigkeit versagen.

Tingting Chen, Beibei Lin, Zifeng Yuan, Qiran Zou, Hongyu He, Anirudh Goyal, Yew-Soon Ong, Dianbo LiuTue, 10 Ma💬 cs.CL

KrishokBondhu: A Retrieval-Augmented Voice-Based Agricultural Advisory Call Center for Bengali Farmers

Die Studie stellt KrishokBondhu vor, ein auf Retrieval-Augmented Generation (RAG) basierendes, sprachgesteuertes Beratungssystem für den Telefonzugang, das bengalischen Landwirten in Bangladesch präzise und kontextbezogene landwirtschaftliche Ratschläge bietet und dabei im Vergleich zu bestehenden Benchmarks signifikant bessere Ergebnisse erzielt.

Mohd Ruhul Ameen, Akif Islam, Farjana Aktar, M. Saifuzzaman RafatTue, 10 Ma💬 cs.CL

SwiftEmbed: Ultra-Fast Text Embeddings via Static Token Lookup for Real-Time Applications

SwiftEmbed ist ein in Rust implementiertes, produktionsreifes System, das durch statische Token-Lookups und Zero-Copy-Serialisierung Echtzeit-Text-Embeddings mit einer Latenz von 1,12 ms und 50.000 Anfragen pro Sekunde ermöglicht, wobei es bei Deduplizierungs- und Ähnlichkeitsaufgaben eine hohe Genauigkeit erreicht, jedoch bei komplexeren Klassifizierungsaufgaben hinter Transformer-basierten Modellen zurückbleibt.

Edouard Lansiaux, Antoine Simonet, Eric WielTue, 10 Ma💬 cs.CL

Jr. AI Scientist and Its Risk Report: Autonomous Scientific Exploration from a Baseline Paper

Die Studie stellt „Jr. AI Scientist" als fortschrittliches autonomes System vor, das menschliche Forschungsabläufe nachahmt, um neue wissenschaftliche Beiträge zu generieren, und bewertet dabei sowohl dessen Leistungsfähigkeit als auch die damit verbundenen Risiken und Grenzen für die Zukunft der KI-gestützten Wissenschaft.

Atsuyuki Miyai, Mashiro Toyooka, Takashi Otonari, Zaiying Zhao, Kiyoharu AizawaTue, 10 Ma🤖 cs.LG

CompanionCast: Toward Social Collaboration with Multi-Agent Systems in Shared Experiences

Das Paper stellt CompanionCast vor, ein Framework zur Orchestrierung mehrerer spezialisierter KI-Agenten, das durch multimodale Ereigniserkennung, rollenden Kontext-Caching und räumliches Audio das soziale Miterleben von Medieninhalten (wie Fußballspielen) verbessert und so das Gefühl von sozialer Präsenz und emotionalem Austausch im Vergleich zum alleinigen Konsum steigert.

Yiyang Wang, Chen Chen, Tica Lin, Vishnu Raj, Josh Kimball, Alex Cabral, Josiah HesterTue, 10 Ma💬 cs.CL

Adaptation of Agentic AI: A Survey of Post-Training, Memory, and Skills

Diese Arbeit bietet eine umfassende Übersicht über die Anpassung agenter KI-Systeme nach dem Pre-Training und gliedert den fragmentierten Forschungsstand in ein vierstufiges Rahmenwerk ein, das Agenten- und Werkzeuganpassung durch Methoden wie Feinabstimmung, Verstärkungslernen und adaptive Speichersysteme zusammenführt.

Pengcheng Jiang, Jiacheng Lin, Zhiyi Shi, Zifeng Wang, Luxi He, Yichen Wu, Ming Zhong, Peiyang Song, Qizheng Zhang, Heng Wang, Xueqiang Xu, Hanwen Xu, Pengrui Han, Dylan Zhang, Jiashuo Sun, Chaoqi Yang, Kun Qian, Tian Wang, Changran Hu, Manling Li, Quanzheng Li, Hao Peng, Sheng Wang, Jingbo Shang, Chao Zhang, Jiaxuan You, Liyuan Liu, Pan Lu, Yu Zhang, Heng Ji, Yejin Choi, Dawn Song, Jimeng Sun, Jiawei HanTue, 10 Ma💬 cs.CL