cs.CL Arbeiten | Gist.Science

Stochastic Self-Organization in Multi-Agent Systems

Die Arbeit stellt SelfOrg vor, ein Rahmenwerk, das Multi-Agenten-Systeme auf Basis von Large Language Models durch eine reaktionsbasierte, stochastische Selbstorganisation und die dynamische Konstruktion eines gerichteten azyklischen Graphen optimiert, um die Kommunikation ohne externe Aufsicht oder Training effizient zu steuern.

Nurbek Tastan, Samuel Horvath, Karthik NandakumarTue, 10 Ma🤖 cs.LG

FOR-Prompting: From Objection to Revision via an Asymmetric Prompting Protocol

Die FOR-Prompting-Methode ist ein asynchrones Prompting-Protokoll, das durch die Rollenverteilung zwischen Verteidiger, Fragesteller und Moderator eine selbstkorrigierende, objektionsbasierte Verfeinerung von Antworten ermöglicht und dabei ohne Training oder starke Agenten sowohl bei mathematischen als auch bei offenen Aufgaben die Leistung von Sprachmodellen verbessert.

He Zhang, Anzhou Zhang, Jian DaiTue, 10 Ma💬 cs.CL

Tree-based Dialogue Reinforced Policy Optimization for Red-Teaming Attacks

Die Arbeit stellt DialTree vor, ein auf-richtungsorientiertes Reinforcement-Learning-Framework, das durch die Integration von Baumsuche autonom vielfältige Mehr-Turn-Angriffsstrategien gegen Large Language Models entwickelt und dabei die Angriffsrate im Vergleich zu bestehenden Methoden um über 44,2 % steigert.

Ruohao Guo, Afshin Oroojlooy, Roshan Sridhar, Miguel Ballesteros, Alan Ritter, Dan RothTue, 10 Ma🤖 cs.LG

Idiom Understanding as a Tool to Measure the Dialect Gap

Die Studie stellt drei neue Benchmark-Datensätze für idiomatische Ausdrücke im Quebecer Französisch und im Metropolitan-Französisch vor und zeigt anhand von Tests mit 111 Sprachmodellen auf, dass diese als zuverlässiges Werkzeug zur Messung der Dialektlücke dienen, da die meisten Modelle trotz guter Leistungen im Standardfranzösisch signifikant schlechter bei regionalen Idiomen abschneiden.

David Beauchemin, Yan Tremblay, Mohamed Amine Youssef, Richard KhouryTue, 10 Ma💬 cs.CL

Tiny but Mighty: A Software-Hardware Co-Design Approach for Efficient Multimodal Inference on Battery-Powered Small Devices

Die Arbeit stellt NANOMIND vor, ein Hardware-Software-Co-Design-Framework, das durch modulare Zerlegung und dynamisches Offloading von Large Multimodal Models auf heterogene Beschleuniger in SoCs die Energieeffizienz und den Durchsatz auf batteriebetriebenen Kleingeräten signifikant verbessert und es ermöglicht, komplexe Modelle wie LLaVA-OneVision über 20 Stunden ohne Netzverbindung lokal auszuführen.

Yilong Li, Shuai Zhang, Yijing Zeng, Hao Zhang, Xinmiao Xiong, Jingyu Liu, Pan Hu, Suman BanerjeeTue, 10 Ma💬 cs.CL

ACE: Attribution-Controlled Knowledge Editing for Multi-hop Factual Recall

Die Arbeit stellt ACE vor, einen mechanistisch fundierten Ansatz zur Wissensbearbeitung in großen Sprachmodellen, der neuronale Attributionsanalysen nutzt, um kritische Query-Value-Pfade für die Verbesserung des mehrstufigen Faktenabrufs zu identifizieren und zu editieren.

Jiayu Yang, Yuxuan Fan, Songning Lai, Shengen Wu, Jiaqi Tang, Chun Kang, Zhijiang Guo, Yutao YueTue, 10 Ma💬 cs.CL

R-WoM: Retrieval-augmented World Model For Computer-use Agents

Das Paper stellt R-WoM vor, ein retrieval-basiertes Weltmodell, das die durch Halluzinationen und statisches Wissen begrenzten Fähigkeiten von LLMs bei der langfristigen Simulation in Computer-Umgebungen durch die Einbindung externer Fakten verbessert und so die Entscheidungsfindung von Agenten signifikant optimiert.

Kai Mei, Jiang Guo, Shuaichen Chang, Mingwen Dong, Dongkyu Lee, Xing Niu, Jiarong JiangTue, 10 Ma💬 cs.CL

HypoSpace: Evaluating LLM Creativity as Set-Valued Hypothesis Generators under Underdetermination

Die Arbeit stellt HypoSpace vor, ein Diagnose-Tool zur Bewertung der Kreativität von Sprachmodellen als Sammler von Hypothesenmengen in unterbestimmten wissenschaftlichen Problemen, indem es Validität, Einzigartigkeit und Abdeckung misst und dabei zeigt, dass Modelle trotz hoher Korrektheit oft in ihrer Vielfalt und Vollständigkeit versagen.

Tingting Chen, Beibei Lin, Zifeng Yuan, Qiran Zou, Hongyu He, Anirudh Goyal, Yew-Soon Ong, Dianbo LiuTue, 10 Ma💬 cs.CL

KrishokBondhu: A Retrieval-Augmented Voice-Based Agricultural Advisory Call Center for Bengali Farmers

Die Studie stellt KrishokBondhu vor, ein auf Retrieval-Augmented Generation (RAG) basierendes, sprachgesteuertes Beratungssystem für den Telefonzugang, das bengalischen Landwirten in Bangladesch präzise und kontextbezogene landwirtschaftliche Ratschläge bietet und dabei im Vergleich zu bestehenden Benchmarks signifikant bessere Ergebnisse erzielt.

Mohd Ruhul Ameen, Akif Islam, Farjana Aktar, M. Saifuzzaman RafatTue, 10 Ma💬 cs.CL

SwiftEmbed: Ultra-Fast Text Embeddings via Static Token Lookup for Real-Time Applications

SwiftEmbed ist ein in Rust implementiertes, produktionsreifes System, das durch statische Token-Lookups und Zero-Copy-Serialisierung Echtzeit-Text-Embeddings mit einer Latenz von 1,12 ms und 50.000 Anfragen pro Sekunde ermöglicht, wobei es bei Deduplizierungs- und Ähnlichkeitsaufgaben eine hohe Genauigkeit erreicht, jedoch bei komplexeren Klassifizierungsaufgaben hinter Transformer-basierten Modellen zurückbleibt.

Edouard Lansiaux, Antoine Simonet, Eric WielTue, 10 Ma💬 cs.CL

Jr. AI Scientist and Its Risk Report: Autonomous Scientific Exploration from a Baseline Paper

Die Studie stellt „Jr. AI Scientist" als fortschrittliches autonomes System vor, das menschliche Forschungsabläufe nachahmt, um neue wissenschaftliche Beiträge zu generieren, und bewertet dabei sowohl dessen Leistungsfähigkeit als auch die damit verbundenen Risiken und Grenzen für die Zukunft der KI-gestützten Wissenschaft.

Atsuyuki Miyai, Mashiro Toyooka, Takashi Otonari, Zaiying Zhao, Kiyoharu AizawaTue, 10 Ma🤖 cs.LG

HatePrototypes: Interpretable and Transferable Representations for Implicit and Explicit Hate Speech Detection

Die Arbeit stellt HatePrototypes vor, interpretierbare und übertragbare Vektordarstellungen, die eine effiziente Erkennung sowohl von expliziter als auch von impliziter Hassrede ermöglichen, ohne wiederholtes Fine-Tuning zu erfordern.

Irina Proskurina, Marc-Antoine Carpentier, Julien VelcinTue, 10 Ma💬 cs.CL

SPOT: An Annotated French Corpus and Benchmark for Detecting Critical Interventions in Online Conversations

Die Studie stellt SPOT vor, das erste annotierte französische Korpus und Benchmark zur Erkennung kritischer Unterbrechungen in Online-Konversationen, und zeigt, dass feinabgestimmte Encoder-Modelle promptgesteuerte LLMs bei dieser Aufgabe deutlich übertreffen.

Manon Berriche, Célia Nouri, Chloée Clavel, Jean-Philippe CointetTue, 10 Ma💬 cs.CL

Multimodal LLMs Do Not Compose Skills Optimally Across Modalities

Die Studie zeigt, dass Multimodale Large Language Models (MLLMs) zwar durch Chain-of-Thought-Prompting und Feinabstimmung verbessert werden können, aber dennoch eine signifikante Lücke bei der optimalen Zusammensetzung von Fähigkeiten über verschiedene Modalitäten hinweg aufweisen.

Paula Ontalvilla, Aitor Ormazabal, Gorka AzkuneTue, 10 Ma💬 cs.CL

Stealth Fine-Tuning: Efficiently Breaking Alignment in RVLMs Using Self-Generated CoT

Die Studie stellt „Stealth Fine-Tuning" vor, eine effiziente Angriffsmethode, die durch segmentweise Störung und die Wiederverwendung selbstgenerierter Chain-of-Thought-Ausgaben die Sicherheitsausrichtung von Reasoning-augmented Vision-Language Models mit minimalem Aufwand und ohne Verlust der allgemeinen Reasoning-Fähigkeiten umgeht.

Le Yu, Zhengyue Zhao, Yawen Zheng, Yunhao LiuTue, 10 Ma💬 cs.CL

Process-Centric Analysis of Agentic Software Systems

Die Arbeit stellt Graphectory vor, ein graphenbasiertes Framework zur prozessorientierten Analyse agenter Softwaresysteme, das nicht nur tiefere Einblicke in deren reasoning-Strategien ermöglicht, sondern durch Echtzeit-Überwachung und Interventionen die Lösungsrate von SWE-bench-Problemen signifikant steigert.

Shuyang Liu, Yang Chen, Rahul Krishna, Saurabh Sinha, Jatin Ganhotra, Reyhan JabbarvandTue, 10 Ma💬 cs.CL

SETUP: Sentence-level English-To-Uniform Meaning Representation Parser

In diesem Paper stellen die Autoren SETUP vor, einen Satz-zu-UMR-Parser für das Englische, der durch Feinabstimmung von AMR-Parsern oder die Nutzung von Universal-Dependencies-Konvertern signifikante Fortschritte bei der automatischen Generierung von Uniform Meaning Representation-Graphen erzielt.

Emma Markle, Javier Gutierrez Bach, Shira WeinTue, 10 Ma💬 cs.CL

Parallel Decoder Transformer: Planner-Seeded Latent Coordination for Synchronized Parallel Decoding

Die Arbeit stellt den Parallel Decoder Transformer (PDT) vor, eine Architektur, die durch einen planer-gespeisten latenten Arbeitsraum und ein synchronisiertes Multi-Stream-Protokoll die parallele Dekodierung von Sprachmodellen von einer externen Orchestrierung in einen internen Koordinationsmechanismus überführt.

Logan RobbinsTue, 10 Ma💬 cs.CL

CompanionCast: Toward Social Collaboration with Multi-Agent Systems in Shared Experiences

Das Paper stellt CompanionCast vor, ein Framework zur Orchestrierung mehrerer spezialisierter KI-Agenten, das durch multimodale Ereigniserkennung, rollenden Kontext-Caching und räumliches Audio das soziale Miterleben von Medieninhalten (wie Fußballspielen) verbessert und so das Gefühl von sozialer Präsenz und emotionalem Austausch im Vergleich zum alleinigen Konsum steigert.

Yiyang Wang, Chen Chen, Tica Lin, Vishnu Raj, Josh Kimball, Alex Cabral, Josiah HesterTue, 10 Ma💬 cs.CL

Adaptation of Agentic AI: A Survey of Post-Training, Memory, and Skills

Diese Arbeit bietet eine umfassende Übersicht über die Anpassung agenter KI-Systeme nach dem Pre-Training und gliedert den fragmentierten Forschungsstand in ein vierstufiges Rahmenwerk ein, das Agenten- und Werkzeuganpassung durch Methoden wie Feinabstimmung, Verstärkungslernen und adaptive Speichersysteme zusammenführt.

Pengcheng Jiang, Jiacheng Lin, Zhiyi Shi, Zifeng Wang, Luxi He, Yichen Wu, Ming Zhong, Peiyang Song, Qizheng Zhang, Heng Wang, Xueqiang Xu, Hanwen Xu, Pengrui Han, Dylan Zhang, Jiashuo Sun, Chaoqi Yang, Kun Qian, Tian Wang, Changran Hu, Manling Li, Quanzheng Li, Hao Peng, Sheng Wang, Jingbo Shang, Chao Zhang, Jiaxuan You, Liyuan Liu, Pan Lu, Yu Zhang, Heng Ji, Yejin Choi, Dawn Song, Jimeng Sun, Jiawei HanTue, 10 Ma💬 cs.CL

← Zurück Weiter →