cs.CL papers | Gist.Science

Stochastic Self-Organization in Multi-Agent Systems

Dit paper introduceert SelfOrg, een zelforganiserend framework voor multi-agent systemen dat dynamische communicatiestructuren genereert op basis van respons-afhankelijke Shapley-waarden om samenwerking te optimaliseren zonder extra supervisie of training.

Nurbek Tastan, Samuel Horvath, Karthik NandakumarTue, 10 Ma🤖 cs.LG

FOR-Prompting: From Objection to Revision via an Asymmetric Prompting Protocol

Dit paper introduceert FOR-Prompting, een asymmetrisch promptprotocol dat zonder extra training de prestaties van taalmodellen verbetert door een Defender, een Debater die kritische vragen stelt zonder directe oplossingen, en een Host te laten samenwerken voor iteratieve zelfherziening.

He Zhang, Anzhou Zhang, Jian DaiTue, 10 Ma💬 cs.CL

Tree-based Dialogue Reinforced Policy Optimization for Red-Teaming Attacks

Dit paper introduceert DialTree, een op-beleid versterkte leerframework geïntegreerd met boomzoektechnieken dat autonoom diverse multi-turn aanvalstrategieën ontdekt om de kwetsbaarheid van grote taalmodellen voor geavanceerde red-teaming-aanvallen significant te vergroten.

Ruohao Guo, Afshin Oroojlooy, Roshan Sridhar, Miguel Ballesteros, Alan Ritter, Dan RothTue, 10 Ma🤖 cs.LG

Idiom Understanding as a Tool to Measure the Dialect Gap

Dit artikel introduceert nieuwe benchmarks voor het meten van het dialectkloof in het Frans door het gebruik van regionale uitdrukkingen, en toont aan dat grote taalmodellen, ondanks hun bekwaamheid in het standaard Frans, significant minder goed presteren op het Quebecse dialect.

David Beauchemin, Yan Tremblay, Mohamed Amine Youssef, Richard KhouryTue, 10 Ma💬 cs.CL

Tiny but Mighty: A Software-Hardware Co-Design Approach for Efficient Multimodal Inference on Battery-Powered Small Devices

Dit paper introduceert NANOMIND, een hardware-software co-design raamwerk dat grote multimodale modellen op batterij-aangedreven apparaten efficiënt uitvoert door modulaire componenten dynamisch toe te wijzen aan de meest geschikte versnellers, wat resulteert in een aanzienlijke verbetering van energie-efficiëntie en doorvoersnelheid zonder netwerkverbinding.

Yilong Li, Shuai Zhang, Yijing Zeng, Hao Zhang, Xinmiao Xiong, Jingyu Liu, Pan Hu, Suman BanerjeeTue, 10 Ma💬 cs.CL

ACE: Attribution-Controlled Knowledge Editing for Multi-hop Factual Recall

Dit paper introduceert ACE, een kader voor kennisbewerking dat neuronale attributie gebruikt om de dynamische query-waarde-paden in meervoudige redeneerketens te identificeren en aan te passen, waardoor de prestaties bij het herinneren van meervoudige feiten aanzienlijk verbeteren.

Jiayu Yang, Yuxuan Fan, Songning Lai, Shengen Wu, Jiaqi Tang, Chun Kang, Zhijiang Guo, Yutao YueTue, 10 Ma💬 cs.CL

R-WoM: Retrieval-augmented World Model For Computer-use Agents

Het artikel introduceert R-WoM, een op retrieval gebaseerde wereldmodel voor computergebruiksagenten die hallucinaties en fouten in langetermijnplanning van grote taalmodellen aanpakt door simulaties te verankeren met feitelijke, actuele kennis uit externe tutorials, wat leidt tot significante prestatieverbeteringen op benchmarks zoals OSWorld en WebArena.

Kai Mei, Jiang Guo, Shuaichen Chang, Mingwen Dong, Dongkyu Lee, Xing Niu, Jiarong JiangTue, 10 Ma💬 cs.CL

HypoSpace: Evaluating LLM Creativity as Set-Valued Hypothesis Generators under Underdetermination

Dit paper introduceert HypoSpace, een diagnostische suite die de creativiteit van taalmodellen evalueert door hun vermogen te meten om diverse, unieke en volledige sets van hypotheses te genereren in onderbepaalde wetenschappelijke scenario's, waarbij wordt aangetoond dat modellen vaak in een 'mode collapse' terechtkomen die door traditionele correctheidsmetingen onopgemerkt blijft.

Tingting Chen, Beibei Lin, Zifeng Yuan, Qiran Zou, Hongyu He, Anirudh Goyal, Yew-Soon Ong, Dianbo LiuTue, 10 Ma💬 cs.CL

KrishokBondhu: A Retrieval-Augmented Voice-Based Agricultural Advisory Call Center for Bengali Farmers

Dit artikel introduceert KrishokBondhu, een stemgebaseerd adviescentrum voor Bengalese boeren in Bangladesh dat gebruikmaakt van Retrieval-Augmented Generation (RAG) en spraaktechnologie om via telefoon real-time, contextbewuste landbouwadviezen te verstrekken.

Mohd Ruhul Ameen, Akif Islam, Farjana Aktar, M. Saifuzzaman RafatTue, 10 Ma💬 cs.CL

SwiftEmbed: Ultra-Fast Text Embeddings via Static Token Lookup for Real-Time Applications

SwiftEmbed is een in Rust geschreven, productiegerichte systeem dat statische token-lookup gebruikt om ultra-snelle tekstembeddings (1,12 ms p50) te leveren voor real-time toepassingen, waarbij het een uitstekende prestatie behaalt voor duplicaatreductie en semantische gelijkenis, maar minder geschikt is voor complexe classificatietaken.

Edouard Lansiaux, Antoine Simonet, Eric WielTue, 10 Ma💬 cs.CL

Jr. AI Scientist and Its Risk Report: Autonomous Scientific Exploration from a Baseline Paper

Dit paper introduceert Jr. AI Scientist, een autonoom systeem dat als beginnend onderzoeker werkt om nieuwe wetenschappelijke hypotheses te formuleren en te valideren op basis van bestaande papers, en analyseert zowel de prestaties als de risico's en beperkingen van dergelijke systemen voor de toekomst van de academische gemeenschap.

Atsuyuki Miyai, Mashiro Toyooka, Takashi Otonari, Zaiying Zhao, Kiyoharu AizawaTue, 10 Ma🤖 cs.LG

HatePrototypes: Interpretable and Transferable Representations for Implicit and Explicit Hate Speech Detection

Deze paper introduceert HatePrototypes, interpreteerbare en overdraagbare vectorrepresentaties die, zelfs met slechts 50 voorbeelden per klasse, effectief zijn voor het detecteren van zowel expliciete als impliciete haatzaaiende taal zonder herhaaldelijke fine-tuning.

Irina Proskurina, Marc-Antoine Carpentier, Julien VelcinTue, 10 Ma💬 cs.CL

SPOT: An Annotated French Corpus and Benchmark for Detecting Critical Interventions in Online Conversations

Deze paper introduceert SPOT, het eerste geannoteerde Franse corpus en benchmark voor het detecteren van kritieke ingrepen in online discussies, en toont aan dat fijngefineerde encoder-modellen contextuele metadata effectiever benutten dan geprompte LLM's voor deze taak.

Manon Berriche, Célia Nouri, Chloée Clavel, Jean-Philippe CointetTue, 10 Ma💬 cs.CL

Multimodal LLMs Do Not Compose Skills Optimally Across Modalities

Deze studie toont aan dat multimodale grote taalmodellen moeite hebben om vaardigheden over verschillende modaliteiten optimaal te combineren, waarbij zelfs geavanceerde strategieën zoals chain-of-thought prompting en specifieke fine-tuning slechts een beperkt deel van deze kloof kunnen dichten.

Paula Ontalvilla, Aitor Ormazabal, Gorka AzkuneTue, 10 Ma💬 cs.CL

Stealth Fine-Tuning: Efficiently Breaking Alignment in RVLMs Using Self-Generated CoT

Dit paper introduceert "Stealth Fine-Tuning", een efficiënte aanvalsmethode die de veiligheidsuitlijning van redeneringsversterkte visueel-taalmodellen (RVLMs) omzeilt door zelf gegenereerde schadelijke redeneersporen te hergebruiken voor fijnafstemming, waardoor de modelveiligheid met weinig data en rekentijd kan worden gebroken.

Le Yu, Zhengyue Zhao, Yawen Zheng, Yunhao LiuTue, 10 Ma💬 cs.CL

Process-Centric Analysis of Agentic Software Systems

Deze paper introduceert Graphectory, een grafgebaseerde methode voor het analyseren van het proces van agente softwaresystemen, die niet alleen inzicht geeft in hun redeneerstrategieën, maar ook door middel van realtime monitoring en interventies de oplossingskansen aanzienlijk verbetert.

Shuyang Liu, Yang Chen, Rahul Krishna, Saurabh Sinha, Jatin Ganhotra, Reyhan JabbarvandTue, 10 Ma💬 cs.CL

SETUP: Sentence-level English-To-Uniform Meaning Representation Parser

Dit paper introduceert SETUP, een nieuw systeem dat Engelse zinnen automatisch omzet naar Uniform Meaning Representation (UMR) en daarmee aanzienlijke verbeteringen boekt in de nauwkeurigheid van deze semantische analyse.

Emma Markle, Javier Gutierrez Bach, Shira WeinTue, 10 Ma💬 cs.CL

Parallel Decoder Transformer: Planner-Seeded Latent Coordination for Synchronized Parallel Decoding

Dit paper introduceert de Parallel Decoder Transformer (PDT), een architectuur die parallelle tekstgeneratie mogelijk maakt door een gefreezeerde decoder te verrijken met een planner-gestuurde latente werkruimte en een gesynchroniseerd multi-stream protocol voor interne coördinatie zonder externe orchestration.

Logan RobbinsTue, 10 Ma💬 cs.CL

CompanionCast: Toward Social Collaboration with Multi-Agent Systems in Shared Experiences

Dit paper introduceert CompanionCast, een framework dat meerdere gespecialiseerde AI-agenten orchestreert om sociale interactie en gedeelde beleving tijdens activiteiten zoals het kijken van sportwedstrijden te verbeteren, wat in proefstudies leidde tot een significant verhoogd gevoel van sociale aanwezigheid en emotionele deling.

Yiyang Wang, Chen Chen, Tica Lin, Vishnu Raj, Josh Kimball, Alex Cabral, Josiah HesterTue, 10 Ma💬 cs.CL

Adaptation of Agentic AI: A Survey of Post-Training, Memory, and Skills

Deze survey biedt een overzicht van de adaptatie van agenten op basis van grote taalmodellen na het vooraf trainen, waarbij een vierparadigmatisch raamwerk wordt gebruikt om methoden voor post-training, adaptief geheugen en vaardigheden te structureren, vergelijken en evalueren.

Pengcheng Jiang, Jiacheng Lin, Zhiyi Shi, Zifeng Wang, Luxi He, Yichen Wu, Ming Zhong, Peiyang Song, Qizheng Zhang, Heng Wang, Xueqiang Xu, Hanwen Xu, Pengrui Han, Dylan Zhang, Jiashuo Sun, Chaoqi Yang, Kun Qian, Tian Wang, Changran Hu, Manling Li, Quanzheng Li, Hao Peng, Sheng Wang, Jingbo Shang, Chao Zhang, Jiaxuan You, Liyuan Liu, Pan Lu, Yu Zhang, Heng Ji, Yejin Choi, Dawn Song, Jimeng Sun, Jiawei HanTue, 10 Ma💬 cs.CL

← Vorige Volgende →