Tiny but Mighty: A Software-Hardware Co-Design Approach for Efficient Multimodal Inference on Battery-Powered Small Devices

Dit paper introduceert NANOMIND, een hardware-software co-design raamwerk dat grote multimodale modellen op batterij-aangedreven apparaten efficiënt uitvoert door modulaire componenten dynamisch toe te wijzen aan de meest geschikte versnellers, wat resulteert in een aanzienlijke verbetering van energie-efficiëntie en doorvoersnelheid zonder netwerkverbinding.

Yilong Li, Shuai Zhang, Yijing Zeng, Hao Zhang, Xinmiao Xiong, Jingyu Liu, Pan Hu, Suman BanerjeeTue, 10 Ma💬 cs.CL

R-WoM: Retrieval-augmented World Model For Computer-use Agents

Het artikel introduceert R-WoM, een op retrieval gebaseerde wereldmodel voor computergebruiksagenten die hallucinaties en fouten in langetermijnplanning van grote taalmodellen aanpakt door simulaties te verankeren met feitelijke, actuele kennis uit externe tutorials, wat leidt tot significante prestatieverbeteringen op benchmarks zoals OSWorld en WebArena.

Kai Mei, Jiang Guo, Shuaichen Chang, Mingwen Dong, Dongkyu Lee, Xing Niu, Jiarong JiangTue, 10 Ma💬 cs.CL

HypoSpace: Evaluating LLM Creativity as Set-Valued Hypothesis Generators under Underdetermination

Dit paper introduceert HypoSpace, een diagnostische suite die de creativiteit van taalmodellen evalueert door hun vermogen te meten om diverse, unieke en volledige sets van hypotheses te genereren in onderbepaalde wetenschappelijke scenario's, waarbij wordt aangetoond dat modellen vaak in een 'mode collapse' terechtkomen die door traditionele correctheidsmetingen onopgemerkt blijft.

Tingting Chen, Beibei Lin, Zifeng Yuan, Qiran Zou, Hongyu He, Anirudh Goyal, Yew-Soon Ong, Dianbo LiuTue, 10 Ma💬 cs.CL

Jr. AI Scientist and Its Risk Report: Autonomous Scientific Exploration from a Baseline Paper

Dit paper introduceert Jr. AI Scientist, een autonoom systeem dat als beginnend onderzoeker werkt om nieuwe wetenschappelijke hypotheses te formuleren en te valideren op basis van bestaande papers, en analyseert zowel de prestaties als de risico's en beperkingen van dergelijke systemen voor de toekomst van de academische gemeenschap.

Atsuyuki Miyai, Mashiro Toyooka, Takashi Otonari, Zaiying Zhao, Kiyoharu AizawaTue, 10 Ma🤖 cs.LG

CompanionCast: Toward Social Collaboration with Multi-Agent Systems in Shared Experiences

Dit paper introduceert CompanionCast, een framework dat meerdere gespecialiseerde AI-agenten orchestreert om sociale interactie en gedeelde beleving tijdens activiteiten zoals het kijken van sportwedstrijden te verbeteren, wat in proefstudies leidde tot een significant verhoogd gevoel van sociale aanwezigheid en emotionele deling.

Yiyang Wang, Chen Chen, Tica Lin, Vishnu Raj, Josh Kimball, Alex Cabral, Josiah HesterTue, 10 Ma💬 cs.CL

Adaptation of Agentic AI: A Survey of Post-Training, Memory, and Skills

Deze survey biedt een overzicht van de adaptatie van agenten op basis van grote taalmodellen na het vooraf trainen, waarbij een vierparadigmatisch raamwerk wordt gebruikt om methoden voor post-training, adaptief geheugen en vaardigheden te structureren, vergelijken en evalueren.

Pengcheng Jiang, Jiacheng Lin, Zhiyi Shi, Zifeng Wang, Luxi He, Yichen Wu, Ming Zhong, Peiyang Song, Qizheng Zhang, Heng Wang, Xueqiang Xu, Hanwen Xu, Pengrui Han, Dylan Zhang, Jiashuo Sun, Chaoqi Yang, Kun Qian, Tian Wang, Changran Hu, Manling Li, Quanzheng Li, Hao Peng, Sheng Wang, Jingbo Shang, Chao Zhang, Jiaxuan You, Liyuan Liu, Pan Lu, Yu Zhang, Heng Ji, Yejin Choi, Dawn Song, Jimeng Sun, Jiawei HanTue, 10 Ma💬 cs.CL