cs.AI papers | Gist.Science

REAP the Experts: Why Pruning Prevails for One-Shot MoE compression

Het artikel introduceert REAP, een nieuwe methode voor het comprimeren van MoE-modellen door experts te verwijderen in plaats van ze te samenvoegen, wat leidt tot superieure prestaties op generatieve taken zoals codegeneratie door het behoud van de fijne routeringscontrole.

Mike Lasby, Ivan Lazarevich, Nish Sinnadurai, Sean Lie, Yani Ioannou, Vithursan ThangarasaWed, 11 Ma🤖 cs.AI

RL-100: Performant Robotic Manipulation with Real-World Reinforcement Learning

Het paper introduceert RL-100, een robuust real-world reinforcement learning-framework dat diffusiebeleid combineert met PPO en consistentiedistillatie om robotmanipulatietaken met 100% succes en menselijke snelheid uit te voeren, zelfs onder dynamische veranderingen en zonder hertraining.

Kun Lei, Huanyu Li, Dongjie Yu, Zhenyu Wei, Lingxiao Guo, Zhennan Jiang, Ziyu Wang, Shiyu Liang, Huazhe XuWed, 11 Ma🤖 cs.AI

From Spatial to Actions: Grounding Vision-Language-Action Model in Spatial Foundation Priors

Dit paper introduceert FALCON, een nieuw paradigma dat rijke 3D-ruimtelijke tokens afgeleid van RGB-beelden injecteert in de actiehead van Vision-Language-Action-modellen om de ruimtelijke redenering te verbeteren en state-of-the-art prestaties te bereiken in zowel simulatie als real-world taken.

Zhengshen Zhang, Hao Li, Yalun Dai, Zhengbang Zhu, Lei Zhou, Chenchen Liu, Dong Wang, Francis E. H. Tay, Sijin Chen, Ziwei Liu, Yuxiao Liu, Xinghang Li, Pan ZhouWed, 11 Ma🤖 cs.AI

SynHLMA:Synthesizing Hand Language Manipulation for Articulated Object with Discrete Human Object Interaction Representation

Dit paper introduceert SynHLMA, een nieuw raamwerk dat natuurlijke taalinstructies omzet in realistische handbewegingen voor het manipuleren van gearticuleerde objecten door middel van een discrete interactierepresentatie en een taalmodel, wat leidt tot superieure prestaties in het genereren, voorspellen en interpoleren van grijpsequenties voor toepassingen in robotica en virtuele realiteit.

Wang zhi, Yuyan Liu, Liu Liu, Li Zhang, Ruixuan Lu, Dan GuoWed, 11 Ma🤖 cs.AI

GraphKeeper: Graph Domain-Incremental Learning via Knowledge Disentanglement and Preservation

Het artikel introduceert GraphKeeper, een nieuwe methode voor graf-domein-incrementeel leren die catastrofale vergetelheid aanpakt door kennisontvlechting en -behoud te combineren, waardoor state-of-the-art resultaten worden behaald met minimale vergetelheid en naadloze integratie met graf-fondamentmodellen.

Zihao Guo, Qingyun Sun, Ziwei Zhang, Haonan Yuan, Huiping Zhuang, Xingcheng Fu, Jianxin LiWed, 11 Ma🤖 cs.AI

Structured Matrix Scaling for Multi-Class Calibration

Dit paper introduceert gestructureerde matrix-schaling met geavanceerde regularisatie en optimalisatie om overfitting bij multi-class kalibratie te voorkomen en zo aanzienlijk betere prestaties te behalen dan bestaande methoden zoals temperatuur- en vector-schaling.

Eugène Berta, David Holzmüller, Michael I. Jordan, Francis BachWed, 11 Ma🤖 cs.AI

Lightweight Time Series Data Valuation on Time Series Foundation Models via In-Context Finetuning

Dit artikel introduceert LTSV, een lichtgewicht methode voor het waarderen van tijdreeksdata in foundationmodellen via in-context finetuning en temporele blokkenaggregatie, die een nauwkeurige en schaalbare oplossing biedt voor de beperkingen van traditionele datawaarderingstechnieken.

Shunyu Wu, Tianyue Li, Yixuan Leng, Jingyi Suo, Jian Lou, Dan Li, See-Kiong NgWed, 11 Ma🤖 cs.AI

MediRound: Multi-Round Entity-Level Reasoning Segmentation in Medical Images

Dit paper introduceert MediRound, een model en dataset voor multi-rond medische segmentatie met entiteitsgebaseerd redenering, dat foutenpropagatie aanpakt en beter presteert dan bestaande methoden in medische educatieve scenario's.

Qinyue Tong, Ziqian Lu, Jun Liu, Rui Zuo, Zheming LuWed, 11 Ma🤖 cs.AI

TSFM in-context learning for time-series classification of bearing-health status

Deze paper introduceert een methode voor het classificeren van de gezondheidstoestand van lagers op basis van in-context learning met tijdreeks-fundamentmodellen, waardoor vibratiegegevens zonder fijnafstemming kunnen worden geanalyseerd en de weg vrijmaken voor schaalbare AI-onderhoudssystemen.

Michel Tokic, Slobodan Djukanovic, Anja von Beuningen, Cheng FengWed, 11 Ma🤖 cs.AI

Research and Prototyping Study of an LLM-Based Chatbot for Electromagnetic Simulations

Dit onderzoek presenteert een op een groot taalmodel (Google Gemini 2.0 Flash) gebaseerde chatbot die de opzet en uitvoering van tweedimensionale elektromagnetische simulaties met Gmsh en GetDP automatiseert, waardoor de tijdsinvestering voor het modelleren van geleiders met variabele geometrieën en aangepaste post-processing aanzienlijk wordt gereduceerd.

Albert Piwonski, Mirsad HadžiefendicWed, 11 Ma🤖 cs.AI

Mitigating Long-Tail Bias in HOI Detection via Adaptive Diversity Cache

Deze paper introduceert de Adaptive Diversity Cache (ADC), een trainingsvrije en plug-and-play module die de langstaartbias in mens-objectinteractie-detectie vermindert door tijdens de inferentie adaptieve, diverse kenmerken op te slaan, waardoor zeldzame interacties op de HICO-DET en V-COCO-datasets aanzienlijk worden verbeterd zonder extra rekencapaciteit.

Yuqiu Jiang, Xiaozhen Qiao, Yifan Chen, Ye Zheng, Zhe Sun, Xuelong LiWed, 11 Ma🤖 cs.AI

Periodic Asynchrony: An On-Policy Approach for Accelerating LLM Reinforcement Learning

Dit artikel introduceert een periodiek asynchrone, on-policy framework voor LLM-versterkingsleer dat door het scheiden van inferentie en training een drievoudige tot vijfvoudige toename in doorvoersnelheid bereikt zonder de nauwkeurigheid te beïnvloeden.

Jian LuWed, 11 Ma🤖 cs.AI

When Robots Obey the Patch: Universal Transferable Patch Attacks on Vision-Language-Action Models

Dit artikel introduceert UPA-RFAS, een uniek raamwerk voor universele en overdraagbare adversariële patch-aanvallen op Vision-Language-Action-modellen die effectief zijn over verschillende architecturen, taken en fysieke uitvoeringen heen.

Hui Lu, Yi Yu, Yiming Yang, Chenyu Yi, Qixin Zhang, Bingquan Shen, Alex C. Kot, Xudong JiangWed, 11 Ma🤖 cs.AI

Multi-Agent Reinforcement Learning with Communication-Constrained Priors

Deze paper introduceert een robuust multi-agent reinforcement learning-framework dat communicatiebeperkingen als leerprioriteit gebruikt om de impact van verliesvolle en verliesvrije berichten op gedecentraliseerde besluitvorming te kwantificeren en te optimaliseren in complexe, dynamische omgevingen.

Guang Yang, Tianpei Yang, Jingwen Qiao, Yanqing Wu, Jing Huo, Xingguo Chen, Yang GaoWed, 11 Ma🤖 cs.AI

Enhancing Retrieval-Augmented Generation with Entity Linking for Educational Platforms

Dit artikel introduceert ELERAG, een verbeterde Retrieval-Augmented Generation-architectuur die Entiteitenkoppeling integreert om de feitelijke nauwkeurigheid van educatieve vraag-antwoordsystemen in het Italiaans te verhogen, waarbij experimenten aantonen dat deze domeinspecifieke aanpak de prestaties van standaardmodellen overtreft in gespecialiseerde contexten.

Francesco Granata, Francesco Poggi, Misael MongiovìWed, 11 Ma🤖 cs.AI

EMFusion: Conditional Diffusion Framework for Trustworthy Frequency Selective EMF Forecasting in Wireless Networks

Dit paper introduceert EMFusion, een conditioneel diffusiemodel dat betrouwbare, frequentieselectieve probabilistische voorspellingen van elektromagnetische velden in draadloze netwerken mogelijk maakt door diverse contextfactoren te integreren en expliciete onzekerheidsschattingen te bieden.

Zijiang Yan, Yixiang Huang, Jianhua Pei, Hina Tabassum, Luca ChiaraviglioWed, 11 Ma🤖 cs.AI

Small Language Models for Efficient Agentic Tool Calling: Outperforming Large Models with Targeted Fine-tuning

Dit onderzoek toont aan dat een zorgvuldig gefinetuned Small Language Model (OPT-350M) door middel van één epoch supervised fine-tuning de prestaties van grote taalmodellen overtreft bij agentic tool-calling, met een opmerkelijke 77,55% slagingskans op de ToolBench-evaluatie.

Polaris Jhandi, Owais Kazi, Shreyas Subramanian, Neel SendasWed, 11 Ma🤖 cs.AI

Reinforcement Learning for Self-Improving Agent with Skill Library

Dit artikel introduceert SAGE, een versterkingsleerframework dat agents via een geautomatiseerde vaardigheidsbibliotheek en sequentiële rollouts in staat stelt om zichzelf te verbeteren, wat resulteert in aanzienlijk betere prestaties, minder interactiestappen en een lagere token-gebruik in vergelijking met bestaande methoden.

Jiongxiao Wang, Qiaojing Yan, Yawei Wang, Yijun Tian, Soumya Smruti Mishra, Zhichao Xu, Megha Gandhi, Panpan Xu, Lin Lee CheongWed, 11 Ma🤖 cs.AI

MCGI: Manifold-Consistent Graph Indexing for Billion-Scale Disk-Resident Vector Search

Dit paper introduceert MCGI, een geometrie-bewuste, schijf-residente indexeringsmethode die lokale intrinsieke dimensie gebruikt om de zoekstrategie dynamisch aan te passen aan de onderliggende data-manifold, waardoor de prestaties van billion-scale vectorzoekopdrachten aanzienlijk worden verbeterd ten opzichte van bestaande methoden zoals DiskANN.

Dongfang ZhaoWed, 11 Ma🤖 cs.AI

CRANE: Causal Relevance Analysis of Language-Specific Neurons in Multilingual Large Language Models

Dit paper introduceert CRANE, een nieuw raamwerk dat taal-specifieke neuronen in meertalige grote taalmodellen identificeert op basis van functionele noodzaak door gerichte interventies, waardoor deze methoden nauwkeuriger zijn dan eerdere op activatie gebaseerde benaderingen.

Yifan Le, Yunliang LiWed, 11 Ma🤖 cs.AI

← Vorige Volgende →