REAP the Experts: Why Pruning Prevails for One-Shot MoE compression

이 논문은 기존 전문가 병합 기법보다 정교한 라우팅 제어가 가능한 전문가 가지치기가 생성 작업에서 더 우수하다는 점을 규명하고, 라우터 게이트 값과 전문가 활성화 노름을 고려한 새로운 가지치기 기준인 REAP 를 제안하여 대규모 SMoE 모델의 압축 성능을 획기적으로 개선했음을 보여줍니다.

Mike Lasby, Ivan Lazarevich, Nish Sinnadurai, Sean Lie, Yani Ioannou, Vithursan ThangarasaWed, 11 Ma🤖 cs.AI

RL-100: Performant Robotic Manipulation with Real-World Reinforcement Learning

이 논문은 인간 숙련도 수준의 신뢰성과 효율성을 갖춘 실세계 로봇 조작을 위해 모방 학습과 강화 학습을 통합하고 증류 기법을 통해 실시간 제어를 가능하게 한 'RL-100' 프레임워크를 제안하며, 다양한 실물 로봇 작업에서 100% 성공률을 기록하고 인간 개입 없이도 장기적으로 안정적으로 작동하는 것을 입증했습니다.

Kun Lei, Huanyu Li, Dongjie Yu, Zhenyu Wei, Lingxiao Guo, Zhennan Jiang, Ziyu Wang, Shiyu Liang, Huazhe XuWed, 11 Ma🤖 cs.AI

From Spatial to Actions: Grounding Vision-Language-Action Model in Spatial Foundation Priors

이 논문은 2D 인코더의 공간적 한계를 극복하고 RGB 만으로 강력한 3D 기하학적 사전 지식을 제공하며, 언어 추론을 보존하기 위해 공간 토큰을 행동 헤드로만 주입하는 새로운 패러다임인 FALCON 을 제안하여 다양한 시뮬레이션 및 실세계 작업에서 최첨단 성능을 달성함을 보여줍니다.

Zhengshen Zhang, Hao Li, Yalun Dai, Zhengbang Zhu, Lei Zhou, Chenchen Liu, Dong Wang, Francis E. H. Tay, Sijin Chen, Ziwei Liu, Yuxiao Liu, Xinghang Li, Pan ZhouWed, 11 Ma🤖 cs.AI

SynHLMA:Synthesizing Hand Language Manipulation for Articulated Object with Discrete Human Object Interaction Representation

이 논문은 자연어 지시를 기반으로 관절형 물체의 변형과 장기 조작 시퀀스를 고려하여 손 그립을 생성하는 새로운 프레임워크 'SynHLMA'를 제안하고, 이를 통해 HAOI 생성, 예측, 보간 작업 및 로봇 그리핑 적용에서 최첨단 성능을 입증합니다.

Wang zhi, Yuyan Liu, Liu Liu, Li Zhang, Ruixuan Lu, Dan GuoWed, 11 Ma🤖 cs.AI

GraphKeeper: Graph Domain-Incremental Learning via Knowledge Disentanglement and Preservation

이 논문은 그래프 기반 모델이 여러 도메인에서 순차적으로 학습할 때 발생하는 catastrophic forgetting 문제를 해결하기 위해, 임베딩 시프트와 결정 경계 편향을 방지하는 지식 분리와 보존 메커니즘을 제안한 GraphKeeper 를 소개합니다.

Zihao Guo, Qingyun Sun, Ziwei Zhang, Haonan Yuan, Huiping Zhuang, Xingcheng Fu, Jianxin LiWed, 11 Ma🤖 cs.AI

Lightweight Time Series Data Valuation on Time Series Foundation Models via In-Context Finetuning

이 논문은 시계열 기반 모델의 성능 향상을 위해 기존 방법의 계산적 한계를 극복하고 시간적 의존성을 보존하는 경량 데이터 가치 평가 기법인 LTSV를 제안하며, 인-컨텍스트 파인튜닝을 통해 효율적이고 강력한 데이터 기여도 측정을 가능하게 합니다.

Shunyu Wu, Tianyue Li, Yixuan Leng, Jingyi Suo, Jian Lou, Dan Li, See-Kiong NgWed, 11 Ma🤖 cs.AI

Multi-Agent Reinforcement Learning with Communication-Constrained Priors

이 논문은 다양한 시나리오의 통신 조건을 통합적으로 모델링하고 손실 유무 메시지를 구분하여 학습 사전 지식으로 활용함으로써, 손실 통신 환경에서도 협력적 다중 에이전트 강화학습의 확장성과 견고성을 향상시키는 새로운 프레임워크를 제안합니다.

Guang Yang, Tianpei Yang, Jingwen Qiao, Yanqing Wu, Jing Huo, Xingguo Chen, Yang GaoWed, 11 Ma🤖 cs.AI

EMFusion: Conditional Diffusion Framework for Trustworthy Frequency Selective EMF Forecasting in Wireless Networks

이 논문은 무선 네트워크의 주파수 선택적 전자기장 (EMF) 예측을 위해 다양한 맥락 정보를 통합하고 불확실성을 정량화하는 조건부 확산 기반 프레임워크 'EMFusion'을 제안하며, 기존 모델보다 예측 정확도와 신뢰성을 크게 향상시킨다고 설명합니다.

Zijiang Yan, Yixiang Huang, Jianhua Pei, Hina Tabassum, Luca ChiaraviglioWed, 11 Ma🤖 cs.AI

Small Language Models for Efficient Agentic Tool Calling: Outperforming Large Models with Targeted Fine-tuning

이 논문은 Hugging Face TRL 을 활용한 단일 에포크 감독 미세조정 (SFT) 으로 3.5 억 파라미터 규모의 소형 언어 모델 (SLM) 을 학습시켜 ToolBench 평가에서 77.55% 의 높은 통과율을 기록하며, ChatGPT-CoT 등 대형 모델들을 압도하는 효율적인 에이전트 도구 호출 솔루션을 제시합니다.

Polaris Jhandi, Owais Kazi, Shreyas Subramanian, Neel SendasWed, 11 Ma🤖 cs.AI

Reinforcement Learning for Self-Improving Agent with Skill Library

이 논문은 LLM 에이전트의 지속적인 자기 개선과 적응 능력을 향상시키기 위해, 이전 작업에서 생성된 기술이 축적되어 후속 작업에 활용되도록 하는 '시퀀셜 롤아웃'과 기술 통합 보상 메커니즘을 도입한 강화 학습 프레임워크인 SAGE 를 제안하고, AppWorld 환경에서 기존 방법보다 정확도와 효율성을 크게 개선한 결과를 입증합니다.

Jiongxiao Wang, Qiaojing Yan, Yawei Wang, Yijun Tian, Soumya Smruti Mishra, Zhichao Xu, Megha Gandhi, Panpan Xu, Lin Lee CheongWed, 11 Ma🤖 cs.AI

MCGI: Manifold-Consistent Graph Indexing for Billion-Scale Disk-Resident Vector Search

이 논문은 고차원 공간에서의 유클리드 - 측지선 불일치 문제를 해결하기 위해 국소 내재 차원성 (LID) 을 활용하여 데이터 매니폴드의 기하학적 특성에 동적으로 적응하는 디스크 기반 벡터 검색 인덱싱 방법인 MCGI 를 제안하며, 수십억 규모 데이터셋에서 기존 최첨단 기법 대비 뛰어난 처리량과 낮은 지연 시간을 입증합니다.

Dongfang ZhaoWed, 11 Ma🤖 cs.AI