REAP the Experts: Why Pruning Prevails for One-Shot MoE compression
이 논문은 기존 전문가 병합 기법보다 정교한 라우팅 제어가 가능한 전문가 가지치기가 생성 작업에서 더 우수하다는 점을 규명하고, 라우터 게이트 값과 전문가 활성화 노름을 고려한 새로운 가지치기 기준인 REAP 를 제안하여 대규모 SMoE 모델의 압축 성능을 획기적으로 개선했음을 보여줍니다.
2220 편의 논문
이 논문은 기존 전문가 병합 기법보다 정교한 라우팅 제어가 가능한 전문가 가지치기가 생성 작업에서 더 우수하다는 점을 규명하고, 라우터 게이트 값과 전문가 활성화 노름을 고려한 새로운 가지치기 기준인 REAP 를 제안하여 대규모 SMoE 모델의 압축 성능을 획기적으로 개선했음을 보여줍니다.
이 논문은 인간 숙련도 수준의 신뢰성과 효율성을 갖춘 실세계 로봇 조작을 위해 모방 학습과 강화 학습을 통합하고 증류 기법을 통해 실시간 제어를 가능하게 한 'RL-100' 프레임워크를 제안하며, 다양한 실물 로봇 작업에서 100% 성공률을 기록하고 인간 개입 없이도 장기적으로 안정적으로 작동하는 것을 입증했습니다.
이 논문은 2D 인코더의 공간적 한계를 극복하고 RGB 만으로 강력한 3D 기하학적 사전 지식을 제공하며, 언어 추론을 보존하기 위해 공간 토큰을 행동 헤드로만 주입하는 새로운 패러다임인 FALCON 을 제안하여 다양한 시뮬레이션 및 실세계 작업에서 최첨단 성능을 달성함을 보여줍니다.
이 논문은 자연어 지시를 기반으로 관절형 물체의 변형과 장기 조작 시퀀스를 고려하여 손 그립을 생성하는 새로운 프레임워크 'SynHLMA'를 제안하고, 이를 통해 HAOI 생성, 예측, 보간 작업 및 로봇 그리핑 적용에서 최첨단 성능을 입증합니다.
이 논문은 그래프 기반 모델이 여러 도메인에서 순차적으로 학습할 때 발생하는 catastrophic forgetting 문제를 해결하기 위해, 임베딩 시프트와 결정 경계 편향을 방지하는 지식 분리와 보존 메커니즘을 제안한 GraphKeeper 를 소개합니다.
이 논문은 다중 클래스 분류에서 과적합을 방지하면서도 기존 로지스틱 기반 보정 기법보다 우수한 성능을 달성하기 위해 구조적 정규화, 견고한 전처리 및 효율적 최적화를 결합한 새로운 사후 보정 방법론을 제안하고 그 유효성을 실험을 통해 입증합니다.
이 논문은 시계열 기반 모델의 성능 향상을 위해 기존 방법의 계산적 한계를 극복하고 시간적 의존성을 보존하는 경량 데이터 가치 평가 기법인 LTSV를 제안하며, 인-컨텍스트 파인튜닝을 통해 효율적이고 강력한 데이터 기여도 측정을 가능하게 합니다.
이 논문은 의료 교육 시나리오에서 다중 라운드 추론을 지원하기 위해 대규모 데이터셋 MR-MedSeg 과 오류 전파를 완화하는 '판단 및 수정 메커니즘'을 갖춘 새로운 모델 MediRound 를 제안합니다.
이 논문은 베어링 건강 상태 분류를 위해 미세 조정 없이 시계열 기반 모델의 인-컨텍스트 학습을 활용하여 다양한 운영 조건에서 효과적으로 작동하는 새로운 방법을 제안합니다.
이 논문은 Google Gemini 2.0 Flash 기반의 챗봇을 활용하여 Gmsh 와 GetDP 를 통해 2 차원 와전류 유한요소 시뮬레이션 모델을 자동으로 생성하고 해석하는 워크플로우를 제안함으로써 전자기 시뮬레이션 모델 설정에 소요되는 시간을 단축하는 방법을 연구합니다.
이 논문은 추가 학습 없이도 추론 단계에서 클래스별 특징을 적응적으로 축적하여 희귀 상호작용의 성능을 향상시키는 '적응형 다양성 캐시 (ADC)' 모듈을 제안함으로써 인간 - 객체 상호작용 (HOI) 검출의 장기 꼬리 편향을 완화합니다.
이 논문은 추론과 학습을 분리하여 비동기 파이프라인을 구축하고, 오프-폴리시 편향 없이 온-폴리시 정확도를 유지하며 NPU 환경에서 기존 RL 프레임워크 대비 3~5 배의 학습 처리량을 달성하는 주기적 비동기 방식을 제안합니다.
이 논문은 다양한 비전 - 언어 - 행동 (VLA) 모델과 실제 환경에서 전이 가능한 범용 물리적 패치 공격을 가능하게 하는 'UPA-RFAS'라는 새로운 프레임워크를 제안하고, 이를 통해 로봇 시스템의 취약성을 규명합니다.
이 논문은 다양한 시나리오의 통신 조건을 통합적으로 모델링하고 손실 유무 메시지를 구분하여 학습 사전 지식으로 활용함으로써, 손실 통신 환경에서도 협력적 다중 에이전트 강화학습의 확장성과 견고성을 향상시키는 새로운 프레임워크를 제안합니다.
이 논문은 교육용 RAG 시스템의 사실적 정확도를 높이기 위해 엔티티 링크링을 통합한 ELERAG 아키텍처를 제안하고, 도메인 특화 데이터셋에서 기존 베이스라인 및 크로스-인코더 기반 방법보다 우수한 성능을 입증했습니다.
이 논문은 무선 네트워크의 주파수 선택적 전자기장 (EMF) 예측을 위해 다양한 맥락 정보를 통합하고 불확실성을 정량화하는 조건부 확산 기반 프레임워크 'EMFusion'을 제안하며, 기존 모델보다 예측 정확도와 신뢰성을 크게 향상시킨다고 설명합니다.
이 논문은 Hugging Face TRL 을 활용한 단일 에포크 감독 미세조정 (SFT) 으로 3.5 억 파라미터 규모의 소형 언어 모델 (SLM) 을 학습시켜 ToolBench 평가에서 77.55% 의 높은 통과율을 기록하며, ChatGPT-CoT 등 대형 모델들을 압도하는 효율적인 에이전트 도구 호출 솔루션을 제시합니다.
이 논문은 LLM 에이전트의 지속적인 자기 개선과 적응 능력을 향상시키기 위해, 이전 작업에서 생성된 기술이 축적되어 후속 작업에 활용되도록 하는 '시퀀셜 롤아웃'과 기술 통합 보상 메커니즘을 도입한 강화 학습 프레임워크인 SAGE 를 제안하고, AppWorld 환경에서 기존 방법보다 정확도와 효율성을 크게 개선한 결과를 입증합니다.
이 논문은 고차원 공간에서의 유클리드 - 측지선 불일치 문제를 해결하기 위해 국소 내재 차원성 (LID) 을 활용하여 데이터 매니폴드의 기하학적 특성에 동적으로 적응하는 디스크 기반 벡터 검색 인덱싱 방법인 MCGI 를 제안하며, 수십억 규모 데이터셋에서 기존 최첨단 기법 대비 뛰어난 처리량과 낮은 지연 시간을 입증합니다.
이 논문은 기존 활성화 기반 방법의 한계를 극복하고, 표적 뉴런 개입을 통해 언어별 예측에 대한 기능적 기여도를 분석하여 다국어 대형 언어 모델 내 언어별 뉴런의 비대칭적 전문성을 규명하는 CRANE 프레임워크를 제안합니다.