Information Capacity: Evaluating the Efficiency of Large Language Models via Text Compression
이 논문은 토크나이저 효율성을 고려한 새로운 효율성 지표인 '정보 용량 (Information Capacity)'을 제안하고, 이를 통해 다양한 크기와 아키텍처의 오픈소스 대규모 언어 모델들의 추론 효율성을 평가하고 성능 예측 및 언어 편향을 분석했습니다.
4988 편의 논문
이 논문은 토크나이저 효율성을 고려한 새로운 효율성 지표인 '정보 용량 (Information Capacity)'을 제안하고, 이를 통해 다양한 크기와 아키텍처의 오픈소스 대규모 언어 모델들의 추론 효율성을 평가하고 성능 예측 및 언어 편향을 분석했습니다.
이 논문은 시계열 기반 모델의 성능 향상을 위해 기존 방법의 계산적 한계를 극복하고 시간적 의존성을 보존하는 경량 데이터 가치 평가 기법인 LTSV를 제안하며, 인-컨텍스트 파인튜닝을 통해 효율적이고 강력한 데이터 기여도 측정을 가능하게 합니다.
이 논문은 의료 교육 시나리오에서 다중 라운드 추론을 지원하기 위해 대규모 데이터셋 MR-MedSeg 과 오류 전파를 완화하는 '판단 및 수정 메커니즘'을 갖춘 새로운 모델 MediRound 를 제안합니다.
이 논문은 베어링 건강 상태 분류를 위해 미세 조정 없이 시계열 기반 모델의 인-컨텍스트 학습을 활용하여 다양한 운영 조건에서 효과적으로 작동하는 새로운 방법을 제안합니다.
이 논문은 Google Gemini 2.0 Flash 기반의 챗봇을 활용하여 Gmsh 와 GetDP 를 통해 2 차원 와전류 유한요소 시뮬레이션 모델을 자동으로 생성하고 해석하는 워크플로우를 제안함으로써 전자기 시뮬레이션 모델 설정에 소요되는 시간을 단축하는 방법을 연구합니다.
이 논문은 추가 학습 없이도 추론 단계에서 클래스별 특징을 적응적으로 축적하여 희귀 상호작용의 성능을 향상시키는 '적응형 다양성 캐시 (ADC)' 모듈을 제안함으로써 인간 - 객체 상호작용 (HOI) 검출의 장기 꼬리 편향을 완화합니다.
이 논문은 추론과 학습을 분리하여 비동기 파이프라인을 구축하고, 오프-폴리시 편향 없이 온-폴리시 정확도를 유지하며 NPU 환경에서 기존 RL 프레임워크 대비 3~5 배의 학습 처리량을 달성하는 주기적 비동기 방식을 제안합니다.
이 논문은 다양한 비전 - 언어 - 행동 (VLA) 모델과 실제 환경에서 전이 가능한 범용 물리적 패치 공격을 가능하게 하는 'UPA-RFAS'라는 새로운 프레임워크를 제안하고, 이를 통해 로봇 시스템의 취약성을 규명합니다.
이 논문은 다양한 시나리오의 통신 조건을 통합적으로 모델링하고 손실 유무 메시지를 구분하여 학습 사전 지식으로 활용함으로써, 손실 통신 환경에서도 협력적 다중 에이전트 강화학습의 확장성과 견고성을 향상시키는 새로운 프레임워크를 제안합니다.
이 논문은 교육용 RAG 시스템의 사실적 정확도를 높이기 위해 엔티티 링크링을 통합한 ELERAG 아키텍처를 제안하고, 도메인 특화 데이터셋에서 기존 베이스라인 및 크로스-인코더 기반 방법보다 우수한 성능을 입증했습니다.
이 논문은 무선 네트워크의 주파수 선택적 전자기장 (EMF) 예측을 위해 다양한 맥락 정보를 통합하고 불확실성을 정량화하는 조건부 확산 기반 프레임워크 'EMFusion'을 제안하며, 기존 모델보다 예측 정확도와 신뢰성을 크게 향상시킨다고 설명합니다.
이 논문은 Hugging Face TRL 을 활용한 단일 에포크 감독 미세조정 (SFT) 으로 3.5 억 파라미터 규모의 소형 언어 모델 (SLM) 을 학습시켜 ToolBench 평가에서 77.55% 의 높은 통과율을 기록하며, ChatGPT-CoT 등 대형 모델들을 압도하는 효율적인 에이전트 도구 호출 솔루션을 제시합니다.
이 논문은 LLM 에이전트의 지속적인 자기 개선과 적응 능력을 향상시키기 위해, 이전 작업에서 생성된 기술이 축적되어 후속 작업에 활용되도록 하는 '시퀀셜 롤아웃'과 기술 통합 보상 메커니즘을 도입한 강화 학습 프레임워크인 SAGE 를 제안하고, AppWorld 환경에서 기존 방법보다 정확도와 효율성을 크게 개선한 결과를 입증합니다.
이 논문은 고차원 공간에서의 유클리드 - 측지선 불일치 문제를 해결하기 위해 국소 내재 차원성 (LID) 을 활용하여 데이터 매니폴드의 기하학적 특성에 동적으로 적응하는 디스크 기반 벡터 검색 인덱싱 방법인 MCGI 를 제안하며, 수십억 규모 데이터셋에서 기존 최첨단 기법 대비 뛰어난 처리량과 낮은 지연 시간을 입증합니다.
이 논문은 기존 활성화 기반 방법의 한계를 극복하고, 표적 뉴런 개입을 통해 언어별 예측에 대한 기능적 기여도를 분석하여 다국어 대형 언어 모델 내 언어별 뉴런의 비대칭적 전문성을 규명하는 CRANE 프레임워크를 제안합니다.
이 논문은 학습된 단일 모델로 재학습 없이도 임의의 조건부 추론을 수행하고 불확실성을 정량화할 수 있도록, 확률적 반복 베이지안 업데이트 알고리즘을 기반으로 한 새로운 베이지안 생성 모델링 (BGM) 프레임워크를 제안합니다.
이 논문은 위성 메가컨스텔레이션 시대에 우주선 전원 시스템의 건강 관리를 혁신하기 위해 인간-AI 협업 프레임워크인 SpaceHMchat 과 새로운 데이터셋을 제안하고, 하드웨어 기반 실험을 통해 그 탁월한 성능을 입증했습니다.
이 논문은 단일 모드, 미세 병변 패턴, 장비 간 편차로 인한 한계를 극복하기 위해 하이퍼네트워크 기반 적응적 조건부 레이어 (HaC) 와 증거 불확실성 학습 기반 신뢰성 예측 체계 (RaP) 를 도입한 CLEAR-Mamba 프레임워크를 제안하여, FFA 및 ICGA 영상을 포함한 대규모 안과 혈관조영 데이터셋에서 기존 모델보다 뛰어난 분류 성능과 신뢰성을 입증했습니다.
이 논문은 대규모 언어 모델 (LLM) 기반 웹 연구 에이전트를 활용하여 자동화되고 검증 가능한 다양한 미래 예측 질문 생성 및 해결 시스템을 구축하고, 이를 통해 AI 예측 모델의 성능 평가와 예측 정확도 향상을 입증했습니다.
이 논문은 고품질의 다턴 도구 사용 데이터를 생성하고 검증 기반 강화 학습을 통해 사용자 시뮬레이션 노이즈를 줄이는 통합 프레임워크인 'EigenData'를 제안하여, 고비용 인간 라벨링 없이도 복잡한 도구 사용 에이전트를 확장 가능하게 학습시키는 방법을 제시합니다.