When Drafts Evolve: Speculative Decoding Meets Online Learning
이 논문은 스펙큘레이티브 디코딩 과정에서 발생하는 검증 피드백을 온라인 학습 패러다임으로 활용하여 드래프트 모델을 지속적으로 진화시키는 'OnlineSpec' 프레임워크를 제안하고, 이를 통해 추론 속도를 최대 24% 향상시키는 이론적 근거와 알고리즘을 제시합니다.
11358 편의 논문
이 논문은 스펙큘레이티브 디코딩 과정에서 발생하는 검증 피드백을 온라인 학습 패러다임으로 활용하여 드래프트 모델을 지속적으로 진화시키는 'OnlineSpec' 프레임워크를 제안하고, 이를 통해 추론 속도를 최대 24% 향상시키는 이론적 근거와 알고리즘을 제시합니다.
이 논문은 시각적 특징의 직접적인 융합 대신 대규모 시각 - 언어 모델을 활용해 아이템을 자연어 설명으로 변환하고 이를 의미적 공간에 정렬함으로써 추천 성능을 향상시키는 경량 프레임워크 'VLM4Rec'을 제안합니다.
이 논문은 음절 단위 신경 신호를 분류하고 대규모 언어 모델을 결합하여 Mandarin(중국어) 의 화성과 지각을 통합적으로 텍스트로 해독하는 새로운 프레임워크를 제시하며, 이를 통해 뇌-텍스트 해독의 일반화 능력을 입증하고 두 모달리티 간 신경 역학의 특징을 규명했습니다.
본 논문은 게임 이론 모델을 통해 AI 공급망에서 가격 경쟁 촉진 정책과 컴퓨팅 보조금이 비용 조건에 따라 상호 보완적으로 소비자 후생을 증대시키는 반면, 품질 경쟁 촉진 정책은 항상 소비자 후생을 개선하지만 하류 기업의 이익을 감소시킨다는 것을 규명했습니다.
이 논문은 LLM 에이전트의 추론 신뢰성을 높이기 위해 미세 조정 없이 단계별 가치 추정과 예산 조건부 노드 선택 메커니즘을 통해 자원을 효율적으로 관리하는 '예산 인식 가치 트리 (BAVT)' 탐색 프레임워크를 제안하며, 이는 단순한 계산량 증가보다 지능적인 예산 관리가 더 뛰어난 성능을 보임을 입증합니다.
이 논문은 기존 MoE 모델의 메모리 과부하 문제를 해결하기 위해 중복 전문가를 효율적인 모듈로 대체하고 적응적 선택 및 점진적 복구 전략을 도입한 'LightMoE' 프레임워크를 제안하며, 이는 기존 압축 방법보다 뛰어난 성능과 효율성을 입증합니다.
이 논문은 LiDAR 반사도 정보를 활용하여 구조 인식형 Salient Gaussian 표현과 경계 일관성 정합을 도입함으로써, 복잡한 조명 및 고자율 주행 환경에서도 기존 방법보다 우수한 재구성 성능과 효율성을 달성한 'LR-SGS'를 제안합니다.
이 논문은 대규모 언어 모델의 파레스트포링을 완화하고 진화하는 지식에 적응하기 위한 지속적 학습 방법론을 세 가지 주요 학습 단계와 기존 분류 체계를 바탕으로 종합적으로 검토하며, 전통적 기계학습과의 차이점, 평가 지표, 그리고 향후 기회와 과제를 체계적으로 분석합니다.
이 논문은 텍스트의 암시적 의미와 시계열 예측의 명시적 수치 간 모달리티 격차를 해소하기 위해, LLM 을 통해 추출한 해석 가능한 시간적 원시 데이터를 중간 매개체로 활용하는 TESS 모델을 제안하여 예측 오차를 최대 29% 감소시킨 결과를 보여줍니다.
이 논문은 화학자의 전략적 사고를 모방하고 합성-역합성 일관성 보상을 강화학습에 적용하여, 기존 모델보다 더 넓은 범위의 실행 가능한 반응물 제안과 명확한 결합 절단 논리를 제공하는 'RetroReasoner'라는 새로운 역합성 예측 모델을 제안합니다.
이 논문은 마커 기반의 유연하고 비용 효율적인 사진측량 기법을 통해 골재의 고품질 3D 모델을 재구성하고, 이를 통해 2D 와 3D 형태학적 특성 간의 유의미한 차이를 규명하여 골재 품질 관리 및 분석을 용이하게 하는 방법을 제시합니다.
이 논문은 지식 편집 (KE) 을 이계 최적화 문제로 재정의하고, 구조적 그래디언트 프록시를 통해 의미적 목표와 실행 가능 영역 간의 불일치를 해결하여 대규모 언어 모델의 지식 편집 성능을 획기적으로 개선하는 'MetaKE'프레임워크를 제안합니다.
이 논문은 인터넷에 유입된 LLM 생성 데이터가 학습에 포함되면서 최신 ChatGPT 모델들이 서로의 출력과 유사해지고 다양성이 감소하는 '모델 자기수렴' 현상이 발생한다는 실험적 증거를 제시합니다.
이 논문은 클라이언트 데이터의 분포를 기반으로 계층적 클러스터링을 수행하여 최적의 클러스터 수를 자동으로 결정하고, 다양한 크기와 형태의 클러스터를 효과적으로 처리할 수 있는 새로운 연방 클러스터링 프레임워크인 Fed--HC 를 제안합니다.
이 논문은 ABAW-10 대회에서 프레임 단위 감정 인식, 가치 - 각성 추정, 행동 단위 감지 및 미세한 폭력 분류를 위해 사전 훈련된 EfficientNet 기반 임베딩 추출과 MLP, 슬라이딩 윈도우 평활화 기법을 결합한 새로운 접근법을 제안하고, 이를 통해 기존 베이스라인 대비 검증 지표가 크게 향상되었음을 보여줍니다.
이 논문은 인간의 시선과 AI 가 공유하는 1 인칭 시점을 기반으로 공동 주의, 수정 가능한 기억, 반성적 피드백을 통합한 'Eye2Eye'프레임워크를 제안하여 인간-AI 협업의 의사소통 및 이해 격차를 해소하고 작업 효율성과 신뢰를 향상시켰음을 보여줍니다.
이 논문은 멀티모달 LLM 추론의 비동기적 하드웨어 요구사항을 활용하여 비동기적 GPU 환경에서 모달리티 단위의 분할을 통해 데이터 전송 오버헤드를 획기적으로 줄이고, 비용 효율성을 극대화하는 'HeteroServe' 런타임을 제안합니다.
이 논문은 웹 에이전트의 실패 원인을 진단하고 아키텍처를 체계적으로 분류하기 위해 웹 작업을 순차적 의사결정 과정으로 정의하고, 새로운 평가 지표와 데이터셋을 제안하여 단계별 에이전트와 사전 전체 계획 에이전트의 성능 차이를 분석하는 AI 계획 프레임워크를 제시합니다.
본 논문은 비전 - 언어 - 행동 (VLA) 로봇에서 물리적 작업 수행에 대한 내적 추론 과정의 개입이 없어도, 추론 텍스트 내의 객체 이름만 조작하면 로봇의 성공률이 급격히 하락한다는 사실을 규명하여, 추론 모델의 중간 계획 단계가 기존 입력 검증 방어로는 막을 수 없는 새로운 취약점임을 밝혔습니다.
본 논문은 3D 점구름 정합의 정확도와 견고성을 향상시키기 위해 계층적 피라미드 구조, 스킵 어텐션 기반의 HCLA 모듈, 그리고 반복적 기하 인식 정제 IGAR 모듈을 통합한 새로운 프레임워크 'IGASA'를 제안하고, 다양한 벤치마크에서 기존 최첨단 방법들을 능가하는 성능을 입증합니다.