Taking Shortcuts for Categorical VQA Using Super Neurons
이 논문은 비전 언어 모델의 얕은 계층에서 직접 스칼라 활성화 값을 추출하여 '슈퍼 뉴런'을 식별함으로써, 추가 학습 없이도 분류 성능을 향상시키고 최대 5.10 배의 속도 향상을 이루는 새로운 효율적 접근법을 제안합니다.
4797 편의 논문
이 논문은 비전 언어 모델의 얕은 계층에서 직접 스칼라 활성화 값을 추출하여 '슈퍼 뉴런'을 식별함으로써, 추가 학습 없이도 분류 성능을 향상시키고 최대 5.10 배의 속도 향상을 이루는 새로운 효율적 접근법을 제안합니다.
이 논문은 5G/6G 네트워크 계획의 신뢰성을 높이기 위해 공간적 자기상관으로 인한 데이터 누출을 방지하고 잔차 보정을 적용한 문맥 인식 2 단계 분할 전략을 통해 셀룰러 트래픽 수요를 정확하게 예측하는 AI 기반 프레임워크를 제안합니다.
이 논문은 공개된 배포 기록을 기반으로 스펙트럼 수요를 추정하기 위해 계층적 다해상도 그래프 어텐션 네트워크 (HR-GAT) 를 제안하며, 다섯 개 캐나다 도시에서의 평가 결과 기존 최우수 모델 대비 중앙값 RMSE 를 약 21% 감소시키고 공간적 편향을 줄여 무선 네트워크의 스펙트럼 공유 및 할당을 지원함을 보여줍니다.
이 논문은 사전 훈련된 확산 모델을 매니폴드 사전으로 활용하여, 단백질의 원하는 특성 달성, 변이 최소화, 그리고 접힘 가능성이라는 세 가지 목표를 균형 있게 충족시키는 생물학적으로 타당한 최소 변이를 생성하는 'MCCOP' 프레임워크를 제안하고 GFP 형광 회복, 열역학적 안정성 향상, E3 리가제 활성 복구 등 다양한 단백질 공학 과제에서 기존 방법론보다 우수한 성능을 입증합니다.
이 논문은 무작위 평활화 (randomized smoothing) 기법을 자율 주행 궤적 예측 모델에 적용하여, 공격에 대한 견고성을 향상시키면서도 정상 환경에서의 예측 정확도를 유지하는 효과적이고 계산 비용이 낮은 방어 메커니즘을 제안하고 검증했습니다.
이 논문은 데이터 부족과 불균형이 있는 표본 데이터 환경에서 예측 성능을 극대화하기 위해 강화 학습을 활용하여 특징 간 상관관계를 보존하는 조건부 분포 학습에 중점을 둔 새로운 합성 데이터 생성 프레임워크 'ReTabSyn'을 제안합니다.
이 논문은 데이터가 부족한 NPU 커널 합성 분야에서 대규모 언어 모델의 성능 저하를 해결하기 위해, 가치 기반 기억 메커니즘을 통해 경험을 축적하고 단계별로 최적화하는 자기 진화 에이전트 프레임워크인 EvoKernel 을 제안합니다.
이 논문은 희소 롤아웃 환경에서 사전 학습된 일반 가치 모델의 예측을 사전 지식으로 활용하고 실시간 통계 검증을 통해 추가 롤아웃 예산을 동적으로 할당함으로써, 편향과 분산을 균형 있게 제어하여 GRPO 및 DAPO 보다 우수한 성능을 보이는 새로운 가치 모델 를 제안합니다.
이 논문은 6S 복사 전달 모델과 구글 어스 엔진을 활용하여 EnMAP 초분광 위성의 수역 대기 보정을 자동화하는 오픈 소스 프레임워크인 6ABOS 를 개발하고, 지중해 내수역에서의 현장 측정 데이터와의 높은 일치도를 통해 그 유효성을 입증했습니다.
SNPgen 은 표현형 정보를 조건으로 한 잠재 확산 모델을 통해 개인 식별 정보가 완전히 제거된 채 질병 예측 성능을 유지하는 합성 유전자형 데이터를 생성하는 새로운 프레임워크를 제안합니다.
이 논문은 낮은 신호 대 잡음비와 높은 개인 간 변이성으로 인한 EEG 분류의 어려움을 해결하기 위해, 사전 학습을 통해 공통 패턴을 포착하고 로렌츠 저랭크 어댑터를 활용해 개인별 특성을 학습하는 'LAtte'라는 새로운 프레임워크를 제안하여 교차 대상 EEG 분류 성능을 크게 향상시켰음을 보여줍니다.
이 논문은 U-Net 을 변형한 파라미터 효율적인 Diffusion Transformer 를 도입하여 200bp 세포 유형별 조절 DNA 서열을 생성하고, Enformer 기반 보상 모델을 활용한 DDPO 미세조정을 통해 예측된 조절 활성을 38 배 향상시켰음을 보고합니다.
이 논문은 기존 동등성 검정의 한계를 극복하고 분포 전체의 차이를 평가하기 위해 커널 스타인 불일치와 최대 평균 불일치를 활용한 새로운 커널 기반 동등성 검정 방법을 제안합니다.
이 논문은 대규모 추론 모델의 강화학습 미세조정 과정에서 비용이 많이 드는 롤아웃을 줄이고 학습 효율성을 극대화하기 위해, 히든 마르코프 모델을 기반으로 한 동적 예측 샘플링 (DPS) 을 제안하여 학습 동역학을 사전에 예측하고 정보량이 풍부한 프롬프트를 선별하는 방법을 제시합니다.
이 논문은 강화학습에서 비에르고딕 보상 과정 하에서 단일 에이전트의 장기적 성능을 최적화하기 위해 기대값 대신 개별 궤적의 평균을 고려해야 함을 예시를 통해 설명하고, 기존 해결 방안들을 제시합니다.
이 논문은 드래프트 생성 없이 파라미터 효율적인 모듈을 통해 미래의 KV 중요도를 예측함으로써, 기존 방법들보다 훨씬 낮은 오버헤드로 긴 컨텍스트 작업에서 KV 캐시 제거의 정확성과 속도를 동시에 향상시키는 'LookaheadKV'를 제안합니다.
이 논문은 랭크-스코어 특성 함수와 인지 다양성을 활용한 결합적 융합 분석 (CFA) 을 통해 2024 년 NCAA 토너먼트 결과 예측 정확도를 기존 최상위 시스템보다 높은 74.60% 로 끌어올린 새로운 접근법을 제시합니다.
이 논문은 차량 내 배포 환경의 제한된 컴퓨팅 자원 하에서 예측 가능한 지연 시간과 안정성을 보장하기 위해, 기존 정확도 중심 평가의 한계를 극복하고 다양한 이상 탐지 모델의 실제 배포 적합성을 체계적으로 평가하는 'ECoLAD' 프로토콜을 제안합니다.
이 논문은 가우시안 혼합 모델 클러스터링의 다중성을 활용하여 반복적인 선택 과정을 통해 '역사적 합의 (Historical Consensus)'를 형성함으로써, 아키텍처 제약이나 하이퍼파라미터 튜닝 없이도 후방 붕괴를 근본적으로 방지하는 새로운 VAE 학습 기법을 제안합니다.
이 논문은 커널 밀도 추정 (KDE) 을 기반으로 훈련 데이터의 분포와 합성 데이터 간의 거리 분포를 모델링하여, 기존 방법보다 정밀하고 계산 효율적으로 표본 합성 데이터의 구성원 유출 위험을 정량화하는 실용적인 프레임워크를 제안합니다.