Enhancing Instruction Following of LLMs via Activation Steering with Dynamic Rejection
이 논문은 과도한 조향으로 인한 품질 저하를 방지하기 위해 가중치 조정과 가능성 기반 디코딩 루프를 결합하여 동적으로 조향 강도를 조절하는 새로운 방법인 DIRECTER 를 제안함으로써 대규모 언어 모델의 지시 따르기 능력을 향상시킵니다.
7103 편의 논문
이 논문은 과도한 조향으로 인한 품질 저하를 방지하기 위해 가중치 조정과 가능성 기반 디코딩 루프를 결합하여 동적으로 조향 강도를 조절하는 새로운 방법인 DIRECTER 를 제안함으로써 대규모 언어 모델의 지시 따르기 능력을 향상시킵니다.
이 논문은 구조적 충실도를 유지하면서 용해도와 열안정성 등 다양한 개발성 속성을 동시에 만족시키기 위해 사전 학습된 역접힘 모델을 다목적 선호도 정렬 (ProtAlign) 프레임워크로 미세 조정하는 새로운 방법을 제시합니다.
이 논문은 비선형 역학 시스템에서 데이터 동화의 성능을 향상시키기 위해, 학습된 잠재 공간 내에서 선형적이고 안정적인 역학을 갖는 오토인코더 기반 앙상블 칼만 필터 (LAE-EnKF) 를 제안하고 그 이론적 근거와 수치적 유효성을 입증합니다.
이 논문은 양자 암시적 신경 표현 (QINR) 을 디코더에 통합한 하이브리드 오토인코더 및 변이형 오토인코더를 제안하여, 제한된 파라미터와 데이터로도 MNIST 등 다양한 데이터셋에서 고주파 특징이 풍부한 선명한 이미지 재구성과 생성이 가능하며 기존 양생성 모델보다 안정적이고 다양성이 높음을 입증합니다.
이 논문은 불균형 데이터에서 소규모 개념의 드리프트를 대규로 개념의 영향으로부터 독립적으로 탐지하고 해석할 수 있도록 설계된 '불균형 클러스터 기술자 기반 드리프트 탐지 (ICD3)' 방법을 제안합니다.
이 논문은 알츠하이머병 진단 및 예후를 위한 머신러닝 모델의 SHAP 설명이 질병 단계와 모델 아키텍처에 걸쳐 일관되고 안정적임을 NACC 데이터셋 기반 실험을 통해 입증함으로써, 임상 현장에서의 신뢰할 수 있는 해석을 가능하게 하는 다단계 설명 가능성 프레임워크를 제안합니다.
이 논문은 PDE 잔차 기반 중요도와 공간적 다양성을 동시에 고려하여 QUBO 최적화와 희소 그래프 기반 하이브리드 코어셋을 통해 물리 정보 신경망 (PINN) 의 콜로케이션 점 선택을 최적화하고, 기존 방법 대비 선택 오버헤드를 줄이면서 정확도를 향상시키는 새로운 방법을 제안합니다.
이 논문은 다공성 매체 내 정상류 예측을 위해 물리 정보 손실 함수를 통합한 머신러닝 프레임워크를 개발하고, CFD 대비 최대 1000 배의 속도 향상과 0.0017 의 낮은 평균 제곱 오차를 달성한 Fourier Neural Operator(FNO) 가 최적의 모델임을 입증했습니다.
이 논문은 그래프 합성곱 신경망과 메타러닝 아키텍처를 결합하여 도로 네트워크 구조 변화 및 수요 패턴 변동이 동시에 발생하는 미지의 교통 혼란 상황에서도 신속하게 적응하고 높은 예측 정확도 (R² 약 0.85) 를 달성하는 교통 배정 모델을 제안합니다.
이 논문은 안전이 중요한 화학 공정 분야에서 설명 가능성과 해석 가능성이 부족하며 실제 고장 데이터가 희소한 기존 AI 의 한계를 극복하기 위해, 에틸렌 산화 공정을 사례로 상징적 기계 학습을 활용하여 고장을 예측하고 해석 가능한 규칙 기반 모델을 생성하는 방법을 제안합니다.
이 논문은 신경망 표현 공간이 가역적 선형 변환에 대한 게이지 자유도를 가지므로 코사인 유사도 등 기존 유사도 측정치가 좌표계 선택에 따라 달라질 수 있음을 보여주고, 이에 따라 표현 분석은 게이지 불변량을 사용하거나 명시적인 표준 좌표를 설정해야 함을 주장합니다.
이 논문은 작업장 스케줄링 문제를 이종 그래프로 모델링하고 이종 그래프 트랜스포머를 활용하여 작업 우선순위 및 기계 경쟁 관계를 구분해 학습함으로써, 기존 동종 그래프 기반 강화학습 방법보다 우수한 스케줄링 성능을 달성하는 'HGT-Scheduler'를 제안합니다.
이 논문은 그래프 확산과 공간 어텐션을 결합한 하이브리드 프레임워크인 SpatialMAGIC 을 제안하여, 공간 전사체 데이터의 희소성과 기술적 노이즈를 해결하고 클러스터링 정확도 및 하류 생물학적 분석 성능을 기존 방법론보다 향상시켰음을 보여줍니다.
이 논문은 실제 데이터셋에 존재하지 않는 시간적 근거를 평가하기 위해, 합성 시계열 데이터 생성 및 표준 로컬라이제이션 지표를 제공하는 재사용 가능한 Python 패키지 'xaitimesynth'를 소개합니다.
이 논문은 데이터 부족과 클래스 불균형으로 인한 난제 해결을 위해, 물리 법칙을 반영한 컨텍스트 기반 확산 모델을 개발하여 열대성 저기압의 급격한 강화를 특징으로 하는 극단적 기상 현상의 합성 데이터를 생성하고, 이를 통해 운영용 기상 탐지 알고리즘의 성능을 향상시키는 확장 가능한 프레임워크를 제시합니다.
이 논문은 조기 수렴 문제를 해결하고 샘플 효율성을 향상시키기 위해 과거의 성공적인 트래젝토리를 보존하고 강화하는 경량 메커니즘인 '낙관적 정책 정규화 (OPR)'를 제안하며, 아타리 및 사이버 방어 환경에서 기존 최첨단 방법보다 뛰어난 성능을 입증했습니다.
이 논문은 보상 분포의 꼬리 두께에 따라 최적의 추론 시간 정렬 전략이 달라진다는 통찰을 바탕으로, 힐 추정기를 통해 꼬리 특성을 동적으로 분석하고 트살리스 발산을 정규화자로 활용하여 낙관주의와 비관주의를 적응적으로 조화시키는 'Best-of-Tails (BoT)' 프레임워크를 제안합니다.
이 논문은 분산 딥러닝 훈련 시 병렬화, 메모리, 네트워크 토폴로지를 통합적으로 고려하여 구조화된 동적 프로그래밍을 통해 최적의 디바이스 배치를 찾는 NEST 프레임워크를 제안하며, 기존 방법론 대비 최대 2.43 배의 처리량 향상과 향상된 확장성을 입증합니다.
이 논문은 에이전트 간 기여도가 중복되는 현실적 시나리오를 모델링하는 협력적 다중 에이전트 강화학습을 위해, 하모듈성 보상을 고려한 새로운 프레임워크를 제시하고 알려진 동역학 하에서는 다항 시간 복잡도로 1/2-근사 해를, 알려지지 않은 동역학 하에서는 UCB 기반 알고리즘을 통해 regret bound 를 보장하는 알고리즘을 제안합니다.
본 논문은 예측 불확실성을 명시적으로 반영하는 크레달 (credal) 방법과 분포 무관한 보장을 제공하는 공형적 (conformal) 예측의 장점을 결합하여, 모델의 외삽 영역에서도 해석 가능하고 보정된 예측 구간을 제공하는 'CREDO'라는 새로운 회귀 기법을 제안합니다.