Input-Adaptive Generative Dynamics in Diffusion Models
이 논문은 각 샘플의 생성 난이도에 따라 고정된 확산 궤적이 아닌 입력 적응형 생성 역학을 도입하여, 생성 품질을 유지하면서 평균 샘플링 단계를 줄일 수 있음을 증명합니다.
2412 편의 논문
이 논문은 각 샘플의 생성 난이도에 따라 고정된 확산 궤적이 아닌 입력 적응형 생성 역학을 도입하여, 생성 품질을 유지하면서 평균 샘플링 단계를 줄일 수 있음을 증명합니다.
이 논문은 경쟁자가 서로의 상태나 행동을 알지 못하는 상황에서도 다중-팔 밴딧 알고리즘이 동기화된 행동을 통해 '순진한 담합'을 학습할 수 있음을 보여주며, 이는 탐험과 확정을 어떻게 균형시키는지에 따라 발생 여부가 결정된다고 주장합니다.
이 논문은 2D 라이다와 오도메트리를 탑재한 로봇이 클라우드 기반의 비지도 딥러닝을 활용해 실시간 지도를 재구성하는 평생 SLAM 시스템의 에너지 효율을 극대화하기 위해 감지, 통신, 기계적 요소를 통합적으로 최적화하는 방법을 제안합니다.
이 논문은 다양한 멀티모달 작업에 적용 가능한 참조 없는 포괄적 평가 지표인 HarmonicEval 과 이를 검증하기 위한 18,000 개의 인간 평가 데이터로 구성된 MMHE 벤치마크를 제안하여, 기존 지표보다 인간 판단과의 상관관계가 높고 세부 기준별 점수를 제공하는 것을 입증합니다.
이 논문은 사전 학습된 비전 - 언어 모델 (VLM) 을 활용하여 시각적 술어 (predicates) 를 추출하고 최적화 기반 학습을 통해 추상적 심볼릭 세계 모델을 구축함으로써, 제한된 짧은 시퀀스 데모만으로도 다양한 물체, 배경, 그리고 훈련 시 보지 못한 긴 시간 범위의 새로운 목표에 대해 제로샷 일반화가 가능한 로봇 의사결정 시스템을 제안합니다.
이 논문은 잠재 공간 클러스터링을 기반으로 결정 경계 근처의 핵심 데이터 샘플을 선별하거나 생성하여, 반지도 적대적 학습 (SSAT) 의 데이터 요구량과 계산 비용을 획기적으로 줄이면서도 강력한 적대적 견고성을 유지하는 효율적인 방법을 제안합니다.
이 논문은 다중 모델 앙상블의 높은 계산 비용과 블랙박스 모델 적용의 한계를 극복하기 위해, 단일 모델을 활용하여 피벗 번역을 통해 생성된 후보들을 사후 집계하는 새로운 앙상블 프레임워크를 제안하고, 이를 통해 저자원 언어 쌍의 번역 품질을 획기적으로 향상시켰음을 보여줍니다.
이 논문은 모델의 기울기를 활용하여 사회적 편향 정보를 인코딩하는 새로운 인코더-디코더 접근법인 GRADIEND를 제안함으로써, 모델의 특정 가중치를 식별하고 수정하여 다른 능력을 유지하면서 편향을 제거할 수 있음을 보여줍니다.
이 논문은 부호화 네트워크에서 크기 불균형 문제를 해결하고 중립 정점을 허용하면서도 대규모 네트워크에 확장 가능한 효율적인 국소 탐색 알고리즘을 제안하여, 기존 방법들보다 우수한 분극된 커뮤니티 탐지 성능을 입증합니다.
이 논문은 연방 학습 환경에서 저랭크 적응 (LoRA) 기법을 적용하면 모델의 성능 저하 없이 훈련 데이터의 암기 현상을 최대 10 배까지 감소시켜 개인정보 보호를 강화할 수 있음을 입증합니다.
이 논문은 저해상도 이미지 쌍을 활용한 자기지도 학습과 잠재 확산 기반의 구조적 표현 프롬프트 생성, 그리고 구조적 어텐션 모듈을 결합하여 상세한 구조 정보를 보존하면서 단일 이미지 노이즈 제거 성능을 극대화하는 'Prompt-SID' 프레임워크를 제안합니다.
이 논문은 윤리적 민감도가 높은 AI 시스템의 해석 가능성과 정확성 간의 균형을 위해, 이산적 분할을 통해 정보 손실을 정량화하고 교육 및 XAI 분야에서의 적용 가능성을 제시하는 '거친 분할 (Coarse-Grained Partitions)' 프레임워크를 제안합니다.
이 논문은 시계열 데이터와 짝을 이루는 텍스트가 시계열의 주기적 특성을 반영한다는 통찰을 바탕으로, 기존 수치 기반 시계열 모델의 아키텍처를 변경하지 않고도 텍스트를 보조 변수로 활용하여 다중 모달 예측 성능을 향상시키는 'Texts as Time Series (TaTS)' 프레임워크를 제안합니다.
이 논문은 대규모 언어 모델 (LLM) 을 활용하여 뇌의 시각 피질 뉴런이 특정 이미지에 반응하는 이유를 자연어 캡션으로 생성하고 해석하는 'LaVCa'라는 새로운 접근법을 제안하며, 기존 방법보다 더 정교하고 상세한 뇌 표현의 특성을 규명했다고 요약할 수 있습니다.
이 논문은 LLM 의 하류 작업 성능 예측 정확도를 높이기 위해 작업 난이도 특성에 따라 클러스터링하는 COD 프레임워크를 제안하고, 이를 통해 예측 가능한 하위 집단의 성능을 전체 평가 세트로 외삽하여 70B 파라미터 모델에서 평균 1.55% 의 낮은 예측 오차를 달성했음을 보여줍니다.
이 논문은 BraTS 데이터셋의 다중 MRI 시퀀스를 기반으로 UNet 을 활용한 2D 및 3D 분할 결과를 가중 평균으로 융합하고 사전 학습된 ResNet50 모델에 입력하여 뇌종양 아형 분류 정확도를 99.25% 로 극대화하는 새로운 기법을 제안합니다.
이 논문은 BraTS 데이터셋을 기반으로 UNET, Inception, ResNet 아키텍처를 활용한 딥러닝 기반 2D 및 3D MRI 뇌종양 자동 분할 모델을 제안하여, 3D 분할에서 98.91% 의 정확도와 0.9888 의 Dice 점수를 달성함으로써 임상 진단 효율성을 크게 향상시켰음을 보여줍니다.
이 논문은 텍스트-이미지 확산 모델의 미세 조정을 위해 REINFORCE 의 분산 감소 기법과 PPO 의 견고함을 결합하여 샘플 효율성과 최종 성능 간의 균형을 개선한 새로운 강화 학습 방법인 'LOOP(Leave-One-Out PPO)'를 제안합니다.
이 논문은 Minecraft 와 같은 동적 환경에서 실시간 대응 능력을 향상시키기 위해, 중앙 집중식 메모리 기반의 계획 스레드와 기술 라이브러리를 활용한 행동 스레드로 구성된 병렬 계획 - 실행 프레임워크를 제안합니다.
이 논문은 웨어러블 센서와 식이 데이터를 활용하여 대형 언어 모델과 기계 학습을 결합한 'GlucoLens' 시스템을 개발함으로써 식후 고혈당을 예측하고 개인 맞춤형 행동 치료 경로를 제시하는 설명 가능한 솔루션을 제안합니다.