LiTo: Surface Light Field Tokenization
이 논문은 RGB-깊이 이미지를 표면 광장 (Surface Light Field) 샘플로 활용하여 기하학과 뷰 의존적 외관을 통합된 3D 잠재 공간으로 토큰화하고, 이를 기반으로 단일 이미지에서 조명과 재질이 일관된 고품질 3D 객체를 생성하는 'LiTo'를 제안합니다.
4972 편의 논문
이 논문은 RGB-깊이 이미지를 표면 광장 (Surface Light Field) 샘플로 활용하여 기하학과 뷰 의존적 외관을 통합된 3D 잠재 공간으로 토큰화하고, 이를 기반으로 단일 이미지에서 조명과 재질이 일관된 고품질 3D 객체를 생성하는 'LiTo'를 제안합니다.
이 논문은 유튜브 코미디 영상 분석을 통해 학습된 LLM 비평가와 다양한 역할을 수행하는 에이전트 군집을 활용하여, 전문적인 스케치 코미디 수준의 자동화 AI 시스템 'COMIC'을 제안하고 그 성능을 입증합니다.
이 논문은 자율주행 환경에서 차량이나 장애물로 인해 가려진 보행자의 키 포인트를 수치 분포 기반의 생성적 적대 신경망 (SDR-GAIN) 을 통해 실시간으로 정확하게 복원하는 새로운 방법을 제안하고 COCO 및 JAAD 데이터셋에서 기존 방법보다 우수한 성능과 마이크로초 단위의 추론 속도를 입증했습니다.
이 논문은 새로운 피험자의 훈련 데이터 의존도를 줄이면서 RSVP-BCI 의 해독 성능을 향상시키기 위해, EEG 신호의 시공간 및 스펙트로그램 정보를 융합하는 트랜스포머 아키텍처와 피험자별 어댑터를 제안합니다.
이 논문은 다양한 카메라 각도와 가려짐으로 인한 어려움을 극복하기 위해 3D 축구장 모델과 검출된 필드 라인을 비선형 최적화 과정에 활용하는 'PnLCalib'라는 새로운 최적화 기반 보정 파이프라인을 제안하여 기존 방법들보다 향상된 정확도와 견고성을 달성했다고 설명합니다.
이 논문은 사전 훈련된 텍스트 - 이미지 확산 모델의 강건한 지각 능력을 활용하여 제한된 데이터로도 뛰어난 일반화 성능을 보이는 새로운 블라인드 이미지 품질 평가 방법인 DP-IQA 를 제안하고, 이를 경량화하여 다양한 자연 환경 데이터셋에서 최첨단 성능을 달성함을 보여줍니다.
이 논문은 오픈드라이브 (OPENDRIVE) 맵 데이터와 그래프 신경망을 활용해 과거 테스트 데이터를 기반으로 고위험 시나리오를 예측·선별하는 'ScenarioFuzz'를 제안함으로써, 기존 방법 대비 시간 비용을 60.3% 절감하고 단위 시간당 발견되는 오류 시나리오를 103% 증가시켜 자율주행 시스템의 안전성을 검증하는 새로운 패러다임을 제시합니다.
이 논문은 자율주행 차량의 계산 부하와 호환성 문제를 해결하기 위해 단일 에이전트 학습보다 확장성이 뛰어나고 다양한 트래픽 유형에서 지연 시간을 크게 단축하는 분산형 멀티 에이전트 Q-러닝 기반 HD 맵 업데이트 솔루션을 제안하고 평가합니다.
이 논문은 부분 관측성과 희소한 보상 신호 하에서 분산형 환경에 있는 이종 다중 에이전트의 협력을 향상시키기 위해 그래프 신경망 (GNN) 기반의 내재적 보상을 활용하는 'CoHet' 알고리즘을 제안하고, 이를 통해 기존 최첨단 방법보다 우수한 성능을 입증합니다.
이 논문은 대규모 데이터셋에서 이상치와 heavy-tail 분포를 효과적으로 모델링하기 위해 희소 유도점 방법을 Student-t 프로세스로 확장한 'Sparse Variational Student-t Processes(SVTP)' 프레임워크와 두 가지 새로운 추론 알고리즘을 제안하며, 이를 통해 기존 희소 가우시안 프로세스 대비 뛰어난 예측 정확도와 수렴 속도를 달성함을 보여줍니다.
이 논문은 양자화와 희소화 연산에서 발생하는 불연속성 문제를 해결하기 위해 양자화를 첨가 노이즈로 모델링하고, 이를 보정하는 정교한 기울기 경로를 제공하는 통합 프레임워크를 제안하여 임의의 정밀도와 희소성 수준에서 안정적으로 신경망을 학습시키는 방법을 제시합니다.
이 논문은 기존 데이터 축소 기법에 특징 또는 주의 주석과 같은 '우월 정보(Privileged Information)'를 추가로 합성하여 모델 학습을 보조함으로써, ImageNet-1K 등 다양한 데이터셋에서 기존 방법들의 성능을 획기적으로 향상시킨 'DRUPI' 방법을 제안합니다.
이 논문은 텍스트 프롬프트를 기반으로 3D 가우스 스플래팅 (3DGS) 과 물리 법칙을 결합하여 다중 객체 간의 복잡한 관계와 물리적 현실감을 반영한 고품질 3D 장면 생성을 가능하게 하는 'LayoutDreamer' 프레임워크를 제안합니다.
이 논문은 MACHO 서베이 데이터로 사전 학습된 자기지도 학습 기반의 새로운 기초 모델인 Astromer 2 를 제안하며, 기존 모델인 Astromer 1 보다 제한된 레이블 데이터에서도 더 높은 분류 성능과 일반화 능력을 입증합니다.
이 논문은 시미밸류 기반 데이터 가치 평가의 유틸리티 선택에 따른 민감도 문제를 해결하기 위해 데이터 포인트를 저차원 공간에 매핑하는 '공간 서명' 개념을 도입하고, 이를 통해 유틸리티 변경에 따른 평가 결과의 강건성을 정량적으로 측정하는 실용적인 방법론을 제시합니다.
이 논문은 중국어 전자 의료 기록 (EMR) 의 간결한 작성 스타일과 구조적 복잡성, 그리고 기존 방법의 한계를 극복하기 위해 4 가지 코딩 축의 다차원 지식과 임상 증거 검증을 통합한 새로운 ICD 자동 코딩 프레임워크인 MKE-Coder 를 제안하고, 대규모 데이터셋 실험을 통해 코딩 정확도와 속도의 향상을 입증했습니다.
이 논문은 다양한 지형에서의 비용 효율적 경로 계획 문제를 해결하기 위해 기존 플래너를 수정하지 않고 LLM 을 후처리 어드바이저로 활용하는 'LLM-Advisor' 프레임워크와 새로운 평가 데이터셋을 제안하며, 이를 통해 기존 최선 경로 알고리즘의 비용 효율성을 상당 부분 개선할 수 있음을 입증합니다.
이 논문은 표 형식 데이터를 위해 설계된 하이퍼네트워크 기반의 분류기인 HyConEx 를 제안하여, 정확도 높은 예측과 동시에 모델의 결정 근거를 설명하는 반사실적 예제를 생성하는 통합 딥러닝 모델을 제시합니다.
이 논문은 범주론을 기반으로 설명과 모델 추론 간의 논리적 함의를 구조적으로 보존하는 '설명 함자 (explaining functor)'를 제안하여, 기존 설명 가능 인공지능 방법론의 일관성 및 충실성 한계를 극복하고 모순되거나 불성실한 설명 생성을 완화하는 이론적 접근법을 제시합니다.
이 논문은 자연어 쿼리를 관계 대수 (Relational Algebra) 를 통한 중간 표현으로 변환하여 실행 가능한 코드를 생성하는 'GateLens'라는 LLM 에이전트 아키텍처를 제안함으로써, 자동차 소프트웨어 릴리스 분석에서 기존 CoT 기반 시스템보다 복잡한 질의 처리 정확도와 속도를 획기적으로 개선하고 분석 시간을 80% 이상 단축하는 성과를 입증했습니다.