FC-4DFS: Frequency-controlled Flexible 4D Facial Expression Synthesizing
이 논문은 주어진 중립 랜드마크와 길이를 기반으로 프레임별 4D 얼굴 표정 시퀀스를 생성하고, 시간적 일관성 손실 및 다중 수준 정체성 인식 변위 네트워크를 통해 유연하고 정교한 4D 얼굴 표정 합성을 가능하게 하는 'FC-4DFS'를 제안합니다.
44 편의 논문
이 논문은 주어진 중립 랜드마크와 길이를 기반으로 프레임별 4D 얼굴 표정 시퀀스를 생성하고, 시간적 일관성 손실 및 다중 수준 정체성 인식 변위 네트워크를 통해 유연하고 정교한 4D 얼굴 표정 합성을 가능하게 하는 'FC-4DFS'를 제안합니다.
이 논문은 기존 방법들의 한계인 다양한 얼굴 정체성에 대한 강건성을 개선하기 위해, 중립 랜드마크를 활용하고 정체성 판별기, 랜드마크 오토인코더, 교차 주의 메커니즘을 통합한 LM-4DGAN 을 제안하여 4D 얼굴 표정을 생성하는 모델을 소개합니다.
이 논문은 Clough-Tocher 및 멀티쿼드릭 RBF 보간법의 노이즈가 있는 데이터에 대한 재현 가능한 비교를 통해, 열역학적 공정 시스템에서 노이즈가 포함된 측정값을 폐기하기보다 구조화하여 보간함으로써 물리적으로 의미 있는 공정 거동을 복원할 수 있음을 시사합니다.
이 논문은 입력 메시의 위상적 품질에 구애받지 않고 구조적 레이아웃과 교차장을 동시에 예측하여 고품질의 사각형 메시를 생성하는 새로운 학습 기반 프레임워크 'TopGen'과 대규모 데이터셋을 제안합니다.
이 논문은 단일 정사영 이미지와 디지털 표고 모델만으로 종별 레이블이나 지상 라이다 스캔 없이도 나무의 3D 포인트 클라우드를 재구성하는 새로운 신경망 기반 프레임워크인 TreeON 을 제안하고, 합성 데이터로 학습하여 실제 환경에서도 높은 품질과 일반화 성능을 입증했습니다.
이 논문은 RGB-깊이 이미지를 표면 광장 (Surface Light Field) 샘플로 활용하여 기하학과 뷰 의존적 외관을 통합된 3D 잠재 공간으로 토큰화하고, 이를 기반으로 단일 이미지에서 조명과 재질이 일관된 고품질 3D 객체를 생성하는 'LiTo'를 제안합니다.
이 논문은 대규모 언어 모델 (LLM) 과 그리드 기반 정수 계획법을 결합하여 텍스트 프롬프트에서 구조화된 제약 조건을 추출하고, coarse-to-fine 최적화 전략을 통해 방 배치와 가구 배치를 공동으로 최적화하는 새로운 자동 인테리어 디자인 프레임워크인 'Co-Layout'을 제안합니다.
이 논문은 대형 언어 모델 (LLM) 과 드로잉 로봇을 통합하여 인간과 기계가 대화와 스케치를 통해 실시간으로 상호작용하며 시각적 스토리텔링을 함께 창조하는 'Companion' 시스템을 제시하고, 전문가 평가를 통해 이 시스템이 독특한 미학적 정체성과 전시 가치를 지닌 예술적 협력자임을 입증했습니다.
이 논문은 AI 시대의 대규모 비정형 데이터와 생성형 모델의 등장으로 인해 발생하는 인간 - 데이터 상호작용의 새로운 도전과제를 분석하고, 기존 효율성 중심의 패러다임을 넘어 인지 및 지각 원리를 통합한 인간 중심의 데이터 분석 시스템 구축을 위한 연구 방향을 제시합니다.
이 논문은 고해상도 환경 맵 생성 시 기존 딥러닝 모델의 한계를 극복하고 태양 및 구름 형성을 정밀하게 제어할 수 있는 풀 다이내믹 레인지 (FDR) 기반의 새로운 하늘 모델 '이카루스 (Icarus)'를 제안하여 이미지 기반 조명 (IBL) 의 사실성과 정확도를 혁신적으로 향상시켰음을 보여줍니다.
이 논문은 단일 RGB 이미지로부터 완전한 3D 실내 장면 메쉬를 직접 생성하는 자동회귀 기반 방법인 PixARMesh 를 제안하며, 기존 방법과 달리 통합된 모델을 통해 객체 배치와 기하학을 동시에 예측하여 고품질의 메쉬를 단일 순방향 통과로 생성합니다.
이 논문은 구조화된 주석 파이프라인을 통해 7 만 건의 타이포그래피 데이터셋 'FontUse'를 구축하고, 이를 기반으로 기존 이미지 생성 모델을 아키텍처 변경 없이 폰트 스타일과 사용 사례 조건에 맞춰 텍스트를 일관되게 생성하도록 미세 조정하는 데이터 중심 접근법을 제안합니다.
이 논문은 생성된 비디오가 물리 법칙을 따르도록 사전 훈련된 확산 모델과 물리 시뮬레이터를 통합하고, 객체 이동 중 텍스처 일관성을 개선하기 위해 테스트 시간 텍스처 최적화 (TTCO) 기법을 제안하는 '물리 시뮬레이터 인더루프 비디오 생성 (PSIVG)' 프레임워크를 소개합니다.
이 논문은 텍스트 프롬프트를 기반으로 3D 가우스 스플래팅 (3DGS) 과 물리 법칙을 결합하여 다중 객체 간의 복잡한 관계와 물리적 현실감을 반영한 고품질 3D 장면 생성을 가능하게 하는 'LayoutDreamer' 프레임워크를 제안합니다.
이 논문은 단일 RGB 이미지나 평면 비디오에서 MiDaS 깊이 추정, OpenCV 및 Telea 인페인팅, 그리고 DIBR 알고리즘을 활용하여 다중 시점의 가상 이미지를 생성하고 Quilt 콜라주나 자유 시점 LCD 디스플레이에서 현실적인 3D 경험을 제공하는 오픈소스 라이브러리 'altiro3D'를 소개합니다.
이 논문은 구조적 일관성이 필요한 작업에 적합하도록 입력 위상 정보를 보존하고 크기만 무작위화하는 위상 보존 확산 (Phase-Preserving Diffusion, Ï-PD) 을 제안하여, 기존 확산 모델의 아키텍처 변경 없이도 구조 정렬 생성 및 시뮬레이션에서 현실로의 전이 성능을 향상시킵니다.
이 논문은 다중 뷰 비디오에서 신체와 의복을 분리하여 학습하는 '가우시안 워드robe' 프레임워크를 제안함으로써, 복잡한 자유형 의복의 동적 표현과 다양한 인체 간 의복 재사용이 가능한 고품질 3D 가상 의상 입기 기술을 구현했습니다.
이 논문은 3D 가우스 스플래팅 훈련 중 명시적인 SfM 특징 트랙을 유지하며 기하학적 앵커와 광학적 손실을 결합한 'GloSplat' 프레임워크를 제안하여, 기존 COLMAP 기반 방법보다 정확하고 COLMAP 없는 방법보다 빠른 3D 재구성을 가능하게 합니다.
이 논문은 헤드마운트 카메라로 촬영된 근접 얼굴 영상에서 발생하는 원근 왜곡을 효과적으로 포착하면서도 기존 정사영 모델의 안정성을 유지하기 위해, 3D 모퍼블 모델 회귀를 위한 새로운 축소 파라미터가 포함된 의사 원근 카메라 모델을 제안합니다.
이 논문은 기존 학습 가능 인코딩의 방향성 표현 한계를 극복하기 위해 지오데식 그리드 기반의 계층적 각도 인코딩을 도입한 5 차원 공간 - 방향 신경 인코딩을 제안하며, 신경 경로 가이드링에서 기존 최첨단 기법 대비 최대 2 배의 분산 감소 효과를 입증했습니다.