Collaborative Problem Solving in Mixed Reality: A Study on Visual Graph Analysis
이 논문은 72 명의 참가자를 대상으로 한 실험을 통해 혼합 현실 환경에서 시각적 그래프 분석을 위한 3D 표현이 기준이 되는 명목상 그룹 (nominal groups) 보다 협업 문제 해결에 더 나은 결과를 유도하지 못함을 보여주었습니다.
44 편의 논문
이 논문은 72 명의 참가자를 대상으로 한 실험을 통해 혼합 현실 환경에서 시각적 그래프 분석을 위한 3D 표현이 기준이 되는 명목상 그룹 (nominal groups) 보다 협업 문제 해결에 더 나은 결과를 유도하지 못함을 보여주었습니다.
본 논문은 LiDAR 점구름을 제약 조건으로 활용하고 왜곡 보정 및 정규화 손실 함수를 도입하여 지상 원거리 촬영 환경에서 발생하는 기하학적 오류와 화질 저하 문제를 해결하고, AIR-LONGYAN 데이터셋을 공개하는 항공 원격 감지를 위한 정밀한 3D 가우스 스플래팅 기법인 ARSGaussian 을 제안합니다.
이 논문은 다양한 시간 비행 비가시선 (ToF NLOS) 이미징 방법들을 공통된 수식과 하드웨어 설정 하에 체계적으로 분석하고, 이를 라돈 변환 및 주파수 영역 모델과 연관 짓는 동시에 동일한 실험 조건에서 성능을 비교 평가하여 향후 연구의 객관적 기준을 제시합니다.
이 논문은 확산 기반 이미지 생성 모델의 색각 이상 (CVD) 접근성을 평가하기 위해 새로운 지표인 'CVDLoss'를 제안하고, 기존 모델이 접근성 중심 프롬프트에 효과적으로 반응하지 못한다는 점을 규명합니다.
본 논문은 3D 형상 최적화에서 챔퍼 거리의 표준 손실 함수가 국소 정규화만으로는 해결되지 않는 구조적 붕괴를 유발한다는 점을 규명하고, 비국소적 결합 (non-local coupling) 을 통해 이를 억제함으로써 최적화 성공을 보장할 수 있음을 보여줍니다.
이 논문은 사용자의 환경 제어와 공유 추론을 가능하게 하기 위해 외부 메모리를 도입하고 생성 과정을 메모리, 관찰, 역학 모듈로 분해하여 편집 가능한 멀티플레이어 월드를 생성하는 'MultiGen' 시스템을 제안합니다.
이 논문은 텍스트 설명을 기반으로 거시적 텍스처와 미세한 조직 구조를 분리하여 생성하는 'FabricGen' 프레임워크를 제안함으로써, 기존 확산 모델의 한계를 극복하고 더 풍부하고 사실적인 직물 재료를 자동 생성하는 방법을 제시합니다.
이 논문은 VAE, GAN, 흐름 기반, 자기회귀 및 트랜스포머, 확산 모델 등 지난 10 년간 발전한 이미지 생성 모델들의 기술적 역사와 최적화 기법, 한계를 체계적으로 정리하고, 최근의 비디오 생성 기술과 딥페이크 위험, 탐지, 워터마킹 등 책임 있는 배포에 대한 중요성을 다루고 있습니다.
이 논문은 명시적인 광선 추적을 사용하지 않고도 근거리 및 원거리 반사를 효율적으로 모델링하여 표면 재구성과 새로운 뷰 합성 성능을 획기적으로 개선한 'Ref-DGS(반사 이중 가우스 스플래팅)' 프레임워크를 제안합니다.
이 논문은 기존 픽셀 기반 방식의 한계를 극복하고 실제 예술 작품과 유사한 브러시 스트로크 도메인에서 이미지를 표현하여 시각적 품질을 향상시키는 새로운 스타일 전이 기법을 제안합니다.
이 논문은 단일 분산 정책으로 다양한 팀 크기와 물체 기하학적 구조를 가진 인간 - 물체 상호작용 (HOI) 을 가능하게 하는 Transformer 기반의 TeamHOI 프레임워크를 제안하며, 단일 인간 모션을 기반으로 한 마스킹된 적대적 운동 우선순위 (AMP) 전략과 형성 보상을 통해 현실적이고 일관된 협력 행동을 학습합니다.
이 논문은 Mamba 기반 확산 모델과 가우시안 기반 비트 표현을 도입하여 기존 트랜스포머 기반 방법의 한계를 극복하고, 음악의 리듬과 비트에 정확히 동기화된 고품질 춤 동작을 생성하는 'MambaDance'를 제안합니다.
이 논문은 강체 솔버의 한계를 극복하고 대규모 관절 조립체의 시뮬레이션을 위해 선형 운동학 매핑과 코-회전 접근법을 활용하여 상수 시스템 행렬을 사전 분해하고 축소된 공간에서 제약 조건을 정확히 해결하는 확장성 있고 효율적인 다중 아핀-바디 역학 (M-ABD) 프레임워크를 제안합니다.
이 논문은 단일 주체의 캡처 데이터만으로도 다양한 표정 일반화 능력을 향상시키기 위해, 학습 중 유사한 표정을 검색하여 증강하는 'RAF(Retrieval-Augmented Faces)' 기법을 제안하고 템플릿 없는 애니메이션 가능한 헤드 아바타의 표현 충실도를 크게 개선함을 보여줍니다.
이 논문은 손으로 그린 스케치를 기반으로 텍스트 프롬프트와 결합하여 스타일화된 풍경의 공간적 요소와 유동적인 움직임 영역을 정밀하게 제어할 수 있는 'Sketch2Cinemagraph' 프레임워크를 제안합니다.
이 논문은 과립 구체 (Granular Ball) 기반의 불완전 사전 지식을 도입하여 소량의 데이터로도 다양한 이미지 퓨전 작업에서 뛰어난 성능과 경량화를 달성하는 새로운 심층 퓨전 방법론을 제안합니다.
이 논문은 단일 이미지로부터 일반화 성능과 3D 일관성을 보장하면서도 실시간 구동이 가능한 고품질 3D Gaussian 헤드 아바타를 생성하는 새로운 방법인 SEGA 를 제안합니다.
이 논문은 스케치의 희소성과 추상성을 고려하여 스케치, 획, 점 수준의 세 가지 계층으로 유효 정보를 식별하고, 이를 활용하는 희소-밀도 그래프 아키텍처인 SDGraph 를 제안하여 분류, 검색, 벡터 생성 등 다양한 스케치 관련 작업에서 기존 최첨단 기법 대비 성능을 크게 향상시켰습니다.
이 논문은 이미지 기반 도메인의 안정적인 편미분방정식 이산화를 위해 경계와 교차하는 삼각형만 재삼각화하고 기저 메쉬를 유지하는 동기화 없는 병렬 실행이 가능한 템플릿 기반 삼각화 프레임워크를 제안하며, 이를 통해 슬리버 요소를 줄이고 기하학적 정밀도를 향상시킵니다.
이 논문은 텍스트 프롬프트, 참조 이미지, 짧은 오디오 클립을 단일 생성 과정으로 통합하여 시각적 외모와 목소리를 동시에 개인화하는 새로운 모델 'ID-LoRA'를 제안하며, 이를 통해 기존 방법론 대비 뛰어난 음성 유사도와 화자 특성을 구현하고 단일 GPU 에서 3 천 개의 훈련 쌍만으로 학습이 가능함을 보여줍니다.