cs.GR 편의 논문 | Gist.Science

Collaborative Problem Solving in Mixed Reality: A Study on Visual Graph Analysis

이 논문은 72 명의 참가자를 대상으로 한 실험을 통해 혼합 현실 환경에서 시각적 그래프 분석을 위한 3D 표현이 기준이 되는 명목상 그룹 (nominal groups) 보다 협업 문제 해결에 더 나은 결과를 유도하지 못함을 보여주었습니다.

Dimitar Garkov, Tommaso Piselli, Emilio Di Giacomo, Karsten Klein, Giuseppe Liotta, Fabrizio Montecchiani, Falk SchreiberWed, 11 Ma💻 cs

ARSGaussian: 3D Gaussian Splatting with LiDAR for Aerial Remote Sensing Novel View Synthesis

본 논문은 LiDAR 점구름을 제약 조건으로 활용하고 왜곡 보정 및 정규화 손실 함수를 도입하여 지상 원거리 촬영 환경에서 발생하는 기하학적 오류와 화질 저하 문제를 해결하고, AIR-LONGYAN 데이터셋을 공개하는 항공 원격 감지를 위한 정밀한 3D 가우스 스플래팅 기법인 ARSGaussian 을 제안합니다.

Yiling Yao, Bing Zhang, Wenjuan Zhang, Lianru Gao, Dailiang Peng, Bocheng Li, Yaning Wang, Bowen WangWed, 11 Ma💻 cs

A comprehensive study of time-of-flight non-line-of-sight imaging

이 논문은 다양한 시간 비행 비가시선 (ToF NLOS) 이미징 방법들을 공통된 수식과 하드웨어 설정 하에 체계적으로 분석하고, 이를 라돈 변환 및 주파수 영역 모델과 연관 짓는 동시에 동일한 실험 조건에서 성능을 비교 평가하여 향후 연구의 객관적 기준을 제시합니다.

Julio Marco, Adrian Jarabo, Ji Hyun Nam, Alberto Tosi, Diego Gutierrez, Andreas VeltenWed, 11 Ma💻 cs

Prompt-Driven Color Accessibility Evaluation in Diffusion-based Image Generation Models

이 논문은 확산 기반 이미지 생성 모델의 색각 이상 (CVD) 접근성을 평가하기 위해 새로운 지표인 'CVDLoss'를 제안하고, 기존 모델이 접근성 중심 프롬프트에 효과적으로 반응하지 못한다는 점을 규명합니다.

Xinyao Zhuang, Jose Echevarria, Kaan AksitWed, 11 Ma💻 cs

On the Structural Failure of Chamfer Distance in 3D Shape Optimization

본 논문은 3D 형상 최적화에서 챔퍼 거리의 표준 손실 함수가 국소 정규화만으로는 해결되지 않는 구조적 붕괴를 유발한다는 점을 규명하고, 비국소적 결합 (non-local coupling) 을 통해 이를 억제함으로써 최적화 성공을 보장할 수 있음을 보여줍니다.

Chang-Yong Song, David HydeWed, 11 Ma💻 cs

MultiGen: Level-Design for Editable Multiplayer Worlds in Diffusion Game Engines

이 논문은 사용자의 환경 제어와 공유 추론을 가능하게 하기 위해 외부 메모리를 도입하고 생성 과정을 메모리, 관찰, 역학 모듈로 분해하여 편집 가능한 멀티플레이어 월드를 생성하는 'MultiGen' 시스템을 제안합니다.

Ryan Po, David Junhao Zhang, Amir Hertz, Gordon Wetzstein, Neal Wadhwa, Nataniel RuizTue, 10 Ma💻 cs

FabricGen: Microstructure-Aware Woven Fabric Generation

이 논문은 텍스트 설명을 기반으로 거시적 텍스처와 미세한 조직 구조를 분리하여 생성하는 'FabricGen' 프레임워크를 제안함으로써, 기존 확산 모델의 한계를 극복하고 더 풍부하고 사실적인 직물 재료를 자동 생성하는 방법을 제시합니다.

Yingjie Tang, Di Luo, Zixiong Wang, Xiaoli Ling, jian Yang, Beibei WangTue, 10 Ma💻 cs

Image Generation Models: A Technical History

이 논문은 VAE, GAN, 흐름 기반, 자기회귀 및 트랜스포머, 확산 모델 등 지난 10 년간 발전한 이미지 생성 모델들의 기술적 역사와 최적화 기법, 한계를 체계적으로 정리하고, 최근의 비디오 생성 기술과 딥페이크 위험, 탐지, 워터마킹 등 책임 있는 배포에 대한 중요성을 다루고 있습니다.

Rouzbeh ShirvaniTue, 10 Ma💬 cs.CL

Ref-DGS: Reflective Dual Gaussian Splatting

이 논문은 명시적인 광선 추적을 사용하지 않고도 근거리 및 원거리 반사를 효율적으로 모델링하여 표면 재구성과 새로운 뷰 합성 성능을 획기적으로 개선한 'Ref-DGS(반사 이중 가우스 스플래팅)' 프레임워크를 제안합니다.

Ningjing Fan, Yiqun Wang, Dongming Yan, Peter WonkaTue, 10 Ma💻 cs

Parameterized Brushstroke Style Transfer

이 논문은 기존 픽셀 기반 방식의 한계를 극복하고 실제 예술 작품과 유사한 브러시 스트로크 도메인에서 이미지를 표현하여 시각적 품질을 향상시키는 새로운 스타일 전이 기법을 제안합니다.

Uma Meleti, Siyu HuangTue, 10 Ma💻 cs

TeamHOI: Learning a Unified Policy for Cooperative Human-Object Interactions with Any Team Size

이 논문은 단일 분산 정책으로 다양한 팀 크기와 물체 기하학적 구조를 가진 인간 - 물체 상호작용 (HOI) 을 가능하게 하는 Transformer 기반의 TeamHOI 프레임워크를 제안하며, 단일 인간 모션을 기반으로 한 마스킹된 적대적 운동 우선순위 (AMP) 전략과 형성 보상을 통해 현실적이고 일관된 협력 행동을 학습합니다.

Stefan Lionar, Gim Hee LeeTue, 10 Ma💻 cs

Not Like Transformers: Drop the Beat Representation for Dance Generation with Mamba-Based Diffusion Model

이 논문은 Mamba 기반 확산 모델과 가우시안 기반 비트 표현을 도입하여 기존 트랜스포머 기반 방법의 한계를 극복하고, 음악의 리듬과 비트에 정확히 동기화된 고품질 춤 동작을 생성하는 'MambaDance'를 제안합니다.

Sangjune Park, Inhyeok Choi, Donghyeon Soon, Youngwoo Jeon, Kyungdon JooTue, 10 Ma💻 cs

M-ABD: Scalable, Efficient, and Robust Multi-Affine-Body Dynamics

이 논문은 강체 솔버의 한계를 극복하고 대규모 관절 조립체의 시뮬레이션을 위해 선형 운동학 매핑과 코-회전 접근법을 활용하여 상수 시스템 행렬을 사전 분해하고 축소된 공간에서 제약 조건을 정확히 해결하는 확장성 있고 효율적인 다중 아핀-바디 역학 (M-ABD) 프레임워크를 제안합니다.

Zhiyong He (University of Utah), Dewen Guo (University of Utah), Minghao Guo (MIT), Yili Zhao (ByteDance), Wojciech Matusik (MIT), Hao Su (UCSD), Chenfanfu Jiang (UCLA), Peter Yichen Chen (UBC), Yin Yang (University of Utah)Tue, 10 Ma💻 cs

Retrieval-Augmented Gaussian Avatars: Improving Expression Generalization

이 논문은 단일 주체의 캡처 데이터만으로도 다양한 표정 일반화 능력을 향상시키기 위해, 학습 중 유사한 표정을 검색하여 증강하는 'RAF(Retrieval-Augmented Faces)' 기법을 제안하고 템플릿 없는 애니메이션 가능한 헤드 아바타의 표현 충실도를 크게 개선함을 보여줍니다.

Matan Levy, Gavriel Habib, Issar Tzachor, Dvir Samuel, Rami Ben-Ari, Nir Darshan, Or Litany, Dani LischinskiTue, 10 Ma🤖 cs.LG

Sketch-Guided Stylized Landscape Cinemagraph Synthesis

이 논문은 손으로 그린 스케치를 기반으로 텍스트 프롬프트와 결합하여 스타일화된 풍경의 공간적 요소와 유동적인 움직임 영역을 정밀하게 제어할 수 있는 'Sketch2Cinemagraph' 프레임워크를 제안합니다.

Hao Jin, Hengyuan Chang, Xiaoxuan Xie, Zhengyang Wang, Xusheng Du, Shaojun Hu, Haoran XieThu, 12 Ma💻 cs

Rethinking Few-Shot Image Fusion: Granular Ball Priors Enable General-Purpose Deep Fusion

이 논문은 과립 구체 (Granular Ball) 기반의 불완전 사전 지식을 도입하여 소량의 데이터로도 다양한 이미지 퓨전 작업에서 뛰어난 성능과 경량화를 달성하는 새로운 심층 퓨전 방법론을 제안합니다.

Minjie Deng, Yan Wei, An Wu, Yuncan Ouyang, Hao Zhai, Qianyao PengThu, 12 Ma⚡ eess

SEGA: Drivable 3D Gaussian Head Avatar from a Single Image

이 논문은 단일 이미지로부터 일반화 성능과 3D 일관성을 보장하면서도 실시간 구동이 가능한 고품질 3D Gaussian 헤드 아바타를 생성하는 새로운 방법인 SEGA 를 제안합니다.

Chen Guo, Zhuo Su, Liao Wang, Jian Wang, Shuang Li, Xu Chang, Zhaohu Li, Yang Zhao, Guidong Wang, Yebin Liu, Ruqi HuangThu, 12 Ma💻 cs

SDGraph: Multi-Level Sketch Representation Learning by Sparse-Dense Graph Architecture

이 논문은 스케치의 희소성과 추상성을 고려하여 스케치, 획, 점 수준의 세 가지 계층으로 유효 정보를 식별하고, 이를 활용하는 희소-밀도 그래프 아키텍처인 SDGraph 를 제안하여 분류, 검색, 벡터 생성 등 다양한 스케치 관련 작업에서 기존 최첨단 기법 대비 성능을 크게 향상시켰습니다.

Xi Cheng, Pingfa Feng, Mingyu Fan, Zhichao Liao, Hang Cheng, Long ZengThu, 12 Ma💻 cs

Structured Bitmap-to-Mesh Triangulation for Geometry-Aware Discretization of Image-Derived Domains

이 논문은 이미지 기반 도메인의 안정적인 편미분방정식 이산화를 위해 경계와 교차하는 삼각형만 재삼각화하고 기저 메쉬를 유지하는 동기화 없는 병렬 실행이 가능한 템플릿 기반 삼각화 프레임워크를 제안하며, 이를 통해 슬리버 요소를 줄이고 기하학적 정밀도를 향상시킵니다.

Wei Feng, Haiyong ZhengThu, 12 Ma💻 cs

ID-LoRA: Identity-Driven Audio-Video Personalization with In-Context LoRA

이 논문은 텍스트 프롬프트, 참조 이미지, 짧은 오디오 클립을 단일 생성 과정으로 통합하여 시각적 외모와 목소리를 동시에 개인화하는 새로운 모델 'ID-LoRA'를 제안하며, 이를 통해 기존 방법론 대비 뛰어난 음성 유사도와 화자 특성을 구현하고 단일 GPU 에서 3 천 개의 훈련 쌍만으로 학습이 가능함을 보여줍니다.

Aviad Dahan, Moran Yanuka, Noa Kraicer, Lior Wolf, Raja GiryesThu, 12 Ma💻 cs