cs.GR 件の論文 | Gist.Science

Collaborative Problem Solving in Mixed Reality: A Study on Visual Graph Analysis

この論文は、72 人の参加者を対象とした混合現実環境での実験を通じて、視覚的グラフ分析における協働問題解決が個人の作業や名目上のペア（ベンチマーク）と比較して必ずしも優位ではないことを示し、3D グラフ表現だけでは協働成果の向上が図れないことを結論付けています。

Dimitar Garkov, Tommaso Piselli, Emilio Di Giacomo, Karsten Klein, Giuseppe Liotta, Fabrizio Montecchiani, Falk SchreiberWed, 11 Ma💻 cs

ARSGaussian: 3D Gaussian Splatting with LiDAR for Aerial Remote Sensing Novel View Synthesis

本論文は、LiDAR ポイントクラウドを制約として導入し、歪みパラメータを考慮した座標変換や幾何学的整合損失を適用することで、空中リモートセンシングにおける浮遊物や過成長の問題を解決し、高精度な新規視点合成を実現する「ARSGaussian」を提案するとともに、対応する高密度データセット「AIR-LONGYAN」を公開するものです。

Yiling Yao, Bing Zhang, Wenjuan Zhang, Lianru Gao, Dailiang Peng, Bocheng Li, Yaning Wang, Bowen WangWed, 11 Ma💻 cs

A comprehensive study of time-of-flight non-line-of-sight imaging

本論文は、共通の数理モデルとハードウェア条件下で代表的な時間飛行非視界（ToF NLOS）撮像手法を包括的に比較検討し、それらの理論的・実験的側面における類似点と相違点を明らかにするとともに、将来の研究における客観的な手法比較のための基準となることを目指しています。

Julio Marco, Adrian Jarabo, Ji Hyun Nam, Alberto Tosi, Diego Gutierrez, Andreas VeltenWed, 11 Ma💻 cs

Prompt-Driven Color Accessibility Evaluation in Diffusion-based Image Generation Models

この論文は、拡散モデルによる画像生成における色覚異常者へのアクセシビリティを評価する新たな指標「CVDLoss」を提案し、既存のモデルがアクセシビリティ向上を目的としたプロンプトに適切に応答できない現状を明らかにしたものである。

Xinyao Zhuang, Jose Echevarria, Kaan AksitWed, 11 Ma💻 cs

On the Structural Failure of Chamfer Distance in 3D Shape Optimization

本論文は、点群再構成や生成における標準的な損失関数であるチャマファ距離の最適化が、局所的な正則化では解決できない勾配構造上の欠陥により「最適化しない場合よりも悪い結果」をもたらす「崩壊」を引き起こすことを示し、これを抑制するには局所領域を超えた非局所的な結合（グローバルな結合）が不可欠であることを明らかにした。

Chang-Yong Song, David HydeWed, 11 Ma💻 cs

MultiGen: Level-Design for Editable Multiplayer Worlds in Diffusion Game Engines

この論文は、ユーザーによる環境の編集可能性とマルチプレイヤー間の一貫性を確保するため、拡散ゲームエンジンにユーザー行動によって更新・参照される外部メモリを統合し、生成プロセスをメモリ・観測・ダイナミクスに分解する「MultiGen」という新しいアプローチを提案しています。

Ryan Po, David Junhao Zhang, Amir Hertz, Gordon Wetzstein, Neal Wadhwa, Nataniel RuizTue, 10 Ma💻 cs

FabricGen: Microstructure-Aware Woven Fabric Generation

この論文は、マクロなテクスチャ生成とマイクロな織り構造の生成を分解して処理するエンドツーエンドのフレームワーク「FabricGen」を提案し、テキスト記述から現実的な織物素材を生成する手法を提示しています。

Yingjie Tang, Di Luo, Zixiong Wang, Xiaoli Ling, jian Yang, Beibei WangTue, 10 Ma💻 cs

Image Generation Models: A Technical History

この論文は、VAE、GAN、拡散モデルなど過去 10 年間の画像生成モデルの技術的変遷を包括的に調査し、各モデルの技術詳細や限界、動画生成への発展、そして深層偽造リスクや責任ある展開といった倫理的課題までを網羅的に解説するものである。

Rouzbeh ShirvaniTue, 10 Ma💬 cs.CL

Ref-DGS: Reflective Dual Gaussian Splatting

本論文は、近距離の鏡面反射を明示的なレイトレーシングなしに効率的にモデル化し、高速な学習と最先端の性能を両立させる「反射双対ガウススプラッティング（Ref-DGS）」という新しいフレームワークを提案するものです。

Ningjing Fan, Yiqun Wang, Dongming Yan, Peter WonkaTue, 10 Ma💻 cs

Parameterized Brushstroke Style Transfer

この論文は、従来の画素ベースのアプローチの限界を克服し、キャンバス上の筆触を模倣する「筆触ドメイン」でのスタイル転送手法を提案することで、より自然で視覚的に優れた芸術的表現を実現することを目的としています。

Uma Meleti, Siyu HuangTue, 10 Ma💻 cs

TeamHOI: Learning a Unified Policy for Cooperative Human-Object Interactions with Any Team Size

TeamHOI は、Transformer ベースのアーキテクチャとマスクされた敵対的運動事前知識（AMP）戦略を活用することで、単一の分散型方策により、チームサイズや対象物の形状に関わらず、物理的に現実的な協調的な人間 - 物体相互作用を実現するフレームワークです。

Stefan Lionar, Gim Hee LeeTue, 10 Ma💻 cs

Not Like Transformers: Drop the Beat Representation for Dance Generation with Mamba-Based Diffusion Model

本論文は、音楽のビートに基づくガウス表現を導入し、Transformer の代わりに長系列処理に優れた Mamba を拡散モデルに組み込むことで、短尺から長尺まで音楽と同期した高品質なダンス生成を実現する「MambaDance」を提案しています。

Sangjune Park, Inhyeok Choi, Donghyeon Soon, Youngwoo Jeon, Kyungdon JooTue, 10 Ma💻 cs

M-ABD: Scalable, Efficient, and Robust Multi-Affine-Body Dynamics

本論文は、アフィイン・ボディ・ダイナミクス（ABD）の線形運動学マッピングとコンパクトな双対空間への座標変換を活用し、大規模な関節構造を持つアセンブリのシミュレーションにおいて、単一 CPU コアでインタラクティブな速度と大時間ステップにおける安定性を両立する新しいフレームワーク「M-ABD」を提案するものである。

Zhiyong He (University of Utah), Dewen Guo (University of Utah), Minghao Guo (MIT), Yili Zhao (ByteDance), Wojciech Matusik (MIT), Hao Su (UCSD), Chenfanfu Jiang (UCLA), Peter Yichen Chen (UBC), Yin Yang (University of Utah)Tue, 10 Ma💻 cs

Retrieval-Augmented Gaussian Avatars: Improving Expression Generalization

本論文は、単一人物のデータから学習したテンプレート不要の頭部アバターが表現の一般化に直面する課題に対し、学習中に外部の表現データバンクから類似表現を检索して特徴を置換する「RAF」という簡易なデータ拡張手法を提案し、追加の注釈やアーキテクチャ変更なしに表現の多様性とロバスト性を向上させることを示しています。

Matan Levy, Gavriel Habib, Issar Tzachor, Dvir Samuel, Rami Ben-Ari, Nir Darshan, Or Litany, Dani LischinskiTue, 10 Ma🤖 cs.LG

Sketch-Guided Stylized Landscape Cinemagraph Synthesis

この論文は、手書きスケッチとテキストプロンプトを条件として、風景の空間構造と流れるような動きを直感的に制御し、美的で連続的な時間的流れを持つ様式化されたシネマグラフィを生成する「Sketch2Cinemagraph」という新しいフレームワークを提案するものである。

Hao Jin, Hengyuan Chang, Xiaoxuan Xie, Zhengyang Wang, Xusheng Du, Shaojun Hu, Haoran XieThu, 12 Ma💻 cs

Rethinking Few-Shot Image Fusion: Granular Ball Priors Enable General-Purpose Deep Fusion

本論文は、手動設計された事前知識の信頼性を推定する「不完全事前知識」の概念と、粒状計算に基づく「GBPC アルゴリズム」を導入し、わずか 10 組の画像対のみで学習可能な軽量な汎用深層画像融合手法を提案するものです。

Minjie Deng, Yan Wei, An Wu, Yuncan Ouyang, Hao Zhai, Qianyao PengThu, 12 Ma⚡ eess

SEGA: Drivable 3D Gaussian Head Avatar from a Single Image

この論文は、単一の画像から高忠実度かつリアルタイムで駆動可能な 3D ヘッドアバターを生成する新しい手法「SEGA」を提案し、大規模な 2D データと FLAME 構造に基づく階層的 UV 空間ガウススプラッティングフレームワークを組み合わせることで、未知の人物への汎化性能と表情のリアルさを大幅に向上させることを示しています。

Chen Guo, Zhuo Su, Liao Wang, Jian Wang, Shuang Li, Xu Chang, Zhaohu Li, Yang Zhao, Guidong Wang, Yebin Liu, Ruqi HuangThu, 12 Ma💻 cs

SDGraph: Multi-Level Sketch Representation Learning by Sparse-Dense Graph Architecture

この論文は、スケッチの抽象性と疎性を踏まえ、スケッチ・ストローク・点の 3 段階の表現を理論的に検証し、疎グラフと密グラフを統合した「SDGraph」という深層学習アーキテクチャを提案することで、分類・検索・生成タスクにおいて最先端の性能を達成したことを報告しています。

Xi Cheng, Pingfa Feng, Mingyu Fan, Zhichao Liao, Hang Cheng, Long ZengThu, 12 Ma💻 cs

Structured Bitmap-to-Mesh Triangulation for Geometry-Aware Discretization of Image-Derived Domains

この論文は、画像から導出された領域における PDE 離散化の安定性と並列性を向上させるため、境界と交差する三角形のみを局所的に再三角化し、決定論的なシンボル検索テーブルを用いてスリバー要素を抑制するテンプレート駆動型の構造化ビットマップからメッシュへの三角化フレームワークを提案するものである。

Wei Feng, Haiyong ZhengThu, 12 Ma💻 cs

ID-LoRA: Identity-Driven Audio-Video Personalization with In-Context LoRA

ID-LoRA は、テキスト、参照画像、短い音声クリップを統合して単一の生成パスで人物の視覚的特徴と声を同時に個人化し、視覚シーンに基づく音声同期やスタイル制御を実現する革新的なモデルです。

Aviad Dahan, Moran Yanuka, Noa Kraicer, Lior Wolf, Raja GiryesThu, 12 Ma💻 cs