Collaborative Problem Solving in Mixed Reality: A Study on Visual Graph Analysis
この論文は、72 人の参加者を対象とした混合現実環境での実験を通じて、視覚的グラフ分析における協働問題解決が個人の作業や名目上のペア(ベンチマーク)と比較して必ずしも優位ではないことを示し、3D グラフ表現だけでは協働成果の向上が図れないことを結論付けています。
44 件の論文
この論文は、72 人の参加者を対象とした混合現実環境での実験を通じて、視覚的グラフ分析における協働問題解決が個人の作業や名目上のペア(ベンチマーク)と比較して必ずしも優位ではないことを示し、3D グラフ表現だけでは協働成果の向上が図れないことを結論付けています。
本論文は、LiDAR ポイントクラウドを制約として導入し、歪みパラメータを考慮した座標変換や幾何学的整合損失を適用することで、空中リモートセンシングにおける浮遊物や過成長の問題を解決し、高精度な新規視点合成を実現する「ARSGaussian」を提案するとともに、対応する高密度データセット「AIR-LONGYAN」を公開するものです。
本論文は、共通の数理モデルとハードウェア条件下で代表的な時間飛行非視界(ToF NLOS)撮像手法を包括的に比較検討し、それらの理論的・実験的側面における類似点と相違点を明らかにするとともに、将来の研究における客観的な手法比較のための基準となることを目指しています。
この論文は、拡散モデルによる画像生成における色覚異常者へのアクセシビリティを評価する新たな指標「CVDLoss」を提案し、既存のモデルがアクセシビリティ向上を目的としたプロンプトに適切に応答できない現状を明らかにしたものである。
本論文は、点群再構成や生成における標準的な損失関数であるチャマファ距離の最適化が、局所的な正則化では解決できない勾配構造上の欠陥により「最適化しない場合よりも悪い結果」をもたらす「崩壊」を引き起こすことを示し、これを抑制するには局所領域を超えた非局所的な結合(グローバルな結合)が不可欠であることを明らかにした。
この論文は、ユーザーによる環境の編集可能性とマルチプレイヤー間の一貫性を確保するため、拡散ゲームエンジンにユーザー行動によって更新・参照される外部メモリを統合し、生成プロセスをメモリ・観測・ダイナミクスに分解する「MultiGen」という新しいアプローチを提案しています。
この論文は、マクロなテクスチャ生成とマイクロな織り構造の生成を分解して処理するエンドツーエンドのフレームワーク「FabricGen」を提案し、テキスト記述から現実的な織物素材を生成する手法を提示しています。
この論文は、VAE、GAN、拡散モデルなど過去 10 年間の画像生成モデルの技術的変遷を包括的に調査し、各モデルの技術詳細や限界、動画生成への発展、そして深層偽造リスクや責任ある展開といった倫理的課題までを網羅的に解説するものである。
本論文は、近距離の鏡面反射を明示的なレイトレーシングなしに効率的にモデル化し、高速な学習と最先端の性能を両立させる「反射双対ガウススプラッティング(Ref-DGS)」という新しいフレームワークを提案するものです。
この論文は、従来の画素ベースのアプローチの限界を克服し、キャンバス上の筆触を模倣する「筆触ドメイン」でのスタイル転送手法を提案することで、より自然で視覚的に優れた芸術的表現を実現することを目的としています。
TeamHOI は、Transformer ベースのアーキテクチャとマスクされた敵対的運動事前知識(AMP)戦略を活用することで、単一の分散型方策により、チームサイズや対象物の形状に関わらず、物理的に現実的な協調的な人間 - 物体相互作用を実現するフレームワークです。
本論文は、音楽のビートに基づくガウス表現を導入し、Transformer の代わりに長系列処理に優れた Mamba を拡散モデルに組み込むことで、短尺から長尺まで音楽と同期した高品質なダンス生成を実現する「MambaDance」を提案しています。
本論文は、アフィイン・ボディ・ダイナミクス(ABD)の線形運動学マッピングとコンパクトな双対空間への座標変換を活用し、大規模な関節構造を持つアセンブリのシミュレーションにおいて、単一 CPU コアでインタラクティブな速度と大時間ステップにおける安定性を両立する新しいフレームワーク「M-ABD」を提案するものである。
本論文は、単一人物のデータから学習したテンプレート不要の頭部アバターが表現の一般化に直面する課題に対し、学習中に外部の表現データバンクから類似表現を检索して特徴を置換する「RAF」という簡易なデータ拡張手法を提案し、追加の注釈やアーキテクチャ変更なしに表現の多様性とロバスト性を向上させることを示しています。
この論文は、手書きスケッチとテキストプロンプトを条件として、風景の空間構造と流れるような動きを直感的に制御し、美的で連続的な時間的流れを持つ様式化されたシネマグラフィを生成する「Sketch2Cinemagraph」という新しいフレームワークを提案するものである。
本論文は、手動設計された事前知識の信頼性を推定する「不完全事前知識」の概念と、粒状計算に基づく「GBPC アルゴリズム」を導入し、わずか 10 組の画像対のみで学習可能な軽量な汎用深層画像融合手法を提案するものです。
この論文は、単一の画像から高忠実度かつリアルタイムで駆動可能な 3D ヘッドアバターを生成する新しい手法「SEGA」を提案し、大規模な 2D データと FLAME 構造に基づく階層的 UV 空間ガウススプラッティングフレームワークを組み合わせることで、未知の人物への汎化性能と表情のリアルさを大幅に向上させることを示しています。
この論文は、スケッチの抽象性と疎性を踏まえ、スケッチ・ストローク・点の 3 段階の表現を理論的に検証し、疎グラフと密グラフを統合した「SDGraph」という深層学習アーキテクチャを提案することで、分類・検索・生成タスクにおいて最先端の性能を達成したことを報告しています。
この論文は、画像から導出された領域における PDE 離散化の安定性と並列性を向上させるため、境界と交差する三角形のみを局所的に再三角化し、決定論的なシンボル検索テーブルを用いてスリバー要素を抑制するテンプレート駆動型の構造化ビットマップからメッシュへの三角化フレームワークを提案するものである。
ID-LoRA は、テキスト、参照画像、短い音声クリップを統合して単一の生成パスで人物の視覚的特徴と声を同時に個人化し、視覚シーンに基づく音声同期やスタイル制御を実現する革新的なモデルです。