Collaborative Problem Solving in Mixed Reality: A Study on Visual Graph Analysis

Cette étude comparative menée sur 72 participants en réalité mixte conclut que, bien que la complexité des tâches influence la demande de collaboration, la représentation graphique en 3D ne suffit pas à générer de meilleurs résultats collaboratifs que les groupes nominaux.

Dimitar Garkov, Tommaso Piselli, Emilio Di Giacomo, Karsten Klein, Giuseppe Liotta, Fabrizio Montecchiani, Falk SchreiberWed, 11 Ma💻 cs

ARSGaussian: 3D Gaussian Splatting with LiDAR for Aerial Remote Sensing Novel View Synthesis

L'article présente ARSGaussian, une méthode innovante de synthèse de vues nouvelles pour la télédétection aérienne qui intègre des nuages de points LiDAR et des pertes de régularisation géométrique pour éliminer les artefacts visuels et améliorer la précision géométrique, accompagnée de la publication du nouveau jeu de données open-source AIR-LONGYAN.

Yiling Yao, Bing Zhang, Wenjuan Zhang, Lianru Gao, Dailiang Peng, Bocheng Li, Yaning Wang, Bowen WangWed, 11 Ma💻 cs

TeamHOI: Learning a Unified Policy for Cooperative Human-Object Interactions with Any Team Size

Le papier présente TeamHOI, un cadre d'apprentissage par renforcement qui permet à une politique décentralisée unique de gérer des interactions coopératives homme-objet réalistes et physiquement plausibles avec un nombre variable d'agents humains, en combinant une architecture Transformer pour la coordination d'équipe et une stratégie de priorité de mouvement adversaire masquée pour pallier le manque de données.

Stefan Lionar, Gim Hee LeeTue, 10 Ma💻 cs

Not Like Transformers: Drop the Beat Representation for Dance Generation with Mamba-Based Diffusion Model

Cet article présente MambaDance, une nouvelle méthode de génération de danse qui remplace les Transformers par un modèle de diffusion basé sur Mamba et utilise une représentation des battements musicaux pour produire des mouvements synchronisés et expressifs, surpassant les approches existantes sur des séquences de toutes durées.

Sangjune Park, Inhyeok Choi, Donghyeon Soon, Youngwoo Jeon, Kyungdon JooTue, 10 Ma💻 cs

M-ABD: Scalable, Efficient, and Robust Multi-Affine-Body Dynamics

Ce papier présente M-ABD, un cadre novateur exploitant la dynamique des corps affines et une projection vers un espace dual compact pour simuler de manière stable et interactive des assemblages articulés à grande échelle sur un seul cœur de processeur, tout en garantissant une résolution exacte des contraintes et une propagation physique précise.

Zhiyong He (University of Utah), Dewen Guo (University of Utah), Minghao Guo (MIT), Yili Zhao (ByteDance), Wojciech Matusik (MIT), Hao Su (UCSD), Chenfanfu Jiang (UCLA), Peter Yichen Chen (UBC), Yin Yang (University of Utah)Tue, 10 Ma💻 cs

Retrieval-Augmented Gaussian Avatars: Improving Expression Generalization

Ce papier présente RAF, une méthode d'augmentation par récupération qui améliore la généralisation des expressions des avatars de tête sans modèle en exposant le champ de déformation à un large éventail d'expressions extraites d'une banque non étiquetée, renforçant ainsi la robustesse et la fidélité sans nécessiter de données appariées ni d'annotations supplémentaires.

Matan Levy, Gavriel Habib, Issar Tzachor, Dvir Samuel, Rami Ben-Ari, Nir Darshan, Or Litany, Dani LischinskiTue, 10 Ma🤖 cs.LG

Rethinking Few-Shot Image Fusion: Granular Ball Priors Enable General-Purpose Deep Fusion

Cet article propose une nouvelle approche de fusion d'images en peu d'exemples qui introduit le concept de priors incomplets et un algorithme de calcul de granules de pixels (GBPC) pour permettre à un réseau de neurones léger d'apprendre des règles de fusion adaptatives sans nécessiter de véritables images de référence.

Minjie Deng, Yan Wei, An Wu, Yuncan Ouyang, Hao Zhai, Qianyao PengThu, 12 Ma⚡ eess

SEGA: Drivable 3D Gaussian Head Avatar from a Single Image

Le papier présente SEGA, une méthode innovante permettant de créer des avatars de tête 3D photoréalistes et animables en temps réel à partir d'une seule image, en combinant des priors généralisés et un nouveau framework de splatting gaussien hiérarchique dans l'espace UV pour garantir une cohérence 3D et une fidélité d'identité supérieures.

Chen Guo, Zhuo Su, Liao Wang, Jian Wang, Shuang Li, Xu Chang, Zhaohu Li, Yang Zhao, Guidong Wang, Yebin Liu, Ruqi HuangThu, 12 Ma💻 cs

SDGraph: Multi-Level Sketch Representation Learning by Sparse-Dense Graph Architecture

Le papier présente SDGraph, une architecture d'apprentissage profond basée sur un graphe combinant des structures clairsemées et denses pour modéliser efficacement les esquisses à trois niveaux (esquisse, trait et point), améliorant ainsi significativement les performances dans les tâches de classification, de recherche et de génération.

Xi Cheng, Pingfa Feng, Mingyu Fan, Zhichao Liao, Hang Cheng, Long ZengThu, 12 Ma💻 cs

Structured Bitmap-to-Mesh Triangulation for Geometry-Aware Discretization of Image-Derived Domains

Ce papier propose un cadre de triangulation piloté par des modèles qui intègre les limites dérivées d'images dans une grille triangulaire régulière en ne retriangulant que les éléments intersectés, garantissant ainsi une discrétisation stable, parallèle et déterministe pour la résolution d'équations aux dérivées partielles sur des domaines complexes.

Wei Feng, Haiyong ZhengThu, 12 Ma💻 cs