Learning to Generate Conditional Tri-plane for 3D-aware Expression Controllable Portrait Animation

In dit paper wordt Export3D voorgesteld, een methode voor één-op-een 3D-bewuste portretanimatie die gezichtsuitdrukkingen en cameraview controleert door een contrastief voortrainingsframework te gebruiken om een uitdrukkingsspecifieke tri-plane te genereren zonder ongewenste uitwisseling van uiterlijke kenmerken bij het overbrengen van uitdrukkingen tussen verschillende gezichten.

Taekyung Ki, Dongchan Min, Gyeongsu Chae2026-03-05🤖 cs.AI

Crab+^{+}: A Scalable and Unified Audio-Visual Scene Understanding Model with Explicit Cooperation

Crab⁺ is een schaalbaar en verenigd audio-visueel taalkundig model dat negatieve overdracht bij multi-task leren effectief aanpakt door middel van het uitgebreide AV-UIE v2-dataset met expliciete redenering en Interaction-aware LoRA (I-LoRA) voor dynamische taakcoördinatie, waardoor het in bijna 88% van de taken superieure prestaties levert vergeleken met single-task baselines.

Dongnuan Cai, Henghui Du, Chang Zhou + 5 more2026-03-05🤖 cs.AI