cs.AI 件の論文 | Gist.Science

SketchGraphNet: A Memory-Efficient Hybrid Graph Transformer for Large-Scale Sketch Corpora Recognition

本論文は、フリーハンドスケッチをラスター画像やストローク系列ではなく構造化グラフとして直接モデル化する「SketchGraphNet」を提案し、344 万点のスケッチを含む大規模ベンチマーク「SketchGraph」上で、補助的な位置・構造エンコーディングを不要としながら、メモリ効率と精度を両立した認識を実現したことを報告しています。

Shilong Chen, Mingyuan Li, Zhaoyang Wang, Zhonglin Ye, Haixing Zhao2026-03-10💻 cs

Neural Dynamics-Informed Pre-trained Framework for Personalized Brain Functional Network Construction

この論文は、事前定義された脳アトラスや線形仮定に依存する既存手法の限界を克服し、神経動態を考慮した事前学習フレームワークを導入することで、多様なシナリオにおける個人固有の脳機能ネットワーク構築を実現し、その汎用性と精度を大幅に向上させることを提案しています。

Hongjie Jiang, Yifei Tang, Shuqiang Wang2026-03-10🤖 cs.LG

How Long Can Unified Multimodal Models Generate Images Reliably? Taming Long-Horizon Interleaved Image Generation via Context Curation

この論文は、長編のテキストと画像を交互に生成する際に視覚履歴の蓄積が品質劣化を招くという課題を特定し、モデル内部の関連性に基づいて不要な視覚情報を動的に排除する「UniLongGen」という推論戦略を提案することで、長期生成の安定性と忠実度を大幅に向上させることを示しています。

Haoyu Chen, Qing Liu, Yuqian Zhou, He Zhang, Zhaowen Wang, Mengwei Ren, Jingjing Ren, Xiang Wang, Zhe Lin, Lei Zhu2026-03-10💻 cs

← 前へ次へ →

cs.AI

SketchGraphNet: A Memory-Efficient Hybrid Graph Transformer for Large-Scale Sketch Corpora Recognition

Neural Dynamics-Informed Pre-trained Framework for Personalized Brain Functional Network Construction

How Long Can Unified Multimodal Models Generate Images Reliably? Taming Long-Horizon Interleaved Image Generation via Context Curation

DreamSAC: Learning Hamiltonian World Models via Symmetry Exploration

COOL-MC: Verifying and Explaining RL Policies for Multi-bridge Network Maintenance

Learning-free L2-Accented Speech Generation using Phonological Rules

Targeted Speaker Poisoning Framework in Zero-Shot Text-to-Speech

Nw\=ach\=a Mun\=a: A Devanagari Speech Corpus and Proximal Transfer Benchmark for Nepal Bhasha ASR

GRD-Net: Generative-Reconstructive-Discriminative Anomaly Detection with Region of Interest Attention Module

A Systematic Comparison of Training Objectives for Out-of-Distribution Detection in Image Classification

Integration of deep generative Anomaly Detection algorithm in high-speed industrial line

Shorter Thoughts, Same Answers: Difficulty-Scaled Segment-Wise RL for CoT Compression

SMAT: Staged Multi-Agent Training for Co-Adaptive Exoskeleton Control

Evaluating Synthetic Data for Baggage Trolley Detection in Airport Logistics

AtomicVLA: Unlocking the Potential of Atomic Skill Learning in Robots

Ref-DGS: Reflective Dual Gaussian Splatting

AI-Driven Phase Identification from X-ray Hyperspectral Imaging of cycled Na-ion Cathode Materials

Memory for Autonomous LLM Agents:Mechanisms, Evaluation, and Emerging Frontiers

Compressed-Domain-Aware Online Video Super-Resolution

TDM-R1: Reinforcing Few-Step Diffusion Models with Non-Differentiable Reward