cs 件の論文 | Gist.Science

AgentServe: Algorithm-System Co-Design for Efficient Agentic AI Serving on a Consumer-Grade GPU

この論文は、消費者向け GPU 上で複数の AI エージェントを安定して実行するために、プリフィルとデコードを分離し、動的な予算配分と CUDA グリーンコンテキストを活用してレイテンシの安定性とスループットを大幅に向上させる「AgentServe」というシステムを提案しています。

Yuning Zhang, Yan Yan, Nan Yang, Dong Yuan2026-03-12💻 cs

EmoStory: Emotion-Aware Story Generation

本論文は、物語の視覚的表現に感情を明確に反映させる新たなタスク「EmoStory」を提案し、エージェントベースの計画と領域意識生成を組み合わせたフレームワークにより、感情の正確性や主の一貫性を向上させることを示しています。

Jingyuan Yang, Rucong Chen, Hui Huang2026-03-12💻 cs

Adaptive Manipulation Potential and Haptic Estimation for Tool-Mediated Interaction

この論文は、視覚的遮蔽や触覚 sensing の未決定性といった課題を克服するため、パラメータ化された平衡多様体と触覚 SLAM を統合した閉ループ制御枠組みを提案し、工具介在操作における適応的な触覚推定と剛性制御を実現することで、実世界でのねじ緩めタスクにおいて高い成功率と安定性を達成したことを示しています。

Lin Yang, Anirvan Dutta, Yuan Ji, Yanxin Zhou, Shilin Shan, Lv Chen, Etienne Burdet, Domenico Campolo2026-03-12💻 cs

S-HPLB: Efficient LLM Attention Serving via Sparsity-Aware Head Parallelism Load Balance

この論文は、LLM のアテンションヘッドが持つ不均一かつ安定したスパース性を利用し、ヘッドごとの適応的なスパース性予算と負荷分散戦略「S-HPLB」を導入することで、品質を維持しつつ平均アテンション計算レイテンシを 2.88 倍改善する手法を提案しています。

Di Liu, Yifei Liu, Chen Chen, Zhibin Yu, Xiaoyi Fan, Quan Chen, Minyi Guo2026-03-12💻 cs

StyleGallery: Training-free and Semantic-aware Personalized Style Transfer from Arbitrary Image References

この論文は、追加の制約や学習なしで任意の参照画像から意味領域を自律的に検出し、局所的なスタイルと大域的な内容のバランスを最適化することで、既存の手法の限界を克服する「StyleGallery」というパーソナライズされたスタイル転送フレームワークを提案しています。

Boyu He (College of Computer Science and Technology, National University of Defense Technology), Yunfan Ye (School of Design, Hunan University), Chang Liu (College of Computer Science and Technology, National University of Defense Technology), Weishang Wu (College of Computer Science and Technology, National University of Defense Technology), Fang Liu (School of Design, Hunan University), Zhiping Cai (College of Computer Science and Technology, National University of Defense Technology)2026-03-12💻 cs

One Token, Two Fates: A Unified Framework via Vision Token Manipulation Against MLLMs Hallucination

この論文は、視覚トークンの強化と剪定をそれぞれ利用して視覚表現を補強し、モデルのバイアスを修正する「視覚トークン操作」に基づく統合フレームワークを提案し、訓練なしで多モーダル大規模言語モデルのハルシネーションを効果的に低減し、推論オーバーヘッドを最小限に抑えつつ POPE 精度を平均 2% 向上させることを示しています。

Zhan Fa, Yue Duan, Jian Zhang, Lei Qi, Yinghuan Shi2026-03-12💻 cs

Geometric Autoencoder for Diffusion Models

この論文は、視覚基盤モデルの事前知識とラテン正規化、動的ノイズサンプリングを組み合わせた「幾何学的オートエンコーダ（GAE）」を提案し、ImageNet-1K における高品質な拡散モデル生成と、圧縮・セマンティクス・再構成安定性の優れたバランスを実現したことを報告しています。

Hangyu Liu, Jianyong Wang, Yutao Sun2026-03-12💻 cs

GeoSense: Internalizing Geometric Necessity Perception for Multimodal Reasoning

この論文は、2D 視覚手がかりが不十分とモデル自身が判断した際にのみ幾何学的特徴を自律的に活用する「GeoSense」というフレームワークを提案し、計算オーバーヘッドを増やさずに多モーダル推論の空間理解能力を大幅に向上させる手法を提示しています。

Ruiheng Liu, Haihong Hao, Mingfei Han, Xin Gu, Kecheng Zhang, Changlin Li, Xiaojun Chang2026-03-12💻 cs

Factor Dimensionality and the Bias-Variance Tradeoff in Diffusion Portfolio Models

本論文は、大規模株式データにおける条件付き拡散モデルを用いた資産収益率予測とポートフォリオ構築において、条件付けるファクターの次元数が過少だと過小適合し多すぎると過剰適合するバイアス・バリアンスのトレードオフが存在し、中間的な次元数が最適な汎化性能とベースライン戦略を上回る成果をもたらすことを実証しています。

Avi Bagchi, Michael Tesfaye, Om Shastri2026-03-12💻 cs

Don't Let the Claw Grip Your Hand: A Security Analysis and Defense Framework for OpenClaw

この論文は、ネイティブのセキュリティ制約が欠如しているオープンソースのコードエージェント「OpenClaw」の脆弱性を分析し、MITRE ATLAS/ATT&CKに基づく攻撃に対して防御率が17%しかないと指摘した上で、人間が介入する防御層（HITL）を導入することで防御率を最大92%まで向上させる有効性を示しています。

Zhengyang Shan, Jiayun Xin, Yue Zhang, Minghui Xu2026-03-12💻 cs

Silent Subversion: Sensor Spoofing Attacks via Supply Chain Implants in Satellite Systems

この論文は、NASA の NOS3 環境を用いた実証を通じて、衛星のサプライチェーンに組み込まれた悪意のあるコンポーネントが地上からの攻撃とは異なり、内部からテレメトリを偽装してミッション全体を危険にさらす新たな脅威を明らかにし、その対策を論じています。

Jack Vanlyssel, Gruia-Catalin Roman, Afsah Anwar2026-03-12💻 cs

ScanDP: Generalizable 3D Scanning with Diffusion Policy

本論文は、 Occupancy Grid Mapping と拡散方策（Diffusion Policy）を組み合わせることで、未知の物体やセンサーノイズに対して頑健かつ効率的な 3D スキャンを実現する新しいフレームワーク「ScanDP」を提案しています。

Itsuki Hirako, Ryo Hakoda, Yubin Liu, Matthew Hwang, Yoshihiro Sato, Takeshi Oishi2026-03-12💻 cs

Moving Phones, Active Peers: Exploring the Effect of Animated Phones as Facilitators in In-Person Group Discussion

本論文は、対面グループディスカッションにおいて、スマートフォンの動きを表現的に制御する「AnimaStand」を開発し、受動的なメンバーの再参加を促してグループダイナミクスやタスク遂行を向上させることを実証した研究です。

Ziqi Pan, Ziqi Liu, Jinhan Zhang, Zeyu Huang, Xiaojuan Ma2026-03-12💻 cs

Multi-Person Pose Estimation Evaluation Using Optimal Transportation and Improved Pose Matching

この論文は、既存の指標が低信頼度の誤検出を軽視する課題を解決するため、推定ポーズと注釈ポーズを最適輸送問題として扱い、信頼度スコアをマッチング精度の向上に活用しながら真陽性と偽陽性のトレードオフを公平に評価する新たな指標「OCpose」を提案するものである。

Takato Moriki, Hiromu Taketsugu, Norimichi Ukita2026-03-12💻 cs

Shape Control of a Planar Hyper-Redundant Robot via Hybrid Kinematics-Informed and Learning-based Approach

本研究は、可撓性メカニズムの不安定性に対処するため、階層的な空間結合を捉え、運動学的知識と学習ベースの制御を適応的に融合するハイブリッド手法「SpatioCoupledNet」を提案し、実験により従来手法よりも大幅に誤差を低減し、動的な障害物回避タスクにおける高い精度とロバスト性を実証したものである。

Yuli Song, Wenbo Li, Wenci Xin, Zhiqiang Tang, Daniela Rus, Cecilia Laschi2026-03-12💻 cs

Rethinking Gaussian Trajectory Predictors: Calibrated Uncertainty for Safe Planning

この論文は、自律移動における安全な計画を実現するために、カーネル密度推定とカイ二乗分布の整合性を活用した新しい損失関数を提案し、ガウス分布に基づく軌道予測モデルの予測不確実性を較正することで、信頼性の高い確率的洞察を提供し、複雑な環境下での衝突回避性能を向上させることを示しています。

Fatemeh Cheraghi Pouria, Mahsa Golchoubian, Katherine Driggs-Campbell2026-03-12💻 cs

Motion Forcing: A Decoupled Framework for Robust Video Generation in Motion Dynamics

本論文は、複雑な物理現象を含む動画生成において視覚的品質、物理的整合性、制御性を両立させるため、物理推論と視覚合成を「点・形状・外観」の階層構造で分離し、物理法則の学習を促す「Motion Forcing」という新たなフレームワークを提案するものである。

Tianshuo Xu, Zhifei Chen, Leyi Wu, Hao Lu, Ying-cong Chen2026-03-12💻 cs

Differentiable Geometric Indexing for End-to-End Generative Retrieval

この論文は、離散インデックスの微分不可能性と流行バイアスによる幾何学的な不整合という 2 つの課題を解決するため、Gumbel-Softmax と対称重み共有による最適化の統一、および単位超球面上のスケーリングされたコサイン類似度による幾何学的最適化を導入した「微分可能な幾何学的インデックス（DGI）」を提案し、大規模検索および電子商取引データセットにおいて既存手法を上回る性能、特にロングテールシナリオでの堅牢性を示しています。

Xujing Wang, Yufeng Chen, Boxuan Zhang, Jie Zhao, Chao Wei, Cai Xu, Ziyu Guan, Wei Zhao, Weiru Zhang, Xiaoyi Zeng2026-03-12💻 cs

Frames2Residual: Spatiotemporal Decoupling for Self-Supervised Video Denoising

この論文は、自己教師あり動画ノイズ除去において、ブラインドな時間的整合性の学習と非ブラインドな空間的テクスチャ復元を明確に分離する「Frames2Residual（F2R）」というフレームワークを提案し、既存手法の課題を解決して性能を向上させることを示しています。

Mingjie Ji, Zhan Shi, Kailai Zhou, Zixuan Fu, Xun Cao2026-03-12💻 cs

TractoRC: A Unified Probabilistic Learning Framework for Joint Tractography Registration and Clustering

本論文は、拡散 MRI 線維路追跡の登録とクラスタリングという 2 つのタスクを、共有潜在埋め込み空間と確率的推論を用いた単一の最適化枠組み「TractoRC」で統合的に学習し、相互補完的な情報活用によって両タスクの性能を大幅に向上させることを提案しています。

Yijie Li, Xi Zhu, Junyi Wang, Ye Wu, Lauren J. O'Donnell, Fan Zhang2026-03-12💻 cs

← 前へ次へ →