AgentServe: Algorithm-System Co-Design for Efficient Agentic AI Serving on a Consumer-Grade GPU
この論文は、消費者向け GPU 上で複数の AI エージェントを安定して実行するために、プリフィルとデコードを分離し、動的な予算配分と CUDA グリーンコンテキストを活用してレイテンシの安定性とスループットを大幅に向上させる「AgentServe」というシステムを提案しています。
5644 件の論文
この論文は、消費者向け GPU 上で複数の AI エージェントを安定して実行するために、プリフィルとデコードを分離し、動的な予算配分と CUDA グリーンコンテキストを活用してレイテンシの安定性とスループットを大幅に向上させる「AgentServe」というシステムを提案しています。
本論文は、物語の視覚的表現に感情を明確に反映させる新たなタスク「EmoStory」を提案し、エージェントベースの計画と領域意識生成を組み合わせたフレームワークにより、感情の正確性や主の一貫性を向上させることを示しています。
この論文は、視覚的遮蔽や触覚 sensing の未決定性といった課題を克服するため、パラメータ化された平衡多様体と触覚 SLAM を統合した閉ループ制御枠組みを提案し、工具介在操作における適応的な触覚推定と剛性制御を実現することで、実世界でのねじ緩めタスクにおいて高い成功率と安定性を達成したことを示しています。
この論文は、LLM のアテンションヘッドが持つ不均一かつ安定したスパース性を利用し、ヘッドごとの適応的なスパース性予算と負荷分散戦略「S-HPLB」を導入することで、品質を維持しつつ平均アテンション計算レイテンシを 2.88 倍改善する手法を提案しています。
この論文は、追加の制約や学習なしで任意の参照画像から意味領域を自律的に検出し、局所的なスタイルと大域的な内容のバランスを最適化することで、既存の手法の限界を克服する「StyleGallery」というパーソナライズされたスタイル転送フレームワークを提案しています。
この論文は、視覚トークンの強化と剪定をそれぞれ利用して視覚表現を補強し、モデルのバイアスを修正する「視覚トークン操作」に基づく統合フレームワークを提案し、訓練なしで多モーダル大規模言語モデルのハルシネーションを効果的に低減し、推論オーバーヘッドを最小限に抑えつつ POPE 精度を平均 2% 向上させることを示しています。
この論文は、視覚基盤モデルの事前知識とラテン正規化、動的ノイズサンプリングを組み合わせた「幾何学的オートエンコーダ(GAE)」を提案し、ImageNet-1K における高品質な拡散モデル生成と、圧縮・セマンティクス・再構成安定性の優れたバランスを実現したことを報告しています。
この論文は、2D 視覚手がかりが不十分とモデル自身が判断した際にのみ幾何学的特徴を自律的に活用する「GeoSense」というフレームワークを提案し、計算オーバーヘッドを増やさずに多モーダル推論の空間理解能力を大幅に向上させる手法を提示しています。
本論文は、大規模株式データにおける条件付き拡散モデルを用いた資産収益率予測とポートフォリオ構築において、条件付けるファクターの次元数が過少だと過小適合し多すぎると過剰適合するバイアス・バリアンスのトレードオフが存在し、中間的な次元数が最適な汎化性能とベースライン戦略を上回る成果をもたらすことを実証しています。
この論文は、ネイティブのセキュリティ制約が欠如しているオープンソースのコードエージェント「OpenClaw」の脆弱性を分析し、MITRE ATLAS/ATT&CKに基づく攻撃に対して防御率が17%しかないと指摘した上で、人間が介入する防御層(HITL)を導入することで防御率を最大92%まで向上させる有効性を示しています。
この論文は、NASA の NOS3 環境を用いた実証を通じて、衛星のサプライチェーンに組み込まれた悪意のあるコンポーネントが地上からの攻撃とは異なり、内部からテレメトリを偽装してミッション全体を危険にさらす新たな脅威を明らかにし、その対策を論じています。
本論文は、 Occupancy Grid Mapping と拡散方策(Diffusion Policy)を組み合わせることで、未知の物体やセンサーノイズに対して頑健かつ効率的な 3D スキャンを実現する新しいフレームワーク「ScanDP」を提案しています。
本論文は、対面グループディスカッションにおいて、スマートフォンの動きを表現的に制御する「AnimaStand」を開発し、受動的なメンバーの再参加を促してグループダイナミクスやタスク遂行を向上させることを実証した研究です。
この論文は、既存の指標が低信頼度の誤検出を軽視する課題を解決するため、推定ポーズと注釈ポーズを最適輸送問題として扱い、信頼度スコアをマッチング精度の向上に活用しながら真陽性と偽陽性のトレードオフを公平に評価する新たな指標「OCpose」を提案するものである。
本研究は、可撓性メカニズムの不安定性に対処するため、階層的な空間結合を捉え、運動学的知識と学習ベースの制御を適応的に融合するハイブリッド手法「SpatioCoupledNet」を提案し、実験により従来手法よりも大幅に誤差を低減し、動的な障害物回避タスクにおける高い精度とロバスト性を実証したものである。
この論文は、自律移動における安全な計画を実現するために、カーネル密度推定とカイ二乗分布の整合性を活用した新しい損失関数を提案し、ガウス分布に基づく軌道予測モデルの予測不確実性を較正することで、信頼性の高い確率的洞察を提供し、複雑な環境下での衝突回避性能を向上させることを示しています。
本論文は、複雑な物理現象を含む動画生成において視覚的品質、物理的整合性、制御性を両立させるため、物理推論と視覚合成を「点・形状・外観」の階層構造で分離し、物理法則の学習を促す「Motion Forcing」という新たなフレームワークを提案するものである。
この論文は、離散インデックスの微分不可能性と流行バイアスによる幾何学的な不整合という 2 つの課題を解決するため、Gumbel-Softmax と対称重み共有による最適化の統一、および単位超球面上のスケーリングされたコサイン類似度による幾何学的最適化を導入した「微分可能な幾何学的インデックス(DGI)」を提案し、大規模検索および電子商取引データセットにおいて既存手法を上回る性能、特にロングテールシナリオでの堅牢性を示しています。
この論文は、自己教師あり動画ノイズ除去において、ブラインドな時間的整合性の学習と非ブラインドな空間的テクスチャ復元を明確に分離する「Frames2Residual(F2R)」というフレームワークを提案し、既存手法の課題を解決して性能を向上させることを示しています。
本論文は、拡散 MRI 線維路追跡の登録とクラスタリングという 2 つのタスクを、共有潜在埋め込み空間と確率的推論を用いた単一の最適化枠組み「TractoRC」で統合的に学習し、相互補完的な情報活用によって両タスクの性能を大幅に向上させることを提案しています。