Cutting the Cord: System Architecture for Low-Cost, GPU-Accelerated Bimanual Mobile Manipulation

この論文は、NVIDIA Jetson Orin Nano などのオンボード計算機を搭載し、1300 ドル未満の低コストで実装されたオープンソースの二腕移動マニピュレータのシステムアーキテクチャと、その剛性設計、電源トポロジー、自律機能について述べています。

Artemis Shaw, Chen Liu, Justin Costa, Rane Gray, Alina Skowronek, Kevin Diaz, Nam Bui, Nikolaus CorrellWed, 11 Ma💻 cs

Intelligent Spatial Estimation for Fire Hazards in Engineering Sites: An Enhanced YOLOv8-Powered Proximity Analysis Framework

この論文は、9,860 枚の画像で学習した強化された YOLOv8 双モデルフレームワークを用いて、火災・煙の検出と周囲物体との距離推定を統合し、定量的なリスク評価スコアを生成する、工場の現場向けインテリジェントな火災ハザード推定システムを提案しています。

Ammar K. AlMhdawi, Nonso Nnamoko, Alaa Mashan UbaidWed, 11 Ma💻 cs

3D UAV Trajectory Estimation and Classification from Internet Videos via Language Model

この論文は、手動アノテーションを必要とせず、大規模なインターネット動画から言語モデルを活用して UAV の 3 次元軌道と分類情報を自動生成し、ゼロショット転移学習により既存のベンチマークで最先端レベルの性能を達成する新たなフレームワークを提案するものである。

Haoxiang Lei, Daotong Wang, Shenghai Yuan, Jianbo SuWed, 11 Ma💻 cs

High-Slip-Ratio Control for Peak Tire-Road Friction Estimation Using Automated Vehicles

本論文は、自動運転車両が空車走行中に高スリップ比制御を能動的に実行することで、従来の自然な走行データでは得られなかった路面摩擦係数のピーク値を安全かつ高精度に推定・評価する新しい枠組みを提案し、シミュレーションおよび実車実験によりその有効性を検証したものである。

Zhaohui Liang, Hang Zhou, Heye Huanh, Xiaopeng LiWed, 11 Ma💻 cs

Provably Safe Trajectory Generation for Manipulators Under Motion and Environmental Uncertainties

本論文は、運動および環境の不確実性下でロボットマニピュレータの衝突リスクを形式的に保証し、効率的かつ安全な軌道生成を実現するための、RM-DeSKO モデルと SOS プログラミングを統合した新たなリスク制約付き運動計画フレームワークを提案し、シミュレーションおよび実世界実験でその有効性を検証したものである。

Fei Meng, Zijiang Yang, Xinyu Mao, Haobo Liang, Max Q. -H. MengWed, 11 Ma💻 cs

OmniEdit: A Training-free framework for Lip Synchronization and Audio-Visual Editing

OmniEdit は、事前学習済みモデルの教師あり微調整に依存せず、FlowEdit の編集シーケンスを目標シーケンスに置換することでバイアスを排除し、確率的要素を除去して滑らかな編集軌道を確立する、トレーニング不要のリップシンクおよび音声・映像編集フレームワークを提案するものです。

Lixiang Lin, Siyuan Jin, Jinshan ZhangWed, 11 Ma💻 cs

Chain of Event-Centric Causal Thought for Physically Plausible Video Generation

この論文は、物理法則に基づく因果関係を明確化するための「物理駆動型イベント連鎖推論」と、イベント間の連続性を保つ「遷移認識型クロスモーダルプロンプティング」という 2 つのモジュールを導入することで、現実の物理現象を忠実に再現する動画生成を実現する新たな枠組みを提案しています。

Zixuan Wang, Yixin Hu, Haolan Wang, Feng Chen, Yan Liu, Wen Li, Yinjie LeiWed, 11 Ma💻 cs

MedKCO: Medical Vision-Language Pretraining via Knowledge-Driven Cognitive Orchestration

本論文は、医療画像の分布シフト下での表現学習を改善するため、診断感度やクラス内代表性に基づくデータ順序付けと非対称コントラスト損失を組み合わせた「知識駆動型認知編成(MedKCO)」を提案し、多様な医療視覚言語タスクで既存手法を大幅に上回る性能を実証したものです。

Chenran Zhang, Ruiqi Wu, Tao Zhou, Yi ZhouWed, 11 Ma💻 cs

Training-free Motion Factorization for Compositional Video Generation

この論文は、複雑な動きを「静止」「剛体運動」「非剛体運動」の 3 つに分解し、生成前に動きの法則を推論して構造化する「計画先行」のフレームワークを提案することで、既存の手法が見過ごしていた多様な動きの指定を可能にするトレーニングフリーのコンポーザショナル動画生成手法を構築したことを示しています。

Zixuan Wang, Ziqin Zhou, Feng Chen, Duo Peng, Yixin Hu, Changsheng Li, Yinjie LeiWed, 11 Ma💻 cs

Progressive Representation Learning for Multimodal Sentiment Analysis with Incomplete Modalities

本論文は、現実世界で頻繁に発生するモダリティの欠損やノイズに対処するため、信頼性推定とプログレッシブな相互作用により不完全なマルチモーダル感情分析を高度化する「PRLF」という新しいフレームワークを提案し、主要なデータセットにおいて最先端の性能を達成したことを報告しています。

Jindi Bao, Jianjun Qian, Mengkai Yan, Jian YangWed, 11 Ma💻 cs

Nezha: A Key-Value Separated Distributed Store with Optimized Raft Integration

本論文は、合意プロトコルとストレージエンジン間の重複する永続化操作による I/O オーバーヘッドを解消するため、キー・バリュー分離と Raft を最適化して統合し、Put/Get/Scan 操作で大幅なスループット向上を実現した分散キーバリューストア「Nezha」を提案するものである。

Yangyang Wang, Yucong Dong, Ziqian Cheng, Zichen XuWed, 11 Ma💻 cs

From Verification to Amplification: Auditing Reverse Image Search as Algorithmic Gatekeeping in Visual Misinformation Fact-checking

この論文は、視覚的偽情報の検証において逆画像検索が事実確認コンテンツよりも誤情報や無関係な結果を優先的に表示するアルゴリズム的ゲートキーピングとして機能し、特に偽情報が出現直後の「データ・ボイド」期にその質が低下することを示しています。

Cong Lin, Yifei Chen, Jiangyue Chen, Yingdan Lu, Yilang Peng, Cuihua ShenWed, 11 Ma💻 cs

AgenticCyOps: Securing Multi-Agentic AI Integration in Enterprise Cyber Operations

本論文は、LLM 駆動のマルチエージェントシステムが企業環境に導入される際に生じる新たな攻撃面を特定し、ツール編成とメモリ管理を主要な信頼境界として定義する「AgenticCyOps」フレームワークを提案し、SOC ワークフローへの適用を通じて攻撃経路の大部分を遮断し、信頼境界を 72% 以上削減する効果を実証しています。

Shaswata Mitra, Raj Patel, Sudip Mittal, Md Rayhanur Rahman, Shahram RahimiWed, 11 Ma💻 cs

Transformer-Based Multi-Region Segmentation and Radiomic Analysis of HR-pQCT Imaging

本論文は、SegFormer 変換器を用いて HR-pQCT 画像から骨および周囲軟組織を自動セグメント化し、抽出した放射線学的特徴量を用いた骨粗鬆症の分類が、従来の骨ベースのモデルよりも高い精度を達成し、軟組織の評価が疾患検出に重要であることを示した研究です。

Mohseu Rashid Subah, Mohammed Abdul Gani Zilani, Thomas L. Nickolas, Matthew R. Allen, Stuart J. Warden, Rachel K. SurowiecWed, 11 Ma💻 cs

Rotation Equivariant Mamba for Vision Tasks

本論文は、画像の回転に対する不変性を欠く既存のビジョン用 Mamba アーキテクチャの課題を解決するため、回転等変性を組み込んだ初のモデル「EQ-VMamba」を提案し、理論的な等変性の保証と、分類・セグメンテーション・超解像などの多様なタスクにおける高い性能とパラメータ効率の向上を実証しています。

Zhongchen Zhao, Qi Xie, Keyu Huang, Lei Zhang, Deyu Meng, Zongben XuWed, 11 Ma💻 cs

Agentic AI as a Network Control-Plane Intelligence Layer for Federated Learning over 6G

本論文は、6G ネットワークにおける分散学習の課題を解決するため、ネットワーク状態を認識してタスク目標を行動に変換する「エージェント型 AI」を制御層として導入し、クライアント選定やリソース割り当てなどの最適化を自律的に行う統合システムを提案し、その有効性を示したものである。

Loc X. Nguyen, Ji Su Yoon, Huy Q. Le, Yu Qiao, Avi Deb Raha, Eui-Nam Huh, Nguyen H. Tran, Choong Seon HongWed, 11 Ma💻 cs