cs.AI 件の論文 | Gist.Science

A Robust Incomplete Multimodal Low-Rank Adaptation Approach for Emotion Recognition

本論文は、センサー故障やプライバシー保護により生じる不完全なマルチモーダルデータの問題に対処するため、モダリティ組合せごとの共有情報と固有特徴を分離し、表現空間の分離性に基づいて動的に学習比率を調整する新しいパラメータ効率型学習フレームワーク「MCULoRA」を提案し、感情認識タスクにおいて既存手法を上回る性能を達成したことを示しています。

Xinkui Zhao, Jinsong Shu, Yangyang Wu, Guanjie Cheng, Zihe Liu, Naibo Wang, Shuiguang Deng, Zhongle Xie, Jianwei Yin2026-03-10💻 cs

Let's Think in Two Steps: Mitigating Agreement Bias in MLLMs with Self-Grounded Verification

本論文は、マルチモーダル大規模言語モデル（MLLM）がエージェントの行動を過剰に肯定する「同意バイアス」を特定し、自己生成された事前知識に基づいて検証を行う軽量手法「SGV」を提案することで、タスク完了率や精度を大幅に向上させることを示しています。

Moises Andrade, Joonhyuk Cha, Brandon Ho, Vriksha Srihari, Karmesh Yadav, Zsolt Kira2026-03-10🤖 cs.LG

Unified Medical Image Segmentation with State Space Modeling Snake

本論文は、状態空間モデルを活用した新しいディープスネークフレームワーク「Mamba Snake」を提案し、多スケールの構造的異質性や器官間の関係性を効果的にモデル化することで、医用画像の統一セグメンテーションにおいて最先端の手法を上回る性能を達成したことを示しています。

Ruicheng Zhang, Haowei Guo, Kanghui Tian, Jun Zhou, Mingliang Yan, Zeyu Zhang, Shen Zhao2026-03-10💻 cs

InsightX Agent: An LMM-based Agentic Framework with Integrated Tools for Reliable X-ray NDT Analysis

本論文は、X 線非破壊検査の信頼性と解釈性を向上させるため、検出器と証拠に基づく反省ツールを LMM エージェントが調整する新たなフレームワーク「InsightX Agent」を提案し、GDXray+ データセットにおいて高い検出精度と信頼性の高い分析を実現したことを示しています。

Jiale Liu, Huan Wang, Yue Zhang + 4 more2026-03-10🤖 cs.AI

Post-Disaster Affected Area Segmentation with a Vision Transformer (ViT)-based EVAP Model using Sentinel-2 and Formosat-5 Imagery

本論文は、台湾宇宙機関（TASA）の緊急付加価値製品（EVAP）を支援するため、Sentinel-2 と Formosat-5 画像を用いた主成分分析と信頼度指標に基づく弱教師あり学習により、ViT（Vision Transformer）ベースのモデルで災害被災域のセグメンテーション精度と信頼性を向上させるフレームワークを提案するものである。

Yi-Shan Chu, Hsuan-Cheng Wei2026-03-10💻 cs

Flow Matching Meets Biology and Life Science: A Survey

この論文は、生物学的配列モデリング、分子生成・設計、ペプチドおよびタンパク質生成の 3 つの主要分野におけるフローマッチングの基礎、応用、データセット、ツール、および将来の展望を網羅的に調査した初の包括的なサーベイである。

Zihao Li, Zhichen Zeng, Xiao Lin, Feihao Fang, Yanru Qu, Zhe Xu, Zhining Liu, Xuying Ning, Tianxin Wei, Ge Liu, Hanghang Tong, Jingrui He2026-03-10🤖 cs.LG

Goal Alignment in LLM-Based User Simulators for Conversational AI

この論文は、LLM ベースのユーザーシミュレータにおける目標指向行動の一貫性欠如という課題を解決するため、会話中の目標進行を追跡する「UGST」フレームワークと評価指標を提案し、マルチターン会話での目標整合性を大幅に向上させることを示しています。

Shuhaib Mehri, Xiaocheng Yang, Takyoung Kim, Gokhan Tur, Shikib Mehri, Dilek Hakkani-Tür2026-03-10💬 cs.CL

CauKer: Classification Time Series Foundation Models Can Be Pretrained on Synthetic Data

本論文は、ガウス過程カーネルの合成と構造的因果モデルを組み合わせることで多様かつ因果的に整合した合成時系列データを生成する「CauKer」を提案し、これにより大規模な実データに依存せず、スケーラブルかつ効率的に時系列基礎モデルを事前学習可能であることを示しています。

Shifeng Xie, Vasilii Feofanov, Ambroise Odonnat, Lei Zan, Marius Alonso, Jianfeng Zhang, Themis Palpanas, Lujia Pan, Keli Zhang, Ievgen Redko2026-03-10🤖 cs.LG

GraphProp: Training the Graph Foundation Models using Graph Properties

この論文は、グラフの抽象的な構造に依存する不変量（グラフ不変量）の予測を通じて構造一般化を強化し、その表現を位置符号として活用してドメイン横断的なグラフ基礎モデル（GFM）を構築する「GraphProp」を提案し、特にノード属性がないグラフにおける分類や少数ショット学習において優れた性能を示すことを示しています。

Ziheng Sun, Qi Feng, Lehao Lin, Chris Ding, Jicong Fan2026-03-10🤖 cs.LG

Video-EM: Event-Centric Episodic Memory for Long-Form Video Understanding

Video-EM は、長期動画理解における文脈制約を解決するため、既存の Video-LLM を追加学習なしで活用し、LLM を能動的な記憶エージェントとして機能させることで、クエリ関連の瞬間を特定し、一貫したイベントにグループ化し、冗長性を除去する自己反省ループを経て、コンパクトかつ信頼性の高い「イベントタイムライン」を構築するトレーニングフリーのフレームワークである。

Yun Wang, Long Zhang, Jingren Liu, Jiaqi Yan, Zhanjie Zhang, Jiahao Zheng, Ao Ma, Run Ling, Xun Yang, Dapeng Wu, Xiangyu Chen, Xuelong Li2026-03-10💻 cs

UniCast: A Unified Framework for Instance-Conditioned Multimodal Time-Series Forecasting

本論文は、時系列、画像、テキストのマルチモーダル入力からインスタンス固有の条件付きプロンプトを推論し、モダリティの関連性を動的に調整する「Modality Routing」メカニズムを導入することで、既存の時間系列基盤モデルの予測精度を大幅に向上させるパラメータ効率の高いフレームワーク「UniCast」を提案するものである。

Sehyuk Park, Soyeon Caren Han, Eduard Hovy2026-03-10💻 cs

ECHO: Frequency-aware Hierarchical Encoding for Variable-length Signals

任意のサンプリングレートと可変長の信号に対応し、帯域分割アーキテクチャと周波数位置エンコーディングを統合した新しい基盤モデル「ECHO」を提案し、機械信号の異常検出や故障分類において最先端の性能を実現したことを報告する論文です。

Yucong Zhang, Juan Liu, Ming Li2026-03-10🤖 cs.LG

Entropy-Driven Curriculum for Multi-Task Training in Human Mobility Prediction

この論文は、Lempel-Ziv 圧縮に基づくエントロピー駆動のカリキュラム学習と、距離・方向の推定を組み合わせたマルチタスク学習を統合したフレームワークを提案し、HuMob チャレンジにおいて最先端の予測精度と最大 2.92 倍の収束速度向上を実現したことを示しています。

Tianye Fang, Xuanshu Luo, Martin Werner2026-03-10🤖 cs.LG

Improving the Resilience of Quadrotors in Underground Environments by Combining Learning-based and Safety Controllers

この論文は、学習ベースの制御と安全制御を切り替えるランタイム監視機構を提案し、学習データ分布から外れた環境でも衝突を回避しながらタスクを迅速に完了させる、地下空間におけるドローンの自律制御の堅牢性を向上させることを示しています。

Isaac Ronald Ward, Mark Paral, Kristopher Riordan + 1 more2026-03-10⚡ eess

OTESGN: Optimal Transport-Enhanced Syntactic-Semantic Graph Networks for Aspect-Based Sentiment Analysis

本論文は、依存関係木と文脈的意味を統合し、シンクホルン法を用いた最適輸送に基づくアスペクト - 意見の対応付けや構文誘導型注意機構を導入することで、ノイズへの耐性を高め、アスペクトベースの感情分析において最先端の性能を達成する「OTESGN」というモデルを提案しています。

Xinfeng Liao, Xuanqi Chen, Lianxi Wang, Jiahuan Yang, Zhuowei Chen, Ziying Rong2026-03-10💬 cs.CL

Classification of Driver Behaviour Using External Observation Techniques for Autonomous Vehicles

この論文は、YOLO 物体検出モデルや車線推定アルゴリズムなどのコンピュータビジョン技術を用いて外部から車両を監視し、自動運転車向けに非接続車両の運転者の不注意や酩酊などの危険な運転行動をリアルタイムで分類する新規フレームワークを提案し、その有効性を検証したものである。

Ian Nell, Shane Gilroy2026-03-10⚡ eess

Synthetic Homes: An Accessible Multimodal Pipeline for Producing Residential Building Data with Generative AI

この論文は、生成 AI を活用して公開画像や住宅情報から住宅建築データを合成するモジュラー型マルチモーダルフレームワークを提案し、エネルギー効率の向上や地域規模の消費シミュレーションを可能にするための、コストのかかるデータへの依存を軽減するアクセシブルなパイプラインを確立したことを示しています。

Jackson Eshbaugh, Chetan Tiwari, Jorge Silveyra2026-03-10🤖 cs.LG

MICA: Multi-Agent Industrial Coordination Assistant

本論文は、制限された計算資源やプライバシー制約下でも実用的な産業環境で動作する、5 つの役割特化型エージェントと安全チェックアウディット、および適応的ステップ融合（ASF）を採用したマルチエージェント協調アシスタント「MICA」を提案し、その有効性をベンチマークと評価指標を用いて実証するものである。

Di Wen, Kunyu Peng, Junwei Zheng, Yufan Chen, Yitian Shi, Jiale Wei, Ruiping Liu, Kailun Yang, Rainer Stiefelhagen2026-03-10🤖 cs.LG

Compose by Focus: Scene Graph-based Atomic Skills

この論文は、タスクに関連する物体と関係に焦点を当てたシーングラフ表現と拡散モデルに基づく模倣学習を統合し、視覚運動制御のロバスト性と長期的タスクの構成的汎化能力を大幅に向上させる新しいフレームワークを提案しています。

Han Qi, Changhe Chen, Heng Yang2026-03-10💻 cs

Efficient Construction of Implicit Surface Models From a Single Image for Motion Generation

本論文は、単一の画像から高忠実度な表面と SDF 場を数秒で効率的に再構築し、ロボットにおける表面追従タスクへの応用を可能にする軽量フレームワーク「FINS」を提案するものである。

Wei-Teng Chu, Tianyi Zhang, Matthew Johnson-Roberson, Weiming Zhi2026-03-10💻 cs

← 前へ次へ →