cs.AI 件の論文 | Gist.Science

Exploiting Spatiotemporal Properties for Efficient Event-Driven Human Pose Estimation

この論文は、イベントカメラのスパースな時空間特性を直接活用し、イベントスライス畳み込みやエッジ強化点雲表現などの新規モジュールを導入することで、高密度なフレーム変換を回避しつつ人間のポーズ推定精度と計算効率を向上させる手法を提案しています。

Haoxian Zhou, Chuanzhi Xu, Langyi Chen, Pengfei Ye, Haodong Chen, Yuk Ying Chung, Qiang Qu2026-03-09🤖 cs.AI

A-3PO: Accelerating Asynchronous LLM Training with Staleness-aware Proximal Policy Approximation

この論文は、非同期 LLM 学習における計算オーバーヘッドを削減し、プロキシポリシーを単純な補間で近似する「A-3PO」手法を提案することで、性能を維持しつつトレーニング速度を 1.8 倍に加速させることを示しています。

Xiaocan Li, Shiliang Wu, Zheng Shen2026-03-09🤖 cs.AI

Data-Driven Global Sensitivity Analysis for Engineering Design Based on Individual Conditional Expectations

本論文は、強い相互作用が存在する際に平均化によって相互作用効果が隠蔽されるという Partial Dependence Plot（PDP）の限界を克服するため、Individual Conditional Expectation（ICE）曲線に基づく新たなグローバル感度指標を提案し、その数学的性質の証明と航空宇宙設計などの実例における PDP や SHAP 等との比較を通じて、その有効性を示したものである。

Pramudita Satria Palar, Paul Saves, Rommel G. Regis, Koji Shimoyama, Shigeru Obayashi, Nicolas Verstaevel, Joseph Morlier2026-03-09🤖 cs.AI

Understanding and Improving Hyperbolic Deep Reinforcement Learning

この論文は、双曲幾何を用いた強化学習における最適化の不安定化要因を解明し、正規化や損失関数の改良などを通じて学習の安定性と効率を大幅に向上させた新しいエージェント「Hyper++」を提案するものである。

Timo Klein, Thomas Lang, Andrii Shkabrii, Alexander Sturm, Kevin Sidak, Lukas Miklautz, Claudia Plant, Yllka Velaj, Sebastian Tschiatschek2026-03-09🤖 cs.AI

Agent Tools Orchestration Leaks More: Dataset, Benchmark, and Mitigation

この論文は、複数のツールの情報を組み合わせることで意図せず機密情報が漏洩する「ツール編成プライバシーリスク（TOP-R）」という新たな脅威を初めて体系的に研究し、評価ベンチマークと緩和策を提案するものである。

Yuxuan Qiao, Dongqin Liu, Hongchang Yang, Wei Zhou, Songlin Hu2026-03-09🤖 cs.AI

CASA: Cross-Attention over Self-Attention for Efficient Vision-Language Fusion

本論文は、クロスアテンションを用いた視覚言語モデルが、従来のトークン挿入方式に匹敵する性能を達成しつつ、長文会話や動画処理においてメモリと計算コストの面で大幅な効率性を実現することを示しています。

Moritz Böhle, Amélie Royer, Juliette Marrie, Edouard Grave, Patrick Pérez2026-03-09🤖 cs.AI

CARE What Fails: Contrastive Anchored-REflection for Verifiable Multimodal

CARE は、失敗事例を教師信号として活用する「アンカー型対照的リフレクション」と「リフレクション誘導リサンプリング」を組み合わせたマルチモーダル推論向けポストトレーニングフレームワークであり、既存の強化学習手法よりも効率的に学習信号を抽出し、視覚推論タスクにおける精度と学習の安定性を大幅に向上させます。

Yongxin Wang, Zhicheng Yang, Meng Cao, Mingfei Han, Haokun Lin, Yingying Zhu, Xiaojun Chang, Xiaodan Liang2026-03-09🤖 cs.AI

LLMTM: Benchmarking and Optimizing LLMs for Temporal Motif Analysis in Dynamic Graphs

本論文は、動的グラフにおける時間的モチーフ分析のための包括的なベンチマーク「LLMTM」を提案し、その結果に基づいて高精度なエージェントと低コストなプロンプティングを構造特性に応じて知的に切り替えるディスパッチャーを開発することで、コストと精度のトレードオフを解決する手法を提示しています。

Bing Hao, Minglai Shao, Zengyi Wo, Yunlong Chu, Yuhang Liu, Ruijie Wang2026-03-09🤖 cs.AI

Window-based Membership Inference Attacks Against Fine-tuned Large Language Models

この論文は、大規模言語モデルのトレーニングデータへの所属を推測する攻撃において、平均損失などのグローバルな指標に依存する従来の手法の限界を克服し、局所的な文脈における記憶信号を捉える「WBC（ウィンドウベース比較）」という新しい手法を提案し、その有効性を複数のデータセットで実証したことを述べています。

Yuetian Chen, Yuntao Du, Kaiyuan Zhang, Ashish Kundu, Charles Fleming, Bruno Ribeiro, Ninghui Li2026-03-09🤖 cs.AI

Classroom AI: Large Language Models as Grade-Specific Teachers

この論文は、7 つの可読性指標を統合したクラスタリング手法と独自のデータセットを用いて大規模言語モデルを微調整する枠組みを提案し、これにより回答の正確性を保ちつつ、小学低学年から成人教育までの 6 つの学年レベルに合わせた適切な教育コンテンツを生成し、プロンプトベースの手法と比較して 35.64 ポイントも学年適合性を向上させたことを示しています。

Jio Oh, Steven Euijong Whang, James Evans, Jindong Wang2026-03-09🤖 cs.AI

Purification Before Fusion: Toward Mask-Free Speech Enhancement for Robust Audio-Visual Speech Recognition

この論文は、ノイズを含む音声から意味情報を失わずに視覚情報を用いて特徴を洗練させるコンフォーマーベースのバトネック融合モジュールを備えたエンドツーエンドの音声増強フレームワークを提案し、LRS3 ベンチマークにおいて既存のマスクベース手法を上回る頑健な音声・視覚音声認識性能を実現することを示しています。

Linzhi Wu, Xingyu Zhang, Hao Yuan, Yakun Zhang, Changyan Zheng, Liang Xie, Tiejun Liu, Erwei Yin2026-03-09🤖 cs.AI

PepEDiff: Zero-Shot Peptide Binder Design via Protein Embedding Diffusion

本論文は、事前学習されたタンパク質埋め込みモデルの潜在空間における拡散サンプリングを活用し、構造予測を介さずにゼロショットで多様性のあるペプチド結合体を設計する新規生成モデル「PepEDiff」を提案し、TIGIT などの難易度の高いターゲットにおいても最先端手法を上回る性能を実証したものである。

Po-Yu Liang, Tibo Duran, Jun Bai2026-03-09🤖 cs.AI

SpatialMem: Metric-Aligned Long-Horizon Video Memory for Language Grounding and QA

SpatialMem は、メトリック 3D 空間を解釈可能なインデックス構造として活用し、カジュアルに撮影された egocentric ビデオから構造的な 3D アンカーと階層的なメモリを構築することで、長期にわたる視覚的コンテキストにおける言語に基づく検索や QA、およびナビゲーションを可能にするメモリ中心のシステムです。

Xinyi Zheng, Yunze Liu, Chi-Hao Wu, Fan Zhang, Hao Zheng, Wenqi Zhou, Walterio W. Mayol-Cuevas, Junxiao Shen2026-03-09🤖 cs.AI

Neural Signals Generate Clinical Notes in the Wild

この論文は、9,048 人の患者から収集した約 11,000 時間の EEG 記録と 9,922 件の臨床報告書を用いて、長時間の EEG 記録から臨床レポートを生成する初の基盤モデル「CELM」を開発し、患者の病歴を考慮した場合やゼロショット設定において既存手法を大幅に上回る性能を達成したことを報告しています。

Jathurshan Pradeepkumar, Zheng Chen, Jimeng Sun2026-03-09🤖 cs.AI

Localizing and Correcting Errors for LLM-based Planners

この論文は、LLM が計画タスクで制約違反を起こす問題を解決するため、失敗したステップに特化した修正例を注入する「局所化インコンテキスト学習（L-ICL）」を提案し、従来の手法や明示的な指示よりも大幅に有効な計画生成を実現したことを示しています。

Aditya Kumar, William W. Cohen2026-03-09🤖 cs.AI

Accelerating Scientific Research with Gemini: Case Studies and Common Techniques

この論文は、Google の Gemini モデルを用いた対話的協力や神経記号ループなどの手法を通じて、理論計算機科学や物理学などの分野で未解決問題の解決や新たな証明の生成を成功させた事例を紹介し、AI が単なる自動化ツールを超えて科学的発見における真のパートナーとなり得る可能性を示しています。

David P. Woodruff, Vincent Cohen-Addad, Lalit Jain, Jieming Mao, Song Zuo, MohammadHossein Bateni, Simina Branzei, Michael P. Brenner, Lin Chen, Ying Feng, Lance Fortnow, Gang Fu, Ziyi Guan, Zahra Hadizadeh, Mohammad T. Hajiaghayi, Mahdi JafariRaviz, Adel Javanmard, Karthik C. S., Ken-ichi Kawarabayashi, Ravi Kumar, Silvio Lattanzi, Euiwoong Lee, Yi Li, Ioannis Panageas, Dimitris Paparas, Benjamin Przybocki, Bernardo Subercaseaux, Ola Svensson, Shayan Taherijam, Xuan Wu, Eylon Yogev, Morteza Zadimoghaddam, Samson Zhou, Yossi Matias, James Manyika, Vahab Mirrokni2026-03-09🤖 cs.AI

Uncertainty Quantification in LLM Agents: Foundations, Emerging Challenges, and Opportunities

この論文は、単発の質問応答から複雑な対話型エージェントへの移行に伴う不確実性定量化（UQ）の必要性を指摘し、そのための包括的な定式化、エージェント特有の 4 つの技術的課題、および将来の研究方向性を提示する枠組みを提案しています。

Changdae Oh, Seongheon Park, To Eun Kim, Jiatong Li, Wendi Li, Samuel Yeh, Xuefeng Du, Hamed Hassani, Paul Bogdan, Dawn Song, Sharon Li2026-03-09🤖 cs.AI

From Features to Actions: Explainability in Traditional and Agentic AI Systems

この論文は、静的な予測に対する従来の説明可能性手法が自律的なエージェント AI の行動軌跡の診断には不向きであり、代わりに実行トレースに基づく評価が失敗の特定や状態管理の重要性を明らかにするため、エージェントシステムには軌跡レベルの説明可能性への転換が必要であることを示しています。

Sindhuja Chaduvula, Jessee Ho, Kina Kim, Aravind Narayanan, Mahshid Alinoori, Muskan Garg, Dhanesh Ramachandram, Shaina Raza2026-03-09🤖 cs.AI

Towards Autonomous Mathematics Research

この論文は、自然言語で数学的推論を生成・検証・修正する自律型研究エージェント「Aletheia」を紹介し、オリンピックレベルの問題から博士課程レベルの課題、さらには人間の介入なしに構造定数を計算する論文の作成や未解決問題の解決に至るまで、AI 支援数学研究における新たな自律性の段階と透明性の枠組みを提案しています。

Tony Feng, Trieu H. Trinh, Garrett Bingham, Dawsen Hwang, Yuri Chervonyi, Junehyuk Jung, Joonkyung Lee, Carlo Pagano, Sang-hyun Kim, Federico Pasqualotto, Sergei Gukov, Jonathan N. Lee, Junsu Kim, Kaiying Hou, Golnaz Ghiasi, Yi Tay, YaGuang Li, Chenkai Kuang, Yuan Liu, Hanzhao Lin, Evan Zheran Liu, Nigamaa Nayakanti, Xiaomeng Yang, Heng-Tze Cheng, Demis Hassabis, Koray Kavukcuoglu, Quoc V. Le, Thang Luong2026-03-09🤖 cs.AI

MERIT Feedback Elicits Better Bargaining in LLM Negotiators

この論文は、LLM の交渉能力を向上させるために、多様なシナリオを網羅する新しいベンチマーク「AgoraBench」、経済的根拠に基づいた人間と整合する評価指標、そして人間の選好に即した学習パイプラインを提案し、これにより LLM がより戦略的で対戦相手への意識の高い交渉を実現できることを示しています。

Jihwan Oh, Murad Aghazada, Yooju Shin, Se-Young Yun, Taehyeon Kim2026-03-09🤖 cs.AI

← 前へ次へ →