cs.AI 件の論文 | Gist.Science

Learning Transferable Sensor Models via Language-Informed Pretraining

本論文は、多様なセンサー設定に汎用可能な言語整合表現を学習するためのオープンソースフレームワーク「SLIP」を提案し、対照的アライメントとセンサー条件付きキャプション生成を統合することで、ゼロショット転移や信号の要約、質問応答などのタスクにおいて既存手法を上回る性能を実現したことを報告しています。

Yuliang Chen, Arvind Pillai, Yu Yvonne Wu, Tess Z. Griffin, Lisa Marsch, Michael V. Heinz, Nicholas C. Jacobson, Andrew Campbell2026-03-13🤖 cs.AI

Multimodal Emotion Recognition via Bi-directional Cross-Attention and Temporal Modeling

本論文は、ABAW 10 番目の EXPR チャレンジ向けに、CLIP と Wav2Vec 2.0 を活用した事前学習モデル、時系列モデルである TCN、および双方向クロスアテンション融合モジュールを統合し、野外環境におけるロバストなマルチモーダル感情認識を実現するフレームワークを提案しています。

Junhyeong Byeon, Jeongyeol Kim, Sejoon Lim2026-03-13🤖 cs.AI

Normative Common Ground Replication (NormCoRe): Replication-by-Translation for Studying Norms in Multi-agent AI

この論文は、人間の被験者実験の設計をマルチエージェント AI 環境へ体系的に変換する「NormCoRe」という新たな方法論的枠組みを提案し、公平性に関する規範的合意形成を研究するための基盤を提供するとともに、AI エージェントの規範的判断が基礎モデルや言語設定に敏感に依存し、人間の基準と異なる可能性があることを示しています。

Luca Deck, Simeon Allmendinger, Lucas Müller, Niklas Kühl2026-03-13🤖 cs.AI

HomeSafe-Bench: Evaluating Vision-Language Models on Unsafe Action Detection for Embodied Agents in Household Scenarios

この論文は、家庭環境における embodied agent の安全評価を目的とした新しいベンチマーク「HomeSafe-Bench」と、リアルタイムな安全性監視を実現する階層的な「HD-Guard」アーキテクチャを提案し、既存の VLM ベースの安全検出における課題と解決策を明らかにしています。

Jiayue Pu, Zhongxiang Sun, Zilu Zhang, Xiao Zhang, Jun Xu2026-03-13🤖 cs.AI

LABSHIELD: A Multimodal Benchmark for Safety-Critical Reasoning and Planning in Scientific Laboratories

この論文は、米国労働安全衛生局（OSHA）や世界調和システム（GHS）の基準に基づき、実験室環境における危険特定や安全重視の推論を評価するための新しいマルチモーダルベンチマーク「LABSHIELD」を提案し、現在の多モーダル大規模言語モデルが専門的な実験室シナリオにおいて安全性に関する判断能力に大きな欠如があることを明らかにしています。

Qianpu Sun, Xiaowei Chi, Yuhan Rui, Ying Li, Kuangzhi Ge, Jiajun Li, Sirui Han, Shanghang Zhang2026-03-13🤖 cs.AI

BTZSC: A Benchmark for Zero-Shot Text Classification Across Cross-Encoders, Embedding Models, Rerankers and LLMs

本論文は、従来の NLI ベースのモデルに加え、埋め込みモデルやリランカー、大規模言語モデルを含む多様なゼロショットテキスト分類アプローチを公平に評価するための包括的ベンチマーク「BTZSC」を提案し、最新の 8B パラメータのリランカーが最高性能を達成しつつ、埋め込みモデルが精度と遅延のバランスにおいて優位であることを示しています。

Ilias Aarab2026-03-13💬 cs.CL

Few-for-Many Personalized Federated Learning

この論文は、クライアント数に依存せず少数の共有モデル（K 個）で多数のクライアントを効率的にパーソナライズする「Few-for-Many」最適化問題を定式化し、クラスタリングや補間などの既存手法よりも優れた性能を達成する新しいアルゴリズム「FedFew」を提案するものです。

Ping Guo, Tiantian Zhang, Xi Lin, Xiang Li, Zhi-Ri Tang, Qingfu Zhang2026-03-13🤖 cs.AI

Can RL Improve Generalization of LLM Agents? An Empirical Study

本論文は、強化学習ファインチューニング（RFT）がタスク難易度内ではよく一般化し、連続学習や環境混合学習によって転移と忘却のバランスを改善できる一方で、環境やインターフェースが異なる未知の環境への転移は限定的であることを実証的に明らかにしています。

Zhiheng Xi, Xin Guo, Jiaqi Liu, Jiazheng Zhang, Yutao Fan, Zhihao Zhang, Shichun Liu, Mingxu Chai, Xiaowei Shi, Yitao Zhai, Xunliang Cai, Tao Gui, Qi Zhang, Xuanjing Huang2026-03-13🤖 cs.AI

Flowcean - Model Learning for Cyber-Physical Systems

本論文は、サイバーフィジカルシステム（CPS）の複雑なモデリングを自動化し、モジュール性と使いやすさを重視したデータ駆動型の学習フレームワーク「Flowcean」を提案するものである。

Maximilian Schmidt, Swantje Plambeck, Markus Knitt, Hendrik Rose, Goerschwin Fey, Jan Christian Wieck, Stephan Balduin2026-03-13🤖 cs.LG

An Intent of Collaboration: On Agencies between Designers and Emerging (Intelligent) Technologies

本論文は、LLM との協働においてデザイナーが創造的代理権を失うリスクを指摘し、内省、技術理解、そして人間と技術の関係性の調整を通じて、デザイナーの創造的代理権を取り戻すための協働のあり方を提案しています。

Pei-Ying Lin, Julie Heij, Iris Borst, Britt Joosten, Kristina Andersen, Wijnand IJsselsteijn2026-03-13🤖 cs.AI

Sim-to-reality adaptation for Deep Reinforcement Learning applied to an underwater docking application

本論文は、Girona AUV 向けに Stonefish シミュレータをマルチプロセッシング環境に統合し、PPO アルゴリズムを用いてシミュレーションで 90% 以上の成功率を達成した深層強化学習制御を、実機テストタンクでの実証実験を通じて「シミュレーションから現実」への適応に成功させたことを報告しています。

Alaaeddine Chaarani, Narcis Palomeras, Pere Ridao2026-03-13🤖 cs.AI

Just Use XML: Revisiting Joint Translation and Label Projection

本論文は、XML タグを用いて機械翻訳とラベル投影を同時に行う新フレームワーク「LabelPigeon」を提案し、翻訳品質を損なうことなく低資源言語へのクロスリンガル転移を大幅に改善できることを実証しています。

Thennal D K, Chris Biemann, Hans Ole Hatzel2026-03-13💬 cs.CL

Cascade: Composing Software-Hardware Attack Gadgets for Adversarial Threat Amplification in Compound AI Systems

この論文は、従来のソフトウェアおよびハードウェアの脆弱性を大規模言語モデル（LLM）固有のアルゴリズム的弱点と組み合わせることで、複合 AI システムの完全性や機密性を侵害する新たな攻撃手法「Cascade」を提案し、その攻撃プリミティブの体系化と防御戦略の基盤構築を論じています。

Sarbartha Banerjee, Prateek Sahu, Anjo Vahldiek-Oberwagner, Jose Sanchez Vicarte, Mohit Tiwari2026-03-13🤖 cs.AI

Slow-Fast Inference: Training-Free Inference Acceleration via Within-Sentence Support Stability

この論文は、文内や意味的に一貫した区間におけるアテンションサポートの安定性という観察に基づき、既存のモデルを再学習することなく推論コストを大幅に削減し、品質を維持しながらスループットを向上させるトレーニングフリーの「Slow-Fast Inference」フレームワークを提案しています。

Xingyu Xie, Zhaochen Yu, Yue Liao, Tao Wang, Kim-Chuan Toh, Shuicheng Yan2026-03-13🤖 cs.LG

XSkill: Continual Learning from Experience and Skills in Multimodal Agents

本論文は、マルチモーダルエージェントがパラメータ更新なしに過去の軌跡から学習し、視覚的観察に基づいて「経験」と「スキル」の二重ストリームを継続的に蓄積・適応させることで、複雑な推論タスクにおけるツール利用の効率性と柔軟性を大幅に向上させるフレームワーク「XSkill」を提案するものである。

Guanyu Jiang (May), Zhaochen Su (May), Xiaoye Qu (May), Yi R. (May), Fung2026-03-13🤖 cs.AI

Coarse-Guided Visual Generation via Weighted h-Transform Sampling

本論文は、事前学習済み拡散モデルを用いて低解像度の粗い参照画像から高品質な画像を生成するトレーニング不要な手法として、h 変換を導入し、近似誤差を補正するノイズレベル感知スケジューリングを組み合わせることで、従来の手法が抱える転送演算子の既知性や品質と誘導性のバランスの問題を解決する「Coarse-Guided Visual Generation via Weighted h-Transform Sampling」を提案しています。

Yanghao Wang, Ziqi Jiang, Zhen Wang, Long Chen2026-03-13🤖 cs.AI

Chemical Reaction Networks Learn Better than Spiking Neural Networks

この論文は、隠れ層を持たない化学反応ネットワークが、隠れ層を必要とするスパイクニューラルネットワークよりも優れた学習能力と分類精度を数学的に証明し、生化学的反応ネットワークが生物学的学習においてより効率的である可能性を示唆しています。

Sophie Jaffard, Ivo F. Sbalzarini2026-03-13📊 stat

Beyond Convolution: A Taxonomy of Structured Operators for Learning-Based Image Processing

この論文は、従来の畳み込み演算の限界を克服し、画像処理における学習ベースのパイプラインを革新する構造化演算子を、分解ベース、適応重み付け、基底適応、積分・カーネル、アテンションの 5 つのファミリーに分類し、その特性と適用性を体系的に整理したものである。

Simone Cammarasana2026-03-13🤖 cs.AI

Paper Title: LoV3D: Grounding Cognitive Prognosis Reasoning in Longitudinal 3D Brain MRI via Regional Volume Assessments

LoV3D は、脳 MRI の縦断的データから領域ごとの体積評価に基づき認知予後を推論し、臨床的に重み付けされた検証器による直接選好最適化を通じて、従来の深層学習手法や VLM の限界を克服して高精度かつ説明可能なアルツハイマー病診断を実現する 3D 視覚言語モデルパイプラインです。

Zhaoyang Jiang, Zhizhong Fu, David McAllister, Yunsoo Kim, Honghan Wu2026-03-13🤖 cs.AI

A Multi-Label Temporal Convolutional Framework for Transcription Factor Binding Characterization

この論文は、転写因子の結合部位予測を単一の因子や二値分類ではなく、転写因子間の相関や協調的な制御メカニズムを捉える多ラベル分類問題として定式化し、時系列畳み込みネットワーク（TCN）を用いて生物学的に意味のあるモチーフや新たな共結合パターンを抽出する深層学習フレームワークを提案しています。

Pietro Demurtas, Ferdinando Zanchetta, Giovanni Perini, Rita Fioresi2026-03-13🧬 q-bio

← 前へ次へ →