The Dual-Stream Transformer: Channelized Architecture for Interpretable Language Modeling

この論文は、アテンションとフィードフォワードをそれぞれ異なるストリームで処理する「デュアルストリームトランスフォーマー」を提案し、ヘッド間の混合戦略を調整することで解釈性と性能のトレードオフを明示的に制御可能にしつつ、注意機構の増幅に対する頑健性を示したものである。

J. Clayton Kerce, Alexis Fox2026-03-10🤖 cs.LG

Do Machines Fail Like Humans? A Human-Centred Out-of-Distribution Spectrum for Mapping Error Alignment

この論文は、人間の知覚的困難さに基づいて分布外(OOD)の度合いを再定義し、人間の誤りパターンとモデルの誤りパターンを比較するための人間中心のフレームワークを提案することで、異なる難易度条件下でのモデルと人間の一致度をより体系的に評価可能にしたことを示しています。

Binxia Xu, Xiaoliang Luo, Luke Dickens, Robert M. Mok2026-03-10💻 cs

Give Them an Inch and They Will Take a Mile:Understanding and Measuring Caller Identity Confusion in MCP-Based AI Systems

本論文は、MCP(Model Context Protocol)ベースの AI システムにおいて、呼び出し元の ID 認証を欠き単一の承認決定を信頼する設計が根本的な脆弱性であり、多数の不正な呼び出し元へのアクセスを許容する大規模な実証分析を通じて、明示的な呼び出し元認証ときめ細かな権限管理の必要性を明らかにしたものである。

Yuhang Huang, Boyang Ma, Biwei Yan, Xuelong Dai, Yechao Zhang, Minghui Xu, Kaidi Xu, Yue Zhang2026-03-10💻 cs

Cross-Modal Taxonomic Generalization in (Vision-) Language Models

この論文は、画像エンコーダと言語モデル(LM)を凍結したビジョン言語モデルにおいて、画像からの明示的なハイパーニム(上位概念)の証拠を完全に排除しても、言語モデルが事前学習した言語的知識とカテゴリー内の視覚的類似性に基づき、ハイパーニムを回復・一般化できることを示しています。

Tianyang Xu, Marcelo Sandoval-Castaneda, Karen Livescu, Greg Shakhnarovich, Kanishka Misra2026-03-10💬 cs.CL

Interpretable-by-Design Transformers via Architectural Stream Independence

この論文は、トークンストリームと文脈セマンティクスを処理の最終段階まで分離して保持する「アーキテクチャ的ストリーム独立性」という設計原理を導入し、標準的なトランスフォーマーが早期に意味と位置情報の混同を起こすのに対し、後融合アーキテクチャ(LFA)は解釈可能な記号ヘッドを維持し、位置依存性への依存を減らしてモデルの安定性と構造的解釈可能性を向上させることを実証しています。

Clayton Kerce, Alexis Fox2026-03-10🤖 cs.LG

A Joint Neural Baseline for Concept, Assertion, and Relation Extraction from Clinical Text

この論文は、臨床テキストからの概念認識、アサーション分類、関係抽出という 3 つのタスクを独立して処理する従来のパイプライン手法の課題を解決し、これらを統合的に最適化するエンドツーエンドのニューラルネットワーク基線モデルを提案し、その有効性を示すものです。

Fei Cheng, Ribeka Tanaka, Sadao Kurohashi2026-03-10💬 cs.CL

From Thinker to Society: Security in Hierarchical Autonomy Evolution of AI Agents

この論文は、LLM 駆動の AI エージェントの自律性進化に伴う新たなセキュリティ課題に対し、認知・実行・集合的自律の 3 段階で脅威を分類し、多層防御アーキテクチャの構築を提唱する階層的自律進化(HAE)フレームワークを提示しています。

Xiaolei Zhang, Lu Zhou, Xiaogang Xu, Jiafei Wu, Tianyu Du, Heqing Huang, Hao Peng, Zhe Liu2026-03-10💻 cs

SeDa: A Unified System for Dataset Discovery and Multi-Entity Augmented Semantic Exploration

本論文は、200 以上のプラットフォームから 760 万以上のデータセットを統合し、意味的注釈とマルチエンティティ拡張ナビゲーションを通じて、分散したデータエコシステムにおける信頼性の高いデータ発見と探索を実現する統一フレームワーク「SeDa」を提案するものである。

Kan Ling, Zhen Qin, Yichi Zhu, Hengrun Zhang, Huiqun Yu, Guisheng Fan2026-03-10💻 cs

A Unified View of Drifting and Score-Based Models

本論文は、Tweedie の公式を用いて「Drifting モデル」がガウス平滑化分布におけるスコアマッチングの原理と厳密に等価であることを示し、拡散モデルや DMD との理論的関係を明らかにするとともに、ラプラス核に対する誤差評価も提供しています。

Chieh-Hsin Lai, Bac Nguyen, Naoki Murata, Yuhta Takida, Toshimitsu Uesaka, Yuki Mitsufuji, Stefano Ermon, Molei Tao2026-03-10🤖 cs.LG

InterReal: A Unified Physics-Based Imitation Framework for Learning Human-Object Interaction Skills

本論文は、実世界の人間 - 物体相互作用(HOI)制御を可能にする統合された物理ベースの模倣学習フレームワーク「InterReal」を提案し、接触制約を考慮したデータ拡張とメタポリシーに基づく自動報酬学習により、Unitree G1 などの実機において高い追従精度とタスク成功率を実現したことを示しています。

Dayang Liang, Yuhang Lin, Xinzhe Liu, Jiyuan Shi, Yunlong Liu, Chenjia Bai2026-03-10💻 cs

SketchGraphNet: A Memory-Efficient Hybrid Graph Transformer for Large-Scale Sketch Corpora Recognition

本論文は、フリーハンドスケッチをラスター画像やストローク系列ではなく構造化グラフとして直接モデル化する「SketchGraphNet」を提案し、344 万点のスケッチを含む大規模ベンチマーク「SketchGraph」上で、補助的な位置・構造エンコーディングを不要としながら、メモリ効率と精度を両立した認識を実現したことを報告しています。

Shilong Chen, Mingyuan Li, Zhaoyang Wang, Zhonglin Ye, Haixing Zhao2026-03-10💻 cs

Neural Dynamics-Informed Pre-trained Framework for Personalized Brain Functional Network Construction

この論文は、事前定義された脳アトラスや線形仮定に依存する既存手法の限界を克服し、神経動態を考慮した事前学習フレームワークを導入することで、多様なシナリオにおける個人固有の脳機能ネットワーク構築を実現し、その汎用性と精度を大幅に向上させることを提案しています。

Hongjie Jiang, Yifei Tang, Shuqiang Wang2026-03-10🤖 cs.LG

How Long Can Unified Multimodal Models Generate Images Reliably? Taming Long-Horizon Interleaved Image Generation via Context Curation

この論文は、長編のテキストと画像を交互に生成する際に視覚履歴の蓄積が品質劣化を招くという課題を特定し、モデル内部の関連性に基づいて不要な視覚情報を動的に排除する「UniLongGen」という推論戦略を提案することで、長期生成の安定性と忠実度を大幅に向上させることを示しています。

Haoyu Chen, Qing Liu, Yuqian Zhou, He Zhang, Zhaowen Wang, Mengwei Ren, Jingjing Ren, Xiang Wang, Zhe Lin, Lei Zhu2026-03-10💻 cs

DreamSAC: Learning Hamiltonian World Models via Symmetry Exploration

DreamSAC は、ハミルトニアンに基づく好奇心ボーナスを用いた対称性探索戦略と、生データから物理的保存則を学習する自己教師ありコントラスト学習を組み合わせた世界モデルを導入することで、統計的相関ではなく物理法則を習得し、未知の物理特性への外挿一般化を飛躍的に向上させる手法を提案しています。

Jinzhou Tang, Fan Feng, Minghao Fu, Wenjun Lin, Biwei Huang, Keze Wang2026-03-10🤖 cs.LG

Learning-free L2-Accented Speech Generation using Phonological Rules

この論文は、大規模なアクセント付きデータや学習を必要とせず、音韻規則と多言語 TTS モデルを組み合わせることで、音声の明瞭さを保ちながらスペイン語やインド英語などのアクセントを音素レベルで制御可能な新しい音声合成フレームワークを提案するものである。

Thanathai Lertpetchpun, Yoonjeong Lee, Jihwan Lee, Tiantian Feng, Dani Byrd, Shrikanth Narayanan2026-03-10💬 cs.CL

Targeted Speaker Poisoning Framework in Zero-Shot Text-to-Speech

この論文は、ゼロショット音声合成モデルから特定の話者アイデンティティを除去する「音声生成話者ポイズニング(SGSP)」という新たな課題を定義し、15 名までの話者に対してプライバシー保護とモデル有用性の両立を達成するフレームワークを提案しています。

Thanapat Trachu, Thanathai Lertpetchpun, Sai Praneeth Karimireddy, Shrikanth Narayanan2026-03-10💻 cs

Nw\=ach\=a Mun\=a: A Devanagari Speech Corpus and Proximal Transfer Benchmark for Nepal Bhasha ASR

ネパール語(ネワール語)の音声認識におけるリソース不足を解消するため、5.39 時間の手書き転写コーパス「Nwāchā Munā」を公開し、大規模多言語モデルに匹敵する性能を、近隣言語であるネパール語からの転移学習によって達成したことを報告する論文です。

Rishikesh Kumar Sharma, Safal Narshing Shrestha, Jenny Poudel, Rupak Tiwari, Arju Shrestha, Rupak Raj Ghimire, Bal Krishna Bal2026-03-10💬 cs.CL