HELM: Hierarchical and Explicit Label Modeling with Graph Learning for Multi-Label Image Classification

本論文は、リモートセンシング画像の階層的マルチラベル分類において、階層構造を明示的にモデル化する Vision Transformer とグラフ畳み込みネットワーク、および半教師あり学習を組み合わせた新しいフレームワーク「HELM」を提案し、特にラベルが不足する状況で最先端の性能を達成したことを報告しています。

Marjan Stoimchev, Boshko Koloski, Jurica Levatic, Dragi Kocev, Sašo Džeroski2026-03-13🤖 cs.AI

Locating Demographic Bias at the Attention-Head Level in CLIP's Vision Encoder

この論文は、CLIP のビジョントランスフォーマーにおいて、特定の注意ヘッドを特定・除去することで性差や年齢のバイアスを局所的に特定・軽減できることを示すメカニズム的公平性監査手法を提案し、性バイアスでは効果的であったが年齢バイアスではより拡散的であることを明らかにしています。

Alaa Yasser, Kittipat Phunjanna, Marcos Escudero Viñolo, Catarina Barata, Jenny Benois-Pineau2026-03-13🤖 cs.AI

DocSage: An Information Structuring Agent for Multi-Doc Multi-Entity Question Answering

本論文は、複数のドキュメントに散在する複数の実体間の論理を追跡する難題に対処するため、動的なスキーマ発見、構造化情報抽出、およびスキーマ意識型の関係推論を統合したエンドツーエンドのエージェントフレームワーク「DocSage」を提案し、既存の LLM や RAG システムを大幅に上回る精度を達成したことを示しています。

Teng Lin, Yizhang Zhu, Zhengxuan Zhang, Yuyu Luo, Nan Tang2026-03-13🤖 cs.AI

A Semi-Decentralized Approach to Multiagent Control

通信の不確実性下における協調マルチエージェント制御のために、半分散化の概念を部分観測マルコフ決定過程(POMDP)に拡張した SDec-POMDP 枠組みと、その最適方策を生成する厳密アルゴリズム RS-SDA* を提案し、理論的基盤とベンチマーク評価を通じてその有効性を示しています。

Mahdi Al-Husseini, Mykel J. Kochenderfer, Kyle H. Wray2026-03-13🤖 cs.AI

Automating Skill Acquisition through Large-Scale Mining of Open-Source Agentic Repositories: A Framework for Multi-Agent Procedural Knowledge Extraction

この論文は、GitHub などのオープンソースリポジトリから大規模にマイニングしたプロシージャル知識を標準化フォーマットに変換するフレームワークを提案し、LLM の再学習なしに自律的なエージェントのスキルを拡張し、教育コンテンツの知識伝達効率を 40% 向上させることを実証しています。

Shuzhen Bi, Mengsong Wu, Hao Hao, Keqian Li, Wentao Liu, Siyu Song, Hongbo Zhao, Aimin Zhou2026-03-13🤖 cs.AI

RADAR: Closed-Loop Robotic Data Generation via Semantic Planning and Autonomous Causal Environment Reset

RADAR は、人間の介入を完全に排除し、視覚言語モデルとグラフニューラルネットワークによる自律的なタスク生成・実行・評価、および有限状態機械による環境の自動リセットを組み合わせた閉ループシステムとして、大規模なロボット学習データの収集を可能にする革新的なフレームワークです。

Yongzhong Wang, Keyu Zhu, Yong Zhong, Liqiong Wang, Jinyu Yang, Feng Zheng2026-03-13🤖 cs.AI

VisiFold: Long-Term Traffic Forecasting via Temporal Folding Graph and Node Visibility

この論文は、長期交通予測における計算リソースの制約と複雑な時空間依存関係の課題を解決するため、時間的フoldingグラフとノード可視性メカニズムを導入した新しいフレームワーク「VisiFold」を提案し、既存手法を凌駕する性能と大幅なリソース削減を実現したことを示しています。

Zhiwei Zhang, Xinyi Du, Weihao Wang, Xuanchi Guo, Wenjuan Han2026-03-13🤖 cs.AI

Automated Detection of Malignant Lesions in the Ovary Using Deep Learning Models and XAI

この論文は、Mendeley の組織病理学データセットを用いて複数の畳み込みニューラルネットワークを比較検討し、InceptionV3 モデルが 94% の精度で卵巣がんを高精度に検出できることを示すと同時に、LIME、Integrated Gradients、SHAP といった説明可能 AI(XAI)手法を用いてモデルの判断根拠を可視化・分析する研究です。

Md. Hasin Sarwar Ifty, Nisharga Nirjan, Labib Islam, M. A. Diganta, Reeyad Ahmed Ornate, Anika Tasnim, Md. Saiful Islam2026-03-13🤖 cs.AI

You Told Me to Do It: Measuring Instructional Text-induced Private Data Leakage in LLM Agents

この論文は、高権限の LLM エージェントが外部ドキュメントに埋め込まれた悪意のある指示を正当な設定手順と区別できずに実行してしまう「信頼される実行者のジレンマ」という構造的な脆弱性を特定し、実世界のリポジトリを用いたベンチマークや防御策の評価を通じて、ドキュメント経由の指示注入攻撃が現在の防御技術では検知・防止が極めて困難な重大な脅威であることを実証しています。

Ching-Yu Kao, Xinfeng Li, Shenyu Dai, Tianze Qiu, Pengcheng Zhou, Eric Hanchen Jiang, Philip Sperl2026-03-13🤖 cs.AI

CreativeBench: Benchmarking and Enhancing Machine Creativity via Self-Evolving Challenges

本論文は、機械の創造性をコード生成タスクにおいて定量的に評価するためのベンチマーク「CreativeBench」を提案し、モデルのスケーリングがもたらす創造性の特性を分析するとともに、進化探索パターンを内包する推論時制御手法「EvoRePE」を開発して機械の創造性を向上させることを示しています。

Zi-Han Wang, Lam Nguyen, Zhengyang Zhao, Mengyue Yang, Chengwei Qin, Yujiu Yang, Linyi Yang2026-03-13🤖 cs.AI

Social, Legal, Ethical, Empathetic and Cultural Norm Operationalisation for AI Agents

この論文は、医療や法執行などの高リスク分野における AI エージェントの行動を社会的・法的・倫理的・共感的・文化的規範(SLEEC)に整合させるため、抽象的な原則を具体的で検証可能な要件へ変換する体系的なプロセスを提案し、関連する手法や課題、研究の方向性を示す枠組みを確立するものである。

Radu Calinescu, Ana Cavalcanti, Marsha Chechik, Lina Marsso, Beverley Townsend2026-03-13🤖 cs.AI

ELISA: An Interpretable Hybrid Generative AI Agent for Expression-Grounded Discovery in Single-Cell Genomics

この論文は、scGPT の埋め込み表現と BioBERT による意味検索、LLM による解釈を統合し、生データへの直接アクセスなしに単一細胞トランスクリプトミクスデータから生物学的仮説を導き出す解釈可能なハイブリッド AI エージェント「ELISA」を提案し、既存手法を大幅に上回る性能と生物学的発見への貢献を実証したものである。

Omar Coser2026-03-13🧬 q-bio

AdaFuse: Accelerating Dynamic Adapter Inference via Token-Level Pre-Gating and Fused Kernel Optimization

AdaFuse は、トークン単位の事前ゲートングとカスタム CUDA カーネルによる融合最適化を組み合わせることで、動的アダプター推論におけるレイテンシを 2.4 倍以上削減しつつ、精度を維持する新しいフレームワークを提案する。

Qiyang Li, Rui Kong, Yuchen Li, Hengyi Cai, Shuaiqiang Wang, Linghe Kong, Guihai Chen, Dawei Yin2026-03-13🤖 cs.AI

The Mirror Design Pattern: Strict Data Geometry over Model Scale for Prompt Injection Detection

この論文は、大規模モデルに依存せず、厳密にキュレーションされたデータ幾何学構造(ミラー・デザインパターン)と線形モデルを用いることで、低遅延かつ高信頼性のプロンプトインジェクション検出を実現し、L1 レベルの防御においてモデルの規模よりもデータの厳密な設計が重要であることを示しています。

J Alex Corll2026-03-13🤖 cs.AI

Bielik-Minitron-7B: Compressing Large Language Models via Structured Pruning and Knowledge Distillation for the Polish Language

本論文は、NVIDIA の Minitron 手法に着想を得た構造化プルーニングと知識蒸留、および高度なアライメントパイプラインを組み合わせることで、ポーランド語および欧州言語に特化した大規模言語モデル「Bielik-11B」をパラメータ数を約 33% 削減しつつ推論速度を最大 50% 向上させ、かつベースラインの性能の約 90% を維持する「Bielik-Minitron-7B」を構築したことを報告しています。

Remigiusz Kinas, Paweł Kiszczak, Sergio P. Perez, Krzysztof Ociepa, Łukasz Flis, Krzysztof Wróbel, Adrian Gwozdziej2026-03-13💬 cs.CL

Think While Watching: Online Streaming Segment-Level Memory for Multi-Turn Video Reasoning in Multimodal Large Language Models

この論文は、マルチターン対話における連続的な動画ストリームの推論を可能にするため、セグメントレベルのメモリを維持し、視聴と思考を並行して行う「Think While Watching」という新しいフレームワークを提案し、Qwen3-VL 基盤で StreamingBench や OVO-Bench などのベンチマークにおいて高い精度と効率的なトークン生成を実現したことを示しています。

Lu Wang (The Key Laboratory of Cognition and Decision Intelligence for Complex Systems, Institute of Automation, Chinese Academy of Sciences, Beijing, China), Zhuoran Jin (The Key Laboratory of Cognition and Decision Intelligence for Complex Systems, Institute of Automation, Chinese Academy of Sciences, Beijing, China), Yupu Hao (The Key Laboratory of Cognition and Decision Intelligence for Complex Systems, Institute of Automation, Chinese Academy of Sciences, Beijing, China), Yubo Chen (The Key Laboratory of Cognition and Decision Intelligence for Complex Systems, Institute of Automation, Chinese Academy of Sciences, Beijing, China), Kang Liu (The Key Laboratory of Cognition and Decision Intelligence for Complex Systems, Institute of Automation, Chinese Academy of Sciences, Beijing, China), Yulong Ao (Beijing Academy of Artificial Intelligence), Jun Zhao (The Key Laboratory of Cognition and Decision Intelligence for Complex Systems, Institute of Automation, Chinese Academy of Sciences, Beijing, China)2026-03-13💬 cs.CL

EnTransformer: A Deep Generative Transformer for Multivariate Probabilistic Forecasting

本論文は、確率論的学習パラダイムである「engression」とトランスフォーマーの表現力を統合し、パラメトリックな仮定を課さずに複雑な多変量予測分布を直接学習することで、高品質な確率論的予測を実現する深層生成モデル「EnTransformer」を提案し、複数のベンチマークデータセットにおいて既存モデルを上回る性能を実証したものである。

Rajdeep Pathak, Rahul Goswami, Madhurima Panja, Palash Ghosh, Tanujit Chakraborty2026-03-13📊 stat

Understanding LLM Behavior When Encountering User-Supplied Harmful Content in Harmless Tasks

この論文は、一見无害なタスクであってもユーザーから有害な内容が提供された際、最新のLLMが倫理的に適切に拒絶できず、その内容やタスクの種類によって脆弱性が異なることを実証し、見過ごされがちなコンテンツレベルの倫理リスクへの対策を促すものである。

Junjie Chu, Yiting Qu, Ye Leng, Michael Backes, Yun Shen, Savvas Zannettou, Yang Zhang2026-03-13🤖 cs.AI

MobileKernelBench: Can LLMs Write Efficient Kernels for Mobile Devices?

本論文は、モバイルデバイス向けカーネル生成の課題を特定し、その評価フレームワーク「MobileKernelBench」を提案するとともに、リポジトリ認識型推論と計画・実行パラダイムを備えたマルチエージェントシステム「MoKA」を開発することで、コンパイル成功率と実行速度の大幅な向上を実現したことを報告しています。

Xingze Zou, Jing Wang, Yuhua Zheng, Xueyi Chen, Haolei Bai, Lingcheng Kong, Syed A. R. Abu-Bakar, Zhaode Wang, Chengfei Lv, Haoji Hu, Huan Wang2026-03-13🤖 cs.LG