Cluster-Aware Attacks on Graph Watermarks

本論文は、既存のグラフ透かし評価がランダムな辺の改変に限定されているのに対し、コミュニティ構造を利用したより高度な「クラスター認識型攻撃」が、同程度の構造歪みで透かしの帰属精度を大幅に低下させることを初めて実証し、現在の防御策の脆弱性と新たな防御の必要性を明らかにしたものである。

Alexander Nemecek, Emre Yilmaz, Erman Ayday2026-03-12💻 cs

Average Calibration Losses for Reliable Uncertainty in Medical Image Segmentation

本論文は、医療画像セグメンテーションにおける深層学習モデルの過信問題を解決するため、画像ごとに計算可能な微分可能な平均較正誤差(mL1-ACE)を補助損失として導入し、予測の信頼性と精度のバランスを制御可能にする手法を提案し、複数のデータセットでその有効性を検証したものです。

Theodore Barfoot, Luis C. Garcia-Peraza-Herrera, Samet Akcay, Ben Glocker, Tom Vercauteren2026-03-12💻 cs

SOTA: Self-adaptive Optimal Transport for Zero-Shot Classification with Multiple Foundation Models

本論文は、視覚言語モデルと視覚専用モデルのそれぞれが持つ弱点を補完し、事前知識に依存せずに複数の基盤モデルの出力を自己適応的な輸送計画で統合する「SOTA」というトレーニング不要のアンサンブル手法を提案し、多様なドメインで個別モデルを上回るゼロショット分類性能を実現することを示しています。

Zhanxuan Hu, Qiyu Xu, Yu Duan, Yonghang Tai, Huafeng Li2026-03-12💻 cs

Community Notes undermoderate polarizing content by design creating risks in electoral processes

この論文は、X のコミュニティノートが異党派間の合意を重視する設計により、政治的分極化コンテンツを意図的に過小評価(under-moderate)する傾向があり、これが米国や欧州などの選挙プロセスにおける市民議論に潜在的なリスクをもたらしていることを、2025 年 3 月までの 190 万件のデータ分析を通じて実証しています。

Paul Bouchaud, Pedro Ramaciotti2026-03-12💻 cs

Shiksha Copilot: Teacher-AI Collaboration for Curating and Customizing Lesson Plans in Low-Resource Schools

この論文は、インドの低資源環境にある公立学校で展開されたAI支援教材作成ツール「Shiksha Copilot」の実証研究を通じて、教師とAIの協働が事務負担の軽減や授業の活動中心化に寄与する一方で、人員不足などの構造的課題が教育変革の限界を規定していることを明らかにし、多言語・グローバルサウス文脈における教師中心のEdTech設計指針を提案するものである。

Deepak Varuvel Dennison, Bakhtawar Ahtisham, Kavyansh Chourasia, Nirmit Arora, Rahul Singh, Rene F. Kizilcec, Akshay Nambi, Tanuja Ganu, Aditya Vashistha2026-03-12💻 cs

Recommender systems, representativeness, and online music: a psychosocial analysis of Italian listeners

この論文は、イタリアの音楽リスナーを対象としたインタビュー調査を通じて、アルゴリズムへの批判的理解の欠如やジェンダー表現への意識の低さなど、レコメンデーションシステムに対する心理社会的な課題を明らかにし、信頼性が高く文化的に配慮されたシステム設計の重要性を説いています。

Lorenzo Porcaro, Chiara Monaldi2026-03-12💻 cs

Speech-to-LaTeX: New Models and Datasets for Converting Spoken Equations and Sentences

この論文は、音声から数式や文章を LaTeX に変換する課題に対処するため、英語とロシア語の 6 万 6 千件以上の音声データを含む大規模なオープンソースデータセットと、既存の手法を大幅に上回る性能を達成する新しいモデルを提案し、数学的コンテンツ認識の新たな基準を確立したものである。

Dmitrii Korzh, Dmitrii Tarasov, Artyom Iudin, Elvir Karimov, Matvey Skripkin, Nikita Kuzmin, Andrey Kuznetsov, Oleg Y. Rogov, Ivan Oseledets2026-03-12💻 cs

What Do Agents Think One Another Want? Level-2 Inverse Games for Inferring Agents' Estimates of Others' Objectives

この論文は、分散型環境におけるエージェント間の戦略的相互作用をより正確に理解するために、第三者が他者の目的を完全に知っているという従来の仮定を越え、各エージェントが他者の目的をどのように推定しているかを推論する「レベル 2 逆ゲーム」の枠組みを提案し、その非凸性を証明するとともに効率的な解法を開発したものである。

Hamzah I. Khan, Jingqi Li, David Fridovich-Keil2026-03-12💻 cs

From Law to Gherkin: A Human-Centred Quasi-Experiment on the Quality of LLM-Generated Behavioural Specifications from Food-Safety Regulations

この論文は、食品衛生規制からLLM(ClaudeおよびLlama)を用いてGherkin形式の行動仕様を生成する実験を行い、生成物は高い品質を示したが、欠落や幻覚といった問題が確認されたため、安全性が重要な分野では人間の監視が不可欠であると結論付けています。

Shabnam Hassani, Mehrdad Sabetzadeh, Daniel Amyot2026-03-12💻 cs

Pixel Motion Diffusion is What We Need for Robot Control

DAWN は、構造化されたピクセル運動表現を介して高レベルの運動意図と低レベルのロボット動作を橋渡しする統合拡散モデルを提案し、CALVIN や MetaWorld などのベンチマークで最先端の性能を達成するとともに、限られた実世界データでの効率的な転移学習を実現する。

E-Ro Nguyen, Yichi Zhang, Kanchana Ranasinghe, Xiang Li, Michael S. Ryoo2026-03-12💻 cs

Efficient Audio-Visual Speech Separation with Discrete Lip Semantics and Multi-Scale Global-Local Attention

この論文は、唇の動きを離散的な意味トークンに変換する軽量エンコーダと、マルチスケールのグローバル・ローカル注意機構を採用した分離器を組み合わせた「Dolphin」という効率的な音声・視覚分離手法を提案し、最先端モデルよりも分離精度を維持しつつパラメータ数や計算コストを大幅に削減したことを示しています。

Kai Li, Kejun Gao, Xiaolin Hu2026-03-12💻 cs

PD-Diag-Net: Clinical-Priors guided Network on Brain MRI for Auxiliary Diagnosis of Parkinson's Disease

この論文は、MRI 前処理モジュールと脳領域関連性及び加齢に関する臨床事前知識を組み合わせた「PD-Diag-Net」を提案し、外部テストで 86%、早期診断で 96% 以上の精度を達成して既存の最先端手法を 20% 以上上回るパーキンソン病の補助診断システムを開発したことを報告しています。

Shuai Shao, Yan Wang, Shu Jiang, Shiyuan Zhao, Di Yang, Jiangtao Wang, Yutong Bai, Jianguo Zhang2026-03-12💻 cs

Seeing Space and Motion: Enhancing Latent Actions with Geometric and Dynamic Awareness for Vision-Language-Action Models

本論文は、空間理解と時間的知覚の欠如という課題を解決するため、幾何学的な空間符号化とマルチスケールの時間モデリングを組み合わせた潜在行動モデル「Farsighted-LAM」と、これに環境動態の明示的推論を組み込んだ VLA フレームワーク「SSM-VLA」を提案し、シミュレーションおよび実世界でのタスクにおいて最先端の性能を達成したことを示しています。

Zhejia Cai, Yandan Yang, Xinyuan Chang, Shiyi Liang, Ronghan Chen, Feng Xiong, Mu Xu, Ruqi Huang2026-03-12💻 cs

Adaptive Event Stream Slicing for Open-Vocabulary Event-Based Object Detection via Vision-Language Knowledge Distillation

本論文は、イベントカメラのオープンボキャブラリー検出における課題を解決するため、CLIP の知識を蒸留する教師モデルと、イベントの時間的損失を防ぐ適応型スパイキングニューラルネットワークを組み合わせた新しいフレームワークを提案しています。

Jinchang Zhang, Zijun Li, Jiakai Lin, Guoyu Lu2026-03-12💻 cs

Equivariant Splitting: Self-supervised learning from incomplete data

この論文は、不完全な観測データのみから自己教師あり学習を行うための新たな戦略を提案し、等価性を持つ再構成ネットワークと分割損失の組み合わせにより、教師あり損失の不偏推定を実現し、画像修復や MRI 再構成など rank 不足の前方モデルを持つ課題において最先端の性能を達成することを示しています。

Victor Sechaud, Jérémy Scanvic, Quentin Barthélemy, Patrice Abry, Julián Tachella2026-03-12💻 cs