cs 件の論文 | Gist.Science

Cluster-Aware Attacks on Graph Watermarks

本論文は、既存のグラフ透かし評価がランダムな辺の改変に限定されているのに対し、コミュニティ構造を利用したより高度な「クラスター認識型攻撃」が、同程度の構造歪みで透かしの帰属精度を大幅に低下させることを初めて実証し、現在の防御策の脆弱性と新たな防御の必要性を明らかにしたものである。

Alexander Nemecek, Emre Yilmaz, Erman Ayday2026-03-12💻 cs

Unsupervised training of keypoint-agnostic descriptors for flexible retinal image registration

本論文は、ラベル付きデータが不足する医療分野において、キーポイント検出器に依存しない教師なし学習による記述子学習手法を提案し、既存の教師あり手法と同等の精度で網膜画像の柔軟な登録を実現することを示しています。

David Rivas-Villar, Álvaro S. Hervella, José Rouco, Jorge Novo2026-03-12💻 cs

Average Calibration Losses for Reliable Uncertainty in Medical Image Segmentation

本論文は、医療画像セグメンテーションにおける深層学習モデルの過信問題を解決するため、画像ごとに計算可能な微分可能な平均較正誤差（mL1-ACE）を補助損失として導入し、予測の信頼性と精度のバランスを制御可能にする手法を提案し、複数のデータセットでその有効性を検証したものです。

Theodore Barfoot, Luis C. Garcia-Peraza-Herrera, Samet Akcay, Ben Glocker, Tom Vercauteren2026-03-12💻 cs

SOTA: Self-adaptive Optimal Transport for Zero-Shot Classification with Multiple Foundation Models

本論文は、視覚言語モデルと視覚専用モデルのそれぞれが持つ弱点を補完し、事前知識に依存せずに複数の基盤モデルの出力を自己適応的な輸送計画で統合する「SOTA」というトレーニング不要のアンサンブル手法を提案し、多様なドメインで個別モデルを上回るゼロショット分類性能を実現することを示しています。

Zhanxuan Hu, Qiyu Xu, Yu Duan, Yonghang Tai, Huafeng Li2026-03-12💻 cs

Community Notes undermoderate polarizing content by design creating risks in electoral processes

この論文は、X のコミュニティノートが異党派間の合意を重視する設計により、政治的分極化コンテンツを意図的に過小評価（under-moderate）する傾向があり、これが米国や欧州などの選挙プロセスにおける市民議論に潜在的なリスクをもたらしていることを、2025 年 3 月までの 190 万件のデータ分析を通じて実証しています。

Paul Bouchaud, Pedro Ramaciotti2026-03-12💻 cs

Shiksha Copilot: Teacher-AI Collaboration for Curating and Customizing Lesson Plans in Low-Resource Schools

この論文は、インドの低資源環境にある公立学校で展開されたAI支援教材作成ツール「Shiksha Copilot」の実証研究を通じて、教師とAIの協働が事務負担の軽減や授業の活動中心化に寄与する一方で、人員不足などの構造的課題が教育変革の限界を規定していることを明らかにし、多言語・グローバルサウス文脈における教師中心のEdTech設計指針を提案するものである。

Deepak Varuvel Dennison, Bakhtawar Ahtisham, Kavyansh Chourasia, Nirmit Arora, Rahul Singh, Rene F. Kizilcec, Akshay Nambi, Tanuja Ganu, Aditya Vashistha2026-03-12💻 cs

A Survey on Interpretability in Visual Recognition

本論文は、人間中心の視点から意図・対象・表現・手法の多次元分類体系を確立し、視覚認識における XAI の評価指標やマルチモーダル大規模言語モデルの解釈性、実用応用を包括的に調査・分析することで、今後の研究の指針となるロードマップを提供する。

Qiyang Wan, Chengzhi Gao, Ruiping Wang, Xilin Chen2026-03-12💻 cs

Getting Python Types Right with RightTyper

本論文は、静的解析と動的実行のハイブリッド手法を採用し、統計的に導かれた適応的サンプリングによってランタイムオーバーヘッドを約 27% に抑えつつ、高精度な Python 型注釈を自動生成する「RightTyper」を提案し、既存の手法を上回る性能を実証したものである。

Juan Altmayer Pizzorno, Emery D. Berger2026-03-12💻 cs

Recommender systems, representativeness, and online music: a psychosocial analysis of Italian listeners

この論文は、イタリアの音楽リスナーを対象としたインタビュー調査を通じて、アルゴリズムへの批判的理解の欠如やジェンダー表現への意識の低さなど、レコメンデーションシステムに対する心理社会的な課題を明らかにし、信頼性が高く文化的に配慮されたシステム設計の重要性を説いています。

Lorenzo Porcaro, Chiara Monaldi2026-03-12💻 cs

Content-Aware Mamba for Learned Image Compression

画像のコンテンツに応じてトークンの処理順序を動的に最適化し、従来の Mamba の厳密な因果制約を打破する「コンテンツアウェア・マンバ」を提案することで、学習型画像圧縮において最先端のレート歪み性能を達成した研究です。

Yunuo Chen, Zezheng Lyu, Bing He, Hongwei Hu, Qi Wang, Yuan Tian, Li Song, Wenjun Zhang, Guo Lu2026-03-12💻 cs

Speech-to-LaTeX: New Models and Datasets for Converting Spoken Equations and Sentences

この論文は、音声から数式や文章を LaTeX に変換する課題に対処するため、英語とロシア語の 6 万 6 千件以上の音声データを含む大規模なオープンソースデータセットと、既存の手法を大幅に上回る性能を達成する新しいモデルを提案し、数学的コンテンツ認識の新たな基準を確立したものである。

Dmitrii Korzh, Dmitrii Tarasov, Artyom Iudin, Elvir Karimov, Matvey Skripkin, Nikita Kuzmin, Andrey Kuznetsov, Oleg Y. Rogov, Ivan Oseledets2026-03-12💻 cs

What Do Agents Think One Another Want? Level-2 Inverse Games for Inferring Agents' Estimates of Others' Objectives

この論文は、分散型環境におけるエージェント間の戦略的相互作用をより正確に理解するために、第三者が他者の目的を完全に知っているという従来の仮定を越え、各エージェントが他者の目的をどのように推定しているかを推論する「レベル 2 逆ゲーム」の枠組みを提案し、その非凸性を証明するとともに効率的な解法を開発したものである。

Hamzah I. Khan, Jingqi Li, David Fridovich-Keil2026-03-12💻 cs

DSER: Spectral Epipolar Representation for Efficient Light Field Depth Estimation

本論文は、疎な角度サンプリングやオクルージョン境界といった課題に対処し、効率的かつ高精度な光場深度推定を実現するために、エピポーラ領域におけるスペクトル正則化を導入した「深層スペクトルエピポーラ表現（DSER）」を提案するものである。

Noor Islam S. Mohammad, Md Muntaqim Meherab2026-03-12💻 cs

From Law to Gherkin: A Human-Centred Quasi-Experiment on the Quality of LLM-Generated Behavioural Specifications from Food-Safety Regulations

この論文は、食品衛生規制からLLM（ClaudeおよびLlama）を用いてGherkin形式の行動仕様を生成する実験を行い、生成物は高い品質を示したが、欠落や幻覚といった問題が確認されたため、安全性が重要な分野では人間の監視が不可欠であると結論付けています。

Shabnam Hassani, Mehrdad Sabetzadeh, Daniel Amyot2026-03-12💻 cs

Pixel Motion Diffusion is What We Need for Robot Control

DAWN は、構造化されたピクセル運動表現を介して高レベルの運動意図と低レベルのロボット動作を橋渡しする統合拡散モデルを提案し、CALVIN や MetaWorld などのベンチマークで最先端の性能を達成するとともに、限られた実世界データでの効率的な転移学習を実現する。

E-Ro Nguyen, Yichi Zhang, Kanchana Ranasinghe, Xiang Li, Michael S. Ryoo2026-03-12💻 cs

Efficient Audio-Visual Speech Separation with Discrete Lip Semantics and Multi-Scale Global-Local Attention

この論文は、唇の動きを離散的な意味トークンに変換する軽量エンコーダと、マルチスケールのグローバル・ローカル注意機構を採用した分離器を組み合わせた「Dolphin」という効率的な音声・視覚分離手法を提案し、最先端モデルよりも分離精度を維持しつつパラメータ数や計算コストを大幅に削減したことを示しています。

Kai Li, Kejun Gao, Xiaolin Hu2026-03-12💻 cs

PD-Diag-Net: Clinical-Priors guided Network on Brain MRI for Auxiliary Diagnosis of Parkinson's Disease

この論文は、MRI 前処理モジュールと脳領域関連性及び加齢に関する臨床事前知識を組み合わせた「PD-Diag-Net」を提案し、外部テストで 86%、早期診断で 96% 以上の精度を達成して既存の最先端手法を 20% 以上上回るパーキンソン病の補助診断システムを開発したことを報告しています。

Shuai Shao, Yan Wang, Shu Jiang, Shiyuan Zhao, Di Yang, Jiangtao Wang, Yutong Bai, Jianguo Zhang2026-03-12💻 cs

Seeing Space and Motion: Enhancing Latent Actions with Geometric and Dynamic Awareness for Vision-Language-Action Models

本論文は、空間理解と時間的知覚の欠如という課題を解決するため、幾何学的な空間符号化とマルチスケールの時間モデリングを組み合わせた潜在行動モデル「Farsighted-LAM」と、これに環境動態の明示的推論を組み込んだ VLA フレームワーク「SSM-VLA」を提案し、シミュレーションおよび実世界でのタスクにおいて最先端の性能を達成したことを示しています。

Zhejia Cai, Yandan Yang, Xinyuan Chang, Shiyi Liang, Ronghan Chen, Feng Xiong, Mu Xu, Ruqi Huang2026-03-12💻 cs

Adaptive Event Stream Slicing for Open-Vocabulary Event-Based Object Detection via Vision-Language Knowledge Distillation

本論文は、イベントカメラのオープンボキャブラリー検出における課題を解決するため、CLIP の知識を蒸留する教師モデルと、イベントの時間的損失を防ぐ適応型スパイキングニューラルネットワークを組み合わせた新しいフレームワークを提案しています。

Jinchang Zhang, Zijun Li, Jiakai Lin, Guoyu Lu2026-03-12💻 cs

Equivariant Splitting: Self-supervised learning from incomplete data

この論文は、不完全な観測データのみから自己教師あり学習を行うための新たな戦略を提案し、等価性を持つ再構成ネットワークと分割損失の組み合わせにより、教師あり損失の不偏推定を実現し、画像修復や MRI 再構成など rank 不足の前方モデルを持つ課題において最先端の性能を達成することを示しています。

Victor Sechaud, Jérémy Scanvic, Quentin Barthélemy, Patrice Abry, Julián Tachella2026-03-12💻 cs

← 前へ次へ →