Decomposing Physician Disagreement in HealthBench

HealthBench における医師間の評価不一致の大部分は構造的な要因に起因するものの、文脈欠如や曖昧な表現といった「解消可能な不確実性」が不一致を有意に増大させる一方、本質的な医学的曖昧さは影響を与えないという見解から、評価シナリオにおける情報ギャップの解消が合意率向上への具体的な改善策となり得ると結論付けています。

Satya Borgohain, Roy Mariathas2026-03-10💻 cs

WISER: Wider Search, Deeper Thinking, and Adaptive Fusion for Training-Free Zero-Shot Composed Image Retrieval

この論文は、ゼロショット合成画像検索(ZS-CIR)において、テキストから画像(T2I)と画像から画像(I2I)の両方の利点を「検索・検証・洗練」というパイプラインで動的に統合し、トレーニング不要で既存の手法を大幅に上回る性能を実現するフレームワーク「WISER」を提案するものです。

Tianyue Wang, Leigang Qu, Tianyu Yang, Xiangzhao Hao, Yifan Xu, Haiyun Guo, Jinqiao Wang2026-03-10💻 cs

PackUV: Packed Gaussian UV Maps for 4D Volumetric Video

本論文は、従来のガウススプラッティング手法が抱える長期シーケンスや大規模運動への対応困難、および既存の動画コーデックとの非互換性を解決するため、ガウス属性を構造化された UV アトラスに変換し標準動画コーデックと互換性のある効率的な 4 次元 volumetric video 表現「PackUV」とその最適化手法「PackUV-GS」を提案し、大規模データセット「PackUV-2B」を用いた実験で高品質かつ長期にわたるレンダリングの成功を実証したものである。

Aashish Rai, Angela Xing, Anushka Agarwal, Xiaoyan Cong, Zekun Li, Tao Lu, Aayush Prakash, Srinath Sridhar2026-03-10💻 cs

Annotation-Free Visual Reasoning for High-Resolution Large Multimodal Models via Reinforcement Learning

この論文は、高価なアノテーションを必要とせず、強化学習に基づく AP-GRPO 手法を用いて大規模マルチモーダルモデルが高解像度画像の重要な領域を自律的に特定・検証し、推論性能を向上させる「HART」というフレームワークを提案するものです。

Jiacheng Yang, Anqi Chen, Yunkai Dang, Qi Fan, Cong Wang, Wenbin Li, Feng Miao, Yang Gao2026-03-10💻 cs

PEPA: a Persistently Autonomous Embodied Agent with Personalities

本論文は、外部からの指示に依存せず、人格特性を内生的な組織原理として活用し、自律的に目標を生成・進化させることで、動的な環境における永続的な自律性を達成する新しい認知アーキテクチャ「PEPA」を提案し、実世界のロボットによる実証実験を通じてその有効性を立証したものである。

Kaige Liu, Yang Li, Lijun Zhu, Weinan Zhang2026-03-10💻 cs

Self-Attention And Beyond the Infinite: Towards Linear Transformers with Infinite Self-Attention

この論文は、アテンションの二次的な計算コストを回避し、高解像度画像処理においてスケーラビリティとエネルギー効率を大幅に向上させるために、拡散過程とマルコフ連鎖の中心性指標に基づいた「無限自己アテンション(InfSA)」とその線形近似版「Linear-InfSA」を提案し、ImageNet での精度向上と超大解像度推論の実現を実証しています。

Giorgio Roffo, Luke Palmer2026-03-10💻 cs

Position: Evaluation of Visual Processing Should Be Human-Centered, Not Metric-Centered

この論文は、生成モデルや知覚指向の手法が主流となった現代において、画像処理システムの評価を単一の数値指標に依存するのではなく、人間の知覚やユーザーの好みに即した人間中心のアプローチへと転換すべきであると主張しています。

Jinfan Hu, Fanghua Yu, Zhiyuan You, Xiang Yin, Hongyu An, Xinqi Lin, Chao Dong, Jinjin Gu2026-03-10💻 cs

Sustainable Care: Designing Technologies That Support Children's Long-Term Engagement with Social Issues

本論文は、子供たちが社会的課題に関わる際に不安や燃え尽き症候群に陥らず、持続的な市民参加を促すための「持続可能なケア」という設計レンズを提案し、CCI 分野の研究者や実践者による研究アジェンダの策定を目的としたワークショップを報告するものである。

JaeWon Kim, Aayushi Dangol, Rotem Landesman, Alexis Hiniker, McKenna F. Parnes2026-03-10💻 cs

DeAR: Fine-Grained VLM Adaptation by Decomposing Attention Head Roles

既存の層中心の仮説を覆し、VLM の深い層におけるアテンションヘッドの役割(属性、汎化、混合)を「概念エントロピー」で分解・分類し、役割に応じたトークンとアテンションマスクを導入することで、タスク適応とゼロショット汎化性能の両立を実現する DeAR 枠組みを提案する論文です。

Yiming Ma, Hongkun Yang, Lionel Z. Wang, Bin Chen, Weizhi Xian, Jianzhi Teng2026-03-10💻 cs

Extended Empirical Validation of the Explainability Solution Space

本技術報告書は、従業員離職予測および都市リソース配分システムという異なるドメインでの評価を通じて、説明性 AI 戦略設計のための汎用的な意思決定支援ツールとしての「説明性ソリューション空間(ESS)」フレームワークの妥当性を拡張的に実証したものである。

Antoni Mestre, Manoli Albert, Miriam Gil, Vicente Pelechano2026-03-10💻 cs

Energy Efficient Traffic Scheduling For Optical LEO Satellite Downlinks

本論文は、気象条件に脆弱な光通信を用いた LEO 衛星のエネルギー効率を向上させるため、閾値方式や強化学習などを用いた静的・適応的なトラフィックスケジューリング手法を提案し、動的環境下での適応的手法が配送率の向上と複雑性の増大というトレードオフをもたらすことを明らかにしています。

Ethan Fettes, Pablo G. Madoery, Halim Yanikomeroglu, Gunes Karabulut Kurt, Abhishek Naik, Stéphane Martel2026-03-10💻 cs

HarmonyCell: Automating Single-Cell Perturbation Modeling under Semantic and Distribution Shifts

本論文は、メタデータの意味的異質性と統計的分布シフトという二重の課題を、LLM 駆動のセマンティック統一化と階層的行動空間における適応的モンテカルロ木探索によるアーキテクチャ合成という二つの専用メカニズムで解決し、人手を介さずに単一細胞干渉実験の自動モデル構築を実現する「HarmonyCell」というエンドツーエンドのエージェントフレームワークを提案するものである。

Wenxuan Huang, Mingyu Tsoi, Yanhao Huang, Xinjie Mao, Xue Xia, Hao Wu, Jiaqi Wei, Yuejin Yang, Lang Yu, Cheng Tan, Xiang Zhang, Zhangyang Gao, Siqi Sun2026-03-10💻 cs

LLM-assisted Semantic Option Discovery for Facilitating Adaptive Deep Reinforcement Learning

この論文は、大規模言語モデル(LLM)を活用して自然言語指示を実行可能なルールに変換し、セマンティックなアノテーション付きのオプションを自動生成する閉ループフレームワークを提案することで、深層強化学習のデータ効率、解釈性、および環境間での転移性を向上させる手法を提示し、Office World や Montezuma's Revenge などの実験でその有効性を実証したものである。

Chang Yao, Jinghui Qin, Kebing Jin, Hankz Hankui Zhuo2026-03-10💻 cs

MSP-ReID: Hairstyle-Robust Cloth-Changing Person Re-Identification

本論文は、髪型の変化に頑健な衣服変更人物再識別(CC-ReID)を実現するため、髪型の依存を軽減し顔や身体の特徴への注意を高める「髪型指向拡張」、構造情報を保持しつつ衣服のテクスチャバイアスを抑制する「衣服保存ランダム消去」、そして髪の特徴を抑制して顔や四肢を強調する「領域基盤パースング注意」を組み合わせた MSP フレームワークを提案し、複数のベンチマークで最先端の性能を達成したことを報告しています。

Xiangyang He, Lin Wan2026-03-10💻 cs

DINOv3 Visual Representations for Blueberry Perception Toward Robotic Harvesting

本論文は、大規模自己教師あり学習で訓練された視覚基盤モデル DINOv3 を青果物収穫ロボット向けタスクに適用した評価を通じて、果実や傷のセグメンテーションには有効である一方、検出やクラスター検出には局所化や空間的集約のモデル化に課題があることを明らかにし、DINOv3 を果実スケールや集約構造に整合した下流タスクのセマンティックなバックボーンとして活用すべきことを示唆しています。

Rui-Feng Wang, Daniel Petti, Yue Chen, Changying Li2026-03-10💻 cs

Event-Driven Safe and Resilient Control of Automated and Human-Driven Vehicles under EU-FDI Attacks

本論文は、混合交通環境における自動運転車と人間運転車の相互作用において、指数関数的に無界な偽データ注入攻撃や不確実な動的特性に対処し、かつ衝突回避を保証するために、イベント駆動型の制御バリア関数と制御リアプノフ関数を統合した安全かつ回復力のある制御フレームワークを提案し、その有効性をシミュレーションで検証したものである。

Yi Zhang, Yichao Wang, Wei Xiao, Mohamadamin Rajabinezhad, Shan Zuo2026-03-10💻 cs