cs 件の論文 | Gist.Science

Prompt-Driven Color Accessibility Evaluation in Diffusion-based Image Generation Models

この論文は、拡散モデルによる画像生成における色覚異常者へのアクセシビリティを評価する新たな指標「CVDLoss」を提案し、既存のモデルがアクセシビリティ向上を目的としたプロンプトに適切に応答できない現状を明らかにしたものである。

Xinyao Zhuang, Jose Echevarria, Kaan Aksit2026-03-11💻 cs

Gap-ETH-Tight Algorithms for Hyperbolic TSP and Steiner Tree

この論文は、Gap-ETH 下で最適であることが示された $2^{O(1/\varepsilon^{d-1})}n^{1+o(1)} $時間のランダム化アルゴリズムを、ハイブリッド双曲型クアドツリーや非一様ポータル配置などの新技術を用いて、$ d $次元双曲空間における巡回セールスマン問題とステイナー木問題の$ (1+\varepsilon)$-近似解法として提示するものである。

Sándor Kisfaludi-Bak, Saeed Odak, Satyam Singh, Geert van Wordragen2026-03-11💻 cs

RecThinker: An Agentic Framework for Tool-Augmented Reasoning in Recommendation

この論文は、推薦エージェントが受動的な情報処理から自律的な調査へ移行できるよう、ユーザーやアイテム、協調的な情報の不足を動的に分析・補完し、専門ツールを自律的に活用して推論を行う「RecThinker」というフレームワークを提案し、その性能を実証したものです。

Haobo Zhang, Yutao Zhu, Kelong Mao, Tianhao Li, Zhicheng Dou2026-03-11💻 cs

Almost-Optimal Upper and Lower Bounds for Clustering in Low Dimensional Euclidean Spaces

この論文は、低次元ユークリッド空間における $k$ -median および $k$ -means 問題の $(1+\varepsilon)$ -近似アルゴリズムの実行時間を大幅に改善し、さらに Gap Exponential Time 仮説の下でその実行時間の下限がほぼ一致することを示しています。

Vincent Cohen-Addad, Karthik C. S., David Saulpic, Chris Schwiegelshohn2026-03-11💻 cs

MissBench: Benchmarking Multimodal Affective Analysis under Imbalanced Missing Modalities

本論文は、現実のアプリケーションで生じるモダリティの欠損率の偏りを考慮し、感情分析タスクにおけるモデルの公平性と最適化の偏りを評価するための新たなベンチマーク「MissBench」と、その診断指標（MEI と MLI）を提案するものです。

Tien Anh Pham, Phuong-Anh Nguyen, Duc-Trong Le, Cam-Van Thi Nguyen2026-03-11💻 cs

The Bureaucracy of Speed: Structural Equivalence Between Memory Consistency Models and Multi-Agent Authorization Revocation

本論文は、従来の時間ベースの権限取り消しモデルがエージェント実行環境において抱える一貫性問題を、メモリ一貫性モデル（MESI）の概念を権限管理に転用した「能力一貫性システム（CCS）」と「リリース整合性指向一貫性（RCC）戦略」によって解決し、シミュレーションにより従来手法に比べ最大 184 倍の安全性向上と権限取り消し遅延に伴う不正操作の理論的限界の突破を実証しています。

Vladyslav Parakhin2026-03-11💻 cs

InternVL-U: Democratizing Unified Multimodal Models for Understanding, Reasoning, Generation and Editing

本論文は、理解・推論・生成・編集を統合した軽量な 40 億パラメータのマルチモーダルモデル「InternVL-U」を提案し、大規模モデルを凌駕する性能と効率性のバランスを達成したことを報告しています。

Changyao Tian, Danni Yang, Guanzhou Chen, Erfei Cui, Zhaokai Wang, Yuchen Duan, Penghao Yin, Sitao Chen, Ganlin Yang, Mingxin Liu, Zirun Zhu, Ziqian Fan, Leyao Gu, Haomin Wang, Qi Wei, Jinhui Yin, Xue Yang, Zhihang Zhong, Qi Qin, Yi Xin, Bin Fu, Yihao Liu, Jiaye Ge, Qipeng Guo, Gen Luo, Hongsheng Li, Yu Qiao, Kai Chen, Hongjie Zhang2026-03-11💻 cs

DISPLAY: Directable Human-Object Interaction Video Generation via Sparse Motion Guidance and Multi-Task Auxiliary

この論文は、手首の関節座標と物体のバウンディングボックスというスパースな運動ガイダンス、物体ストレスアテンション機構、そしてマルチタスク補助学習戦略を組み合わせることで、物理的に整合性が高く制御可能な人間 - 物体相互作用（HOI）ビデオ生成を実現する「DISPLAY」というフレームワークを提案しています。

Jiazhi Guan, Quanwei Yang, Luying Huang, Junhao Liang, Borong Liang, Haocheng Feng, Wei He, Kaisiyuan Wang, Hang Zhou, Jingdong Wang2026-03-11💻 cs

Robust Cooperative Localization in Featureless Environments: A Comparative Study of DCL, StCL, CCL, CI, and Standard-CL

この論文は、GPS 非依存環境における 5 種類の協調局所化手法（CCL、DCL、StCL、CI、Standard-CL）を ROS 環境で比較評価し、StCL や Standard-CL は精度が高いもののフィルタの一貫性に問題があり、DCL は頑健性が高く、CI は精度と一貫性のバランスに優れているなど、各手法のトレードオフを明らかにしたものである。

Nivand Khosravi, Meysam Basiri, Rodrigo Ventura2026-03-11💻 cs

Overview of the TREC 2025 Retrieval Augmented Generation (RAG) Track

TREC 2025 RAG トラックは、MS MARCO V2.1 コーパスを用い、複雑な推論を要する長文ナラティブクエリへの対応や、透明性・事実性のある回答生成を評価対象として、信頼性の高い検索拡張生成システムの開発を促進するものです。

Shivani Upadhyay, Nandan Thakur, Ronak Pradeep, Nick Craswell, Daniel Campos, Jimmy Lin2026-03-11💻 cs

Stepping VLMs onto the Court: Benchmarking Spatial Intelligence in Sports

本論文は、スポーツの空間的知能を評価する初の大規模データセット「CourtSI」とベンチマーク「CourtSI-Bench」を提案し、既存の視覚言語モデルの空間認識能力の限界を明らかにするとともに、CourtSI によるファインチューニングがモデルの精度向上と汎化性能の改善に寄与することを示しています。

Yuchen Yang, Yuqing Shao, Duxiu Huang, Linfeng Dong, Yifei Liu, Suixin Tang, Xiang Zhou, Yuanyuan Gao, Wei Wang, Yue Zhou, Xue Yang, Yanfeng Wang, Xiao Sun, Zhihang Zhong2026-03-11💻 cs

The 802.11 MAC protocol leads to inefficient equilibria

本論文は、ゲーム理論モデルとシミュレーションを用いて、非協力的な環境における 802.11 の MAC プロトコル（DCF および 802.11e）がシステム全体のパフォーマンスを低下させる望ましくないナッシュ均衡をもたらすことを示し、チャネル資源の割り当てとノードの送信戦略を独立させることで、より高いスループットを実現する理想的な MAC プロトコルが可能であることを論じています。

Godfrey Tan, John Guttag2026-03-11💻 cs

Role Classification of Hosts within Enterprise Networks Based on Connection Patterns

この論文は、エンタープライズネットワークにおける接続パターンに基づいてホストを役割分類し、ネットワーク管理の効率化や侵入検知の精度向上に貢献する 2 つのアルゴリズムを提案し、実機環境での検証により、ホスト数を大幅に削減しつつ論理的なネットワーク構造を反映したグループ化が可能であることを示しています。

Godfrey Tan, Massimiliano Poletto, John Guttag, Frans Kaashoek2026-03-11💻 cs

WikiCLIP: An Efficient Contrastive Baseline for Open-domain Visual Entity Recognition

本論文は、大規模言語モデルの埋め込みと視覚誘導知識アダプタ、および硬い負例合成メカニズムを活用して、生成モデルに比べて推論遅延を約 100 倍削減しつつ、オープンドメイン視覚実体認識タスクで高い性能を達成する効率的な対照学習ベースライン「WikiCLIP」を提案するものです。

Shan Ning, Longtian Qiu, Jiaxuan Sun, Xuming He2026-03-11💻 cs

On the Structural Failure of Chamfer Distance in 3D Shape Optimization

本論文は、点群再構成や生成における標準的な損失関数であるチャマファ距離の最適化が、局所的な正則化では解決できない勾配構造上の欠陥により「最適化しない場合よりも悪い結果」をもたらす「崩壊」を引き起こすことを示し、これを抑制するには局所領域を超えた非局所的な結合（グローバルな結合）が不可欠であることを明らかにした。

Chang-Yong Song, David Hyde2026-03-11💻 cs

How to Write to SSDs

本論文は、データベースシステムが SSD の性能を最大限に引き出し寿命を延ばすために、B-tree ベースの LeanStore を再設計してアウト・オブ・プレイス書き込みを最適化し、トランザクションごとのフラッシュ書き込みを大幅に削減しながらスループットを向上させる手法を提案・評価したものである。

Bohyun Lee, Tobias Ziegler, Viktor Leis2026-03-11💻 cs

Fine-grained Motion Retrieval via Joint-Angle Motion Images and Token-Patch Late Interaction

この論文は、関節角度に基づく擬似画像表現とトークン単位の遅延相互作用（MaxSim）を組み合わせることで、既存の手法が抱える細粒度対応の欠如や解釈性の低さを克服し、テキストと 3 次元人間の動きの間の高精度かつ解釈可能な検索を実現する手法を提案しています。

Yao Zhang, Zhuchenyang Liu, Yanlan He, Thomas Ploetz, Yu Xiao2026-03-11💻 cs

Unsupervised Domain Adaptation with Target-Only Margin Disparity Discrepancy

この論文は、注釈付きの CT データと注釈なしのインターベンショナル CBCT データを用いて、マージン・ディスパリティ・ディスクリパンシー（MDD）の最適化枠組みを再定式化した新しい教師なしドメイン適応フレームワークを提案し、肝臓セグメンテーションの性能を向上させることを示しています。

Gauthier Miralles, Loïc Le Folgoc, Vincent Jugnon, Pietro Gori2026-03-11💻 cs

A Voronoi Cell Formulation for Principled Token Pruning in Late-Interaction Retrieval Models

この論文は、遅延相互作用型検索モデルにおけるトークンプルーニングを埋め込み空間のボロノイ細胞推定問題として定式化し、幾何学的な原理に基づいてインデックスサイズを削減しつつ検索品質を維持する新たな枠組みを提案しています。

Yash Kankanampati, Yuxuan Zong, Nadi Tomeh, Benjamin Piwowarksi, Joseph Le Roux2026-03-11💻 cs

Leveraging whole slide difficulty in Multiple Instance Learning to improve prostate cancer grading

この論文では、専門家と非専門家の診断間の不一致に基づいて「スライドの難易度（WSD）」を定義し、それをマルチタスク学習や重み付き損失関数に組み込むことで、前立腺がんのグレアス分類における多实例学習（MIL）の性能、特に高悪性度のケースでの精度向上を実現する手法を提案しています。

Marie Arrivat, Rémy Peyret, Elsa Angelini, Pietro Gori2026-03-11💻 cs

← 前へ次へ →