cs 件の論文 | Gist.Science

Granulon: Awakening Pixel-Level Visual Encoders with Adaptive Multi-Granularity Semantics for MLLM

この論文は、CLIP ベースの視覚エンコーダが抱える細粒度理解の課題と DINOv3 が持つ粗粒度抽象化の欠点を補うため、テキスト入力に応じて視覚抽象化レベルを動的に調整する「Granulon」という新しいマルチモーダル大規模言語モデルを提案し、単一のフォワードパスでピクセルから粗粒度までを統合的に推論可能にすることで、精度の向上とハルシネーションの削減を実現したことを示しています。

Junyuan Mao, Qiankun Li, Linghao Meng, Zhicheng He, Xinliang Zhou, Kun Wang, Yang Liu, Yueming Jin2026-03-11💻 cs

Time warping with Hellinger elasticity

任意の距離空間に値を持つ時系列のマッチング問題に対し、ヘリングカーネルを伸縮ペナルティとして用いる最適化手法「弾性時間歪み（Elastic Time Warping）」アルゴリズムを提案し、その計算量を立方（O(n³)）に抑えている。

Yuly Billig2026-03-11💻 cs

Where, What, Why: Toward Explainable 3D-GS Watermarking

この論文は、3D ガウススプラッティングの品質を損なわずにロバストな透かし埋め込みを実現し、どのガウスプリミティブに情報を埋め込み、なぜそれが選択されたかを説明可能な「Trio-Experts」モジュールと「SBAG」ゲートを用いた新しいフレームワークを提案するものです。

Mingshu Cai, Jiajun Li, Osamu Yoshie, Yuya Ieiri, Yixuan Li2026-03-11💻 cs

Age-Related Differences in the Perception of Eye-Gaze from a Social Robot

この論文は、高齢者が日常生活支援を行う社会ロボットからの視線手がかりを若年層と比較してどのように知覚するかを調査し、加齢に伴う変化を考慮した適応的な非言語キューの設計に貢献することを目的としています。

Lucas Morillo-Mendez, Martien G. S. Schrooten, Oscar Martinez Mozos2026-03-11💻 cs

VisionCreator-R1: A Reflection-Enhanced Native Visual-Generation Agentic Model

本論文は、視覚生成エージェントにおける中間エラー修正のための体系的なリフレクション機構の欠如を解決するため、リフレクションと計画の非対称性を踏まえた「リフレクション・プラン共最適化（RPCO）」トレーニング手法を提案し、これにより単一画像および複数画像タスクにおいて既存のベンチマークで Gemini2.5 Pro を凌駕する VisionCreator-R1 を開発したことを報告しています。

Jinxiang Lai, Wenzhe Zhao, Zexin Lu, Hualei Zhang, Qinyu Yang, Rongwei Quan, Zhimin Li, Shuai Shao, Song Guo, Qinglin Lu2026-03-11💻 cs

HMR-1: Hierarchical Massage Robot with Vision-Language-Model for Embodied Healthcare

本論文は、視覚言語モデルを用いた階層的なマッサージロボット「HMR-1」を提案し、12,190 枚の画像と 17 万 4,177 組の QA ペアからなるマルチモーダルデータセット「MedMassage-12K」および評価ベンチマークを構築することで、医療分野における身体知能の課題を解決し、実機実験を通じてその実用性を検証したものです。

Rongtao Xu, Mingming Yu, Xiaofeng Han, Yu Zhang, Kaiyi Hu, Zhe Feng, Zenghuang Fu, Changwei Wang, Weiliang Meng, Xiaopeng Zhang2026-03-11💻 cs

Clarifying the Compass: A Reflexive Narrative on Entry Barriers into HCI and Aging Research

この論文は、HCI と高齢化研究の分野への参入障壁をテーマに、高齢者ニーズと技術設計の乖離を指摘するとともに、シニアコミュニティでのボランティア活動を通じて培った共感や理解の深まりを、2 人の研究者が自らの経験に基づき振り返った内容を示しています。

Tianyi Li, Jin Wei-Kocsis2026-03-11💻 cs

Impact of Different Failures on a Robot's Perceived Reliability

この研究は、オンライン動画実験を通じて、ロボットが失敗した際の種類（ミス、スリップ、凍結）が人間の信頼度に与える影響が異なり、ミスはスリップや凍結よりも信頼回復に寄与しやすく、その後の成功が信頼を回復させることを明らかにしました。

Andrew Violette, Zhanxin Wu, Haruki Nishimura, Masha Itkina, Leticia Priebe Rocha, Mark Zolotas, Guy Hoffman, Hadas Kress-Gazit2026-03-11💻 cs

d-QBF with Few Existential Variables Revisited

この論文は、存在量化変数の数 $k$ をパラメータとする d-QBF 問題において、一般には ETH 仮説の下で $2^{2^{o(k)}} $の時間が必要であり二重指数依存性が最適であることを証明するとともに、2 つの量化ブロック（$ \forall\exists$-QBF）に限定された場合にはより効率的なアルゴリズムとほぼ最適な下界を示すことで、既存研究のギャップを埋める結果を報告しています。

Andreas Grigorjew, Michael Lampis2026-03-11💻 cs

Computer Vision-Based Vehicle Allotment System using Perspective Mapping

この論文は、4 台のカメラからの画像を逆透視写像（IPM）で統合し、YOLOv8 を用いた物体検出と 3D 座標プロットによる空きスペースの可視化を実現する、コスト効果が高く実装容易なコンピュータビジョンベースのスマート駐車割当システムを提案しています。

Prachi Nandi, Sonakshi Satapathy, Suchismita Chinara2026-03-11💻 cs

HeteroFedSyn: Differentially Private Tabular Data Synthesis for Heterogeneous Federated Settings

本論文は、異質なデータ分布を持つ水平フェデレーテッド学習環境において、従来の手法が抱えるバイアスや過剰なノイズの問題を解決し、中央集権的な合成と同等の有用性を達成する新たな差分プライバシー対応表形式データ合成フレームワーク「HeteroFedSyn」を提案するものです。

Xiaochen Li, Fengyu Gao, Xizixiang Wei, Tianhao Wang, Cong Shen, Jing Yang2026-03-11💻 cs

NaviNote: Enabling In-situ Spatial Annotation Authoring to Support Exploration and Navigation for Blind and Low Vision People

本論文は、視覚障害者向けに高精度な視覚位置推定技術とエージェント型アーキテクチャを組み合わせ、音声による場所の注釈作成と精密なナビゲーションを可能にする「NaviNote」を開発し、その有効性をユーザー評価で実証したものである。

Ruijia Chen, Yuheng Wu, Charlie Houseago, Filipe Gaspar, Filippo Aleotti, Dorian Gálvez-López, Oliver Johnston, Diego Mazala, Guillermo Garcia-Hernando, Maryam Bandukda, Gabriel Brostow, Jessica Van Brummelen2026-03-11💻 cs

Investigating the Effects of LLM Use on Critical Thinking Under Time Constraints: Access Timing and Time Availability

大規模言語モデル（LLM）の批判的思考への影響は時間制約に依存し、時間的制約がある場合は初期段階での LLM 利用がパフォーマンスを向上させるが、十分な時間があれば逆に阻害するという逆転現象が実験（n=393）で示されました。

Jiayin Zhi, Harsh Kumar, Mina Lee2026-03-11💻 cs

HECTOR: Hybrid Editable Compositional Object References for Video Generation

本論文は、静止画や動画のハイブリッド参照と各要素の軌跡指定を可能にする「HECTOR」という生成パイプラインを提案し、複雑な時空間制約を満たしつつ高品質で参照に忠実な動画生成を実現するものである。

Guofeng Zhang, Angtian Wang, Jacob Zhiyuan Fang, Liming Jiang, Haotian Yang, Alan Yuille, Chongyang Ma2026-03-11💻 cs

DeZent: Decentralized z-Anonymity with Privacy-Preserving Coordination

この論文は、スマートメーターなどのセンサーネットワークデータにおけるプライバシー保護を目的として、中央集権的な信頼を最小化し、軽量な協調と確率的な計数構造を用いて分散型で z-匿名性を実現する「deZent」という新しいアプローチを提案し、その中央集権型との同等のパフォーマンスと通信オーバーヘッドの削減を実証しています。

Carolin Brunn, Florian Tschorsch2026-03-11💻 cs

Adaptive SINDy: Residual Force System Identification Based UAV Disturbance Rejection

本論文は、スパース同定法（SINDy）と再帰最小二乗法（RLS）適応制御を統合した「Adaptive SINDy」を提案し、乱流環境下でのドローン外乱拒絶と軌道追跡精度の向上を実機実験で実証したものである。

Fawad Mehboob, Amir Atef Habel, Roohan Ahmed Khan, Mikhail Derevianchenko, Clement Fortin, Dzmitry Tsetserukou2026-03-11💻 cs

OptBench: An Interactive Workbench for AI/ML-SQL Co-Optimization[Extended Demonstration Proposal]

この論文は、SQL と AI/ML を組み合わせたハイブリッドクエリ向けの最適化手法を、DuckDB ベースの統合バックエンドとインタラクティブな Web インターフェースを通じて公平かつ透明性高く構築・比較・可視化することを可能にする「OptBench」という対話型ワークベンチを提案するものである。

Jaykumar Tandel, Douglas Oscarson, Jia Zou2026-03-11💻 cs

Touching Emotions, Smelling Shapes: Exploring Tactile, Olfactory and Emotional Cross-sensory Correspondences in Preschool Aged Children

この論文は、2〜4 歳の幼児 26 名を対象とした遊びベースの研究を通じて、嗅覚・触覚・感情の間の有意な対応関係と、それらを結びつける認知戦略を実証的に明らかにし、幼児の感覚入力に即したデザイン指針と再現可能な研究方法を提供するものである。

Tegan Roberts-Morgan, Min S. Li, Priscilla Lo, Zhuzhi Fan, Dan Bennett, Oussama Metatla2026-03-11💻 cs

Computing $L_\infty$ Hausdorff Distances Under Translations: The Interplay of Dimensionality, Symmetry and Discreteness

本論文は、点集合間の $L_\infty$ ハウスドルフ距離の最小化問題において、次元数、対称性（有向・無向）、および連続・離散の区別が計算複雑性に及ぼす影響を、微細な複雑性理論を用いて体系的に分析し、特に次元や入力サイズ比に応じた非対称な時間計算量や、3SUM 仮説との関係など、新たな理論的限界とアルゴリズムを明らかにしたものである。

Sebastian Angrick, Kevin Buchin, Geri Gokaj, Marvin Künnemann2026-03-11💻 cs

A Decentralized Frontier AI Architecture Based on Personal Instances, Synthetic Data, and Collective Context Synchronization

この論文は、計算リソースの集中やエネルギー消費などの課題に対処するため、個人インスタンスが生成する合成データと「集合的コンテキスト場（CCF）」を介した文脈信号の同期によって、プライバシーを保護しつつ持続可能な分散型 AI 学習を実現する「H3LIX 分散型フロンティアモデルアーキテクチャ」を提案しています。

Jacek Małecki, Alexander Mathiesen-Ohman, Katarzyna Tworek2026-03-11💻 cs

← 前へ次へ →

cs