cs.HC 件の論文 | Gist.Science

Just-In-Time Objectives: A General Approach for Specialized AI Interactions

この論文は、ユーザーの行動を受動的に観察してその瞬間の目的を推論し、大規模言語モデル（LLM）をその目的に即座に最適化する「Just-In-Time 目的」アプローチを提案し、これにより汎用的な LLM よりもはるかに高品質で個別化されたツールや応答を生成できることを示しています。

Michelle S. Lam, Omar Shaikh, Hallie Xu, Alice Guo, Diyi Yang, Jeffrey Heer, James A. Landay, Michael S. BernsteinMon, 09 Ma🤖 cs.AI

Indicating Robot Vision Capabilities with Augmented Reality

本論文は、ロボットと人間の視野の違いに対する人間の誤解を解消し、協業タスクの精度向上を図るため、拡張現実を用いた視野表示手法を提案し、その有効性とガイドラインを実験を通じて検証したものである。

Hong Wang, Ridhima Phatak, James Ocampo, Zhao HanMon, 09 Ma💻 cs

Safe Autonomous Lane Changing: Planning with Dynamic Risk Fields and Time-Varying Convex Space Generation

この論文は、動的リスク場と時間変化する凸可能領域の生成を統合し、制約付き iLQR アルゴリズムを用いて複雑な交通状況における安全かつ効率的な自律的な車線変更軌道計画を実現する新たなパイプラインを提案しています。

Yijun Lu, Zhihao Lin, Zhen TianMon, 09 Ma💻 cs

XR-DT: Extended Reality-Enhanced Digital Twin for Safe Motion Planning via Human-Aware Model Predictive Path Integral Control

本論文は、拡張現実（XR）とデジタルツインを統合した XR-DT 枠組みと、XR ヘッドセットによる人間の視線予測を統合した新しい人間意識型モデル予測経路積分制御（HA-MPPI）を提案し、人間とロボットの安全かつ効率的で解釈可能な協調動作を実現する実証実験結果を示しています。

Tianyi Wang, Jiseop Byeon, Ahmad Yehia, Yiming Xu, Jihyung Park, Tianyi Zeng, Sikai Chen, Ziran Wang, Junfeng Jiao, Christian ClaudelMon, 09 Ma🤖 cs.AI

Why Human Guidance Matters in Collaborative Vibe Coding

この論文は、737 人の参加者による 20 件の実験を通じて、AI による指示ではパフォーマンスが低下するが人間による指示が効果的であり、特に人間が指示を与え AI が評価を行うハイブリッド体制が最善であることを示しています。

Haoyu Hu, Raja Marjieh, Katherine M Collins, Chenyi Li, Thomas L. Griffiths, Ilia Sucholutsky, Nori JacobyMon, 09 Ma🤖 cs.AI

From OCR to Analysis: Tracking Correction Provenance in Digital Humanities Pipelines

この論文は、人文科学のテキスト処理における OCR 修正の経緯（プロベナンス）を詳細に記録・追跡可能なフレームワークを提案し、修正履歴の考慮が下流の NLP 解析結果や学術的解釈に与える影響を明らかにすることで、再現性と不確実性を考慮した解釈を可能にすることを論じています。

Haoze Guo, Ziqi WeiMon, 09 Ma💻 cs

"When to Hand Off, When to Work Together": Expanding Human-Agent Co-Creative Collaboration through Concurrent Interaction

本論文は、AI エージェントが共有アーティファクト上のユーザーの同時行動を解釈し適応する「CLEO」システムを提案し、デザイナーとの共創的協働において、作業の委任、指示、同時作業のいずれを選択すべきかを決定するモデルと設計指針を導出したものである。

Kihoon Son, Hyewon Lee, DaEun Choi, Yoonsu Kim, Tae Soo Kim, Yoonjoo Lee, John Joon Young Chung, HyunJoon Jung, Juho KimMon, 09 Ma🤖 cs.AI

XR and Hybrid Data Visualization Spaces for Enhanced Data Analytics

この論文は、データ分析の複雑化と高次元化に対応するため、XR 空間に 2 次元と 3 次元の可視化をシームレスに統合するアプローチの利点を概説し、その有効性を示す 3 つの事例研究を紹介するものである。

Santiago Lombeyda, S. G. Djorgovski, Ciro DonalekMon, 09 Ma💻 cs

Exploring Human-in-the-Loop Themes in AI Application Development: An Empirical Thematic Analysis

本論文は、顧客サポートチャットボットの回顧的日記研究と AI 専門家へのインタビューに基づき、AI 応用開発における人間関与（HITL）の課題を「AI 統治と人間の権限」「HITL による反復的改善」「AI システムライフサイクルと運用制約」「人間-AI チームの協働と調整」という 4 つのテーマに分類し、今後の HITL フレームワーク設計への実証的基盤を提供するものです。

Parm Suksakul, Nathan Kittichaikoonkij, Nakhin Polthai, Aung PyaeMon, 09 Ma🤖 cs.AI

An Embodied Companion for Visual Storytelling

この論文は、大規模言語モデルと描画ロボットを統合した「Companion」システムが、双方向の対話を通じて人間と機械が協働する視覚的物語創作を実現し、専門家による評価でその芸術的価値が確認されたことを報告しています。

Patrick Tresset, Markus WulfmeierMon, 09 Ma🤖 cs.AI

Biometric-enabled Personalized Augmentative and Alternative Communications

本論文は、生体認証技術をコミュニケーション障害者向けの個人化支援技術（AAC）に統合するロードマップを提案し、手話やジェスチャー認識などの現状の AI 精度が実用要件を満たしていないことを示唆するとともに、そのギャップを埋めるための改善策を提言している。

S. Yanushkevich, E. Berepiki, P. Ciunkiewicz, V. Shmerko, G. Wolbring, R. GuestMon, 09 Ma💻 cs

The People's Gaze: Co-Designing and Refining Gaze Gestures with General Users and Gaze Interaction Experts

本論文は、非専門家の参加者による共創ワークショップで生成された視線ジェスチャーの概念を、視線相互作用の専門家が評価・洗練させるという二段階のアプローチを採用し、直感的で誤操作を防ぐ視線ベースのインタラクションのためのジェスチャーセットと設計原則を確立したものである。

Yaxiong Lei, Xinya Gong, Shijing He, Yafei Wang, Mohamed Khamis, Juan YeMon, 09 Ma💻 cs

From Toil to Thought: Designing for Strategic Exploration and Responsible AI in Systematic Literature Reviews

この論文は、システマティック・レビューの非効率性と認知的負荷を軽減するため、複数の研究者を対象とした設計研究に基づき、透明性のある AI 支援と戦略的探索を可能にする統合環境「ARC」を提案し、その有効性を検証したものである。

Runlong Ye, Naaz Sibia, Angela Zavaleta Bernuy, Tingting Zhu, Carolina Nobre, Viktoria Pammer-Schindler, Michael LiutMon, 09 Ma🤖 cs.AI

Enhancing Tool Calling in LLMs with the International Tool Calling Dataset

本論文は、既存のツール呼び出しベンチマークの課題を克服し、20 分野・40 カ国にわたる 3,571 の実 API と 17,540 のタスクを含む大規模な多言語データセット「International Tool Calling (ITC)」を提案し、これにより特に非英語クエリにおける LLM の性能向上と汎化能力の強化を実証しています。

Zuoyu Zhang, Yancheng ZhuMon, 09 Ma💻 cs

Human-Centered Ambient and Wearable Sensing for Automated Monitoring in Dementia Care: A Scoping Review

このスコーピングレビューは、2015 年から 2025 年にかけてのウェアラブルおよび環境センサー技術の動向を分析し、認知症ケアにおける自動化と自律性を高めるために、人間中心設計、個人化、ワークフロー統合、プライバシー配慮、そして費用対効果の高い公平な解決策という 5 つの実装原則を提唱しています。

Mason Kadem, Sarah Masri, Anthea Innes, Rong ZhengMon, 09 Ma💻 cs

CoEditor++: Instruction-based Visual Editing via Cognitive Reasoning

CoEditor++ は、追加学習を必要とせず「何を編集するか」と「どのように編集するか」の 2 つの認知段階と反射的な自己選択メカニズムを採用することで、複雑な指示に対する高レベルな意味論的推論と視覚的一貫性を両立し、既存のオープンソースモデルやクローズドソースモデルを上回る性能を達成するトレーニングフリーの画像編集フレームワークである。

Minheng Ni, Yutao Fan, Zhengyuan Yang, Yeli Shen, Yuxiang Wei, Yaowen Zhang, Lijuan Wang, Lei Zhang, Wangmeng ZuoMon, 09 Ma💻 cs

Verify as You Go: An LLM-Powered Browser Extension for Fake News Detection

この論文は、RAG と大規模言語モデルを活用し、ファクトチェックの根拠提示やユーザー対話機能を備えたブラウザ拡張機能「Aletheia」を開発・評価し、その検出精度と実用性を実証したものである。

Dorsaf Sallami, Esma AïmeurMon, 09 Ma💬 cs.CL

RFM-HRI : A Multimodal Dataset of Medical Robot Failure, User Reaction and Recovery Preferences for Item Retrieval Tasks

医療用ロボットがアイテム回収タスク中に発生する通信失敗に対する人間の反応と回復の好みを多角的に記録・分析した「RFM-HRI」データセットの公開と、失敗がユーザーの感情や制御感に与える影響に関する知見が、安全な失敗検出・回復手法の基盤となることを示しています。

Yashika Batra, Giuliano Pioldi, Promise Ekpo, Arman Sayatqyzy, Purnjay Maruur, Shalom Otieno, Kevin Ching, Angelique TaylorMon, 09 Ma💻 cs

From Risk Avoidance to User Empowerment: Reframing Safety in Generative AI for Mental Health Crises

この論文は、メンタルヘルスの危機において生成 AI が単にリスク回避のために支援を拒絶する現状を批判し、コミュニティヘルパーのモデルに基づき、ユーザーを支援し専門的なケアへつなぐ「エンパワーメント指向」の設計原則を提唱しています。

Benjamin Kaveladze, Arka Ghosh, Leah Ajmani, Denae Ford, Peter M Gutierrez, Jetta E Hanson, Eugenia Kim, Keertana Namuduri, Theresa Nguyen, Ebele Okoli, Teresa Rexin, Jessica L Schleider, Hongyi Shen, Jina SuhMon, 09 Ma💻 cs

The Fragility Of Moral Judgment In Large Language Models

この論文は、r/AmITheAsshole の事例を用いた大規模実験により、大規模言語モデルの道徳的判断が物語の視点やプロンプトの構成といった提示形式に強く依存し、本質的な道徳的実質よりも提示の仕方で結果が左右される脆弱性を示したことを明らかにしています。

Tom van Nuenen, Pratik S. SachdevaMon, 09 Ma🤖 cs.AI

← 前へ次へ →