Just-In-Time Objectives: A General Approach for Specialized AI Interactions
この論文は、ユーザーの行動を受動的に観察してその瞬間の目的を推論し、大規模言語モデル(LLM)をその目的に即座に最適化する「Just-In-Time 目的」アプローチを提案し、これにより汎用的な LLM よりもはるかに高品質で個別化されたツールや応答を生成できることを示しています。
254 件の論文
この論文は、ユーザーの行動を受動的に観察してその瞬間の目的を推論し、大規模言語モデル(LLM)をその目的に即座に最適化する「Just-In-Time 目的」アプローチを提案し、これにより汎用的な LLM よりもはるかに高品質で個別化されたツールや応答を生成できることを示しています。
本論文は、ロボットと人間の視野の違いに対する人間の誤解を解消し、協業タスクの精度向上を図るため、拡張現実を用いた視野表示手法を提案し、その有効性とガイドラインを実験を通じて検証したものである。
この論文は、動的リスク場と時間変化する凸可能領域の生成を統合し、制約付き iLQR アルゴリズムを用いて複雑な交通状況における安全かつ効率的な自律的な車線変更軌道計画を実現する新たなパイプラインを提案しています。
本論文は、拡張現実(XR)とデジタルツインを統合した XR-DT 枠組みと、XR ヘッドセットによる人間の視線予測を統合した新しい人間意識型モデル予測経路積分制御(HA-MPPI)を提案し、人間とロボットの安全かつ効率的で解釈可能な協調動作を実現する実証実験結果を示しています。
この論文は、737 人の参加者による 20 件の実験を通じて、AI による指示ではパフォーマンスが低下するが人間による指示が効果的であり、特に人間が指示を与え AI が評価を行うハイブリッド体制が最善であることを示しています。
この論文は、人文科学のテキスト処理における OCR 修正の経緯(プロベナンス)を詳細に記録・追跡可能なフレームワークを提案し、修正履歴の考慮が下流の NLP 解析結果や学術的解釈に与える影響を明らかにすることで、再現性と不確実性を考慮した解釈を可能にすることを論じています。
本論文は、AI エージェントが共有アーティファクト上のユーザーの同時行動を解釈し適応する「CLEO」システムを提案し、デザイナーとの共創的協働において、作業の委任、指示、同時作業のいずれを選択すべきかを決定するモデルと設計指針を導出したものである。
この論文は、データ分析の複雑化と高次元化に対応するため、XR 空間に 2 次元と 3 次元の可視化をシームレスに統合するアプローチの利点を概説し、その有効性を示す 3 つの事例研究を紹介するものである。
本論文は、顧客サポートチャットボットの回顧的日記研究と AI 専門家へのインタビューに基づき、AI 応用開発における人間関与(HITL)の課題を「AI 統治と人間の権限」「HITL による反復的改善」「AI システムライフサイクルと運用制約」「人間-AI チームの協働と調整」という 4 つのテーマに分類し、今後の HITL フレームワーク設計への実証的基盤を提供するものです。
この論文は、大規模言語モデルと描画ロボットを統合した「Companion」システムが、双方向の対話を通じて人間と機械が協働する視覚的物語創作を実現し、専門家による評価でその芸術的価値が確認されたことを報告しています。
本論文は、生体認証技術をコミュニケーション障害者向けの個人化支援技術(AAC)に統合するロードマップを提案し、手話やジェスチャー認識などの現状の AI 精度が実用要件を満たしていないことを示唆するとともに、そのギャップを埋めるための改善策を提言している。
本論文は、非専門家の参加者による共創ワークショップで生成された視線ジェスチャーの概念を、視線相互作用の専門家が評価・洗練させるという二段階のアプローチを採用し、直感的で誤操作を防ぐ視線ベースのインタラクションのためのジェスチャーセットと設計原則を確立したものである。
この論文は、システマティック・レビューの非効率性と認知的負荷を軽減するため、複数の研究者を対象とした設計研究に基づき、透明性のある AI 支援と戦略的探索を可能にする統合環境「ARC」を提案し、その有効性を検証したものである。
本論文は、既存のツール呼び出しベンチマークの課題を克服し、20 分野・40 カ国にわたる 3,571 の実 API と 17,540 のタスクを含む大規模な多言語データセット「International Tool Calling (ITC)」を提案し、これにより特に非英語クエリにおける LLM の性能向上と汎化能力の強化を実証しています。
このスコーピングレビューは、2015 年から 2025 年にかけてのウェアラブルおよび環境センサー技術の動向を分析し、認知症ケアにおける自動化と自律性を高めるために、人間中心設計、個人化、ワークフロー統合、プライバシー配慮、そして費用対効果の高い公平な解決策という 5 つの実装原則を提唱しています。
CoEditor++ は、追加学習を必要とせず「何を編集するか」と「どのように編集するか」の 2 つの認知段階と反射的な自己選択メカニズムを採用することで、複雑な指示に対する高レベルな意味論的推論と視覚的一貫性を両立し、既存のオープンソースモデルやクローズドソースモデルを上回る性能を達成するトレーニングフリーの画像編集フレームワークである。
この論文は、RAG と大規模言語モデルを活用し、ファクトチェックの根拠提示やユーザー対話機能を備えたブラウザ拡張機能「Aletheia」を開発・評価し、その検出精度と実用性を実証したものである。
医療用ロボットがアイテム回収タスク中に発生する通信失敗に対する人間の反応と回復の好みを多角的に記録・分析した「RFM-HRI」データセットの公開と、失敗がユーザーの感情や制御感に与える影響に関する知見が、安全な失敗検出・回復手法の基盤となることを示しています。
この論文は、メンタルヘルスの危機において生成 AI が単にリスク回避のために支援を拒絶する現状を批判し、コミュニティヘルパーのモデルに基づき、ユーザーを支援し専門的なケアへつなぐ「エンパワーメント指向」の設計原則を提唱しています。
この論文は、r/AmITheAsshole の事例を用いた大規模実験により、大規模言語モデルの道徳的判断が物語の視点やプロンプトの構成といった提示形式に強く依存し、本質的な道徳的実質よりも提示の仕方で結果が左右される脆弱性を示したことを明らかにしています。