Vision-Language System using Open-Source LLMs for Gestures in Medical Interpreter Robots
この論文は、医療通訳ロボット向けに、プライバシーを保護しつつオープンソースの大規模言語モデルと新規データセットを活用して、同意や指示などの発話意図を検知し、人間らしく自然なジェスチャーを生成するビジョン・言語フレームワークを提案し、その有効性を示したものです。
255 件の論文
この論文は、医療通訳ロボット向けに、プライバシーを保護しつつオープンソースの大規模言語モデルと新規データセットを活用して、同意や指示などの発話意図を検知し、人間らしく自然なジェスチャーを生成するビジョン・言語フレームワークを提案し、その有効性を示したものです。
この論文は、ニュースの地域性(国内・世界)に関する多様性を高めることを目的とした「双方向較正アルゴリズム的ナッジ」と「LLM ベースの提示ナッジ」を 120 名の米国人読者を対象に 5 週間にわたり実証研究した結果、アルゴリズム的ナッジが多様なニュースの接触と消費を成功裡に増加させたこと、および長期的な較正されたニュースへの曝露が読者の習慣を国内と世界のニュースのバランスを重視する方向へ変容させる可能性を示したことを報告しています。
本論文は、高解像度の触覚センサーアレイと振動触覚フィードバックを統合し、音声・視覚表示への依存を減らして自己主導的な CPR 訓練を可能にする閉ループ訓練用手袋を提案し、そのセンサー性能、高精度な力推定アルゴリズム、およびユーザー試験による有効性を示しています。
本論文は、対話型可視分析(CVA)における大規模言語モデルの評価課題を解決するため、開発者やエンドユーザーからのインタビューに基づき、実世界シナリオに対応するテストケース、解釈可能な評価指標、そしてプログラミング不要の対話型ツールキット「Lexara」を提案し、その有効性を実証したものである。
本論文は、UX デザイナーを対象としたワークショップを通じて、AI 導入が効率性だけでなく責任や自律性といった価値観の交渉プロセスとして捉えられ、個人のスキルから組織の規範に至るまで役割や権力関係が再編成されることを示唆しています。
本論文は、遠隔でのデータ可視化協働において、相手の映像と可視化要素を「ガラス」のように重ね合わせ、両者が双方向のジェスチャーで操作できる「Glass Chirolytics」を提案し、その存在感や相互の意図の理解を促進する効果を実証研究で示したものである。
この論文は、拡張現実や人工知能の進展を踏まえ、国際的な専門家グループの視点から、可視化を中心とした遠隔・同期協働における 16 の課題を特定し、技術的選択、社会的要因、AI 支援、評価という 4 つの研究開発段階に沿って整理したものです。
本論文は、医療意思決定シミュレーションを用いたユーザー調査を通じて、人々が公平性を単純な統計的平等ではなく、データ分布やパフォーマンス差の原因に関する信念に基づいて評価することを示し、アルゴリズムの公平性指標を人間の期待に合わせるためには分布の文脈を考慮することが重要であると論じています。
本論文は、混合現実における通知の緊急性に応じて空間配置を適応的に調整するシステムを開発・評価し、その結果、認知的負荷やフラストレーションを軽減しつつ通知の認知性を維持できることを実証した。
この論文は、ユーザーの長期的なマルチモーダル相互作用データから学習し、文脈を考慮して次の行動を予測する新しいモデル「LongNAP」を提案し、従来の手法を大幅に上回る精度でユーザーのニーズを先回りして予測できることを実証しています。
この論文は、大規模言語モデル(8B Llama)において、同じ著者の他のテキストを文脈として扱う「HuLM」タスクや「HuFT」手法を用いて生態学的誤謬に対処することで、標準的な微調整よりも下流タスクの性能を向上させられることを示しています。
この論文は、個人の特性と状況的要素を統合した理論に基づく解釈可能なモデルを開発し、ソーシャルメディアデータから精神的健康を予測・分析することで、計算機モデルと心理学的理論の融合が文脈に敏感で人間に理解しやすい動的な精神状態の評価に有効であることを示しています。
この論文は、読書における眼球運動と理解の関係を統一的に説明する原理として「リソース合理性」を提案し、階層的な最適化モデルが人間の読書行動の多様な知見を再現できることを示しています。
この論文は、生成 AI と音声合成技術を活用してユーザーの発話を変化させ、VR 空間におけるアバターを介した「自己拡張」の概念を探求するプロトタイプ「ProxyMe」の設計と実装、およびその帰結としての主体性や自己同一性への影響について論じています。
本論文は、統計的支援に視覚化された認知的診断推論(対照的・反事実的説明を含む)を組み合わせた「XIA」と呼ばれる説明可能な知的評価プラットフォームを開発し、予備教員における評価リテラシーの向上と評価誤りの削減に寄与したことを報告しています。
この論文は、VR 環境でのピアノ学習において、学習者のパフォーマンスに応じてゴースト指導者の透明度を動的に調整する「スキル適応型ゴースト指導者」を提案し、従来の固定表示と比較して依存性を減らし、短期間の技能保持と正確性を向上させることを実証したものです。
この論文は、小学生を対象としたピア・メディエーション(同級生による紛争解決)の練習に社会的支援ロボット(SAR)を活用する探索的研究を行い、ロボットを用いた活動が学生の自己肯定感や対人支援スキル向上に寄与する可能性を示しつつ、読解力の個人差やロボット条件における学習効果との相関など、今後の研究設計への示唆を得たことを報告しています。
この研究は、身体活動意欲を高めるための 4 週間のフィールド調査を通じて、行動変容技法の選択における構造化された探索(バンディット)と生成の柔軟性(LLM)を比較し、LLM による文脈に応じた応答がユーザーの支援感を高めた一方で、LLM 単独とバンディット最適化の組み合わせに有意な差は見られなかったことを明らかにしています。
この論文は、仮想現実におけるアバターの能力と操作方法を直感的に伝えるためのデザインガイドラインを、デザイナーへの調査とユーザー検証を通じて策定し、その有効性を示したものである。
この論文は、プライバシーや社会的な不快感を軽減し、ユーザーの主体性や認知の流動性を高めるために、耳に装着するペン型のウェアラブル AI「The Pen」を提案し、必要な時だけ意図的に起動・終了させる「エピソード型」の認知支援パラダイムとその有効性を示した研究です。