NasoVoce: A Nose-Mounted Low-Audibility Speech Interface for Always-Available Speech Interaction
NasoVoce は、スマートグラスの鼻架に装着されたマイクと振動センサーを融合させることで、環境雑音に強くかつ低音量の発話も認識可能な、常時利用可能な静かな音声対話インターフェースの実現を提案する研究です。
254 件の論文
NasoVoce は、スマートグラスの鼻架に装着されたマイクと振動センサーを融合させることで、環境雑音に強くかつ低音量の発話も認識可能な、常時利用可能な静かな音声対話インターフェースの実現を提案する研究です。
この論文は、AI との共作において「アイデア生成」から「AI の提案への反応と評価」へとプロセスがシフトする「反応的執筆(Reactive Writing)」という新たな実践が、著者の意識的な気づきなく意見や信念を形成・変容させるメカニズムを、混合手法による研究で明らかにしたものである。
本論文は、対面グループディスカッションにおいて、スマートフォンの動きを表現的に制御する「AnimaStand」を開発し、受動的なメンバーの再参加を促してグループダイナミクスやタスク遂行を向上させることを実証した研究です。
本論文は、XR 環境における複雑な音源を分離し、音声と視覚の手がかりを統合したリアルタイムシステム「MoXaRt」を提案し、その有効性が聴解力の向上と認知的負荷の軽減を通じて実証されたことを示しています。
本論文は、長尺の複数話者音声における時間指定付き話者割り当て付きASRを実現するため、時間意識型話者追跡モジュールと音声LLMを組み合わせたエンドツーエンドシステム「G-STAR」を提案し、チャンク間の話者同一性の一貫性と微細な時間境界の両方を維持する手法を確立したものである。
この論文は、12 万 6 千以上の科学論文から抽出された 909 件の単語規模のグラフィックを分析し、その配置、機能、視覚表現を特徴づける枠組みを提案するとともに、学術コミュニケーションの向上に向けた可能性を論じています。
本論文は、自律型コンピュータ操作エージェント(CUA)の評価にビジョン・言語モデル(VLM)を監査者として用いる手法を大規模に検証し、複雑な環境では精度が低下しモデル間での判断に不一致が生じるなど、現在のモデルベース監査アプローチには根本的な限界があることを明らかにしています。
この論文は、AI エージェントと人間の協働において、GUI ではなくターミナルが実用的である理由を「表現の互換性」「操作の透明性」「参入障壁の低さ」という 3 つの設計特性に求め、ターミナルを単なるレガシーではなく、あらゆるエージェント向けインターフェースが模倣すべき設計の範例であると主張しています。
本論文は、OpenBCI Galea ヘッドセットと SuperTux を活用し、AI モデルや行動推論を埋め込まずに生体信号とインタラクションを構造化された観測データとして分離・表現することで、再現性と拡張性に優れたプラットフォーム非依存のデジタルヒューマンモデリングフレームワークを提案するものである。
この論文は、2026 年 4 月 15 日にスペイン・バルセロナで開催された ACM CHI 会議において、イデオロギーを通じて HCI(人間とコンピュータの相互作用)の断片化した政治、価値観、想像力を解きほぐすことを目的とした初回 CHIdeology ワークショップの proceedings をまとめたものである。
この論文は、AI との協働における人間の「自己効力感」と「AI への信頼」が実際のチームパフォーマンスに直結しない「AI 楽観バイアス」の存在を実証し、単なる透明性の提供ではなく、文脈に応じた設計指針の必要性を提唱しています。
この研究は、K-12 教師が MagicSchool.ai を活用した AI 生成評価基準の導入に関するワークショップに参加した結果、AI が下書き作成や基準の明確化に有用である一方、文脈への適合性や編集のしやすさ、教師の管理権の維持が課題として認識され、条件付きの導入意向を示したことを明らかにしています。
この論文は、ドメイン専門知識の暗黙的・流動的な性質に適合させるため、エージェントを構造化された対話を通じて段階的に育成し、対話から知識を構造化資産として凝縮する「Nurture-First Development(NFD)」という新たなパラダイムを提唱しています。
この論文は、物理空間と仮想空間をまたぐシームレスな相互作用を実現するため、物理オブジェクトをインタラクティブな表面として扱う「World Mouse」と呼ばれる新しいクロスリアリティカーソルシステムを提案し、その有効性をプロトタイプを通じて検証したものです。
この論文は、LLM エージェントと人間の協働における情報非対称性を解消するため、オフライン評価からタスク固有の能力プロファイルと協調リスクの手がかりを導き出し、可視化・交渉・監査可能な委任プロトコルを構築するフレームワークを提案しています。
この論文は、アルゴリズムや AI による要約が圧縮・自動化しつつある人間の解釈的労働を可視化し、読書自体を創造的活動として再定義する「Reading Activity Traces(RATs)」という概念を提案し、その具体例としてウィキペディア向けの「WikiRAT」を紹介することで、人間の解釈が失われることなく知的ツールを設計するための新たな基盤を築こうとするものです。
この論文は、生成タスクに優れた大規模言語モデル(LLM)が評価タスクでも同様に優れているという仮説を検証し、実際には評価性能が生成性能より低く、さらにモデルが不十分な領域でも誤って自信を持って評価を行う「不誠実な評価」が発生する「生成 AI のパラドックス」が存在することを明らかにしています。
この論文は、成人を対象とした AI 生成の非同意性画像(ディープフェイクポルノ)を容易に作成可能にする「悪意ある技術生態系」の存在を指摘し、NIST の報告書に基づく現在のガバナンス手法がその生態系を効果的に規制できていないことと、その背景にある誤った前提を明らかにする survivor-centered(生存者中心)のアプローチを採った研究です。
ベイジアン分析における事前分布の選定を支援するため、分析者が仮定を反復的なデータセット構築を通じて視覚的に表現し、統計的事前分布を導出するインタラクティブな可視化システム「PriorWeaver」を提案し、その有効性を実証した。
本論文は、失われた建築遺産の解釈課題に対し、唐代大明宮の含元殿を事例としたVR体験「Pre/Absence」を開発し、その混合手法評価を通じて、単なる事実の提示を超えて文化的意識や感情的没入、批判的省察を促進する可能性を実証したものである。