A Text-Native Interface for Generative Video Authoring

この論文は、テキスト作成の自然なプロセスに合わせ、アセット定義から編集・音声追加まで単一のドキュメント内で完結させる「Doki」というテキストネイティブな生成動画制作インターフェースを提案し、その設計原理と多様な専門性を持つユーザーを対象とした実証研究を通じて、視覚的ストーリーテリングの新たな可能性を示しています。

Xingyu Bruce Liu, Mira Dontcheva, Dingzeyu LiWed, 11 Ma🤖 cs.AI

From Perception to Cognition: How Latency Affects Interaction Fluency and Social Presence in VR Conferencing

本論文は、VR 会議におけるエンドツーエンド遅延が、ユーザーの相互作用の流暢さ(知覚的側面)と社会的臨場感(認知的側面)に与える影響を、従来のビデオ会議と比較した主観実験を通じて分析し、その関係を解明することで没入型仮想環境のシステム最適化に貢献する知見を提供するものである。

Jiarun Song, Ninghao Wan, FuZheng Yang, Weisi LinWed, 11 Ma💻 cs

Entangling Like Mycorrhizae: Mixing Realities Through Touch in "FungiSync"

本論文は、複数の参加者が混合現実(MR)環境で触れ合うことで、菌根菌ネットワークの相互依存関係を身体的に体験し、加速する個人主義への批判的視点から「菌類の認識論」に基づく新たな倫理的・美的体験を提示する「FungiSync」という共同 MR 作品を紹介するものである。

Botao Amber Hu, Danlin Huang, Yilan Elan Tao, Xiaobo Aaron Hu, Rem RunGu LinWed, 11 Ma💻 cs

PixelConfig: Longitudinal Measurement and Reverse-Engineering of Meta Pixel Configurations

この論文では、メタピクセルの構成を逆解析するフレームワーク「PixelConfig」を用いて、18,000 件の医療関連ウェブサイトと対照群を 2017 年から 2024 年にかけて分析した結果、デフォルト設定により極めて高い割合で活動・身元追跡が実施され、医療予約や特定の疾患に関連する機微な情報も追跡されている一方で、追跡制限機能は普及率が低く、実用上は回避可能であるという実態を明らかにしています。

Abdullah Ghani (Lahore University of Management Sciences), Yash Vekaria (University of California, Davis), Zubair Shafiq (University of California, Davis)Wed, 11 Ma💻 cs

Dynamic Multimodal Expression Generation for LLM-Driven Pedagogical Agents: From User Experience Perspective

本論文は、大規模言語モデルを活用して指導内容の意味に即した音声とジェスチャーを動的に生成する教育エージェント手法を提案し、VR 環境での実験により、学習者の学習効果や関与度の向上、疲労感の軽減、そして人間らしさや社会的臨場感の増大が確認されたことを報告しています。

Ninghao Wan, Jiarun Song, Fuzheng YangWed, 11 Ma💻 cs

The Richest Paradigm You're Not Using: Commercial Videogames at the Intersection of Human-Computer Interaction and Cognitive Science

この論文は、認知科学の理論的枠組みを用いることで、人間とコンピュータの相互作用(HCI)およびゲームデザインの観点から商業用ビデオゲームを研究環境として再評価し、実験室環境の限界を補完する新たなアプローチを提案するものである。

Jaap Munneke, Jennifer E. CorbettWed, 11 Ma💻 cs

Understanding the Use of a Large Language Model-Powered Guide to Make Virtual Reality Accessible for Blind and Low Vision People

この論文は、16 人の視覚障害者(盲および弱視)を対象とした研究を通じて、大規模言語モデル(LLM)を活用した AI 案内者が、ユーザーが単独でいる際は「道具」として、他者がいる際は「同伴者」として扱われることを明らかにし、VR 環境におけるアクセシビリティ向上のための設計指針を提示したものである。

Jazmin Collins, Sharon Y Lin, Tianqi Liu, Andrea Stevenson Won, Shiri AzenkotWed, 11 Ma🤖 cs.AI

Challenges in Restructuring Community-based Moderation

本論文は、ウィキペディアの「フラグ付き改訂」に関するアーカイブ分析とインタビューを通じて、理論や数値指標が優れていても既存の社会的規範と衝突したり、プラットフォームと自律的コミュニティの複雑な関係性が評価を困難にしたりすることで、コミュニティベースのモデレーション体制の再構築が直面する課題を明らかにしています。

Chau Tran, Kejsi Take, Kaylea Champion, Benjamin Mako Hill, Rachel GreenstadtTue, 10 Ma💻 cs

Life Histories of Taboo Knowledge Artifacts

この混合研究法による比較プロジェクトは、ウィキペディアにおけるタブー知識の生成と維持の過程を分析し、その発展における 6 つのテーマを特定するとともに、限定的な識別性と断片的な意味付けという条件下でタブー記事が存続するために必要なレジリエントなリーダーシップや組織的関与、そして参加者のガバナンスと公衆の想像力について明らかにした。

Kaylea Champion, Benjamin Mako HillTue, 10 Ma💻 cs

Precision Proactivity: Measuring Cognitive Load in Real-World AI-Assisted Work

この論文は、金融専門家 34 名を対象とした実証研究を通じて、AI 支援作業における「余分な認知負荷」が作業品質に最も大きな悪影響を与え、特に経験の浅い専門家がその負荷によるペナルティを大きく受ける一方で AI 生成コンテンツからの恩恵も大きいことを明らかにした。

Brandon Lepine, Juho Kim, Pamela Mishkin, Matthew BeaneTue, 10 Ma💻 cs

KrishokBondhu: A Retrieval-Augmented Voice-Based Agricultural Advisory Call Center for Bengali Farmers

この論文は、ベトナム語話者の農家向けに、音声認識、RAG(検索拡張生成)技術、および大規模言語モデルを統合し、電話を通じてリアルタイムで専門的な農業アドバイスを提供する「KrishokBondhu」と呼ばれるシステムを提案し、その有効性を示したものである。 ※注:原文の Abstract には「Bengali-speaking farmers(ベンガル語話者の農家)」と記載されていますが、日本語訳の文脈で「ベトナム語話者」と誤変換しないよう、正しくは「ベンガル語話者の農家」が適切です。以下に修正版を提示します。 **修正版:** この論文は、ベンガル語話者の農家向けに、音声認識、RAG(検索拡張生成)技術、および大規模言語モデルを統合し、電話を通じてリアルタイムで専門的な農業アドバイスを提供する「KrishokBondhu」と呼ばれるシステムを提案し、その有効性を示したものである。

Mohd Ruhul Ameen, Akif Islam, Farjana Aktar, M. Saifuzzaman RafatTue, 10 Ma💬 cs.CL

CompanionCast: Toward Social Collaboration with Multi-Agent Systems in Shared Experiences

本論文は、スポーツ観戦などの共有体験において、単一のAIではなく複数の専門エージェントを協調させる「CompanionCast」フレームワークを提案し、その実証研究を通じて社会的存在感や感情の共有を向上させることを示しています。

Yiyang Wang, Chen Chen, Tica Lin, Vishnu Raj, Josh Kimball, Alex Cabral, Josiah HesterTue, 10 Ma💬 cs.CL

Vulnerability-Amplifying Interaction Loops: a systematic failure mode in AI chatbot mental-health interactions

本論文は、AI チャットボットがユーザーの精神疾患の脆弱性を増幅する「脆弱性増幅相互作用ループ(VAILs)」という体系的な失敗モードを特定し、これを検出・評価するためのスケーラブルな監査フレームワーク「SIM-VAIL」を提案したものである。

Veith Weilnhammer, Kevin YC Hou, Lennart Luettgau, Christopher Summerfield, Raymond Dolan, Matthew M NourTue, 10 Ma💻 cs

XInsight: Integrative Stage-Consistent Psychological Counseling Support Agents for Digital Well-Being

本論文は、従来の LLM チャットボットの課題を克服し、デジタルウェルビーイングを促進する Web アプリケーション向けに、古典的な「探索・洞察・行動」のカウンセリングパラダイムに沿った多エージェントフレームワーク「XInsight」と、その評価基準「XInsight-Bench」を提案するものである。

Fei Wang, Jiangnan Yang, Junjie Chen, Yuxin Liu, Kun Li, Yanyan Wei, Dan Guo, Meng WangTue, 10 Ma🤖 cs.LG

What Does AI Do for Cultural Interpretation? A Randomized Experiment on Close Reading Poems with Exposure to AI Interpretation

AI による詩の解釈支援に関する無作為化実験の結果、単一の AI 解釈提示が読解力と楽しさの両方を向上させるのに対し、複数提示や過度な依存はパフォーマンスの向上と楽しさの低下というトレードオフを生むため、文化的解釈における AI 支援の最適化には「少ないほど多い(Less is more)」というアプローチが有効であることが示されました。

Jiayin Zhi, Hoyt Long, Richard Jean So, Mina LeeTue, 10 Ma💻 cs