cs.HC articles | Gist.Science

NasoVoce: A Nose-Mounted Low-Audibility Speech Interface for Always-Available Speech Interaction

Le papier présente NasoVoce, une interface discrète montée sur le pont nasal qui fusionne des signaux acoustiques et vibratoires pour permettre une interaction vocale avec l'IA en tout temps, même dans des environnements bruyants ou lors de chuchotements.

Jun Rekimoto, Yu Nishimura, Bojian YangThu, 12 Ma🤖 cs.AI

Reactive Writers: How Co-Writing with AI Changes How We Engage with Ideas

Cette étude démontre que la co-écriture avec l'IA favorise une pratique de « rédaction réactive » où les auteurs, en évaluant d'abord les suggestions de l'IA plutôt qu'en développant leurs propres idées, adoptent involontairement les opinions de l'outil tout en conservant l'illusion d'un contrôle total sur leur texte.

Advait Bhat, Marianne Aubin Le Quéré, Mor Naaman, Maurice JakeschThu, 12 Ma🤖 cs.AI

Moving Phones, Active Peers: Exploring the Effect of Animated Phones as Facilitators in In-Person Group Discussion

Cette étude propose et évalue « AnimaStand », un support animé qui transforme les smartphones en facilitateurs corporels expressifs capables de réengager les membres passifs et d'améliorer la dynamique, la performance et les relations lors de discussions de groupe en présentiel.

Ziqi Pan, Ziqi Liu, Jinhan Zhang, Zeyu Huang, Xiaojuan MaThu, 12 Ma💻 cs

MoXaRt: Audio-Visual Object-Guided Sound Interaction for XR

Le système MoXaRt introduit une architecture en cascade pour les réalités étendues (XR) qui combine des indices audio et visuels afin de séparer en temps réel jusqu'à cinq sources sonores concurrentes, améliorant ainsi significativement l'intelligibilité de la parole et réduisant la charge cognitive des utilisateurs.

Tianyu Xu, Sieun Kim, Qianhui Zheng, Ruoyu Xu, Tejasvi Ravi, Anuva Kulkarni, Katrina Passarella-Ward, Junyi Zhu, Adarsh KowdleThu, 12 Ma💻 cs

G-STAR: End-to-End Global Speaker-Tracking Attributed Recognition

Le papier présente G-STAR, un système de reconnaissance automatique de la parole attribué aux locuteurs de bout en bout qui couple un module de suivi temporel des locuteurs avec un modèle de langage pour assurer une cohérence des identités à l'échelle de la réunion tout en générant des transcriptions étiquetées et horodatées.

Jing Peng, Ziyi Chen, Haoyu Li, Yucheng Wang, Duo Ma, Mengtian Li, Yunfan Du, Dezhu Xu, Kai Yu, Shuai WangThu, 12 Ma⚡ eess

Graphing Inline: Understanding Word-scale Graphics Use in Scientific Papers

Cette étude analyse un corpus de graphiques à l'échelle du mot dans des articles scientifiques pour proposer un cadre caractérisant leur positionnement, leur fonction communicative et leur représentation visuelle, tout en soulignant leur sous-utilisation actuelle et en explorant des pistes pour améliorer la communication scientifique.

Siyu Lu, Yanhan Liu, Shiyu Xu, Ruishi Zou, Chen YeThu, 12 Ma💻 cs

CUAAudit: Meta-Evaluation of Vision-Language Models as Auditors of Autonomous Computer-Use Agents

Ce papier présente CUAAudit, une méta-évaluation de cinq modèles vision-langage en tant qu'auditeurs autonomes des agents d'utilisation d'ordinateurs, révélant que bien que ces modèles affichent une bonne précision, ils souffrent de limitations significatives dans des environnements complexes et d'un manque de consensus, soulignant ainsi la nécessité de prendre en compte leur fiabilité et leur incertitude pour un déploiement réel.

Marta Sumyk, Oleksandr KosovanThu, 12 Ma🤖 cs.AI

Terminal Is All You Need: Design Properties for Human-AI Agent Collaboration

Ce papier soutient que le terminal, et non les interfaces graphiques, constitue le modèle de conception idéal pour la collaboration humain-IA en raison de sa compatibilité représentationnelle, de la transparence de ses actions et de sa faible barrière d'entrée, des propriétés que toute interface agentielle devrait délibérément reproduire.

Alexandre De MasiThu, 12 Ma💻 cs

A Platform-Agnostic Multimodal Digital Human Modelling Framework: Neurophysiological Sensing in Game-Based Interaction

Cet article présente un cadre de modélisation numérique d'humain (DHM) indépendant de la plateforme qui intègre le casque OpenBCI Galea pour le capteur multimodal et l'environnement SuperTux pour l'interaction, afin de fournir une infrastructure reproductible et éthique pour la recherche future en interaction homme-machine et en accessibilité.

Daniel J. Buxton, Mufti Mahmud, Jordan J. Bird, Thomas Hughes-Roberts, David J. BrownThu, 12 Ma🤖 cs.AI

Proceedings of CHIdeology 2026: CHI Workshop on Disentangling the fragmented politics, values and imaginaries of Human-Computer Interaction through ideologies

Ce document présente les actes du premier atelier CHIdeology de la conférence CHI 2026, tenu à Barcelone, qui vise à démêler les politiques, valeurs et imaginaires fragmentés de l'interaction humain-ordinateur à travers le prisme des idéologies.

Felix Anand Epp, Matti Nelimarkka, Jesse Haapoja, Pedro Ferreira, Os Keyes, Shaowen BardzellThu, 12 Ma💻 cs

Believing vs. Achieving -- The Disconnect between Efficacy Beliefs and Collaborative Outcomes

Cette étude révèle que les croyances d'efficacité agissent comme des ancres cognitives persistantes favorisant un optimisme excessif envers l'IA, influençant les décisions de délégation de manière asymétrique selon le contexte, mais ayant un impact plus faible sur les performances réelles de l'équipe humain-IA, ce qui remet en question les approches centrées sur la transparence.

Philipp Spitzer, Joshua HolsteinThu, 12 Ma💻 cs

AI-Generated Rubric Interfaces: K-12 Teachers' Perceptions and Practices

Cette étude examine les perceptions et pratiques de 25 enseignants du primaire et du secondaire lors d'un atelier sur la génération de grilles d'évaluation par l'IA, révélant que bien qu'ils apprécient les ébauches structurées offertes par l'outil, ils insistent sur la nécessité d'une révision humaine pour corriger les inexactitudes et maintenir le contrôle pédagogique.

Bahare Riahi, Sayali Patukale, Joy Niranjan, Yogya Koneru, Tiffany Barnes, Veronica CatetéThu, 12 Ma💻 cs

Nurture-First Agent Development: Building Domain-Expert AI Agents Through Conversational Knowledge Crystallization

Ce papier propose le développement « Nurture-First » (NFD), un nouveau paradigme qui remplace les approches de codage ou de prompt statique par une croissance progressive des agents via des interactions conversationnelles structurées, permettant la cristallisation continue de l'expertise de domaine tacite en actifs de connaissances réutilisables.

Linghao ZhangThu, 12 Ma🤖 cs.AI

World Mouse: Exploring Interactions with a Cross-Reality Cursor

Ce papier présente « World Mouse », un curseur de réalité croisée qui réinterprète la souris 2D pour les scènes 3D en combinant l'interaction précise sur les surfaces physiques et la navigation fluide dans l'espace vide, afin de faciliter l'interaction entre les environnements réels et virtuels.

Esen K. Tütüncü, Mar Gonzalez-Franco, Khushman Patel, Eric J. GonzalezThu, 12 Ma💻 cs

Task-Aware Delegation Cues for LLM Agents

Cet article propose un cadre de collaboration humain-agent qui transforme l'asymétrie d'information en signaux de délégation explicites et auditable, en utilisant des profils de capacité et des indicateurs de risque de coordination dérivés de comparaisons de paires pour optimiser la répartition des tâches et la confiance mutuelle.

Xingrui GuThu, 12 Ma💻 cs

Chasing RATs: Tracing Reading for and as Creative Activity

Ce papier propose les « Reading Activity Traces » (RATs), un cadre conceptuel et technique qui requalifie la lecture comme une activité créative en rendant visibles les trajectoires d'interprétation humaine souvent effacées par l'automatisation, illustré par une mise en œuvre spéculative sur Wikipédia.

Sophia Liu, Shm Garanganao AlmedaThu, 12 Ma💻 cs

The Generative AI Paradox on Evaluation: What It Can Solve, It May Not Evaluate

Cette étude révèle le paradoxe de l'IA générative en démontrant que les grands modèles de langage, bien qu'habiles à générer des réponses, sont souvent moins performants et moins fiables lorsqu'ils sont chargés d'évaluer ces mêmes réponses.

Juhyun Oh, Eunsu Kim, Inha Cha, Alice OhMon, 09 Ma💻 cs

The Malicious Technical Ecosystem: Exposing Limitations in Technical Governance of AI-Generated Non-Consensual Intimate Images of Adults

En adoptant une approche centrée sur les survivants, cette étude expose l'écosystème technique malveillant facilitant la création d'images intimes non consensuelles générées par l'IA et démontre l'inefficacité des cadres de gouvernance actuels, tels que le rapport NIST AI 100-4, pour réguler ce phénomène.

Michelle L. Ding, Harini SureshMon, 09 Ma🤖 cs.AI

PriorWeaver: Prior Elicitation via Iterative Dataset Construction

Le papier présente PriorWeaver, un système de visualisation interactive qui facilite l'élaboration de priors en analyse bayésienne en permettant aux analystes de construire et d'affiner itérativement des jeux de données, améliorant ainsi leur contrôle, leur clarté et la conformité de leurs priors par rapport à leurs attentes.

Yuwei Xiao, Shuai Ma, Antti Oulasvirta, Eunice JunMon, 09 Ma💻 cs

Pre/Absence: Prompting Cultural Awareness and Understanding for Lost Architectural Heritage in Virtual Reality

L'étude présente « Pre/Absence », une expérience de réalité virtuelle conçue autour de la dialectique présence-absence pour interpréter le patrimoine architectural perdu, démontrant qu'elle favorise davantage la conscience culturelle, l'engagement émotionnel et la réflexion critique que les supports traditionnels.

Yaning Li, Ke Zhao, Shucheng Zheng, Xingyu Chen, Chenyi Chen, Wenxi Dai, Weile Jiang, Qi Dong, Yiqing Zhao, Meng Li, Lin-Ping YuanMon, 09 Ma💻 cs

← Précédent Suivant →