cs.HC artículos | Gist.Science

NasoVoce: A Nose-Mounted Low-Audibility Speech Interface for Always-Available Speech Interaction

El paper presenta NasoVoce, una interfaz montada en la nariz que fusiona señales acústicas y de vibración para capturar el habla silenciosa y susurrada de manera robusta frente al ruido, permitiendo interacciones de voz discretas y siempre disponibles con IA.

Jun Rekimoto, Yu Nishimura, Bojian YangThu, 12 Ma🤖 cs.AI

Reactive Writers: How Co-Writing with AI Changes How We Engage with Ideas

El estudio introduce el concepto de "escritura reactiva" para describir cómo la colaboración con IA desplaza la generación de ideas hacia la evaluación de sugerencias, lo que influye sutilmente en las opiniones de los autores sin que estos sean conscientes de dicha manipulación.

Advait Bhat, Marianne Aubin Le Quéré, Mor Naaman, Maurice JakeschThu, 12 Ma🤖 cs.AI

Moving Phones, Active Peers: Exploring the Effect of Animated Phones as Facilitators in In-Person Group Discussion

Este estudio presenta AnimaStand, un soporte que anima los teléfonos móviles para actuar como facilitadores corporales en discusiones grupales presenciales, demostrando que estas expresiones dinámicas mejoran la reactivación de miembros inactivos, la dinámica del grupo y el rendimiento de la tarea.

Ziqi Pan, Ziqi Liu, Jinhan Zhang, Zeyu Huang, Xiaojuan MaThu, 12 Ma💻 cs

MoXaRt: Audio-Visual Object-Guided Sound Interaction for XR

MoXaRt es un sistema de Realidad Extendida en tiempo real que utiliza una arquitectura en cascada con guías audiovisuales para separar fuentes sonoras concurrentes, mejorando significativamente la inteligibilidad del habla y reduciendo la carga cognitiva en entornos acústicos complejos.

Tianyu Xu, Sieun Kim, Qianhui Zheng, Ruoyu Xu, Tejasvi Ravi, Anuva Kulkarni, Katrina Passarella-Ward, Junyi Zhu, Adarsh KowdleThu, 12 Ma💻 cs

G-STAR: End-to-End Global Speaker-Tracking Attributed Recognition

El artículo presenta G-STAR, un sistema de reconocimiento automático de habla (ASR) con atribución de hablantes de extremo a extremo que combina un módulo de seguimiento temporal con un modelo de lenguaje grande (Speech-LLM) para generar transcripciones etiquetadas por hablante con consistencia global en conversaciones largas y superpuestas.

Jing Peng, Ziyi Chen, Haoyu Li, Yucheng Wang, Duo Ma, Mengtian Li, Yunfan Du, Dezhu Xu, Kai Yu, Shuai WangThu, 12 Ma⚡ eess

Graphing Inline: Understanding Word-scale Graphics Use in Scientific Papers

Este estudio analiza un corpus de 909 gráficos a escala de palabra extraídos de más de 126,000 artículos científicos para proponer un marco que describe su posición, función comunicativa y representación visual, revelando su escasa adopción actual y destacando oportunidades para mejorar la comunicación académica mediante innovaciones técnicas y administrativas.

Siyu Lu, Yanhan Liu, Shiyu Xu, Ruishi Zou, Chen YeThu, 12 Ma💻 cs

CUAAudit: Meta-Evaluation of Vision-Language Models as Auditors of Autonomous Computer-Use Agents

Este estudio presenta CUAAudit, una meta-evaluación a gran escala que demuestra que, aunque los Modelos de Lenguaje y Visión (VLM) pueden actuar como auditores autónomos efectivos para agentes de uso informático, su fiabilidad disminuye en entornos complejos y heterogéneos, revelando limitaciones fundamentales en su precisión, calibración y acuerdo inter-modelo.

Marta Sumyk, Oleksandr KosovanThu, 12 Ma🤖 cs.AI

Terminal Is All You Need: Design Properties for Human-AI Agent Collaboration

El artículo sostiene que la terminal, y no las interfaces gráficas, es el paradigma ideal para la colaboración humano-IA debido a su compatibilidad representacional, transparencia y baja barrera de entrada, propiedades que cualquier modalidad de interfaz debe replicar deliberadamente para ser efectiva.

Alexandre De MasiThu, 12 Ma💻 cs

A Platform-Agnostic Multimodal Digital Human Modelling Framework: Neurophysiological Sensing in Game-Based Interaction

Este artículo presenta un marco de modelado digital humano multimodal e independiente de la plataforma que integra sensores biométricos (como el casco OpenBCI Galea) y un entorno de juego reproducible (SuperTux) para generar datos fisiológicos estructurados y sincronizados, facilitando así investigaciones futuras sobre interacción inclusiva e impulsada por IA sin depender de modelos de inferencia específicos.

Daniel J. Buxton, Mufti Mahmud, Jordan J. Bird, Thomas Hughes-Roberts, David J. BrownThu, 12 Ma🤖 cs.AI

Proceedings of CHIdeology 2026: CHI Workshop on Disentangling the fragmented politics, values and imaginaries of Human-Computer Interaction through ideologies

Este documento presenta las actas del primer taller CHIdeology de la conferencia CHI 2026, celebrado en Barcelona, que tiene como objetivo desentrañar la fragmentación de las políticas, valores e imaginarios de la Interacción Humano-Computadora a través del análisis de las ideologías.

Felix Anand Epp, Matti Nelimarkka, Jesse Haapoja, Pedro Ferreira, Os Keyes, Shaowen BardzellThu, 12 Ma💻 cs

Believing vs. Achieving -- The Disconnect between Efficacy Beliefs and Collaborative Outcomes

Mediante un experimento controlado, este estudio revela que las creencias de eficacia actúan como anclajes cognitivos que generan un optimismo sistemático hacia la IA, el cual solo se mitiga con información sobre el rendimiento de la IA, mientras que las discrepancias en estas creencias influyen más en las decisiones de delegación que en el rendimiento real del equipo humano-IA.

Philipp Spitzer, Joshua HolsteinThu, 12 Ma💻 cs

AI-Generated Rubric Interfaces: K-12 Teachers' Perceptions and Practices

Este estudio revela que, aunque los docentes de primaria y secundaria perciben las rúbricas generadas por IA como un punto de partida útil que mejora la estructura y claridad, su adopción condicional depende de herramientas que permitan una fácil personalización y mantengan el control humano sobre el contenido y la evaluación.

Bahare Riahi, Sayali Patukale, Joy Niranjan, Yogya Koneru, Tiffany Barnes, Veronica CatetéThu, 12 Ma💻 cs

Nurture-First Agent Development: Building Domain-Expert AI Agents Through Conversational Knowledge Crystallization

El artículo propone el desarrollo "Nurture-First" (NFD), un nuevo paradigma que construye agentes de IA expertos mediante interacciones conversacionales estructuradas con practicantes del dominio para cristalizar progresivamente el conocimiento tácito, superando así las limitaciones de los enfoques tradicionales basados en código o prompts estáticos.

Linghao ZhangThu, 12 Ma🤖 cs.AI

World Mouse: Exploring Interactions with a Cross-Reality Cursor

El artículo presenta "World Mouse", un cursor de realidad cruzada que combina la interacción precisa sobre superficies físicas mediante normales y la navegación interpolada entre objetos para superar las limitaciones de los métodos de entrada actuales en entornos de Realidad Extendida (XR).

Esen K. Tütüncü, Mar Gonzalez-Franco, Khushman Patel, Eric J. GonzalezThu, 12 Ma💻 cs

Task-Aware Delegation Cues for LLM Agents

Este artículo propone un marco de colaboración consciente de la tarea que transforma la delegación a agentes de LLM de un proceso opaco en una decisión visible y auditable, mediante la generación de señales de confianza basadas en perfiles de capacidad y riesgos de coordinación derivados de evaluaciones de preferencia.

Xingrui GuThu, 12 Ma💻 cs

Chasing RATs: Tracing Reading for and as Creative Activity

El artículo presenta las "Reading Activity Traces" (RATs), un marco que revaloriza la lectura como una actividad creativa en sí misma al hacer visibles los procesos de navegación, interpretación y curación que las herramientas automatizadas suelen ocultar, ilustrado mediante una implementación especulativa en Wikipedia llamada WikiRAT.

Sophia Liu, Shm Garanganao AlmedaThu, 12 Ma💻 cs

The Generative AI Paradox on Evaluation: What It Can Solve, It May Not Evaluate

Este estudio demuestra que los modelos de lenguaje grandes, aunque expertos en tareas de generación, presentan un rendimiento significativamente inferior y a veces poco fiable en tareas de evaluación, revelando una paradoja que cuestiona la confianza en su capacidad para juzgar sus propias respuestas.

Juhyun Oh, Eunsu Kim, Inha Cha, Alice OhMon, 09 Ma💻 cs

The Malicious Technical Ecosystem: Exposing Limitations in Technical Governance of AI-Generated Non-Consensual Intimate Images of Adults

Este artículo adopta un enfoque centrado en las supervivientes para exponer cómo un "ecosistema técnico malicioso" de herramientas de código abierto y software de desnudamiento, junto con las limitaciones de los marcos de gobernanza actuales como el informe NIST AI 100-4, impiden eficazmente regular la creación de imágenes íntimas generadas por IA sin consentimiento.

Michelle L. Ding, Harini SureshMon, 09 Ma🤖 cs.AI

PriorWeaver: Prior Elicitation via Iterative Dataset Construction

PriorWeaver es un sistema interactivo de visualización que facilita la elicitación de priores en el análisis bayesiano mediante la construcción iterativa de conjuntos de datos, permitiendo a los analistas expresar visualmente sus creencias y obtener priores mejor alineados con sus expectativas en comparación con las técnicas existentes.

Yuwei Xiao, Shuai Ma, Antti Oulasvirta, Eunice JunMon, 09 Ma💻 cs

Pre/Absence: Prompting Cultural Awareness and Understanding for Lost Architectural Heritage in Virtual Reality

El estudio presenta "Pre/Absence", una experiencia de realidad virtual que, mediante la dialéctica entre presencia y ausencia, supera las reconstrucciones estáticas tradicionales para fomentar una mayor conciencia cultural, compromiso emocional y reflexión crítica sobre el patrimonio arquitectónico perdido, utilizando el Salón Hanyuan del Palacio Daming como caso de estudio.

Yaning Li, Ke Zhao, Shucheng Zheng, Xingyu Chen, Chenyi Chen, Wenxi Dai, Weile Jiang, Qi Dong, Yiqing Zhao, Meng Li, Lin-Ping YuanMon, 09 Ma💻 cs

← Anterior Siguiente →