G-STAR: End-to-End Global Speaker-Tracking Attributed Recognition

El artículo presenta G-STAR, un sistema de reconocimiento automático de habla (ASR) con atribución de hablantes de extremo a extremo que combina un módulo de seguimiento temporal con un modelo de lenguaje grande (Speech-LLM) para generar transcripciones etiquetadas por hablante con consistencia global en conversaciones largas y superpuestas.

Jing Peng, Ziyi Chen, Haoyu Li, Yucheng Wang, Duo Ma, Mengtian Li, Yunfan Du, Dezhu Xu, Kai Yu, Shuai WangThu, 12 Ma⚡ eess

Graphing Inline: Understanding Word-scale Graphics Use in Scientific Papers

Este estudio analiza un corpus de 909 gráficos a escala de palabra extraídos de más de 126,000 artículos científicos para proponer un marco que describe su posición, función comunicativa y representación visual, revelando su escasa adopción actual y destacando oportunidades para mejorar la comunicación académica mediante innovaciones técnicas y administrativas.

Siyu Lu, Yanhan Liu, Shiyu Xu, Ruishi Zou, Chen YeThu, 12 Ma💻 cs

CUAAudit: Meta-Evaluation of Vision-Language Models as Auditors of Autonomous Computer-Use Agents

Este estudio presenta CUAAudit, una meta-evaluación a gran escala que demuestra que, aunque los Modelos de Lenguaje y Visión (VLM) pueden actuar como auditores autónomos efectivos para agentes de uso informático, su fiabilidad disminuye en entornos complejos y heterogéneos, revelando limitaciones fundamentales en su precisión, calibración y acuerdo inter-modelo.

Marta Sumyk, Oleksandr KosovanThu, 12 Ma🤖 cs.AI

A Platform-Agnostic Multimodal Digital Human Modelling Framework: Neurophysiological Sensing in Game-Based Interaction

Este artículo presenta un marco de modelado digital humano multimodal e independiente de la plataforma que integra sensores biométricos (como el casco OpenBCI Galea) y un entorno de juego reproducible (SuperTux) para generar datos fisiológicos estructurados y sincronizados, facilitando así investigaciones futuras sobre interacción inclusiva e impulsada por IA sin depender de modelos de inferencia específicos.

Daniel J. Buxton, Mufti Mahmud, Jordan J. Bird, Thomas Hughes-Roberts, David J. BrownThu, 12 Ma🤖 cs.AI

Proceedings of CHIdeology 2026: CHI Workshop on Disentangling the fragmented politics, values and imaginaries of Human-Computer Interaction through ideologies

Este documento presenta las actas del primer taller CHIdeology de la conferencia CHI 2026, celebrado en Barcelona, que tiene como objetivo desentrañar la fragmentación de las políticas, valores e imaginarios de la Interacción Humano-Computadora a través del análisis de las ideologías.

Felix Anand Epp, Matti Nelimarkka, Jesse Haapoja, Pedro Ferreira, Os Keyes, Shaowen BardzellThu, 12 Ma💻 cs

Believing vs. Achieving -- The Disconnect between Efficacy Beliefs and Collaborative Outcomes

Mediante un experimento controlado, este estudio revela que las creencias de eficacia actúan como anclajes cognitivos que generan un optimismo sistemático hacia la IA, el cual solo se mitiga con información sobre el rendimiento de la IA, mientras que las discrepancias en estas creencias influyen más en las decisiones de delegación que en el rendimiento real del equipo humano-IA.

Philipp Spitzer, Joshua HolsteinThu, 12 Ma💻 cs

AI-Generated Rubric Interfaces: K-12 Teachers' Perceptions and Practices

Este estudio revela que, aunque los docentes de primaria y secundaria perciben las rúbricas generadas por IA como un punto de partida útil que mejora la estructura y claridad, su adopción condicional depende de herramientas que permitan una fácil personalización y mantengan el control humano sobre el contenido y la evaluación.

Bahare Riahi, Sayali Patukale, Joy Niranjan, Yogya Koneru, Tiffany Barnes, Veronica CatetéThu, 12 Ma💻 cs

Nurture-First Agent Development: Building Domain-Expert AI Agents Through Conversational Knowledge Crystallization

El artículo propone el desarrollo "Nurture-First" (NFD), un nuevo paradigma que construye agentes de IA expertos mediante interacciones conversacionales estructuradas con practicantes del dominio para cristalizar progresivamente el conocimiento tácito, superando así las limitaciones de los enfoques tradicionales basados en código o prompts estáticos.

Linghao ZhangThu, 12 Ma🤖 cs.AI

The Malicious Technical Ecosystem: Exposing Limitations in Technical Governance of AI-Generated Non-Consensual Intimate Images of Adults

Este artículo adopta un enfoque centrado en las supervivientes para exponer cómo un "ecosistema técnico malicioso" de herramientas de código abierto y software de desnudamiento, junto con las limitaciones de los marcos de gobernanza actuales como el informe NIST AI 100-4, impiden eficazmente regular la creación de imágenes íntimas generadas por IA sin consentimiento.

Michelle L. Ding, Harini SureshMon, 09 Ma🤖 cs.AI

Pre/Absence: Prompting Cultural Awareness and Understanding for Lost Architectural Heritage in Virtual Reality

El estudio presenta "Pre/Absence", una experiencia de realidad virtual que, mediante la dialéctica entre presencia y ausencia, supera las reconstrucciones estáticas tradicionales para fomentar una mayor conciencia cultural, compromiso emocional y reflexión crítica sobre el patrimonio arquitectónico perdido, utilizando el Salón Hanyuan del Palacio Daming como caso de estudio.

Yaning Li, Ke Zhao, Shucheng Zheng, Xingyu Chen, Chenyi Chen, Wenxi Dai, Weile Jiang, Qi Dong, Yiqing Zhao, Meng Li, Lin-Ping YuanMon, 09 Ma💻 cs