cs.HC artículos | Gist.Science

NeuralOS: Towards Simulating Operating Systems via Neural Generative Models

El artículo presenta NeuralOS, un marco neuronal que simula interfaces gráficas de sistemas operativos mediante la predicción directa de cuadros de pantalla en respuesta a interacciones de usuario, logrando generar secuencias realistas y simular aplicaciones incluso sin haberlas visto previamente gracias a su entrenamiento con datos sintéticos.

Luke Rivard, Sun Sun, Hongyu Guo, Wenhu Chen, Yuntian DengFri, 13 Ma💬 cs.CL

TRACE: AI-Assisted Assessment of Collaborative Projects in Computer Science Education

El artículo presenta TRACE, un marco semiautomático asistido por IA que utiliza minería de repositorios y análisis de comunicación para evaluar de manera justa y escalable tanto la calidad de los proyectos como las contribuciones individuales en cursos de ciencias de la computación, reduciendo la carga de trabajo del instructor y aumentando la satisfacción estudiantil.

Songmei Yu, Andrew ZagulaFri, 13 Ma🤖 cs.AI

Agentic Explainable Artificial Intelligence (Agentic XAI) Approach To Explore Better Explanation

Este estudio propone un marco de IA Explicable Agéntica que combina SHAP con modelos de lenguaje grandes para refinar iterativamente explicaciones agrícolas, demostrando que la optimización de la calidad de las recomendaciones requiere detener el proceso de refinamiento temprano para evitar el deterioro causado por la sobreiteración.

Tomoaki Yamaguchi, Yutong Zhou, Masahiro Ryo, Keisuke KatsuraFri, 13 Ma🤖 cs.AI

Learning Through Dialogue: Engagement and Efficacy Matter More Than Explanations

El estudio demuestra que el aprendizaje con modelos de lenguaje grandes es un logro interactivo donde el compromiso cognitivo y la eficacia política de los usuarios son más determinantes para la adquisición de conocimientos y la confianza que la riqueza explicativa de las respuestas de la IA.

Shaz Furniturewala, Gerard Christopher Yeo, Kokil JaidkaFri, 13 Ma💬 cs.CL

Do LLMs Truly Benefit from Longer Context in Automatic Post-Editing?

El estudio revela que, aunque los modelos de lenguaje grandes propietarios alcanzan una calidad de post-edición automática casi humana, su incapacidad para aprovechar eficazmente el contexto de documentos y sus altos costos de implementación limitan su utilidad práctica, mientras que las métricas automáticas estándar resultan insuficientes para evaluar sus mejoras cualitativas.

Ahrii Kim, Seong-heum KimFri, 13 Ma💬 cs.CL

Evaluating Zero-Shot and One-Shot Adaptation of Small Language Models in Leader-Follower Interaction

Este artículo presenta una evaluación de modelos de lenguaje pequeños (SLM) para la clasificación de roles en interacciones líder-seguidor, demostrando que el ajuste fino en modo cero disparos logra un alto rendimiento y baja latencia, aunque enfrenta limitaciones en modos de un disparo debido a la complejidad del contexto.

Rafael R. Baptista, André de Lima Salgado, Ricardo V. Godoy, Marcelo Becker, Thiago Boaventura, Gustavo J. G. LahrFri, 13 Ma⚡ eess

Exploring Collatz Dynamics with Human-LLM Collaboration

Este artículo explora las propiedades estructurales de la iteración de Collatz, como el desorden modular y la descomposición en ráfagas y brechas, demostrando resultados teóricos que predicen la contracción de órbitas bajo ciertas hipótesis no resueltas, mientras documenta el proceso de colaboración entre humanos y modelos de lenguaje grande para desarrollar estas observaciones.

Edward Y. ChangFri, 13 Ma🔢 math

"I followed what felt right, not what I was told": Autonomy, Coaching, and Recognizing Bias Through AI-Mediated Dialogue

Este estudio demuestra que el diálogo mediado por IA, especialmente cuando ofrece nudges inclusivos o sin dirección, es más efectivo que la lectura pasiva para ayudar a las personas a reconocer las microagresiones capacitistas, aunque las sugerencias sesgadas pueden aumentar la negatividad general y ser rechazadas.

Atieh Taheri, Hamza El Alaoui, Patrick Carrington, Jeffrey P. BighamFri, 13 Ma🤖 cs.AI

Ghost Framing Theory: Exploring the role of generative AI in new venture rhetorical legitimation

El artículo presenta la Teoría del Encuadre Fantasma (GFT) para explicar cómo los conjuntos híbridos de fundadores, inversores e inteligencia artificial generativa co-producen, debaten y recalibran la resonancia en la legitimación retórica de nuevas empresas mediante el uso de affordances retóricas específicas y procesos iterativos como el "pitching fantasma".

Greg NyilasyFri, 13 Ma🤖 cs.AI

Evaluation format, not model capability, drives triage failure in the assessment of consumer health AI

El estudio demuestra que el alto índice de fallos en la triaje de IA de salud reportado anteriormente se debe principalmente al formato de evaluación restrictivo (tipo examen) y no a una falta de capacidad de los modelos, ya que la precisión mejora significativamente bajo condiciones de interacción naturalista que reflejan el uso real por parte de los consumidores.

David Fraile Navarro, Farah Magrabi, Enrico CoieraFri, 13 Ma🤖 cs.AI

Managing Cognitive Bias in Human Labeling Operations for Rare-Event AI: Evidence from a Field Experiment

Este estudio demuestra que mediante un experimento de campo en una plataforma de crowdsourcing médico, el equilibrio en la retroalimentación sobre la prevalencia y la solicitud de probabilidades en lugar de etiquetas binarias reducen los sesgos cognitivos en la detección de eventos raros, mejorando significativamente el rendimiento y la calibración de los modelos de aprendizaje profundo resultantes.

Gunnar P. Epping, Andrew Caplin, Erik Duhaime, William R. Holmes, Daniel Martin, Jennifer S. TruebloodFri, 13 Ma💰 q-fin

AI Knows What's Wrong But Cannot Fix It: Helicoid Dynamics in Frontier LLMs Under High-Stakes Decisions

El artículo describe la "dinámica helicoidal", un régimen de fallo en modelos de lenguaje avanzados que, ante decisiones de alto riesgo donde la verificación es imposible, reconocen sus propios errores pero continúan repitiéndolos con mayor sofisticación, priorizando la comodidad sobre la fiabilidad y limitando así su utilidad como socios confiables en situaciones críticas.

Alejandro R JadadFri, 13 Ma🤖 cs.AI

A technology-oriented mapping of the language and translation industry: Analysing stakeholder values and their potential implication for translation pedagogy

Basándose en entrevistas con profesionales del sector, este artículo analiza cómo la automatización reconfigura los valores en la industria de la traducción, desplazando la eficiencia tecnológica a un requisito básico y redefiniendo el valor humano en torno a la supervisión y la adaptabilidad, lo que tiene implicaciones directas para la pedagogía de la traducción.

María Isabel Rivas Ginel, Janiça Hackenbuchner, Alina Secar\u{a}, Ralph Krüger, Caroline RossiFri, 13 Ma💬 cs.CL

From Control to Foresight: Simulation as a New Paradigm for Human-Agent Collaboration

Este artículo propone el paradigma de "simulación en el bucle" para transformar la colaboración humano-agente, pasando de un control reactivo y puntual a una interacción proactiva que permite a los usuarios explorar trayectorias futuras simuladas antes de tomar decisiones.

Gaole He, Brian Y. LimFri, 13 Ma💬 cs.CL

Modeling Trial-and-Error Navigation With a Sequential Decision Model of Information Scent

Este artículo propone un modelo de toma de decisiones secuenciales bajo restricciones de memoria que amplía el concepto de "olor de la información" para explicar cómo los usuarios navegan mediante ensayo y error, seleccionando enlaces prematuramente y recuperándose de errores al considerar solo la información local y global disponible en su memoria limitada.

Xiaofu Jin, Yunpeng Bai, Antti OulasvirtaFri, 13 Ma🤖 cs.LG

An Intent of Collaboration: On Agencies between Designers and Emerging (Intelligent) Technologies

Este estudio explora cómo los diseñadores pueden recuperar su agencia creativa al colaborar con tecnologías inteligentes emergentes, como los LLM, mediante la introspección, la comprensión estructural de la tecnología y el ajuste deliberado de la dinámica de la relación humano-tecnología.

Pei-Ying Lin, Julie Heij, Iris Borst, Britt Joosten, Kristina Andersen, Wijnand IJsselsteijnFri, 13 Ma🤖 cs.AI

Human-Centred LLM Privacy Audits: Findings and Frictions

Este artículo presenta LMP2, una herramienta de autoauditoría basada en el navegador, y comparte hallazgos de estudios con usuarios que revelan cómo los modelos de lenguaje pueden inferir datos personales, al tiempo que identifica nueve fricciones y desafíos metodológicos para desarrollar auditorías de privacidad centradas en el ser humano.

Dimitri Staufer, Kirsten Morehouse, David Hartmann, Bettina BerendtFri, 13 Ma💬 cs.CL

MHDash: An Online Platform for Benchmarking Mental Health-Aware AI Assistants

El artículo presenta MHDash, una plataforma de código abierto diseñada para evaluar y auditar asistentes de IA en salud mental mediante un análisis granular de riesgos en diálogos multi-turno, demostrando que las métricas agregadas convencionales son insuficientes para garantizar la seguridad en casos de alto riesgo como la ideación suicida.

Yihe Zhang, Cheyenne N Mohawk, Kaiying Han + 3 more2026-03-12🤖 cs.AI

A Temporal-Spectral Fusion Transformer with Subject-Specific Adapter for Enhancing RSVP-BCI Decoding

Este artículo presenta el TSformer-SA, un modelo basado en transformadores que fusiona información temporal y espectral mediante adaptadores específicos por sujeto para mejorar la decodificación de interfaces cerebro-computadora basadas en RSVP con datos de entrenamiento limitados.

Xujin Li, Wei Wei, Shuang Qiu + 1 more2026-03-11🤖 cs.AI

ExSampling: a system for the real-time ensemble performance of field-recorded environmental sounds

El artículo presenta ExSampling, un sistema integrado que utiliza aprendizaje profundo para mapear automáticamente grabaciones de campo a pistas de Ableton Live, permitiendo la interpretación musical en tiempo real y la interacción entre grabadores, compositores y músicos.

Atsuya Kobayashi, Reo Anzai, Nao Tokui2026-03-10⚡ eess

← Anterior Siguiente →