NeuralOS: Towards Simulating Operating Systems via Neural Generative Models

El artículo presenta NeuralOS, un marco neuronal que simula interfaces gráficas de sistemas operativos mediante la predicción directa de cuadros de pantalla en respuesta a interacciones de usuario, logrando generar secuencias realistas y simular aplicaciones incluso sin haberlas visto previamente gracias a su entrenamiento con datos sintéticos.

Luke Rivard, Sun Sun, Hongyu Guo, Wenhu Chen, Yuntian DengFri, 13 Ma💬 cs.CL

TRACE: AI-Assisted Assessment of Collaborative Projects in Computer Science Education

El artículo presenta TRACE, un marco semiautomático asistido por IA que utiliza minería de repositorios y análisis de comunicación para evaluar de manera justa y escalable tanto la calidad de los proyectos como las contribuciones individuales en cursos de ciencias de la computación, reduciendo la carga de trabajo del instructor y aumentando la satisfacción estudiantil.

Songmei Yu, Andrew ZagulaFri, 13 Ma🤖 cs.AI

Agentic Explainable Artificial Intelligence (Agentic XAI) Approach To Explore Better Explanation

Este estudio propone un marco de IA Explicable Agéntica que combina SHAP con modelos de lenguaje grandes para refinar iterativamente explicaciones agrícolas, demostrando que la optimización de la calidad de las recomendaciones requiere detener el proceso de refinamiento temprano para evitar el deterioro causado por la sobreiteración.

Tomoaki Yamaguchi, Yutong Zhou, Masahiro Ryo, Keisuke KatsuraFri, 13 Ma🤖 cs.AI

Evaluating Zero-Shot and One-Shot Adaptation of Small Language Models in Leader-Follower Interaction

Este artículo presenta una evaluación de modelos de lenguaje pequeños (SLM) para la clasificación de roles en interacciones líder-seguidor, demostrando que el ajuste fino en modo cero disparos logra un alto rendimiento y baja latencia, aunque enfrenta limitaciones en modos de un disparo debido a la complejidad del contexto.

Rafael R. Baptista, André de Lima Salgado, Ricardo V. Godoy, Marcelo Becker, Thiago Boaventura, Gustavo J. G. LahrFri, 13 Ma⚡ eess

"I followed what felt right, not what I was told": Autonomy, Coaching, and Recognizing Bias Through AI-Mediated Dialogue

Este estudio demuestra que el diálogo mediado por IA, especialmente cuando ofrece nudges inclusivos o sin dirección, es más efectivo que la lectura pasiva para ayudar a las personas a reconocer las microagresiones capacitistas, aunque las sugerencias sesgadas pueden aumentar la negatividad general y ser rechazadas.

Atieh Taheri, Hamza El Alaoui, Patrick Carrington, Jeffrey P. BighamFri, 13 Ma🤖 cs.AI

Evaluation format, not model capability, drives triage failure in the assessment of consumer health AI

El estudio demuestra que el alto índice de fallos en la triaje de IA de salud reportado anteriormente se debe principalmente al formato de evaluación restrictivo (tipo examen) y no a una falta de capacidad de los modelos, ya que la precisión mejora significativamente bajo condiciones de interacción naturalista que reflejan el uso real por parte de los consumidores.

David Fraile Navarro, Farah Magrabi, Enrico CoieraFri, 13 Ma🤖 cs.AI

Managing Cognitive Bias in Human Labeling Operations for Rare-Event AI: Evidence from a Field Experiment

Este estudio demuestra que mediante un experimento de campo en una plataforma de crowdsourcing médico, el equilibrio en la retroalimentación sobre la prevalencia y la solicitud de probabilidades en lugar de etiquetas binarias reducen los sesgos cognitivos en la detección de eventos raros, mejorando significativamente el rendimiento y la calibración de los modelos de aprendizaje profundo resultantes.

Gunnar P. Epping, Andrew Caplin, Erik Duhaime, William R. Holmes, Daniel Martin, Jennifer S. TruebloodFri, 13 Ma💰 q-fin

AI Knows What's Wrong But Cannot Fix It: Helicoid Dynamics in Frontier LLMs Under High-Stakes Decisions

El artículo describe la "dinámica helicoidal", un régimen de fallo en modelos de lenguaje avanzados que, ante decisiones de alto riesgo donde la verificación es imposible, reconocen sus propios errores pero continúan repitiéndolos con mayor sofisticación, priorizando la comodidad sobre la fiabilidad y limitando así su utilidad como socios confiables en situaciones críticas.

Alejandro R JadadFri, 13 Ma🤖 cs.AI

A technology-oriented mapping of the language and translation industry: Analysing stakeholder values and their potential implication for translation pedagogy

Basándose en entrevistas con profesionales del sector, este artículo analiza cómo la automatización reconfigura los valores en la industria de la traducción, desplazando la eficiencia tecnológica a un requisito básico y redefiniendo el valor humano en torno a la supervisión y la adaptabilidad, lo que tiene implicaciones directas para la pedagogía de la traducción.

María Isabel Rivas Ginel, Janiça Hackenbuchner, Alina Secar\u{a}, Ralph Krüger, Caroline RossiFri, 13 Ma💬 cs.CL

Modeling Trial-and-Error Navigation With a Sequential Decision Model of Information Scent

Este artículo propone un modelo de toma de decisiones secuenciales bajo restricciones de memoria que amplía el concepto de "olor de la información" para explicar cómo los usuarios navegan mediante ensayo y error, seleccionando enlaces prematuramente y recuperándose de errores al considerar solo la información local y global disponible en su memoria limitada.

Xiaofu Jin, Yunpeng Bai, Antti OulasvirtaFri, 13 Ma🤖 cs.LG

An Intent of Collaboration: On Agencies between Designers and Emerging (Intelligent) Technologies

Este estudio explora cómo los diseñadores pueden recuperar su agencia creativa al colaborar con tecnologías inteligentes emergentes, como los LLM, mediante la introspección, la comprensión estructural de la tecnología y el ajuste deliberado de la dinámica de la relación humano-tecnología.

Pei-Ying Lin, Julie Heij, Iris Borst, Britt Joosten, Kristina Andersen, Wijnand IJsselsteijnFri, 13 Ma🤖 cs.AI