cs.CY artículos | Gist.Science

AI Misuse in Education Is a Measurement Problem: Toward a Learning Visibility Framework

Este artículo propone el Marco de Visibilidad del Aprendizaje para abordar el mal uso de la IA en la educación, redefiniendo el problema no como uno de detección, sino como una pérdida de visibilidad sobre el proceso de aprendizaje que debe recuperarse mediante la transparencia y la evaluación de evidencias de proceso junto con los resultados.

Eduardo Davalos, Yike ZhangTue, 10 Ma💻 cs

Social Proof is in the Pudding: The (Non)-Impact of Social Proof on Software Downloads

Este estudio mediante experimentos de campo en GitHub demuestra que la manipulación de métricas de prueba social, como las estrellas o las descargas, no tiene un impacto discernible en las descargas posteriores ni en la actividad de los desarrolladores de paquetes de software de código abierto.

Lucas Shen, Gaurav SoodTue, 10 Ma💻 cs

Semantic Risk Scoring of Aggregated Metrics: An AI-Driven Approach for Healthcare Data Governance

Este artículo propone un marco de IA modular que utiliza análisis semántico y sintáctico de consultas SQL para asignar puntuaciones de riesgo a métricas agregadas en el sector salud, permitiendo la detección proactiva de violaciones de privacidad y facilitando el intercambio seguro de datos entre equipos empresariales sin acceder a información sensible.

Mohammed Omer Shakeel AhmedTue, 10 Ma🤖 cs.LG

Evaluating LLM-Based Grant Proposal Review via Structured Perturbations

Este artículo evalúa la capacidad de los modelos de lenguaje grandes para revisar propuestas de subvenciones mediante perturbaciones estructuradas, concluyendo que un enfoque de análisis por secciones supera a otros métodos pero que los sistemas actuales presentan variabilidad y priorizan la verificación de cumplimiento sobre la evaluación holística.

William Thorne, Joseph James, Yang Wang, Chenghua Lin, Diana MaynardTue, 10 Ma💬 cs.CL

Improving Fairness with Ensemble Combination: Margin-Dependent Bounds

Este artículo propone una nueva medida de calidad de equidad llamada "riesgo discriminatorio" que integra la equidad individual y grupal, establece límites teóricos basados en márgenes para demostrar que la combinación de conjuntos puede mejorar la equidad y presenta métodos de poda de conjuntos para obtener modelos precisos y justos.

Yijun BianThu, 12 Ma🤖 cs.LG

Personalizing explanations of AI-driven hints to users' characteristics: an empirical evaluation

Este estudio evalúa empíricamente cómo personalizar las explicaciones de las pistas generadas por IA en un sistema de tutoría inteligente según los rasgos de los estudiantes, demostrando que adaptar estas explicaciones a alumnos con baja necesidad de cognición y baja conciencia mejora su interacción, comprensión y aprendizaje.

Vedant Bahel, Harshinee Sriram, Cristina ConatiThu, 12 Ma🤖 cs.AI

Shiksha Copilot: Teacher-AI Collaboration for Curating and Customizing Lesson Plans in Low-Resource Schools

Este estudio evalúa Shiksha Copilot, una herramienta de IA desplegada en escuelas de Karnataka, India, que demuestra cómo la colaboración entre docentes y la inteligencia artificial puede reducir la carga administrativa y el estrés mientras fomenta una pedagogía más activa, aunque su impacto transformador se ve limitado por desafíos sistémicos como la escasez de personal.

Deepak Varuvel Dennison, Bakhtawar Ahtisham, Kavyansh Chourasia, Nirmit Arora, Rahul Singh, Rene F. Kizilcec, Akshay Nambi, Tanuja Ganu, Aditya VashisthaThu, 12 Ma💻 cs

Recommender systems, representativeness, and online music: a psychosocial analysis of Italian listeners

Este estudio analiza las percepciones de oyentes italianos sobre los sistemas de recomendación musical, revelando una falta de comprensión crítica de los algoritmos y una conciencia limitada sobre los sesgos de género, lo que subraya la necesidad de integrar perspectivas psicosociales en el diseño de sistemas más confiables y culturalmente sensibles.

Lorenzo Porcaro, Chiara MonaldiThu, 12 Ma💻 cs

R v F (2025): Addressing the Defence of Hacking

Este artículo presenta un estudio de caso pionero sobre el caso R v F (2025) que ilustra cómo los investigadores de informática forense pueden desmontar la defensa de "hacking" mediante evidencia empírica, ofreciendo lecciones prácticas para ayudar a los tribunales a distinguir entre inocentes y culpables.

Junade AliThu, 12 Ma💻 cs

Intuition First or Reflection Before Judgment? The Impact of Evaluation Sequence on Consumer Ratings

Esta investigación demuestra que el orden de evaluación en las reseñas en línea (calificación antes o después del texto) polariza las calificaciones de los consumidores mediante un mecanismo de heurística afectiva y esfuerzo cognitivo, donde la secuencia "calificación primero" amplifica las puntuaciones extremas según la calidad del servicio y el tipo de producto, un hallazgo respaldado por datos secundarios de plataformas como Yelp y Letterboxd.

He Wang, Yueheng Wang, Ziyu Zhou, Hanxiang LiuThu, 12 Ma💻 cs

Empathy Is Not What Changed: Clinical Assessment of Psychological Safety Across GPT Model Generations

Este estudio clínico demuestra que la percepción de pérdida de empatía en las nuevas generaciones de modelos de OpenAI no se debe a un cambio en la empatía real, que permanece estadísticamente invariable, sino a una mayor detección de crisis y una postura de seguridad más estricta que altera la dinámica conversacional, especialmente en situaciones de riesgo.

Michael Keeman, Anastasia KeemanThu, 12 Ma💬 cs.CL

Adaptive Engram Memory System for Indonesian Language Model: Generative AI Based on TOBA LM for Batak and Minang Language

Este estudio presenta TOBA-LM, un modelo de lenguaje trilingüe (indonesio, batak y minangkabau) basado en GPT-2 que integra un mecanismo de memoria engrama adaptativa, logrando una convergencia de entrenamiento significativamente más rápida y eficiente que las arquitecturas transformadoras convencionales para el desarrollo de modelos de lenguas regionales con recursos limitados.

Hokky Situngkir, Kevin Siringoringo, Andhika Bernard LumbantobingThu, 12 Ma💬 cs.CL

Open Educational Resources: Barriers and Open Issues

Este artículo identifica y evalúa 26 barreras sociales, económicas y técnicas que limitan la adopción de Recursos Educativos Abiertos (REA), proponiendo un modelo conceptual y estrategias para superarlas y fomentar un ecosistema educativo más inclusivo y equitativo.

Pedro Henrique Dias Valle, Rafael Capilla, Vinicius dos Santos, Daniel Feitosa, Elisa Yumi NakagawaThu, 12 Ma💻 cs

$\mu$ Ed API: Towards A Shared API for EdTech Microservices

El artículo propone la especificación inicial de una API estandarizada y agnóstica a plataformas llamada $\mu$ Ed, diseñada para crear un ecosistema interoperable de microservicios educativos que automatice funciones clave como la retroalimentación, la evaluación y los chatbots, mejorando así la experiencia de aprendizaje en diversas disciplinas.

Maximillan Sölch, Alexandra Neagu, Marcus Messer, Peter Johnson, Gerd Kortemeyer, Samuel S. H. Ng, Fun Siong Lim, Stephan KruscheThu, 12 Ma💻 cs

The coordination gap in frontier AI safety policies

El artículo argumenta que las políticas de seguridad de la IA de vanguardia presentan una brecha estructural al centrarse en la prevención y descuidar la capacidad institucional para coordinar respuestas ante fallos, proponiendo adaptar mecanismos de otros campos como la seguridad nuclear para establecer compromisos previos y protocolos compartidos que permitan una gestión efectiva de los riesgos.

Isaak MengeshaThu, 12 Ma📈 econ

Assessing Cognitive Biases in LLMs for Judicial Decision Support: Virtuous Victim and Halo Effects

Este estudio evalúa si cinco modelos de lenguaje grandes (LLMs) exhiben sesgos cognitivos humanos, como el efecto de víctima virtuosa y el efecto halo, al asistir en sentencias judiciales, encontrando que aunque muestran variaciones y limitaciones para su uso inmediato, presentan mejoras modestas respecto a los benchmarks humanos en la reducción de ciertos prejuicios.

Sierra S. LiuThu, 12 Ma💻 cs

The science and practice of proportionality in AI risk evaluations

Este artículo examina cómo el principio de proporcionalidad del Derecho de la Unión Europea puede guiar el desarrollo de métodos científicos para calibrar las evaluaciones de riesgos sistémicos de los modelos de IA de propósito general, asegurando que cumplan con los objetivos de la Ley de IA sin imponer cargas excesivas a los proveedores.

Carlos Mougan, Lauritz Morlock, Jair Aguirre, James R. M. Black, Jan Brauner, Simeon Campos, Sunishchal Dev, David Fernández Llorca, Alberto Franzin, Mario Fritz, Emilia Gómez, Friederike Grosse-Holz, Eloise Hamilton, Max Hasin, Jose Hernandez-Orallo, Dan Lahav, Luca Massarelli, Vasilios Mavroudis, Malcolm Murray, Patricia Paskov, Jaime Raldua, Wout SchellaertThu, 12 Ma💻 cs

DeliberationBench: A Normative Benchmark for the Influence of Large Language Models on Users' Views

El artículo presenta DeliberationBench, una nueva métrica normativa que evalúa la influencia de los modelos de lenguaje grandes (LLM) en las opiniones de los usuarios comparándola con encuestas deliberativas democráticas, y demuestra mediante un experimento que estos modelos generan cambios de opinión sustanciales y epistémicamente deseables.

Luke Hewitt, Maximilian Kroner Dale, Paul de Font-ReaulxThu, 12 Ma💻 cs

Prompts and Prayers: the Rise of GPTheology

Este artículo examina el surgimiento de la "GPTheología" como una forma de tecnorreligión en la que la inteligencia artificial es tratada como un oráculo divino, analizando cómo las narrativas comunitarias y las interacciones rituales con modelos de lenguaje reflejan conceptos religiosos tradicionales y plantean desafíos éticos y sociotécnicos sobre la relación entre la humanidad y sus creaciones.

Ioana Cheres, Adrian Groza, Ioana Moldovan, Mick O'Hara, Connell VaughanThu, 12 Ma💻 cs

Dark Patterns and Consumer Protection Law for App Makers

Este artículo examina cómo los patrones oscuros en el diseño de aplicaciones pueden comprometer la autonomía del consumidor y generar responsabilidad legal, proponiendo estrategias de arquitectura de elección y diseño transparente para que los desarrolladores cumplan con las leyes de protección al consumidor y fomenten la confianza.

Gregory M. DickinsonThu, 12 Ma💻 cs

← Anterior Siguiente →

cs.CY