Semantic Risk Scoring of Aggregated Metrics: An AI-Driven Approach for Healthcare Data Governance

Este artículo propone un marco de IA modular que utiliza análisis semántico y sintáctico de consultas SQL para asignar puntuaciones de riesgo a métricas agregadas en el sector salud, permitiendo la detección proactiva de violaciones de privacidad y facilitando el intercambio seguro de datos entre equipos empresariales sin acceder a información sensible.

Mohammed Omer Shakeel AhmedTue, 10 Ma🤖 cs.LG

Evaluating LLM-Based Grant Proposal Review via Structured Perturbations

Este artículo evalúa la capacidad de los modelos de lenguaje grandes para revisar propuestas de subvenciones mediante perturbaciones estructuradas, concluyendo que un enfoque de análisis por secciones supera a otros métodos pero que los sistemas actuales presentan variabilidad y priorizan la verificación de cumplimiento sobre la evaluación holística.

William Thorne, Joseph James, Yang Wang, Chenghua Lin, Diana MaynardTue, 10 Ma💬 cs.CL

Shiksha Copilot: Teacher-AI Collaboration for Curating and Customizing Lesson Plans in Low-Resource Schools

Este estudio evalúa Shiksha Copilot, una herramienta de IA desplegada en escuelas de Karnataka, India, que demuestra cómo la colaboración entre docentes y la inteligencia artificial puede reducir la carga administrativa y el estrés mientras fomenta una pedagogía más activa, aunque su impacto transformador se ve limitado por desafíos sistémicos como la escasez de personal.

Deepak Varuvel Dennison, Bakhtawar Ahtisham, Kavyansh Chourasia, Nirmit Arora, Rahul Singh, Rene F. Kizilcec, Akshay Nambi, Tanuja Ganu, Aditya VashisthaThu, 12 Ma💻 cs

Recommender systems, representativeness, and online music: a psychosocial analysis of Italian listeners

Este estudio analiza las percepciones de oyentes italianos sobre los sistemas de recomendación musical, revelando una falta de comprensión crítica de los algoritmos y una conciencia limitada sobre los sesgos de género, lo que subraya la necesidad de integrar perspectivas psicosociales en el diseño de sistemas más confiables y culturalmente sensibles.

Lorenzo Porcaro, Chiara MonaldiThu, 12 Ma💻 cs

Intuition First or Reflection Before Judgment? The Impact of Evaluation Sequence on Consumer Ratings

Esta investigación demuestra que el orden de evaluación en las reseñas en línea (calificación antes o después del texto) polariza las calificaciones de los consumidores mediante un mecanismo de heurística afectiva y esfuerzo cognitivo, donde la secuencia "calificación primero" amplifica las puntuaciones extremas según la calidad del servicio y el tipo de producto, un hallazgo respaldado por datos secundarios de plataformas como Yelp y Letterboxd.

He Wang, Yueheng Wang, Ziyu Zhou, Hanxiang LiuThu, 12 Ma💻 cs

Empathy Is Not What Changed: Clinical Assessment of Psychological Safety Across GPT Model Generations

Este estudio clínico demuestra que la percepción de pérdida de empatía en las nuevas generaciones de modelos de OpenAI no se debe a un cambio en la empatía real, que permanece estadísticamente invariable, sino a una mayor detección de crisis y una postura de seguridad más estricta que altera la dinámica conversacional, especialmente en situaciones de riesgo.

Michael Keeman, Anastasia KeemanThu, 12 Ma💬 cs.CL

Adaptive Engram Memory System for Indonesian Language Model: Generative AI Based on TOBA LM for Batak and Minang Language

Este estudio presenta TOBA-LM, un modelo de lenguaje trilingüe (indonesio, batak y minangkabau) basado en GPT-2 que integra un mecanismo de memoria engrama adaptativa, logrando una convergencia de entrenamiento significativamente más rápida y eficiente que las arquitecturas transformadoras convencionales para el desarrollo de modelos de lenguas regionales con recursos limitados.

Hokky Situngkir, Kevin Siringoringo, Andhika Bernard LumbantobingThu, 12 Ma💬 cs.CL

μ\muEd API: Towards A Shared API for EdTech Microservices

El artículo propone la especificación inicial de una API estandarizada y agnóstica a plataformas llamada μ\muEd, diseñada para crear un ecosistema interoperable de microservicios educativos que automatice funciones clave como la retroalimentación, la evaluación y los chatbots, mejorando así la experiencia de aprendizaje en diversas disciplinas.

Maximillan Sölch, Alexandra Neagu, Marcus Messer, Peter Johnson, Gerd Kortemeyer, Samuel S. H. Ng, Fun Siong Lim, Stephan KruscheThu, 12 Ma💻 cs

Assessing Cognitive Biases in LLMs for Judicial Decision Support: Virtuous Victim and Halo Effects

Este estudio evalúa si cinco modelos de lenguaje grandes (LLMs) exhiben sesgos cognitivos humanos, como el efecto de víctima virtuosa y el efecto halo, al asistir en sentencias judiciales, encontrando que aunque muestran variaciones y limitaciones para su uso inmediato, presentan mejoras modestas respecto a los benchmarks humanos en la reducción de ciertos prejuicios.

Sierra S. LiuThu, 12 Ma💻 cs

The science and practice of proportionality in AI risk evaluations

Este artículo examina cómo el principio de proporcionalidad del Derecho de la Unión Europea puede guiar el desarrollo de métodos científicos para calibrar las evaluaciones de riesgos sistémicos de los modelos de IA de propósito general, asegurando que cumplan con los objetivos de la Ley de IA sin imponer cargas excesivas a los proveedores.

Carlos Mougan, Lauritz Morlock, Jair Aguirre, James R. M. Black, Jan Brauner, Simeon Campos, Sunishchal Dev, David Fernández Llorca, Alberto Franzin, Mario Fritz, Emilia Gómez, Friederike Grosse-Holz, Eloise Hamilton, Max Hasin, Jose Hernandez-Orallo, Dan Lahav, Luca Massarelli, Vasilios Mavroudis, Malcolm Murray, Patricia Paskov, Jaime Raldua, Wout SchellaertThu, 12 Ma💻 cs

DeliberationBench: A Normative Benchmark for the Influence of Large Language Models on Users' Views

El artículo presenta DeliberationBench, una nueva métrica normativa que evalúa la influencia de los modelos de lenguaje grandes (LLM) en las opiniones de los usuarios comparándola con encuestas deliberativas democráticas, y demuestra mediante un experimento que estos modelos generan cambios de opinión sustanciales y epistémicamente deseables.

Luke Hewitt, Maximilian Kroner Dale, Paul de Font-ReaulxThu, 12 Ma💻 cs

Prompts and Prayers: the Rise of GPTheology

Este artículo examina el surgimiento de la "GPTheología" como una forma de tecnorreligión en la que la inteligencia artificial es tratada como un oráculo divino, analizando cómo las narrativas comunitarias y las interacciones rituales con modelos de lenguaje reflejan conceptos religiosos tradicionales y plantean desafíos éticos y sociotécnicos sobre la relación entre la humanidad y sus creaciones.

Ioana Cheres, Adrian Groza, Ioana Moldovan, Mick O'Hara, Connell VaughanThu, 12 Ma💻 cs