cs artículos | Gist.Science

One Model, Many Skills: Parameter-Efficient Fine-Tuning for Multitask Code Analysis

Este artículo presenta la primera evaluación exhaustiva del ajuste fino eficiente en parámetros (PEFT) para el análisis de código multitarea, demostrando que un único módulo PEFT compartido puede igualar o superar al ajuste completo con una reducción drástica de costos computacionales y de almacenamiento, aunque su éxito depende críticamente de factores como la estabilidad de las tareas, la arquitectura del modelo y la calidad de los datos.

Amal Akli, Maxime Cordy, Mike Papadakis, Yves Le Traon2026-03-12💻 cs

Open Educational Resources: Barriers and Open Issues

Este artículo identifica y evalúa 26 barreras sociales, económicas y técnicas que limitan la adopción de Recursos Educativos Abiertos (REA), proponiendo un modelo conceptual y estrategias para superarlas y fomentar un ecosistema educativo más inclusivo y equitativo.

Pedro Henrique Dias Valle, Rafael Capilla, Vinicius dos Santos, Daniel Feitosa, Elisa Yumi Nakagawa2026-03-12💻 cs

$\mu$ Ed API: Towards A Shared API for EdTech Microservices

El artículo propone la especificación inicial de una API estandarizada y agnóstica a plataformas llamada $\mu$ Ed, diseñada para crear un ecosistema interoperable de microservicios educativos que automatice funciones clave como la retroalimentación, la evaluación y los chatbots, mejorando así la experiencia de aprendizaje en diversas disciplinas.

Maximillan Sölch, Alexandra Neagu, Marcus Messer, Peter Johnson, Gerd Kortemeyer, Samuel S. H. Ng, Fun Siong Lim, Stephan Krusche2026-03-12💻 cs

Assessing Cognitive Biases in LLMs for Judicial Decision Support: Virtuous Victim and Halo Effects

Este estudio evalúa si cinco modelos de lenguaje grandes (LLMs) exhiben sesgos cognitivos humanos, como el efecto de víctima virtuosa y el efecto halo, al asistir en sentencias judiciales, encontrando que aunque muestran variaciones y limitaciones para su uso inmediato, presentan mejoras modestas respecto a los benchmarks humanos en la reducción de ciertos prejuicios.

Sierra S. Liu2026-03-12💻 cs

The science and practice of proportionality in AI risk evaluations

Este artículo examina cómo el principio de proporcionalidad del Derecho de la Unión Europea puede guiar el desarrollo de métodos científicos para calibrar las evaluaciones de riesgos sistémicos de los modelos de IA de propósito general, asegurando que cumplan con los objetivos de la Ley de IA sin imponer cargas excesivas a los proveedores.

Carlos Mougan, Lauritz Morlock, Jair Aguirre, James R. M. Black, Jan Brauner, Simeon Campos, Sunishchal Dev, David Fernández Llorca, Alberto Franzin, Mario Fritz, Emilia Gómez, Friederike Grosse-Holz, Eloise Hamilton, Max Hasin, Jose Hernandez-Orallo, Dan Lahav, Luca Massarelli, Vasilios Mavroudis, Malcolm Murray, Patricia Paskov, Jaime Raldua, Wout Schellaert2026-03-12💻 cs

DeliberationBench: A Normative Benchmark for the Influence of Large Language Models on Users' Views

El artículo presenta DeliberationBench, una nueva métrica normativa que evalúa la influencia de los modelos de lenguaje grandes (LLM) en las opiniones de los usuarios comparándola con encuestas deliberativas democráticas, y demuestra mediante un experimento que estos modelos generan cambios de opinión sustanciales y epistémicamente deseables.

Luke Hewitt, Maximilian Kroner Dale, Paul de Font-Reaulx2026-03-12💻 cs

Prompts and Prayers: the Rise of GPTheology

Este artículo examina el surgimiento de la "GPTheología" como una forma de tecnorreligión en la que la inteligencia artificial es tratada como un oráculo divino, analizando cómo las narrativas comunitarias y las interacciones rituales con modelos de lenguaje reflejan conceptos religiosos tradicionales y plantean desafíos éticos y sociotécnicos sobre la relación entre la humanidad y sus creaciones.

Ioana Cheres, Adrian Groza, Ioana Moldovan, Mick O'Hara, Connell Vaughan2026-03-12💻 cs

Dark Patterns and Consumer Protection Law for App Makers

Este artículo examina cómo los patrones oscuros en el diseño de aplicaciones pueden comprometer la autonomía del consumidor y generar responsabilidad legal, proponiendo estrategias de arquitectura de elección y diseño transparente para que los desarrolladores cumplan con las leyes de protección al consumidor y fomenten la confianza.

Gregory M. Dickinson2026-03-12💻 cs

Law Proofing the Future

Este artículo sostiene que, en lugar de endurecer la legislación para anticiparse a las nuevas tecnologías, el sistema legal debe proteger el futuro mediante la restricción regulatoria y el uso de las herramientas generales y adaptables del derecho consuetudinario, evitando así que las leyes rígidas y específicas sofocuen la innovación y la libertad.

Gregory M. Dickinson2026-03-12💻 cs

Consumer Rights and Algorithms

Este artículo examina la evolución de la ley de protección al consumidor desde sus raíces históricas hasta los desafíos actuales de la era digital, analizando el impacto de la inteligencia artificial y los grandes datos en el mercado, así como las respuestas regulatorias como las leyes de privacidad y la prohibición de patrones oscuros.

Gregory M. Dickinson2026-03-12💻 cs

A Review of the Negative Effects of Digital Technology on Cognition

Esta revisión integradora de más de 500 estudios sintetiza las evidencias sobre cómo la tecnología digital, especialmente la inteligencia artificial generativa, puede erosionar capacidades cognitivas superiores y agotar la reserva cognitiva a largo plazo mediante mecanismos como la interferencia funcional y la desregulación neuroquímica, a pesar de optimizar el rendimiento inmediato.

Urška Žnidarič, Erik Štrumbelj, Octavian Machidon2026-03-12💻 cs

Quantal Response Equilibrium as a Measure of Strategic Sophistication: Theory and Validation for LLM Evaluation

Este artículo presenta un marco de evaluación basado en el equilibrio de respuesta cuantal (QRE) para medir la sofisticación estratégica de los modelos de lenguaje, ofreciendo una métrica continua calibrada con datos humanos que supera las limitaciones de los puntajes agregados tradicionales, aunque revela una alta sensibilidad a la formulación de las instrucciones.

Mateo Pechon-Elkins, Jon Chun2026-03-12💻 cs

Tureis: Transformer-based Unified Resilience for IoT Devices in Smart Homes

El artículo presenta Tureis, un método auto-supervisado basado en Transformers que detecta y localiza fallos en sensores de hogares inteligentes mediante la reconstrucción de características de bits, logrando una alta precisión en escenarios multi-fallo y multi-residente con un footprint ligero apto para dispositivos de borde como Raspberry Pi.

Alireza Borhani, Vafa Andalibi, Bahar Asgari2026-03-12💻 cs

Evaluating Generalization Mechanisms in Autonomous Cyber Attack Agents

Este artículo evalúa la capacidad de generalización de agentes de ciberataque autónomos ante cambios en la asignación de direcciones IP, concluyendo que aunque los agentes impulsados por LLM logran el mejor rendimiento en escenarios no vistos, lo hacen a costa de un mayor consumo computacional, menor transparencia y la aparición de fallos prácticos como bucles de acciones inválidas.

Ondřej Lukáš, Jihoon Shin, Emilia Rivas, Diego Forni, Maria Rigaki, Carlos Catania, Aritran Piplai, Christopher Kiekintveld, Sebastian Garcia2026-03-12💻 cs

OmniGuide: Universal Guidance Fields for Enhancing Generalist Robot Policies

El artículo presenta OmniGuide, un marco flexible que mejora el rendimiento de los modelos de política generalista visión-lenguaje-acción (VLA) en tareas complejas al integrar diversas fuentes de orientación como funciones de energía diferenciables que guían la generación de acciones en el espacio 3D.

Yunzhou Song, Long Le, Yong-Hyun Park, Jie Wang, Junyao Shi, Lingjie Liu, Jiatao Gu, Eric Eaton, Dinesh Jayaraman, Kostas Daniilidis2026-03-12💻 cs

OAuthHub: Mitigating OAuth Data Overaccess through a Local Data Hub

El artículo presenta OAuthHub, un marco de desarrollo que utiliza dispositivos personales como intermediarios para mitigar el acceso excesivo a datos en OAuth mediante un modelo de permisos centralizado y patrones de acceso discretos, logrando reducir significativamente el tiempo de codificación y la complejidad del código en comparación con las APIs tradicionales.

Qiyu Li, Yuhe Tian, Haojian Jin2026-03-12💻 cs

Model-Free Co-Optimization of Manufacturable Sensor Layouts and Deformation Proprioception

Este trabajo presenta una tubería computacional libre de modelos que optimiza conjuntamente la disposición de sensores flexibles y los parámetros de una red neuronal para predecir deformaciones en sistemas robóticos blandos y dispositivos portátiles, mejorando la precisión de la predicción y garantizando la viabilidad de fabricación sin depender de simulaciones físicas.

Yingjun Tian, Guoxin Fang, Aoran Lyu, Xilong Wang, Zikang Shi, Yuhu Guo, Weiming Wang, Charlie C. L. Wang2026-03-12💻 cs

Decision-Aware Uncertainty Evaluation of Vision-Language Model-Based Early Action Anticipation for Human-Robot Interaction

Este artículo presenta la primera evaluación sistemática de la incertidumbre en modelos de visión-linguaje para la anticipación temprana de acciones en interacciones humano-robot, introduciendo un protocolo de evaluación temporal y métricas de calibración para garantizar predicciones confiables bajo observaciones parciales.

Zhaoda Du, Michael Bowman, Qiaojie Zheng, Xiaoli Zhang2026-03-12💻 cs

Building Privacy-and-Security-Focused Federated Learning Infrastructure for Global Multi-Centre Healthcare Research

Este artículo presenta FLA³, una plataforma de aprendizaje federado que integra controles de autenticación, autorización y contabilidad para habilitar la investigación clínica global segura y cumplir con las normativas de privacidad sin compartir datos.

Fan Zhang, Daniel Kreuter, Javier Fernandez-Marques, BloodCounts Consortium, Gregory Verghese, Bernard Butler, Nicholas Lane, Suthesh Sivapalaratnam, Joseph Taylor, Norbert C. J. de Wit, Nicholas S. Gleadall, Carola-Bibiane Schönlieb, Michael Roberts2026-03-12💻 cs

Categorical Calculus and Algebra for Multi-Model Data

Este artículo establece una base teórica para consultar bases de datos categóricas mediante la propuesta de un cálculo y un álgebra categóricos, demostrando su equivalencia, ofreciendo reglas de optimización y analizando su poder expresivo y complejidad computacional.

Jiaheng Lu (University of Helsinki)2026-03-12💻 cs

← Anterior Siguiente →

cs

One Model, Many Skills: Parameter-Efficient Fine-Tuning for Multitask Code Analysis

Open Educational Resources: Barriers and Open Issues

μ\muμEd API: Towards A Shared API for EdTech Microservices

Assessing Cognitive Biases in LLMs for Judicial Decision Support: Virtuous Victim and Halo Effects

The science and practice of proportionality in AI risk evaluations

DeliberationBench: A Normative Benchmark for the Influence of Large Language Models on Users' Views

Prompts and Prayers: the Rise of GPTheology

Dark Patterns and Consumer Protection Law for App Makers

Law Proofing the Future

Consumer Rights and Algorithms

A Review of the Negative Effects of Digital Technology on Cognition

Quantal Response Equilibrium as a Measure of Strategic Sophistication: Theory and Validation for LLM Evaluation

Tureis: Transformer-based Unified Resilience for IoT Devices in Smart Homes

Evaluating Generalization Mechanisms in Autonomous Cyber Attack Agents

OmniGuide: Universal Guidance Fields for Enhancing Generalist Robot Policies

OAuthHub: Mitigating OAuth Data Overaccess through a Local Data Hub

Model-Free Co-Optimization of Manufacturable Sensor Layouts and Deformation Proprioception

Decision-Aware Uncertainty Evaluation of Vision-Language Model-Based Early Action Anticipation for Human-Robot Interaction

Building Privacy-and-Security-Focused Federated Learning Infrastructure for Global Multi-Centre Healthcare Research

Categorical Calculus and Algebra for Multi-Model Data

$\mu$ Ed API: Towards A Shared API for EdTech Microservices