cs artículos | Gist.Science

KVSmooth: Mitigating Hallucination in Multi-modal Large Language Models through Key-Value Smoothing

El artículo presenta KVSmooth, un método gratuito y plug-and-play que mitiga las alucinaciones en modelos de lenguaje multimodal grandes mediante un suavizado adaptativo de los estados ocultos guiado por la entropía de la atención, mejorando significativamente la precisión y el recall sin necesidad de reentrenamiento.

Siyu Jiang, Feiyang Chen, Xiaojin Zhang, Kun He2026-03-12💻 cs

Dull, Dirty, Dangerous: Understanding the Past, Present, and Future of a Key Motivation for Robotics

Este artículo analiza empíricamente la escasa definición y ejemplificación del concepto de trabajo "aburrido, sucio y peligroso" (DDD) en la literatura robótica, revisa la literatura de ciencias sociales para ofrecer definiciones claras y propone un marco para que la comunidad considere el contexto laboral y el impacto de la robótica en el empleo humano.

Nozomi Nakajima, Pedro Reynolds-Cuéllar, Caitrin Lynch, Kate Darling2026-03-12💻 cs

ThunderAgent: A Simple, Fast and Program-Aware Agentic Inference System

ThunderAgent es un sistema de inferencia ágil y consciente del programa que unifica la gestión de recursos heterogéneos mediante la abstracción de flujos de trabajo como "programas LLM", logrando mejoras significativas en el rendimiento y la eficiencia de memoria en comparación con los sistemas existentes.

Hao Kang, Ziyang Li, Xinyu Yang, Weili Xu, Yinfang Chen, Junxiong Wang, Beidi Chen, Tushar Krishna, Chenfeng Xu, Simran Arora2026-03-12💻 cs

OmniVTON++: Training-Free Universal Virtual Try-On with Principal Pose Guidance

OmniVTON++ es un marco de prueba de ropa virtual universal y sin entrenamiento que aborda desafíos de alineación y coherencia mediante morfología de prendas estructurada, guía de pose principal y costura de límites continua, logrando un rendimiento superior en diversos escenarios y soportando casos de múltiples prendas, personas y personajes de anime.

Zhaotong Yang, Yong Du, Shengfeng He, Yuhui Li, Xinzhe Li, Yangyang Xu, Junyu Dong, Jian Yang2026-03-12💻 cs

Similarity-as-Evidence: Calibrating Overconfident VLMs for Interpretable and Label-Efficient Medical Active Learning

El marco Similarity-as-Evidence (SaE) calibra las predicciones sobreconfiadas de los Modelos Visuales-Linguísticos mediante una cabeza de evidencia de similitud que parametriza una distribución Dirichlet, permitiendo una selección de muestras más interpretable y eficiente en etiquetas para el aprendizaje activo en imágenes médicas al priorizar casos de alta vacuidad y disonancia.

Zhuofan Xie, Zishan Lin, Jinliang Lin, Jie Qi, Shaohua Hong, Shuo Li2026-03-12💻 cs

Structured Bitmap-to-Mesh Triangulation for Geometry-Aware Discretization of Image-Derived Domains

Este artículo presenta un marco de triangulación basado en plantillas que incrusta fronteras derivadas de imágenes en una malla triangular regular mediante una tabla de búsqueda simbólica para garantizar una discretización de EDPs estable, paralela y geométricamente fiel sin necesidad de actualizaciones globales de conectividad.

Wei Feng, Haiyong Zheng2026-03-12💻 cs

SIMSPINE: A Biomechanics-Aware Simulation Framework for 3D Spine Motion Annotation and Benchmarking

El artículo presenta SIMSPINE, un marco de simulación consciente de la biomecánica y un nuevo conjunto de datos abierto que, al generar 2,14 millones de anotaciones 3D de vértebras a partir de modelos musculoesqueléticos, establece el primer benchmark unificado para la estimación de movimientos de la columna vertebral basada en visión por computadora, logrando mejoras significativas en el estado del arte.

Muhammad Saif Ullah Khan, Didier Stricker2026-03-12💻 cs

DRESS and the WL Hierarchy: Climbing One Deletion at a Time

Este artículo proporciona la justificación teórica de que el marco $\Delta^k$ -DRESS distingue pares CFI $(K_{k+3})$ para todo $k \geq 0$ y demuestra condicionalmente que su poder de discriminación es al menos equivalente al de la jerarquía $(k{+}2)$ -WL para todos los grafos.

Eduar Castrillo Velilla2026-03-12💻 cs

Mind the Way You Select Negative Texts: Pursuing the Distance Consistency in OOD Detection with VLMs

El artículo presenta InterNeg, un marco que mejora la detección de distribuciones fuera de contexto en modelos de visión y lenguaje al resolver inconsistencias en el uso de distancias intra-modales mediante la selección coherente de textos negativos y la generación dinámica de embeddings textuales a partir de imágenes OOD, logrando así un rendimiento superior en benchmarks estándar.

Zhikang Xu, Qianqian Xu, Zitai Wang, Cong Hua, Sicong Li, Zhiyong Yang, Qingming Huang2026-03-12💻 cs

Kraken: Higher-order EM Side-Channel Attacks on DNNs in Near and Far Field

Este trabajo presenta "Kraken", el primer ataque de canal lateral electromagnético de alto orden capaz de extraer parámetros de modelos de aprendizaje profundo directamente de las unidades Tensor Core de las GPUs, demostrando la vulnerabilidad de estos sistemas tanto en campo cercano como en campo lejano a través de obstáculos.

Peter Horvath, Ilia Shumailov, Lukasz Chmielewski, Lejla Batina, Yuval Yarom2026-03-12💻 cs

One Model, Many Skills: Parameter-Efficient Fine-Tuning for Multitask Code Analysis

Este artículo presenta la primera evaluación exhaustiva del ajuste fino eficiente en parámetros (PEFT) para el análisis de código multitarea, demostrando que un único módulo PEFT compartido puede igualar o superar al ajuste completo con una reducción drástica de costos computacionales y de almacenamiento, aunque su éxito depende críticamente de factores como la estabilidad de las tareas, la arquitectura del modelo y la calidad de los datos.

Amal Akli, Maxime Cordy, Mike Papadakis, Yves Le Traon2026-03-12💻 cs

Open Educational Resources: Barriers and Open Issues

Este artículo identifica y evalúa 26 barreras sociales, económicas y técnicas que limitan la adopción de Recursos Educativos Abiertos (REA), proponiendo un modelo conceptual y estrategias para superarlas y fomentar un ecosistema educativo más inclusivo y equitativo.

Pedro Henrique Dias Valle, Rafael Capilla, Vinicius dos Santos, Daniel Feitosa, Elisa Yumi Nakagawa2026-03-12💻 cs

$\mu$ Ed API: Towards A Shared API for EdTech Microservices

El artículo propone la especificación inicial de una API estandarizada y agnóstica a plataformas llamada $\mu$ Ed, diseñada para crear un ecosistema interoperable de microservicios educativos que automatice funciones clave como la retroalimentación, la evaluación y los chatbots, mejorando así la experiencia de aprendizaje en diversas disciplinas.

Maximillan Sölch, Alexandra Neagu, Marcus Messer, Peter Johnson, Gerd Kortemeyer, Samuel S. H. Ng, Fun Siong Lim, Stephan Krusche2026-03-12💻 cs

Assessing Cognitive Biases in LLMs for Judicial Decision Support: Virtuous Victim and Halo Effects

Este estudio evalúa si cinco modelos de lenguaje grandes (LLMs) exhiben sesgos cognitivos humanos, como el efecto de víctima virtuosa y el efecto halo, al asistir en sentencias judiciales, encontrando que aunque muestran variaciones y limitaciones para su uso inmediato, presentan mejoras modestas respecto a los benchmarks humanos en la reducción de ciertos prejuicios.

Sierra S. Liu2026-03-12💻 cs

The science and practice of proportionality in AI risk evaluations

Este artículo examina cómo el principio de proporcionalidad del Derecho de la Unión Europea puede guiar el desarrollo de métodos científicos para calibrar las evaluaciones de riesgos sistémicos de los modelos de IA de propósito general, asegurando que cumplan con los objetivos de la Ley de IA sin imponer cargas excesivas a los proveedores.

Carlos Mougan, Lauritz Morlock, Jair Aguirre, James R. M. Black, Jan Brauner, Simeon Campos, Sunishchal Dev, David Fernández Llorca, Alberto Franzin, Mario Fritz, Emilia Gómez, Friederike Grosse-Holz, Eloise Hamilton, Max Hasin, Jose Hernandez-Orallo, Dan Lahav, Luca Massarelli, Vasilios Mavroudis, Malcolm Murray, Patricia Paskov, Jaime Raldua, Wout Schellaert2026-03-12💻 cs

DeliberationBench: A Normative Benchmark for the Influence of Large Language Models on Users' Views

El artículo presenta DeliberationBench, una nueva métrica normativa que evalúa la influencia de los modelos de lenguaje grandes (LLM) en las opiniones de los usuarios comparándola con encuestas deliberativas democráticas, y demuestra mediante un experimento que estos modelos generan cambios de opinión sustanciales y epistémicamente deseables.

Luke Hewitt, Maximilian Kroner Dale, Paul de Font-Reaulx2026-03-12💻 cs

Prompts and Prayers: the Rise of GPTheology

Este artículo examina el surgimiento de la "GPTheología" como una forma de tecnorreligión en la que la inteligencia artificial es tratada como un oráculo divino, analizando cómo las narrativas comunitarias y las interacciones rituales con modelos de lenguaje reflejan conceptos religiosos tradicionales y plantean desafíos éticos y sociotécnicos sobre la relación entre la humanidad y sus creaciones.

Ioana Cheres, Adrian Groza, Ioana Moldovan, Mick O'Hara, Connell Vaughan2026-03-12💻 cs

Dark Patterns and Consumer Protection Law for App Makers

Este artículo examina cómo los patrones oscuros en el diseño de aplicaciones pueden comprometer la autonomía del consumidor y generar responsabilidad legal, proponiendo estrategias de arquitectura de elección y diseño transparente para que los desarrolladores cumplan con las leyes de protección al consumidor y fomenten la confianza.

Gregory M. Dickinson2026-03-12💻 cs

Law Proofing the Future

Este artículo sostiene que, en lugar de endurecer la legislación para anticiparse a las nuevas tecnologías, el sistema legal debe proteger el futuro mediante la restricción regulatoria y el uso de las herramientas generales y adaptables del derecho consuetudinario, evitando así que las leyes rígidas y específicas sofocuen la innovación y la libertad.

Gregory M. Dickinson2026-03-12💻 cs

Consumer Rights and Algorithms

Este artículo examina la evolución de la ley de protección al consumidor desde sus raíces históricas hasta los desafíos actuales de la era digital, analizando el impacto de la inteligencia artificial y los grandes datos en el mercado, así como las respuestas regulatorias como las leyes de privacidad y la prohibición de patrones oscuros.

Gregory M. Dickinson2026-03-12💻 cs

← Anterior Siguiente →

cs

KVSmooth: Mitigating Hallucination in Multi-modal Large Language Models through Key-Value Smoothing

Dull, Dirty, Dangerous: Understanding the Past, Present, and Future of a Key Motivation for Robotics

ThunderAgent: A Simple, Fast and Program-Aware Agentic Inference System

OmniVTON++: Training-Free Universal Virtual Try-On with Principal Pose Guidance

Similarity-as-Evidence: Calibrating Overconfident VLMs for Interpretable and Label-Efficient Medical Active Learning

Structured Bitmap-to-Mesh Triangulation for Geometry-Aware Discretization of Image-Derived Domains

SIMSPINE: A Biomechanics-Aware Simulation Framework for 3D Spine Motion Annotation and Benchmarking

DRESS and the WL Hierarchy: Climbing One Deletion at a Time

Mind the Way You Select Negative Texts: Pursuing the Distance Consistency in OOD Detection with VLMs

Kraken: Higher-order EM Side-Channel Attacks on DNNs in Near and Far Field

One Model, Many Skills: Parameter-Efficient Fine-Tuning for Multitask Code Analysis

Open Educational Resources: Barriers and Open Issues

μ\muμEd API: Towards A Shared API for EdTech Microservices

Assessing Cognitive Biases in LLMs for Judicial Decision Support: Virtuous Victim and Halo Effects

The science and practice of proportionality in AI risk evaluations

DeliberationBench: A Normative Benchmark for the Influence of Large Language Models on Users' Views

Prompts and Prayers: the Rise of GPTheology

Dark Patterns and Consumer Protection Law for App Makers

Law Proofing the Future

Consumer Rights and Algorithms

$\mu$ Ed API: Towards A Shared API for EdTech Microservices