cs artículos | Gist.Science

Serving Compound Inference Systems on Datacenter GPUs

JigsawServe es un marco de servicio pionero que optimiza conjuntamente la latencia, la precisión y el costo de los sistemas de inferencia compuestos en GPUs de centros de datos mediante la selección adaptativa de variantes de modelos y la asignación de recursos espacialmente particionados, logrando un aumento de 11,3 veces en la demanda servible en comparación con trabajos anteriores.

Sriram Devata, Rahul Singh, Sarita Adve2026-03-11💻 cs

Granulon: Awakening Pixel-Level Visual Encoders with Adaptive Multi-Granularity Semantics for MLLM

Granulon es un nuevo modelo de lenguaje multimodal basado en DINOv3 que supera las limitaciones de los encoders visuales actuales mediante un controlador de granularidad condicionado por texto y una agregación de tokens adaptativa, logrando un razonamiento unificado de nivel de píxel a concepto global que mejora la precisión y reduce las alucinaciones.

Junyuan Mao, Qiankun Li, Linghao Meng, Zhicheng He, Xinliang Zhou, Kun Wang, Yang Liu, Yueming Jin2026-03-11💻 cs

Time warping with Hellinger elasticity

Este artículo presenta el algoritmo de Alineamiento Temporal Elástico, que resuelve el problema de emparejamiento de series temporales en espacios métricos arbitrarios utilizando una penalización de estiramiento basada en el núcleo de Hellinger y logra una complejidad computacional cúbica.

Yuly Billig2026-03-11💻 cs

Where, What, Why: Toward Explainable 3D-GS Watermarking

Este artículo presenta un marco de marca de agua nativo para la representación 3D Gaussian Splatting que, mediante un módulo de expertos y un mecanismo de seguridad, logra una robustez superior frente a distorsiones y una alta fidelidad visual, al tiempo que ofrece explicabilidad auditable sobre la selección de portadores de la información.

Mingshu Cai, Jiajun Li, Osamu Yoshie, Yuya Ieiri, Yixuan Li2026-03-11💻 cs

Age-Related Differences in the Perception of Eye-Gaze from a Social Robot

Este trabajo investiga cómo las diferencias relacionadas con la edad afectan la percepción de la mirada deíctica en la interacción humano-robot, con el objetivo de mejorar el diseño de señales no verbales adaptativas para robots sociales que asisten a adultos mayores.

Lucas Morillo-Mendez, Martien G. S. Schrooten, Oscar Martinez Mozos2026-03-11💻 cs

VisionCreator-R1: A Reflection-Enhanced Native Visual-Generation Agentic Model

El artículo presenta VisionCreator-R1, un agente nativo de generación visual que incorpora mecanismos de reflexión explícita y un método de entrenamiento de co-optimización reflexión-plan (RPCO) para corregir errores en tiempo real, superando consistentemente a modelos como Gemini2.5Pro en tareas de generación de imágenes individuales y múltiples.

Jinxiang Lai, Wenzhe Zhao, Zexin Lu, Hualei Zhang, Qinyu Yang, Rongwei Quan, Zhimin Li, Shuai Shao, Song Guo, Qinglin Lu2026-03-11💻 cs

HMR-1: Hierarchical Massage Robot with Vision-Language-Model for Embodied Healthcare

Este artículo presenta HMR-1, un robot de masaje jerárquico que integra un modelo de lenguaje visual para la localización de acupuntos y un módulo de control de bajo nivel, respaldado por el nuevo conjunto de datos multimodal MedMassage-12K y un benchmark para evaluar tareas de masaje en la atención sanitaria.

Rongtao Xu, Mingming Yu, Xiaofeng Han, Yu Zhang, Kaiyi Hu, Zhe Feng, Zenghuang Fu, Changwei Wang, Weiliang Meng, Xiaopeng Zhang2026-03-11💻 cs

Clarifying the Compass: A Reflexive Narrative on Entry Barriers into HCI and Aging Research

Este manuscrito reflexiona sobre las barreras interdisciplinarias en la investigación de HCI y el envejecimiento, explorando la desconexión entre las necesidades de los adultos mayores y el diseño tecnológico, así como el viaje personal de los autores hacia una mayor empatía a través del voluntariado en una comunidad de vida senior.

Tianyi Li, Jin Wei-Kocsis2026-03-11💻 cs

Impact of Different Failures on a Robot's Perceived Reliability

Este estudio demuestra que, en la interacción humano-robot, los errores de selección o colocación afectan menos la fiabilidad percibida que los deslizamientos o bloqueos, y que una ejecución exitosa posterior es suficiente para recuperar la confianza sin necesidad de reparaciones sociales explícitas.

Andrew Violette, Zhanxin Wu, Haruki Nishimura, Masha Itkina, Leticia Priebe Rocha, Mark Zolotas, Guy Hoffman, Hadas Kress-Gazit2026-03-11💻 cs

d-QBF with Few Existential Variables Revisited

Este trabajo cierra la brecha de complejidad en el problema d-QBF con pocas variables existenciales demostrando que la dependencia doblemente exponencial es óptima bajo la conjetura ETH para fórmulas generales, mientras que para el caso restringido de dos bloques cuantificadores se presenta un algoritmo casi óptimo con una dependencia exponencial simple.

Andreas Grigorjew, Michael Lampis2026-03-11💻 cs

Computer Vision-Based Vehicle Allotment System using Perspective Mapping

Esta investigación presenta un sistema inteligente de asignación de plazas de aparcamiento basado en visión por computadora y el modelo YOLOv8, que utiliza mapeo de perspectiva inversa para integrar vistas de múltiples cámaras y simular un entorno 3D que guía a los usuarios hacia espacios vacíos de manera eficiente y económica.

Prachi Nandi, Sonakshi Satapathy, Suchismita Chinara2026-03-11💻 cs

HeteroFedSyn: Differentially Private Tabular Data Synthesis for Heterogeneous Federated Settings

HeteroFedSyn es el primer marco de síntesis de datos tabulares con privacidad diferencial diseñado específicamente para entornos federados horizontales heterogéneos, que mediante innovaciones en la selección de márgenes distribuidos logra una utilidad comparable a la síntesis centralizada a pesar de la heterogeneidad de los datos y el ruido adicional.

Xiaochen Li, Fengyu Gao, Xizixiang Wei, Tianhao Wang, Cong Shen, Jing Yang2026-03-11💻 cs

NaviNote: Enabling In-situ Spatial Annotation Authoring to Support Exploration and Navigation for Blind and Low Vision People

El artículo presenta NaviNote, un sistema que combina localización de alta precisión basada en visión y una arquitectura agéntica para permitir a personas ciegas o con baja visión crear anotaciones espaciales in situ y mejorar su navegación en entornos desconocidos.

Ruijia Chen, Yuheng Wu, Charlie Houseago, Filipe Gaspar, Filippo Aleotti, Dorian Gálvez-López, Oliver Johnston, Diego Mazala, Guillermo Garcia-Hernando, Maryam Bandukda, Gabriel Brostow, Jessica Van Brummelen2026-03-11💻 cs

Investigating the Effects of LLM Use on Critical Thinking Under Time Constraints: Access Timing and Time Availability

Un estudio experimental revela que el impacto de los modelos de lenguaje grandes (LLM) en el pensamiento crítico depende fundamentalmente del tiempo disponible y el momento de acceso: mientras que el uso temprano o continuo de LLM mejora el rendimiento bajo presión temporal, lo perjudica cuando hay tiempo suficiente, invirtiendo este efecto cuando el acceso es tardío o nulo.

Jiayin Zhi, Harsh Kumar, Mina Lee2026-03-11💻 cs

HECTOR: Hybrid Editable Compositional Object References for Video Generation

HECTOR es un pipeline generativo que permite un control composicional fino en la generación de videos mediante referencias híbridas de imágenes y videos estáticos o dinámicos, junto con la especificación explícita de trayectorias para cada elemento.

Guofeng Zhang, Angtian Wang, Jacob Zhiyuan Fang, Liming Jiang, Haotian Yang, Alan Yuille, Chongyang Ma2026-03-11💻 cs

DeZent: Decentralized z-Anonymity with Privacy-Preserving Coordination

El artículo presenta deZent, una implementación descentralizada de la anonimización z que utiliza estructuras de conteo estocástico y sumas seguras para coordinar la privacidad en redes de sensores, logrando un rendimiento comparable al enfoque centralizado mientras reduce la sobrecarga de comunicación y la dependencia de una entidad central de confianza.

Carolin Brunn, Florian Tschorsch2026-03-11💻 cs

Adaptive SINDy: Residual Force System Identification Based UAV Disturbance Rejection

Este artículo presenta un método de control adaptativo que integra la identificación de sistemas SINDy con un controlador RLS para rechazar perturbaciones del viento en UAVs, logrando un seguimiento de trayectoria preciso y estable en entornos turbulentos tanto simulados como reales.

Fawad Mehboob, Amir Atef Habel, Roohan Ahmed Khan, Mikhail Derevianchenko, Clement Fortin, Dzmitry Tsetserukou2026-03-11💻 cs

OptBench: An Interactive Workbench for AI/ML-SQL Co-Optimization[Extended Demonstration Proposal]

El artículo presenta OptBench, un entorno interactivo basado en DuckDB que permite construir, comparar y visualizar de manera transparente optimizadores de consultas para cargas de trabajo híbridas que combinan SQL con inferencias de inteligencia artificial y aprendizaje automático.

Jaykumar Tandel, Douglas Oscarson, Jia Zou2026-03-11💻 cs

Touching Emotions, Smelling Shapes: Exploring Tactile, Olfactory and Emotional Cross-sensory Correspondences in Preschool Aged Children

Este estudio con 26 niños en edad preescolar demuestra que existen correspondencias significativas entre el olfato, el tacto y las emociones, revelando estrategias de asociación que ofrecen nuevas perspectivas empíricas y directrices de diseño para tecnologías educativas dirigidas a esta etapa del desarrollo.

Tegan Roberts-Morgan, Min S. Li, Priscilla Lo, Zhuzhi Fan, Dan Bennett, Oussama Metatla2026-03-11💻 cs

Computing $L_\infty$ Hausdorff Distances Under Translations: The Interplay of Dimensionality, Symmetry and Discreteness

Este artículo utiliza la complejidad de precisión fina para analizar cómo la dimensionalidad, la simetría (dirigido vs. no dirigido) y la discretización afectan la complejidad temporal de calcular la distancia de Hausdorff $L_\infty$ bajo traslaciones, revelando asimetrías en los límites superiores e inferiores y reducciones a problemas como 3SUM y MaxConv.

Sebastian Angrick, Kevin Buchin, Geri Gokaj, Marvin Künnemann2026-03-11💻 cs

← Anterior Siguiente →

cs