cs artículos | Gist.Science

Beyond Sequential Distance: Inter-Modal Distance Invariant Position Encoding

El artículo propone DIPE, un mecanismo de codificación posicional que mitiga el desvanecimiento visual en modelos de lenguaje multimodal de gran contexto al eliminar la penalización basada en la distancia entre tokens visuales y textuales, garantizando así una conexión visual estable sin sacrificar el rendimiento en tareas de contexto corto.

Lin Chen, Bolin Ni, Qi Yang, Zili Wang, Kun Ding, Ying Wang, Houwen Peng, Shiming Xiang2026-03-12💻 cs

Exploring Indicators of Developers' Sentiment Perceptions in Student Software Projects

Este estudio, basado en una encuesta con estudiantes de proyectos de software, revela que la percepción del sentimiento en los mensajes es inestable, depende fuertemente del contenido específico del enunciado y muestra correlaciones débiles con factores individuales o del proyecto, lo que sugiere precaución al interpretar los resultados del análisis de sentimiento.

Martin Obaidi, Marc Herrmann, Jendrik Martensen, Jil Klünder, Kurt Schneider2026-03-12💻 cs

FG-CLTP: Fine-Grained Contrastive Language Tactile Pretraining for Robotic Manipulation

El artículo presenta FG-CLTP, un marco de preentrenamiento contrastivo que integra representaciones táctiles de nubes de puntos 3D cuantitativas con lenguaje para superar las limitaciones de los métodos actuales y lograr un control robótico más preciso en tareas de manipulación complejas.

Wenxuan Ma, Chaofan Zhang, Yinghao Cai, Guocai Yao, Shaowei Cui, Shuo Wang2026-03-12💻 cs

Bilevel Layer-Positioning LoRA for Real Image Dehazing

Este artículo presenta BiLaLoRA, un método de desvanecimiento de imágenes reales que combina una pérdida dirigida por texto basada en CLIP para el aprendizaje no supervisado y una estrategia de posicionamiento de capas LoRA de dos niveles para una adaptación eficiente y dirigida.

Yan Zhang, Long Ma, Yuxin Feng, Zhe Huang, Fan Zhou, Zhuo Su2026-03-12💻 cs

RL-Augmented MPC for Non-Gaited Legged and Hybrid Locomotion

Este artículo propone una arquitectura jerárquica que combina aprendizaje por refuerzo y control predictivo de modelo para gestionar la locomoción de robots con patas y híbridos, logrando la transferencia cero-shot de simulación a realidad en un robot Centauro de 120 kg sin necesidad de aleatorización de dominios.

Andrea Patrizi, Carlo Rizzardo, Arturo Laurenzi, Francesco Ruscelli, Luca Rossini, Nikos G. Tsagarakis2026-03-12💻 cs

VoxCare: Studying Natural Communication Behaviors of Hospital Caregivers through Wearable Sensing of Egocentric Audio

El estudio presenta VoxCare, un sistema escalable de sensores auditivos corporales que analiza en tiempo real los patrones de comunicación natural de los profesionales sanitarios sin almacenar audio crudo, revelando cómo estas interacciones reflejan la carga de trabajo y el estrés para mejorar la entrega de cuidados.

Tiantian Feng, Kleanthis Avramidis, Anfeng Xu, Deqi Wang, Brandon M Booth, Shrikanth Narayanan2026-03-12💻 cs

S2D: Sparse to Dense Lifting for 3D Reconstruction with Minimal Inputs

El artículo presenta S2D, una nueva metodología que combina un modelo de difusión eficiente y una estrategia de reconstrucción robusta para transformar nubes de puntos dispersas en representaciones 3D densas de alta calidad mediante mallas de Gauss 3D, logrando así una reconstrucción de alta fidelidad con un número mínimo de vistas de entrada.

Yuzhou Ji, Qijian Tian, He Zhu, Xiaoqi Jiang, Guangzhi Cao, Lizhuang Ma, Yuan Xie, Xin Tan2026-03-12💻 cs

Expressive Boundedness of Authoritative DNS Response Selection

Este artículo formaliza la selección de respuestas de DNS autoritativo como un dominio semántico acotado por las restricciones del protocolo, demostrando que cualquier mecanismo de selección en tiempo de consulta puede reducirse a una forma normal finita y estableciendo una estructura algebraica que permite un razonamiento preciso sobre la equivalencia y la expresividad entre sistemas heterogéneos.

Chris Bertinato2026-03-12💻 cs

Data Augmentation and Convolutional Network Architecture Influence on Distributed Learning

Este estudio analiza cómo las arquitecturas de redes neuronales convolucionales influyen en la precisión del modelo y examina factores adicionales que afectan la eficiencia computacional en entornos de aprendizaje distribuido, proporcionando perspectivas clave para optimizar su despliegue en escenarios intensivos de recursos.

Victor Forattini Jansen, Emanuel Teixeira Martins, Yasmin Souza Lima, Flavio de Oliveira Silva, Rodrigo Moreira, Larissa Ferreira Rodrigues Moreira2026-03-12💻 cs

Training-Free Multi-Step Inference for Target Speaker Extraction

Este artículo propone un método de inferencia multi-paso sin entrenamiento para la extracción de hablantes objetivo que, utilizando un modelo preentrenado congelado, refina iterativamente la estimación mediante interpolación y selección de candidatos, optimizando métricas intrusivas o no intrusivas (o una combinación de ambas) para lograr mejoras consistentes y un control adaptable en el despliegue práctico.

Zhenghai You, Ying Shi, Lantian Li, Dong Wang2026-03-12💻 cs

Novel Architecture of RPA In Oral Cancer Lesion Detection

Este estudio presenta una nueva arquitectura de automatización robótica de procesos (RPA) para la detección de lesiones de cáncer oral que, mediante el uso de patrones de diseño y procesamiento por lotes, logra una mejora de eficiencia de 60 a 100 veces en comparación con los métodos estándar.

Revana Magdy, Joy Naoum, Ali Hamdi2026-03-12💻 cs

Lifelong Imitation Learning with Multimodal Latent Replay and Incremental Adjustment

Este trabajo presenta un marco de aprendizaje por imitación de por vida que utiliza un espacio latente multimodal para la reproducción de experiencias y un mecanismo de ajuste incremental para estabilizar la adaptación, logrando un nuevo estado del arte en los benchmarks LIBERO con mejoras significativas en el rendimiento y una reducción sustancial del olvido catastrófico.

Fanqi Yu, Matteo Tiezzi, Tommaso Apicella, Cigdem Beyan, Vittorio Murino2026-03-12💻 cs

Huffman-Bucket Sketch: A Simple $O(m)$ Algorithm for Cardinality Estimation

Este artículo presenta la Huffman-Bucket Sketch (HBS), una estructura de datos simple y fusionable que comprime sin pérdidas un HyperLogLog a un espacio óptimo de $O(m+\log n)$ bits mediante codificación Huffman dinámica, manteniendo actualizaciones de tiempo constante y reduciendo significativamente los requisitos de memoria.

Matti Karppa2026-03-12💻 cs

Bridging the Skill Gap in Clinical CBCT Interpretation with CBCTRepD

El sistema CBCTRepD, desarrollado con un conjunto de datos de 7.408 estudios, mejora la interpretación de tomografías cónicas (CBCT) orales y maxilofaciales al generar informes de alta calidad que asisten a radiólogos de todos los niveles en la reducción de errores y la estandarización de los diagnósticos.

Qinxin Wu, Fucheng Niu, Hengchuan Zhu, Yifan Sun, Ye Shen, Xu Li, Han Wu, Leqi Liu, Zhiwen Pan, Zuozhu Liu, Fudong Zhu, Bin Feng2026-03-12💻 cs

STADA: Specification-based Testing for Autonomous Driving Agents

El artículo presenta STADA, un marco de generación de pruebas basado en especificaciones que utiliza lógica temporal (LTLf) para crear sistemáticamente escenarios de conducción autónoma que superan significativamente a los métodos existentes en cobertura y eficiencia.

Joy Saha, Trey Woodlief, Sebastian Elbaum, Matthew B. Dwyer2026-03-12💻 cs

Simple minimally unsatisfiable subsets of 2-CNFs

Este artículo presenta un procedimiento lineal para reconocer subconjuntos mínimamente insatisfacibles (MUS) en fórmulas 2-CNF, extiende resultados sobre la complejidad NP de ciertos casos y demuestra que encontrar o decidir la existencia de MUSs que contengan una o dos cláusulas unitarias es resoluble en tiempo polinómico.

Oliver Kullmann, Edward Clewer2026-03-12💻 cs

Contrastive learning-based video quality assessment-jointed video vision transformer for video recognition

Este artículo propone SSL-V3, un modelo basado en aprendizaje auto-supervisado y transformadores de visión que integra la evaluación de calidad de video sin referencia para mejorar la clasificación de videos, demostrando una alta precisión en datasets de salud como I-CONECT al abordar la escasez de etiquetas de calidad.

Jian Sun, Mohammad H. Mahoor2026-03-12💻 cs

Med-DualLoRA: Local Adaptation of Foundation Models for 3D Cardiac MRI

El artículo presenta Med-DualLoRA, un marco de ajuste fino federado y eficiente en parámetros que adapta modelos fundacionales a imágenes de resonancia magnética cardíaca 3D mediante la descomposición aditiva de adaptadores globales y locales, logrando un mejor rendimiento y privacidad en entornos clínicos heterogéneos con menor costo de comunicación.

Joan Perramon-Llussà, Amelia Jiménez-Sánchez, Grzegorz Skorupko, Fotis Avgoustidis, Carlos Martín-Isla, Karim Lekadir, Polyxeni Gkontra2026-03-12💻 cs

VCR: Variance-Driven Channel Recalibration for Robust Low-Light Enhancement

El artículo presenta VCR, un marco novedoso para la mejora de imágenes en baja iluminación que utiliza recalibración de canales impulsada por la varianza y alineación de distribuciones de color para superar las limitaciones de consistencia y fidelidad cromática de los métodos existentes.

Zhixin Cheng, Fangwen Zhang, Xiaotian Yin, Baoqun Yin, Haodian Wang2026-03-12💻 cs

Report for NSF Workshop on Algorithm-Hardware Co-design for Medical Applications

Este informe resume los hallazgos y recomendaciones estratégicas del taller del NSF sobre el diseño conjunto de algoritmos y hardware para aplicaciones médicas, el cual abogó por un cambio fundamental en el desarrollo de tecnologías sanitarias mediante inversiones en infraestructuras compartidas, sistemas conscientes de los flujos de trabajo clínicos y ecosistemas de validación escalables para garantizar plataformas seguras y resilientes.

Peipei Zhou, Zheng Dong, Insup Lee, Aidong Zhang, Robert Dick, Majid Sarrafzadeh, Xiaodong Wu, Weisong Shi, Zhuoping Yang, Jingtong Hu, Yiyu Shi2026-03-12💻 cs

← Anterior Siguiente →

cs