cs artículos | Gist.Science

Distilling LLM Semantic Priors into Encoder-Only Multi-Talker ASR with Talker-Count Routing

Este trabajo propone un marco de reconocimiento automático de habla multi-parlante basado únicamente en un codificador que destila las priores semánticas de un modelo de lenguaje grande para regularizar las representaciones de habla mezclada y utiliza un cabezal de conteo de hablantes para la selección dinámica de ramas, logrando un rendimiento comparable o superior a los sistemas basados en LLM con una menor complejidad computacional.

Hao Shi, Yusuke Fujita, Roman Koshkin, Mengjie Zhao, Yuan Gao, Lianbo Liu, Yui Sudo2026-03-12💻 cs

Exact Interpolation under Noise: A Reproducible Comparison of Clough-Tocher and Multiquadric RBF Surfaces

Este artículo presenta una comparación reproducible de los interpolantes Clough-Tocher y Multicúbrico RBF, demostrando que, aunque el ruido degrada el rendimiento de ambos métodos, el interpolante cúbico ofrece mayor estabilidad y permite recuperar comportamientos de procesos físicos a partir de mediciones ruidosas en ingeniería ambiental.

Mirkan Emir Sancak2026-03-12💻 cs

Layer Consistency Matters: Elegant Latent Transition Discrepancy for Generalizable Synthetic Image Detection

Este trabajo propone un nuevo método de detección de imágenes sintéticas llamado "discrepancia de transición latente" (LTD), que aprovecha las inconsistencias en la coherencia estructural y la atención semántica entre capas de redes neuronales para lograr una detección más precisa, generalizable y robusta frente a imágenes generadas por IA.

Yawen Yang, Feng Li, Shuqi Kong, Yunfeng Diao, Xinjian Gao, Zenglin Shi, Meng Wang2026-03-12💻 cs

HyPER-GAN: Hybrid Patch-Based Image-to-Image Translation for Real-Time Photorealism Enhancement

El artículo presenta HyPER-GAN, un modelo generativo ligero basado en parches híbridos que mejora la fotorealidad de datos sintéticos en tiempo real mediante una estrategia de entrenamiento que combina imágenes emparejadas y parches del mundo real, superando a los métodos actuales en latencia, realismo visual y consistencia semántica.

Stefanos Pasios, Nikos Nikolaidis2026-03-12💻 cs

TopGen: Learning Structural Layouts and Cross-Fields for Quadrilateral Mesh Generation

El artículo presenta TopGen, un marco de aprendizaje robusto y eficiente que genera mallas cuadriláteras de alta calidad mediante la predicción simultánea de diseños estructurales y campos cruzados, superando las limitaciones de los métodos tradicionales y basándose en un nuevo conjunto de datos a gran escala llamado TopGen-220K.

Yuguang Chen, Xinhai Liu, Xiangyu Zhu, Yiling Zhu, Zhuo Chen, Dongyu Zhang, Chunchao Guo2026-03-12💻 cs

An Approach for Safe and Secure Software Protection Supported by Symbolic Execution

Este artículo presenta un nuevo método de protección de software para sistemas de control industrial que utiliza funciones físicamente no clonables (PUF) para vincular el programa al hardware y la ejecución simbólica para garantizar la seguridad y la preservación de las propiedades de seguridad ante intentos de ingeniería inversa o ejecución en máquinas no autorizadas.

Daniel Dorfmeister, Flavio Ferrarotti, Bernhard Fischer, Evelyn Haslinger, Rudolf Ramler, Markus Zimmermann2026-03-12💻 cs

Learning Bimanual Cloth Manipulation with Vision-based Tactile Sensing via Single Robotic Arm

Este artículo presenta Touch G.O.G., un marco de percepción y control basado en un sensor táctil visual que permite a un solo brazo robótico manipular y desplegar telas deformables con alta precisión mediante el uso de modelos de visión y datos sintéticos.

Dongmyoung Lee, Wei Chen, Xiaoshuai Chen, Rui Zong, Petar Kormushev2026-03-12💻 cs

AdaClearGrasp: Learning Adaptive Clearing for Zero-Shot Robust Dexterous Grasping in Densely Cluttered Environments

El artículo presenta AdaClearGrasp, un marco de decisión y ejecución en bucle cerrado que combina modelos de visión-idioma y aprendizaje por refuerzo para permitir a los robots dexteros decidir adaptativamente entre agarrar directamente o despejar obstáculos, logrando así un agarre robusto y de generalización cero en entornos densamente cluttered.

Zixuan Chen, Wenquan Zhang, Jing Fang, Ruiming Zeng, Zhixuan Xu, Yiwen Hou, Xinke Wang, Jieqi Shi, Jing Huo, Yang Gao2026-03-12💻 cs

QuantumX: an experience for the consolidation of Quantum Computing and Quantum Software Engineering as an emerging discipline

Este artículo presenta la primera edición de la pista QuantumX en JISBD 2025, un evento pionero que consolidó la intersección entre la Computación Cuántica y la Ingeniería de Software en España, fomentó la colaboración de redes de investigación nacionales e iberoamericanas y definió desafíos futuros para el desarrollo de esta disciplina emergente.

Juan M. Murillo, Ignacio García Rodríguez de Guzmán, Enrique Moguel, Javier Romero-Álvarez, Jaime Alvarado-Valiente, Álvaro M. Aparicio-Morales, Jose Garcia-Alonso, Ana Díaz Muñoz, Eduardo Fernández-Medina, Francisco Chicano, Carlos Canal, José Daniel Viqueira, Sebastián Villarroya, Eduardo Gutiérrez, Adrián Romero-Flores, Alfonso E. Márquez-Chamorro, Antonio Ruiz-Cortes, Cyrille YetuYetu Kesiku, Pedro Sánchez, Diego Alonso Cáceres, Lidia Sánchez-González, Fernando Plou2026-03-12💻 cs

A Hypergraph-Based Framework for Exploratory Business Intelligence

Este artículo presenta ExBI, un sistema innovador basado en hipergrafos que supera las limitaciones de los sistemas de Inteligencia de Negocios tradicionales mediante esquemas dinámicos y reutilización de vistas, logrando aceleraciones significativas (hasta 230 veces) y una alta precisión en flujos de trabajo exploratorios a gran escala.

Yunkai Lou, Shunyang Li, Longbin Lai, Jianke Yu, Wenyuan Yu, Ying Zhang2026-03-12💻 cs

Double-Precision Matrix Multiplication Emulation via Ozaki-II Scheme with FP8 Quantization

Este artículo presenta un método novedoso para emular la multiplicación de matrices de doble precisión (FP64) utilizando unidades de multiplicación-matriz en FP8 mediante el esquema Ozaki-II, superando las limitaciones de las implementaciones anteriores y reduciendo significativamente el número de operaciones necesarias en comparación con el esquema Ozaki-I.

Yuki Uchino, Katsuhisa Ozaki, Toshiyuki Imamura2026-03-12💻 cs

Q-StaR: A Quasi-Static Routing Scheme for NoCs

El artículo presenta Q-StaR, un esquema de enrutamiento cuasi-estático para redes en chip que utiliza el análisis de la topología y la distribución del tráfico para guiar la selección de rutas en tiempo real, logrando un equilibrio de carga superior y reduciendo significativamente la latencia en comparación con el enrutamiento por orden de dimensión tradicional.

Yang Zhang, Yiren Zhao, Xu Wang, Fengyuan Ren2026-03-12💻 cs

Splat2Real: Novel-view Scaling for Physical AI with 3D Gaussian Splatting

El artículo presenta Splat2Real, un marco de preentrenamiento de profundidad monoculares que utiliza 3D Gaussian Splatting y un currículo de selección de vistas basado en cobertura y novedad (CN-Coverage) para mejorar la robustez ante cambios de perspectiva en la IA física, demostrando que la calidad de las vistas seleccionadas es más crítica que la cantidad bruta para la estabilidad del rendimiento.

Hansol Lim, Jongseong Brad Choi2026-03-12💻 cs

Density-Dependent Graph Orientation and Coloring in Scalable MPC

Este artículo presenta algoritmos de computación masivamente paralela (MPC) en el régimen de memoria fuertemente sublineal que orientan y colorean grafos en $poly(\log\log n)$ rondas en función de la densidad de su subgrafo más denso, superando así la barrera de complejidad de rondas de $\tilde{\Theta}(\sqrt{\log n})$ establecida por trabajos anteriores.

Mohsen Ghaffari, Christoph Grunau2026-03-12💻 cs

ESG Reporting Lifecycle Management with Large Language Models and AI Agents

Este artículo presenta un marco de ciclo de vida de informes ESG impulsado por agentes de IA y modelos de lenguaje grande que transforma la generación de reportes de un proceso estático a un sistema dinámico y adaptable mediante la integración de múltiples agentes para la extracción, verificación y actualización de datos de sostenibilidad.

Thong Hoang, Mykhailo Klymenko, Xiwei Xu, Shidong Pan, Yi Ding, Xushuo Tang, Zhengyi Yang, Jieke Shi, David Lo2026-03-12💻 cs

Less is More: Decoder-Free Masked Modeling for Efficient Skeleton Representation Learning

El artículo presenta SLiM, un marco unificado innovador que elimina el decodificador en el aprendizaje de representaciones esqueléticas mediante una combinación de modelado enmascarado y aprendizaje contrastivo, logrando un rendimiento superior al estado del arte con una reducción significativa en los costos computacionales.

Jeonghyeok Do, Yun Chen, Geunhyuk Youk, Munchurl Kim2026-03-12💻 cs

How To Embed Matters: Evaluation of EO Embedding Design Choices

Este artículo presenta un análisis sistemático de las decisiones de diseño en la creación de representaciones incrustadas para modelos fundacionales geoespaciales, demostrando que es posible generar representaciones fijas más de 500 veces más pequeñas que los datos brutos sin sacrificar el rendimiento en diversas tareas de observación terrestre.

Luis Gilch, Isabelle Wittmann, Maximilian Nitsche, Johannes Jakubik, Arne Ewald, Thomas Brunschwiler2026-03-12💻 cs

STM32-Based Smart Waste Bin for Hygienic Disposal Using Embedded Sensing and Automated Control

Este artículo presenta el diseño y la implementación de un contenedor de residuos automático e higiénico basado en un microcontrolador STM32, que utiliza sensores ultrasónicos para detectar la presencia de usuarios y monitorear el nivel de llenado, controlando un motor servo para abrir la tapa sin contacto y ofreciendo retroalimentación en tiempo real mediante una pantalla OLED.

Mohammed Aman Bhuiyan, Aritra Islam Saswato, Md. Misbah Khan, Anish Paul, Ahmed Faizul Haque Dhrubo, Mohammad Abdul Qayum2026-03-12💻 cs

Terminal Is All You Need: Design Properties for Human-AI Agent Collaboration

El artículo sostiene que la terminal, y no las interfaces gráficas, es el paradigma ideal para la colaboración humano-IA debido a su compatibilidad representacional, transparencia y baja barrera de entrada, propiedades que cualquier modalidad de interfaz debe replicar deliberadamente para ser efectiva.

Alexandre De Masi2026-03-12💻 cs

Breaking User-Centric Agency: A Tri-Party Framework for Agent-Based Recommendation

Este trabajo presenta TriRec, el primer marco de recomendación basado en agentes LLM de tres partes que coordina la utilidad del usuario, la exposición de los artículos y la equidad de la plataforma mediante una arquitectura de dos etapas, logrando mejoras simultáneas en precisión, equidad y utilidad sin sacrificar la relevancia.

Yaxin Gong, Chongming Gao, Chenxiao Fan, Wenjie Wang, Fuli Feng, Xiangnan He2026-03-12💻 cs

← Anterior Siguiente →