cs artículos | Gist.Science

StructDamage:A Large Scale Unified Crack and Surface Defect Dataset for Robust Structural Damage Detection

El artículo presenta StructDamage, un nuevo conjunto de datos unificado y a gran escala que agrupa y reetiqueta más de 78.000 imágenes de nueve tipos de superficies para entrenar y evaluar modelos de aprendizaje profundo capaces de detectar y clasificar grietas y defectos estructurales con alta precisión y generalización.

Misbah Ijaz, Saif Ur Rehman Khan, Abd Ur Rehman, Sebastian Vollmer, Andreas Dengel, Muhammad Nabeel Asim2026-03-12💻 cs

Spatial self-supervised Peak Learning and correlation-based Evaluation of peak picking in Mass Spectrometry Imaging

Este artículo presenta un método de aprendizaje auto-supervisado espacial basado en autoencodificadores para la selección de picos en imágenes de espectrometría de masas, junto con una nueva evaluación basada en máscaras de segmentación experta, demostrando un rendimiento superior a los métodos actuales en la identificación de picos con estructura espacial en diversos conjuntos de datos.

Philipp Weigand, Nikolas Ebert, Shad A. Mohammed, Denis Abu Sammour, Carsten Hopf, Oliver Wasenmüller2026-03-12💻 cs

IMTBench: A Multi-Scenario Cross-Modal Collaborative Evaluation Benchmark for In-Image Machine Translation

El artículo presenta IMTBench, un nuevo benchmark de 2.500 muestras que evalúa la traducción automática de texto en imágenes (IIMT) en múltiples escenarios y idiomas mediante métricas de calidad de traducción, preservación del fondo y alineación cruzada entre el texto generado y la imagen renderizada, revelando importantes brechas de rendimiento en los sistemas actuales.

Jiahao Lyu, Pei Fu, Zhenhang Li, Weichao Zeng, Shaojie Zhan, Jiahui Yang, Can Ma, Yu Zhou, Zhenbo Luo, Jian Luan2026-03-12💻 cs

Efficiency vs Demand in AI Electricity: Implications for Post-AGI Scaling

Este estudio integra el sector de la computación de IA en el modelo GCAM para demostrar que el crecimiento futuro de la demanda eléctrica en EE. UU. no es lineal, sino que depende críticamente de la trayectoria de la eficiencia energética y del crecimiento de los ingresos, lo que sugiere que las políticas basadas únicamente en precios tienen un impacto limitado frente a la dinámica de la demanda impulsada por la renta.

Doyi Kim, Jiseok Ahn, Haewon McJeon, Changick Kim2026-03-12💻 cs

UHD Image Deblurring via Autoregressive Flow with Ill-conditioned Constraints

Este artículo propone un nuevo método de flujo autorregresivo con restricciones mal condicionadas que descompone la restauración de imágenes UHD en un proceso progresivo de lo grueso a lo fino, utilizando Flow Matching y regularización de estabilidad numérica para lograr una recuperación detallada eficiente y estable en resoluciones de 4K o superiores.

Yucheng Xin, Dawei Zhao, Xiang Chen, Chen Wu, Pu Wang, Dianjie Lu, Guijuan Zhang, Xiuyi Jia, Zhuoran Zheng2026-03-12💻 cs

Visually-Guided Controllable Medical Image Generation via Fine-Grained Semantic Disentanglement

Este trabajo propone un marco de desentrelado semántico guiado visualmente que, mediante una alineación latente cruzada y un módulo de fusión híbrida, supera las limitaciones de los modelos texto-imagen generales para generar imágenes médicas de alta calidad y control fino, mejorando tanto la síntesis como el rendimiento en tareas de clasificación posteriores.

Xin Huang, Junjie Liang, Qingshan Hou, Peng Cao, Jinzhu Yang, Xiaoli Liu, Osmar R. Zaiane2026-03-12💻 cs

Sparse Task Vector Mixup with Hypernetworks for Efficient Knowledge Transfer in Whole-Slide Image Prognosis

El artículo presenta STEPH, un nuevo esquema que utiliza mezclas de vectores de tareas dispersas y redes hiperpara transferir eficientemente conocimiento generalizable entre diferentes tipos de cáncer en imágenes de diapositivas completas mediante la fusión de modelos, logrando mejoras significativas en la predicción del pronóstico sin necesidad de entrenamiento conjunto a gran escala.

Pei Liu, Xiangxiang Zeng, Tengfei Ma, Yucheng Xing, Xuanbai Ren, Yiping Liu2026-03-12💻 cs

BinWalker: Development and Field Evaluation of a Quadruped Manipulator Platform for Sustainable Litter Collection

Este trabajo presenta y evalúa en campo BinWalker, un robot cuadrúpedo con brazo manipulador diseñado para detectar, recoger y almacenar basura de forma autónoma en terrenos difíciles, ofreciendo una solución robótica sostenible para la limpieza ambiental.

Giulio Turrisi, Angelo Bratta, Giovanni Minelli, Gabriel Fischer Abati, Amir H. Rad, João Carlos Virgolino Soares, Claudio Semini2026-03-12💻 cs

Graphing Inline: Understanding Word-scale Graphics Use in Scientific Papers

Este estudio analiza un corpus de 909 gráficos a escala de palabra extraídos de más de 126,000 artículos científicos para proponer un marco que describe su posición, función comunicativa y representación visual, revelando su escasa adopción actual y destacando oportunidades para mejorar la comunicación académica mediante innovaciones técnicas y administrativas.

Siyu Lu, Yanhan Liu, Shiyu Xu, Ruishi Zou, Chen Ye2026-03-12💻 cs

An Event-Driven E-Skin System with Dynamic Binary Scanning and real time SNN Classification

Este trabajo presenta un sistema de piel electrónica (e-skin) totalmente integrado que combina una matriz táctil de 16x16 con un algoritmo de escaneo binario basado en eventos y una red neuronal de impulsos (SNN) en FPGA, logrando una clasificación en tiempo real de dígitos manuscritos con una eficiencia energética y de datos significativamente mejorada sin sacrificar la precisión.

Gaishan Li, Zhengnan Fu, Anubhab Tripathi, Junyi Yang, Arindam Basu2026-03-12💻 cs

DSFlash: Comprehensive Panoptic Scene Graph Generation in Realtime

El artículo presenta DSFlash, un modelo de baja latencia para la generación de grafos de escena panorámicos que logra un procesamiento en tiempo real de 56 cuadros por segundo sin sacrificar el rendimiento, ofrece información contextual completa y es accesible para entrenarse en hardware antiguo y limitado.

Julian Lorenz, Vladyslav Kovganko, Elias Kohout, Mrunmai Phatak, Daniel Kienzle, Rainer Lienhart2026-03-12💻 cs

In-Memory ADC-Based Nonlinear Activation Quantization for Efficient In-Memory Computing

Este artículo presenta la cuantización no lineal BS-KMQ, un método que suprime valores atípicos en los bordes para reducir los requisitos de resolución de los convertidores analógico-digitales en la computación en memoria, logrando mejoras significativas en precisión, área y eficiencia energética en comparación con técnicas existentes.

Shuai Dong, Junyi Yang, Biyan Zhou, Hongyang Shang, Gourav Datta, Arindam Basu2026-03-12💻 cs

P-GSVC: Layered Progressive 2D Gaussian Splatting for Scalable Image and Video

El artículo presenta P-GSVC, el primer marco de salpicadura gaussiana 2D progresiva en capas que ofrece una solución unificada para la representación escalable de imágenes y videos mediante una estrategia de entrenamiento conjunto que mejora significativamente la calidad de la reconstrucción progresiva en comparación con los métodos secuenciales.

Longan Wang, Yuang Shi, Wei Tsang Ooi2026-03-12💻 cs

CD-Raft: Reducing the Latency of Distributed Consensus in Cross-Domain Sites

El artículo presenta CD-Raft, un protocolo de consenso optimizado para sitios de dominio cruzado que reduce significativamente la latencia mediante la optimización del tiempo de ida y vuelta y la ubicación estratégica del nodo líder, garantizando al mismo tiempo la consistencia fuerte mediante especificación formal TLA+ y validación empírica.

Yangyang Wang, Ziqian Cheng, Yucong Dong, Zichen Xu2026-03-12💻 cs

FP-Predictor - False Positive Prediction for Static Analysis Reports

Este trabajo presenta FP-Predictor, un modelo de Red Neuronal Convolucional sobre Grafos (GCN) que utiliza Grafos de Propiedades de Código para predecir con alta precisión (hasta 100% en pruebas y 96.6% en CryptoAPI-Bench) si los informes de análisis estático de seguridad son falsos positivos, demostrando un razonamiento conservador y seguro a pesar de limitaciones en la representación del flujo de control interprocedimental.

Tom Ohlmer, Michael Schlichtig, Eric Bodden2026-03-12💻 cs

PET-F2I: A Comprehensive Benchmark and Parameter-Efficient Fine-Tuning of LLMs for PET/CT Report Impression Generation

El artículo presenta PET-F2I, un nuevo benchmark de 41.000 informes y un modelo de lenguaje eficiente (PET-F2I-7B) que supera a los modelos existentes en la generación de impresiones diagnósticas para imágenes PET/CT mediante métricas clínicas innovadoras y ajuste fino de parámetros.

Yuchen Liu, Wenbo Zhang, Liling Peng, Yichi Zhang, Yu Fu, Xin Guo, Chao Qu, Yuan Qi, Le Xue2026-03-12💻 cs

TacLoc: Global Tactile Localization on Objects from a Registration Perspective

El artículo presenta TacLoc, un marco novedoso para la localización táctil que formula la estimación de la pose como una tarea de registro de nubes de puntos de un solo disparo, logrando una precisión eficiente sin depender de datos renderizados ni modelos preentrenados.

Zirui Zhang, Boyang Zhang, Fumin Zhang, Huan Yin2026-03-12💻 cs

UniStitch: Unifying Semantic and Geometric Features for Image Stitching

El artículo presenta UniStitch, un marco innovador que unifica características geométricas y semánticas mediante los módulos Neural Point Transformer y Adaptive Mixture of Experts para superar a los métodos actuales en la costura de imágenes.

Yuan Mei, Lang Nie, Kang Liao, Yunqiu Xu, Chunyu Lin, Bin Xiao2026-03-12💻 cs

Safety-critical Control Under Partial Observability: Reach-Avoid POMDP meets Belief Space Control

Este artículo propone una arquitectura de control en capas basada en certificados que opera en el espacio de creencias para resolver POMDPs de alcanzar-evitar, desacoplando la búsqueda de objetivos, la recolección de información y la seguridad mediante funciones de Lyapunov y barrera de control, logrando así garantías probabilísticas y rendimiento en tiempo real superior a los solucionadores existentes.

Matti Vahs, Joris Verhagen, Jana Tumova2026-03-12💻 cs

R4-CGQA: Retrieval-based Vision Language Models for Computer Graphics Image Quality Assessment

El artículo R4-CGQA aborda la evaluación de la calidad de imágenes de gráficos por computadora mediante la creación de un nuevo dataset con descripciones detalladas y la propuesta de un marco de dos corrientes basado en recuperación que mejora significativamente la capacidad de los modelos de lenguaje visuales para juzgar y explicar la calidad visual.

Zhuangzi Li, Jian Jin, Shilv Cai, Weisi Lin2026-03-12💻 cs

← Anterior Siguiente →