Semi-Supervised Biomedical Image Segmentation via Diffusion Models and Teacher-Student Co-Training

Este artículo presenta un marco novedoso de aprendizaje semi-supervisado para la segmentación de imágenes biomédicas que combina modelos de difusión y un entrenamiento colaborativo maestro-alumno, logrando superar a las técnicas actuales al generar máscaras de segmentación precisas a partir de datos limitados etiquetados.

Luca Ciampi, Gabriele Lagani, Giuseppe Amato, Fabrizio FalchiWed, 11 Ma💻 cs

Zooming In on Fakes: A Novel Dataset for Localized AI-Generated Image Detection with Forgery Amplification Approach

Este trabajo presenta BR-Gen, un nuevo dataset a gran escala de imágenes con manipulaciones localizadas que abarca escenas completas, junto con NFA-ViT, un modelo basado en transformadores que amplifica las huellas de falsificación para mejorar la detección y generalización de alteraciones de IA en imágenes.

Lvpan Cai, Haowei Wang, Jiayi Ji, Yanshu Zhoumen, Shen Chen, Taiping Yao, Xiaoshuai SunWed, 11 Ma💻 cs

Scalable and Performant Data Loading

El artículo presenta SPDL, una biblioteca de código abierto y agnóstica a frameworks que optimiza la carga de datos en GPU liberando el bloqueo del intérprete global (GIL) de Python, logrando una velocidad de iteración un 74% superior y un menor consumo de recursos en comparación con el DataLoader de PyTorch, con mejoras adicionales al adoptar Python sin GIL.

Moto Hira, Christian Puhrsch, Valentin Andrei, Roman Malinovskyy, Gael Le Lan, Abhinandan Krishnan, Joseph Cummings, Victor Bourgin, Olga Gerasimova, Miguel Martin, Gokul Gunasekaran, Yuta Inoue, Alex J Turner, Raghuraman KrishnamoorthiWed, 11 Ma💻 cs

MARRS: Masked Autoregressive Unit-based Reaction Synthesis

El trabajo presenta MARRS, un marco novedoso que genera reacciones humanas coordinadas y detalladas mediante representaciones continuas, utilizando un VAE dividido por unidades corporales, fusión condicionada por acciones, modulación adaptativa entre unidades y un modelo de difusión con predictores MLP independientes para superar las limitaciones de los enfoques autoregresivos basados en cuantización vectorial.

Yabiao Wang, Shuo Wang, Jiangning Zhang, Jiafu Wu, Qingdong He, Yong LiuWed, 11 Ma💻 cs

Evaluating Large Language Models for Multilingual Vulnerability Detection at Dual Granularities

Este estudio evalúa empíricamente la eficacia de modelos de lenguaje preentrenados y grandes modelos de lenguaje en la detección de vulnerabilidades multilingües a nivel de función y línea, demostrando que los grandes modelos de lenguaje, especialmente GPT-4o, superan significativamente a los enfoques anteriores al identificar con mayor precisión vulnerabilidades críticas en múltiples lenguajes de programación.

Honglin Shu, Michael Fu, Junji Yu, Dong Wang, Chakkrit Tantithamthavorn, Junjie Chen, Yasutaka KameiWed, 11 Ma💻 cs

SpikeSMOKE: Spiking Neural Networks for Monocular 3D Object Detection with Cross-Scale Gated Coding

El artículo presenta SpikeSMOKE, una arquitectura de redes neuronales de espigas para la detección 3D de objetos monocular que, mediante un nuevo mecanismo de codificación de compuertas de escala cruzada y bloques residuales ligeros, logra una alta precisión en conjuntos de datos como KITTI y NuScenes mientras reduce significativamente el consumo energético y la complejidad computacional en comparación con métodos tradicionales.

Xuemei Chen, Huamin Wang, Jing Peng, Hangchi Shen, Shukai Duan, Shiping Wen, Tingwen HuangWed, 11 Ma💻 cs

A Decade of News Forum Interactions: Threaded Conversations, Signed Votes, and Topical Tags

Este artículo presenta un conjunto de datos a gran escala y longitudinal que abarca una década (2013-2022) de interacciones en el foro de noticias del periódico austriaco DerStandard, incluyendo más de 75 millones de comentarios y 400 millones de votos anonimizados y representados mediante vectores para preservar la privacidad, facilitando así investigaciones sobre dinámicas de discusión y análisis semántico en alemán.

Emma Fraxanet, Vicenç Gómez, Andreas Kaltenbrunner, Max PellertWed, 11 Ma💻 cs

Improving Large Vision-Language Models' Understanding for Flow Field Data

El artículo presenta FieldLVLM, un marco innovador que mejora la comprensión de los Grandes Modelos Visuales-Lingüísticos sobre datos de campos científicos mediante una estrategia de generación de lenguaje específica del dominio y un ajuste de modelos multimodales con compresión de datos, logrando un rendimiento superior en tareas de investigación científica.

Xiaomei Zhang, Hanyu Zheng, Xiangyu Zhu, Jinghuan Wei, Junhong Zou, Zhen Lei, Zhaoxiang ZhangWed, 11 Ma💻 cs

CoRe-GS: Coarse-to-Refined Gaussian Splatting with Semantic Object Focus

El artículo presenta CoRe-GS, un marco de dispersión gaussiana de lo grueso a lo fino que optimiza selectivamente solo los objetos de interés en una escena, logrando una reconstrucción 3D más rápida y de mayor calidad al reducir los costos computacionales innecesarios para aplicaciones robóticas.

Hannah Schieber, Dominik Frischmann, Victor Schaack, Simon Boche, Angela Schoellig, Stefan Leutenegger, Daniel RothWed, 11 Ma💻 cs

Floating-Point Usage on GitHub: A Large-Scale Study of Statically Typed Languages

Este estudio presenta el primer análisis a gran escala del uso de aritmética de punto flotante en repositorios públicos de GitHub para lenguajes estáticamente tipados, revelando que, aunque algunos benchmarks existentes son representativos, el código real presenta matices que requieren nuevas evaluaciones y proporcionando un conjunto de datos de 10 millones de funciones para guiar el desarrollo futuro de técnicas de razonamiento.

Andrea Gilot, Tobias Wrigstad, Eva DarulovaWed, 11 Ma💻 cs

VocSegMRI: Multimodal Learning for Precise Vocal Tract Segmentation in Real-time MRI

El artículo presenta VocSegMRI, un marco de aprendizaje multimodal que integra señales visuales, acústicas y fonológicas mediante fusión por atención cruzada y aprendizaje contrastivo para lograr una segmentación precisa y robusta del tracto vocal en imágenes de resonancia magnética en tiempo real, superando a los métodos unimodales existentes.

Daiqi Liu, Tomás Arias-Vergara, Johannes Enk, Fangxu Xing, Maureen Stone, Jerry L. Prince, Jana Hutter, Andreas Maier, Jonghye Woo, Paula Andrea Pérez-ToroWed, 11 Ma💻 cs

Multi-Quadruped Cooperative Object Transport: Learning Decentralized Pinch-Lift-Move

Este artículo presenta un enfoque de aprendizaje descentralizado que permite a equipos de robots cuadrúpedos cooperar mediante contacto físico para transportar objetos no manipulables, utilizando una arquitectura jerárquica y un diseño de recompensas que fomenta un comportamiento de agarre rígido sin necesidad de comunicación ni acoplamiento mecánico.

Bikram Pandit, Aayam Kumar Shrestha, Alan FernWed, 11 Ma💻 cs