DivCon: Divide and Conquer for Complex Numerical and Spatial Reasoning in Text-to-Image Generation

El artículo presenta DivCon, un enfoque de dividir y conquistar que mejora la generación de imágenes texto-a-imagen al desacoplar la predicción de la disposición espacial y la síntesis de objetos en subtasas manejables, permitiendo a modelos de lenguaje ligeros lograr una precisión superior y una mejor calidad perceptual en prompts complejos con múltiples objetos.

Yuhao Jia, Wenhan Tan2026-03-10💻 cs

Deepfake Generation and Detection: A Benchmark and Survey

Esta encuesta presenta una revisión integral y un benchmark de las tecnologías más avanzadas para la generación y detección de deepfakes, abarcando definiciones de tareas, conjuntos de datos, métricas, cuatro campos representativos (intercambio de rostros, reenactment, generación de rostros parlantes y edición de atributos faciales) y sus desafíos futuros.

Gan Pei, Jiangning Zhang, Menghan Hu, Zhenyu Zhang, Chengjie Wang, Yunsheng Wu, Guangtao Zhai, Jian Yang, Dacheng Tao2026-03-10💻 cs

Goldilocks Test Sets for Face Verification

Los autores proponen tres nuevos conjuntos de prueba de alta calidad denominados Hadrian, Eclipse y ND-Twins para evaluar la verificación facial en escenarios desafiantes como diferencias en atributos faciales y similitud entre individuos, evitando la degradación artificial de las imágenes y aplicando reglas estrictas para garantizar una evaluación equilibrada y rigurosa.

Haiyu Wu, Sicong Tian, Aman Bhatta, Jacob Gutierrez, Grace Bezold, Genesis Argueta, Karl Ricanek Jr., Michael C. King, Kevin W. Bowyer2026-03-10💻 cs

On Polynomial-Time Decidability of k-Negations Fragments of First-Order Theories

Este artículo presenta un marco genérico que garantiza la decidibilidad en tiempo polinómico de fragmentos de teorías de primer orden con un número fijo de negaciones, demostrando su aplicabilidad para probar la tractabilidad de la aritmética débil de Presburger y otras teorías relacionadas, en contraste con la dureza NP de fragmentos más restringidos de la aritmética de Presburger estándar.

Christoph Haase, Alessio Mansutti, Amaury Pouly2026-03-10💻 cs

A 1.6-fJ/Spike Subthreshold Analog Spiking Neuron in 28 nm CMOS

Este trabajo presenta un diseño de neurona analógica Leaky Integrate-and-Fire en tecnología CMOS de 28 nm que consume solo 1.61 fJ por espiga, logrando una frecuencia máxima de 300 kHz y una precisión del 82.5% en el conjunto de datos MNIST, demostrando así la viabilidad de sistemas neuromórficos de bajo consumo para aplicaciones de aprendizaje automático embebido.

Marwan Besrour, Takwa Omrani, Jacob Lavoie, Gabriel Martin-Hardy, Esmaeil Ranjbar Koleibi, Jeremy Menard, Konin Koua, Philippe Marcoux, Mounir Boukadoum, Rejean Fontaine2026-03-10💻 cs

Multimodal Laryngoscopic Video Analysis for Assisted Diagnosis of Vocal Fold Paralysis

Este trabajo presenta el Sistema de Análisis Multimodal de Video Laringoscópico (MLVAS), una herramienta innovadora que combina datos de audio y video mediante detección de glotis, refinamiento de segmentación basado en difusión y extracción de características acústicas y visuales para asistir en el diagnóstico objetivo y automatizado de la parálisis de las cuerdas vocales.

Yucong Zhang, Xin Zou, Jinshan Yang, Wenjun Chen, Juan Liu, Faya Liang, Ming Li2026-03-10💻 cs

InterMind: Doctor-Patient-Family Interactive Depression Assessment Empowered by Large Language Models

El artículo presenta InterMind, un sistema basado en modelos de lenguaje grande que mejora la evaluación de la depresión mediante la interacción entre médicos, pacientes y familiares, integrando técnicas como la generación aumentada por recuperación y la cadena de pensamiento para ofrecer diagnósticos más precisos, interpretables y libres de alucinaciones.

Zhiyuan Zhou, Jilong Liu, Sanwang Wang, Shijie Hao, Yanrong Guo, Richang Hong2026-03-10💻 cs

Diagnosing and Repairing Distributed Routing Configurations Using Selective Symbolic Simulation

El sistema S^2Sim automatiza el diagnóstico y la reparación de configuraciones de enrutamiento distribuido mediante la simulación simbólica selectiva de variantes para identificar errores y generar parches que cumplan con los requisitos de intención, demostrando su eficacia en redes de gran escala.

Rulan Yang, Gao Han, Hanyang Shao, Xiaoqiang Zheng, Xing Fang, Ziyi Wang, Lizhao You, Ruiting Zhou, Linghe Kong, Ennan Zhai, Qiao Xiang, Jiwu Shu2026-03-10💻 cs

Optimal Mediation Mechanism in Bilateral Trade

Este artículo estudia el diseño de mecanismos de mediación que maximizan los ingresos en el comercio bilateral con valoraciones interdependientes, demostrando una trilema de imposibilidad y caracterizando mecanismos óptimos bajo condiciones de relajación que revelan estructuras de umbral que generan efectos de mercado de limones o asignan más información a los compradores de menor tipo.

Zhikang Fan, Weiran Shen, Shaojie Tang, Yao Wang2026-03-10💻 cs