UniBYD: A Unified Framework for Learning Robotic Manipulation Across Embodiments Beyond Imitation of Human Demonstrations

El artículo presenta UniBYD, un marco unificado que supera las limitaciones de la imitación humana en la manipulación robótica mediante un algoritmo de aprendizaje por refuerzo dinámico y una representación morfológica unificada, logrando un rendimiento superior al estado del arte al adaptar las políticas a las características físicas específicas de diversos robots.

Tingyu Yuan, Biaoliang Guan, Wen Ye, Ziyan Tian, Yi Yang, Weijie Zhou, Zhaowen Li, Yan Huang, Peng Wang, Chaoyang Zhao, Jinqiao WangWed, 11 Ma💻 cs

Taming Preference Mode Collapse via Directional Decoupling Alignment in Diffusion Reinforcement Learning

Este trabajo introduce DivGenBench para cuantificar el colapso de modo de preferencia en modelos de difusión y propone D²-Align, un marco de alineación que mitiga este problema mediante la corrección direccional de la señal de recompensa para preservar la diversidad generativa sin sacrificar la calidad.

Chubin Chen, Sujie Hu, Jiashu Zhu, Meiqi Wu, Jintao Chen, Yanxun Li, Nisha Huang, Chengyu Fang, Jiahong Wu, Xiangxiang Chu, Xiu LiWed, 11 Ma💻 cs

A Tale of 1001 LoC: Potential Runtime Error-Guided Specification Synthesis for Verifying Large-Scale Programs

Este artículo presenta Preguss, un marco modular que combina análisis estático y modelos de lenguaje grandes para sintetizar especificaciones formales y verificar automáticamente la ausencia de errores en tiempo de ejecución en programas a gran escala, reduciendo significativamente el esfuerzo humano necesario.

Zhongyi Wang, Tengjie Lin, Mingshuai Chen, Haokun Li, Mingqi Yang, Xiao Yi, Shengchao Qin, Yixing Luo, Xiaofeng Li, Bin Gu, Liqiang Lu, Jianwei YinWed, 11 Ma💻 cs

CovertComBench: A First Domain-Specific Testbed for LLMs in Wireless Covert Communication

El artículo presenta CovertComBench, un nuevo banco de pruebas especializado para evaluar las capacidades de los Grandes Modelos de Lenguaje (LLM) en comunicaciones encubiertas inalámbricas, revelando que, aunque son eficaces en tareas conceptuales y de generación de código, carecen de la fiabilidad necesaria para realizar las derivaciones matemáticas complejas exigidas por las garantías de seguridad.

Zhaozhi Liu, Jiaxin Chen, Yuanai Xie, Yuna Jiang, Minrui Xu, Xiao Zhang, Pan Lai, Zan ZhouWed, 11 Ma💻 cs

Optimal conversion from Rényi Differential Privacy to ff-Differential Privacy

Este artículo demuestra que la regla de conversión basada en la intersección de las regiones de privacidad de RDP de un solo orden es óptima y fundamental para transformar perfiles de Privacidad Diferencial de Rényi en funciones de trade-off de ff-Privacidad Diferencial, estableciendo el límite superior de cualquier conversión de caja negra.

Anneliese Riess, Juan Felipe Gomez, Flavio du Pin Calmon, Julia Anne Schnabel, Georgios KaissisWed, 11 Ma💻 cs

Pathwise Test-Time Correction for Autoregressive Long Video Generation

Este artículo presenta la Corrección en Tiempo de Prueba (TTC), un método libre de entrenamiento que utiliza el primer cuadro como ancla estable para corregir la deriva en la generación de videos largos con modelos autoregresivos destilados, logrando una calidad comparable a métodos basados en entrenamiento con un costo computacional mínimo.

Xunzhi Xiang, Zixuan Duan, Guiyu Zhang, Haiyu Zhang, Zhe Gao, Junta Wu, Shaofeng Zhang, Tengfei Wang, Qi Fan, Chunchao GuoWed, 11 Ma💻 cs

A 26-Gram Butterfly-Inspired Robot Achieving Autonomous Tailless Flight

El artículo presenta a *AirPulse*, un robot autónomo de 26 gramos inspirado en mariposas que logra por primera vez un vuelo controlado y cerrado en una plataforma alada sin cola, replicando las complejas ondulaciones corporales biológicas mediante un diseño de alas flexibles y una arquitectura de control jerárquica.

Weibin Gu, Chenrui Feng, Lian Liu, Chen Yang, Xingchi Jiao, Yuhe Ding, Xiaofei Shi, Chao Gao, Alessandro Rizzo, Guyue ZhouWed, 11 Ma💻 cs

Queer NLP: A Critical Survey on Literature Gaps, Biases and Trends

Esta encuesta crítica examina la literatura sobre NLP y la comunidad LGBTQIA+ para identificar tendencias, sesgos y vacíos, destacando la necesidad de un enfoque más proactivo, interdisciplinario e inclusivo que priorice la justicia y la mitigación de daños.

Sabine Weber, Angelina Wang, Ankush Gupta, Arjun Subramonian, Dennis Ulmer, Eshaan Tanwar, Geetanjali Aich, Hannah Devinney, Jacob Hobbs, Jennifer Mickel, Joshua Tint, Mae Sosto, Ray Groshan, Simone Astarita, Vagrant Gautam, Verena Blaschke, William Agnew, Wilson Y Lee, Yanan LongWed, 11 Ma💻 cs

DOCFORGE-BENCH: A Comprehensive 0-shot Benchmark for Document Forgery Detection and Analysis

El documento presenta DOCFORGE-BENCH, el primer benchmark unificado de cero disparos para la detección de falsificaciones documentales, que revela que el principal obstáculo para el despliegue práctico no es la capacidad de discriminación de los modelos, sino una falla de calibración crítica causada por la baja proporción de píxeles alterados, la cual puede mitigarse mediante la adaptación del umbral sin necesidad de reentrenamiento.

Zengqi Zhao, Weidi Xia, En Wei, Yan Zhang, Jane Mo, Tiannan Zhang, Yuanqin Dai, Zexi Chen, Yiran Tao, Simiao RenWed, 11 Ma💻 cs

Hardness of the Binary Covering Radius Problem in Large p\ell_p Norms

Este artículo demuestra que el problema de decisión de aproximación del radio de cobertura en retículos bajo la norma p\ell_p es NP-duro para una función explícita de factor de aproximación γ(p)\gamma(p) cuando pp supera un umbral de aproximadamente 35.31, estableciendo así la primera prueba de dureza para este problema en normas p\ell_p explícitas.

Huck Bennett, Peter LyWed, 11 Ma💻 cs

Scaling Multilingual Semantic Search in Uber Eats Delivery

Este artículo presenta un sistema de recuperación semántica multilingüe y multi-vertical para Uber Eats que, mediante el ajuste fino de un modelo Qwen2 con aprendizaje de representaciones matryoshka y una combinación de funciones de pérdida, logra mejoras significativas en la recuperación de tiendas, platos y artículos de supermercado en múltiples mercados.

Bo Ling, Zheng Liu, Haoyang Chen, Divya Nagar, Luting Yang, Mehul ParsanaWed, 11 Ma💻 cs

A Hybrid Residue Floating Numerical Architecture with Formal Error Bounds for High Throughput FPGA Computation

Este artículo presenta la Arquitectura Numérica de Residuo Híbrido Flotante (HRFNA), un sistema diseñado para FPGAs que combina aritmética de residuo sin acarreo con escalado de exponentes para lograr un alto rendimiento, eficiencia energética y límites de error formales, superando significativamente a la aritmética de punto flotante IEEE 754 en aplicaciones científicas y de CAD.

Mostafa DarvishiWed, 11 Ma💻 cs