UniBYD: A Unified Framework for Learning Robotic Manipulation Across Embodiments Beyond Imitation of Human Demonstrations

O artigo apresenta o UniBYD, um framework unificado que utiliza aprendizado por reforço dinâmico e uma representação morfológica unificada para superar as limitações da imitação humana, permitindo que políticas de manipulação robótica se adaptem eficientemente a diversas configurações de mãos robóticas, resultando em um aumento significativo na taxa de sucesso em comparação com o estado da arte.

Tingyu Yuan, Biaoliang Guan, Wen Ye, Ziyan Tian, Yi Yang, Weijie Zhou, Zhaowen Li, Yan Huang, Peng Wang, Chaoyang Zhao, Jinqiao WangWed, 11 Ma💻 cs

Taming Preference Mode Collapse via Directional Decoupling Alignment in Diffusion Reinforcement Learning

Este artigo apresenta o DivGenBench, um novo benchmark para quantificar o colapso de modo de preferência em modelos de difusão, e propõe o D²-Align, um framework que mitiga esse problema ao corrigir direcionalmente o sinal de recompensa, preservando assim a diversidade gerativa sem comprometer a qualidade.

Chubin Chen, Sujie Hu, Jiashu Zhu, Meiqi Wu, Jintao Chen, Yanxun Li, Nisha Huang, Chengyu Fang, Jiahong Wu, Xiangxiang Chu, Xiu LiWed, 11 Ma💻 cs

A Tale of 1001 LoC: Potential Runtime Error-Guided Specification Synthesis for Verifying Large-Scale Programs

Este artigo apresenta o Preguss, um framework modular que combina análise estática e modelos de linguagem para automatizar a geração e refinamento de especificações formais, permitindo a verificação de programas de grande escala com mais de 1000 linhas de código e reduzindo o esforço humano em até 88,9%.

Zhongyi Wang, Tengjie Lin, Mingshuai Chen, Haokun Li, Mingqi Yang, Xiao Yi, Shengchao Qin, Yixing Luo, Xiaofeng Li, Bin Gu, Liqiang Lu, Jianwei YinWed, 11 Ma💻 cs

CovertComBench: A First Domain-Specific Testbed for LLMs in Wireless Covert Communication

O artigo apresenta o CovertComBench, um novo *benchmark* específico para avaliar a capacidade de Modelos de Linguagem Grandes (LLMs) em comunicações covert sem fio, revelando que, embora eficazes em conceitos e geração de código, eles ainda falham em realizar as derivações matemáticas complexas necessárias para garantir a segurança, indicando a necessidade de ferramentas externas para sistemas de IA confiáveis.

Zhaozhi Liu, Jiaxin Chen, Yuanai Xie, Yuna Jiang, Minrui Xu, Xiao Zhang, Pan Lai, Zan ZhouWed, 11 Ma💻 cs

Exploiting the Final Component of Generator Architectures for AI-Generated Image Detection

Este artigo propõe um método inovador para detecção de imagens geradas por IA que explora a generalização dos componentes finais comuns das arquiteturas de geradores, alcançando uma precisão média de 98,83% em testes com geradores não vistos ao treinar um detector para distinguir imagens reais de versões "contaminadas" por esses componentes.

Yanzhu Liu, Xiao Liu, Yuexuan Wang, Mondal SoumikWed, 11 Ma💻 cs

Optimal conversion from Rényi Differential Privacy to ff-Differential Privacy

O artigo prova a conjectura de que a regra de conversão baseada na interseção das regiões de privacidade RDP de ordem única é ótima e fundamental para mapear perfis de Privacidade Diferencial de Rényi para funções de privacidade ff, estabelecendo o limite teórico intransponível para inferências de privacidade baseadas apenas em garantias RDP.

Anneliese Riess, Juan Felipe Gomez, Flavio du Pin Calmon, Julia Anne Schnabel, Georgios KaissisWed, 11 Ma💻 cs

Pathwise Test-Time Correction for Autoregressive Long Video Generation

O artigo apresenta o Test-Time Correction (TTC), um método sem treinamento que utiliza o quadro inicial como âncora estável para calibrar estados intermediários e corrigir o acúmulo de erros em modelos autoregressivos de difusão destilados, permitindo a geração de vídeos longos de alta qualidade com custo computacional mínimo.

Xunzhi Xiang, Zixuan Duan, Guiyu Zhang, Haiyu Zhang, Zhe Gao, Junta Wu, Shaofeng Zhang, Tengfei Wang, Qi Fan, Chunchao GuoWed, 11 Ma💻 cs

A 26-Gram Butterfly-Inspired Robot Achieving Autonomous Tailless Flight

O artigo apresenta o *AirPulse*, um robô voador autônomo de 26 gramas inspirado em borboletas que, pela primeira vez em sua escala, alcança voo controlado sem cauda ao replicar as características biomecânicas de batidas de asas de baixa frequência e um corpo ondulante através de uma arquitetura de controle hierárquico inovadora.

Weibin Gu, Chenrui Feng, Lian Liu, Chen Yang, Xingchi Jiao, Yuhe Ding, Xiaofei Shi, Chao Gao, Alessandro Rizzo, Guyue ZhouWed, 11 Ma💻 cs

Queer NLP: A Critical Survey on Literature Gaps, Biases and Trends

Esta pesquisa oferece um panorama crítico do estado atual da NLP voltada para a comunidade LGBTQIA+, identificando tendências, lacunas e vieses na literatura, e defende uma abordagem mais proativa, interdisciplinar e inclusiva para desenvolver tecnologias linguísticas mais justas.

Sabine Weber, Angelina Wang, Ankush Gupta, Arjun Subramonian, Dennis Ulmer, Eshaan Tanwar, Geetanjali Aich, Hannah Devinney, Jacob Hobbs, Jennifer Mickel, Joshua Tint, Mae Sosto, Ray Groshan, Simone Astarita, Vagrant Gautam, Verena Blaschke, William Agnew, Wilson Y Lee, Yanan LongWed, 11 Ma💻 cs

Algorithmic Collusion at Test Time: A Meta-game Design and Evaluation

Este artigo propõe um design de meta-jogo para avaliar o risco de colusão algorítmica em cenários de teste, modelando agentes com políticas pré-treinadas e regras de adaptação para analisar como estratégias de aprendizado por reforço, UCB e LLMs evoluem para cooperação ou competição em jogos de preços repetidos sob condições simétricas e assimétricas.

Yuhong Luo, Daniel Schoepflin, Xintong WangWed, 11 Ma💻 cs

DOCFORGE-BENCH: A Comprehensive 0-shot Benchmark for Document Forgery Detection and Analysis

O artigo apresenta o DOCFORGE-BENCH, o primeiro benchmark zero-shot unificado para detecção de falsificação de documentos, revelando que a falha generalizada dos métodos atuais em cenários práticos não se deve à falta de capacidade discriminativa, mas sim a uma calibração inadequada dos limiares de decisão devido à extrema raridade de pixels adulterados, o que exige adaptação de limiar em vez de retreinamento para viabilizar a implantação.

Zengqi Zhao, Weidi Xia, En Wei, Yan Zhang, Jane Mo, Tiannan Zhang, Yuanqin Dai, Zexi Chen, Yiran Tao, Simiao RenWed, 11 Ma💻 cs

Scaling Multilingual Semantic Search in Uber Eats Delivery

Este artigo apresenta um sistema de recuperação semântica unificado e multilíngue para o Uber Eats, que utiliza um modelo Qwen2 de duas torres com aprendizado de representação Matryoshka e treinamento em centenas de milhões de interações para melhorar significativamente a precisão na busca por restaurantes, pratos e itens de varejo em múltiplos mercados.

Bo Ling, Zheng Liu, Haoyang Chen, Divya Nagar, Luting Yang, Mehul ParsanaWed, 11 Ma💻 cs

A Hybrid Residue Floating Numerical Architecture with Formal Error Bounds for High Throughput FPGA Computation

Este artigo apresenta a Arquitetura Numérica Híbrida de Resíduo Flutuante (HRFNA), um sistema formalmente definido com limites de erro rigorosos e implementação em FPGA que combina aritmética de resíduo livre de transporte com escalonamento de expoente leve, alcançando maior eficiência energética e throughput em comparação com a precisão de ponto flutuante IEEE 754 padrão.

Mostafa DarvishiWed, 11 Ma💻 cs