Zooming In on Fakes: A Novel Dataset for Localized AI-Generated Image Detection with Forgery Amplification Approach

Este artigo apresenta o BR-Gen, um novo dataset de grande escala com 150.000 imagens localmente falsificadas e o modelo NFA-ViT, que utiliza amplificação de ruído para detectar e propagar traços de falsificações sutis em todo o contexto da imagem, superando os métodos existentes em precisão e generalização.

Lvpan Cai, Haowei Wang, Jiayi Ji, Yanshu Zhoumen, Shen Chen, Taiping Yao, Xiaoshuai Sun2026-03-11💻 cs

Scalable and Performant Data Loading

O artigo apresenta o SPDL, uma biblioteca de código aberto e agnóstica a frameworks que otimiza o carregamento de dados para GPU, superando o gargalo do GIL do Python para atingir um desempenho 74% superior ao do DataLoader do PyTorch no ImageNet e benefícios adicionais com o Python 3.13t de thread livre.

Moto Hira, Christian Puhrsch, Valentin Andrei, Roman Malinovskyy, Gael Le Lan, Abhinandan Krishnan, Joseph Cummings, Victor Bourgin, Olga Gerasimova, Miguel Martin, Gokul Gunasekaran, Yuta Inoue, Alex J Turner, Raghuraman Krishnamoorthi2026-03-11💻 cs

M4-SAR: A Multi-Resolution, Multi-Polarization, Multi-Scene, Multi-Source Dataset and Benchmark for optical-SAR Object Detection

Este artigo apresenta o M4-SAR, um novo dataset abrangente e padronizado para detecção de objetos por fusão óptica-SAR, acompanhado de um toolkit de benchmark e do framework E2E-OSDet, demonstrando que a combinação desses dados melhora significativamente a precisão da detecção em ambientes complexos.

Chao Wang, Wei Lu, Xiang Li, Jian Yang, Lei Luo2026-03-11💻 cs

MARRS: Masked Autoregressive Unit-based Reaction Synthesis

O artigo apresenta o MARRS, um novo framework que utiliza representações contínuas e um modelo autoregressivo baseado em unidades corporais distintas para sintetizar reações humanas coordenadas e de alta qualidade, superando as limitações de perda de informação e complexidade computacional dos métodos anteriores baseados em quantização vetorial.

Yabiao Wang, Shuo Wang, Jiangning Zhang, Jiafu Wu, Qingdong He, Yong Liu2026-03-11💻 cs

Evaluating Large Language Models for Multilingual Vulnerability Detection at Dual Granularities

Este estudo realiza uma avaliação empírica abrangente de modelos de linguagem pré-treinados e grandes modelos de linguagem (LLMs) para detecção de vulnerabilidades em múltiplas linguagens e granularidades, demonstrando que o GPT-4o, otimizado com ajuste de instrução e *few-shot prompting*, supera significativamente outras abordagens na identificação de vulnerabilidades críticas em diversos contextos.

Honglin Shu, Michael Fu, Junji Yu, Dong Wang, Chakkrit Tantithamthavorn, Junjie Chen, Yasutaka Kamei2026-03-11💻 cs

SpikeSMOKE: Spiking Neural Networks for Monocular 3D Object Detection with Cross-Scale Gated Coding

O artigo apresenta o SpikeSMOKE, uma arquitetura de redes neurais de pulso (SNN) para detecção de objetos 3D monoculares que introduz um mecanismo de codificação de portão cruzado (CSGC) e blocos residuais leves para superar a perda de informação das SNNs, resultando em maior precisão e consumo energético drasticamente reduzido em comparação com métodos tradicionais.

Xuemei Chen, Huamin Wang, Jing Peng, Hangchi Shen, Shukai Duan, Shiping Wen, Tingwen Huang2026-03-11💻 cs

A Decade of News Forum Interactions: Threaded Conversations, Signed Votes, and Topical Tags

Este artigo apresenta um grande conjunto de dados longitudinal e anonimizado, abrangendo uma década (2013-2022) de interações no fórum de notícias do jornal austríaco DerStandard, que inclui mais de 75 milhões de comentários e 400 milhões de votos para facilitar a análise de dinâmicas de discussão, estruturas de rede e análises semânticas em alemão, preservando a privacidade dos usuários através da disponibilização apenas de representações vetoriais pré-calculadas em vez dos textos brutos.

Emma Fraxanet, Vicenç Gómez, Andreas Kaltenbrunner, Max Pellert2026-03-11💻 cs

Improving Large Vision-Language Models' Understanding for Flow Field Data

O artigo apresenta o FieldLVLM, um novo framework que aprimora a compreensão de modelos de linguagem-visão grandes sobre dados de campos científicos, como escoamentos, por meio de uma estratégia de geração de linguagem orientada a características físicas e um ajuste de modelo multimodal com compressão de dados, superando métodos existentes em benchmarks especializados.

Xiaomei Zhang, Hanyu Zheng, Xiangyu Zhu, Jinghuan Wei, Junhong Zou, Zhen Lei, Zhaoxiang Zhang2026-03-11💻 cs

A robust and compliant robotic assembly control strategy for batch precision assembly task with uncertain fit types and fit amounts

Este artigo propõe uma estratégia de controle robótico robusta e compatível para tarefas de montagem em lote com incertezas nos tipos e quantidades de ajuste, utilizando um método de aprendizado por reforço com fusão de força e visão (FVFC-MTRL) e destilação de políticas para integrar múltiplas estratégias de controle em uma rede unificada que demonstra alta eficiência e sucesso em experimentos reais.

Bin Wang, Jiwen Zhang, Song Wang + 1 more2026-03-11💻 cs

You Only Pose Once: A Minimalist's Detection Transformer for Monocular RGB Category-level 9D Multi-Object Pose Estimation

O artigo apresenta o YOPO, um método de detecção baseado em transformers que unifica a detecção 2D e a estimativa de pose 9D de objetos em nível de categoria a partir de imagens RGB monoculares em uma única etapa, alcançando desempenho superior ao estado da arte sem depender de dados adicionais como profundidade ou modelos CAD.

Hakjin Lee, Junghoon Seo, Jaehoon Sim2026-03-11💻 cs