M4-SAR: A Multi-Resolution, Multi-Polarization, Multi-Scene, Multi-Source Dataset and Benchmark for optical-SAR Object Detection

Este artigo apresenta o M4-SAR, um novo dataset abrangente e padronizado para detecção de objetos por fusão óptica-SAR, acompanhado de um toolkit de benchmark e do framework E2E-OSDet, demonstrando que a combinação desses dados melhora significativamente a precisão da detecção em ambientes complexos.

Chao Wang, Wei Lu, Xiang Li, Jian Yang, Lei Luo2026-03-11💻 cs

MARRS: Masked Autoregressive Unit-based Reaction Synthesis

O artigo apresenta o MARRS, um novo framework que utiliza representações contínuas e um modelo autoregressivo baseado em unidades corporais distintas para sintetizar reações humanas coordenadas e de alta qualidade, superando as limitações de perda de informação e complexidade computacional dos métodos anteriores baseados em quantização vetorial.

Yabiao Wang, Shuo Wang, Jiangning Zhang, Jiafu Wu, Qingdong He, Yong Liu2026-03-11💻 cs

Evaluating Large Language Models for Multilingual Vulnerability Detection at Dual Granularities

Este estudo realiza uma avaliação empírica abrangente de modelos de linguagem pré-treinados e grandes modelos de linguagem (LLMs) para detecção de vulnerabilidades em múltiplas linguagens e granularidades, demonstrando que o GPT-4o, otimizado com ajuste de instrução e *few-shot prompting*, supera significativamente outras abordagens na identificação de vulnerabilidades críticas em diversos contextos.

Honglin Shu, Michael Fu, Junji Yu, Dong Wang, Chakkrit Tantithamthavorn, Junjie Chen, Yasutaka Kamei2026-03-11💻 cs

SpikeSMOKE: Spiking Neural Networks for Monocular 3D Object Detection with Cross-Scale Gated Coding

O artigo apresenta o SpikeSMOKE, uma arquitetura de redes neurais de pulso (SNN) para detecção de objetos 3D monoculares que introduz um mecanismo de codificação de portão cruzado (CSGC) e blocos residuais leves para superar a perda de informação das SNNs, resultando em maior precisão e consumo energético drasticamente reduzido em comparação com métodos tradicionais.

Xuemei Chen, Huamin Wang, Jing Peng, Hangchi Shen, Shukai Duan, Shiping Wen, Tingwen Huang2026-03-11💻 cs

A Decade of News Forum Interactions: Threaded Conversations, Signed Votes, and Topical Tags

Este artigo apresenta um grande conjunto de dados longitudinal e anonimizado, abrangendo uma década (2013-2022) de interações no fórum de notícias do jornal austríaco DerStandard, que inclui mais de 75 milhões de comentários e 400 milhões de votos para facilitar a análise de dinâmicas de discussão, estruturas de rede e análises semânticas em alemão, preservando a privacidade dos usuários através da disponibilização apenas de representações vetoriais pré-calculadas em vez dos textos brutos.

Emma Fraxanet, Vicenç Gómez, Andreas Kaltenbrunner, Max Pellert2026-03-11💻 cs

Improving Large Vision-Language Models' Understanding for Flow Field Data

O artigo apresenta o FieldLVLM, um novo framework que aprimora a compreensão de modelos de linguagem-visão grandes sobre dados de campos científicos, como escoamentos, por meio de uma estratégia de geração de linguagem orientada a características físicas e um ajuste de modelo multimodal com compressão de dados, superando métodos existentes em benchmarks especializados.

Xiaomei Zhang, Hanyu Zheng, Xiangyu Zhu, Jinghuan Wei, Junhong Zou, Zhen Lei, Zhaoxiang Zhang2026-03-11💻 cs

You Only Pose Once: A Minimalist's Detection Transformer for Monocular RGB Category-level 9D Multi-Object Pose Estimation

O artigo apresenta o YOPO, um método de detecção baseado em transformers que unifica a detecção 2D e a estimativa de pose 9D de objetos em nível de categoria a partir de imagens RGB monoculares em uma única etapa, alcançando desempenho superior ao estado da arte sem depender de dados adicionais como profundidade ou modelos CAD.

Hakjin Lee, Junghoon Seo, Jaehoon Sim2026-03-11💻 cs

CoRe-GS: Coarse-to-Refined Gaussian Splatting with Semantic Object Focus

O artigo apresenta o CoRe-GS, um framework de Gaussian Splatting que otimiza seletivamente apenas as regiões de interesse (POIs) em uma abordagem de "grossa para refinada", reduzindo drasticamente o tempo de treinamento e melhorando a qualidade da reconstrução para aplicações robóticas críticas, ao mesmo tempo que mitiga artefatos visuais sem necessidade de rasterização de máscaras.

Hannah Schieber, Dominik Frischmann, Victor Schaack, Simon Boche, Angela Schoellig, Stefan Leutenegger, Daniel Roth2026-03-11💻 cs

Floating-Point Usage on GitHub: A Large-Scale Study of Statically Typed Languages

Este artigo apresenta o primeiro estudo em grande escala sobre o uso de aritmética de ponto flutuante em repositórios públicos do GitHub para linguagens estaticamente tipadas, analisando milhões de funções para validar benchmarks existentes e fornecer um novo conjunto de dados de 10 milhões de funções para orientar o desenvolvimento e a avaliação de futuras técnicas de raciocínio automatizado.

Andrea Gilot, Tobias Wrigstad, Eva Darulova2026-03-11💻 cs

VocSegMRI: Multimodal Learning for Precise Vocal Tract Segmentation in Real-time MRI

O artigo apresenta o VocSegMRI, um framework de aprendizado multimodal que integra vídeo, áudio e sinais fonológicos para alcançar a segmentação de precisão das estruturas articulatórias em ressonância magnética em tempo real, superando os métodos existentes com uma pontuação Dice de 0,95.

Daiqi Liu, Tomás Arias-Vergara, Johannes Enk, Fangxu Xing, Maureen Stone, Jerry L. Prince, Jana Hutter, Andreas Maier, Jonghye Woo, Paula Andrea Pérez-Toro2026-03-11💻 cs

Multi-Quadruped Cooperative Object Transport: Learning Decentralized Pinch-Lift-Move

Este artigo apresenta uma abordagem de aprendizado descentralizado que permite a equipes de robôs quadrúpedes coordenarem o transporte de objetos não manipuláveis apenas por meio de contato físico, utilizando uma política hierárquica e um esquema de recompensas que simula conexões rígidas sem necessidade de comunicação ou controle centralizado.

Bikram Pandit, Aayam Kumar Shrestha, Alan Fern2026-03-11💻 cs

Designing Culturally Aligned AI Systems For Social Good in Non-Western Contexts

Este artigo analisa oito implementações reais de IA em contextos não ocidentais para identificar seis fatores transversais e influências socioculturais, institucionais e tecnológicas que moldam esses sistemas, culminando na apresentação de 12 diretrizes para o desenvolvimento de soluções de IA culturalmente alinhadas, equitativas e eficazes para o bem social.

Deepak Varuvel Dennison, Mohit Jain, Tanuja Ganu, Aditya Vashistha2026-03-11💻 cs

Automated Coral Spawn Monitoring for Reef Restoration: The Coral Spawn and Larvae Imaging Camera System (CSLICS)

Este artigo apresenta o Sistema de Câmera de Imagem de Desova e Larvas de Coral (CSLICS), uma solução automatizada de baixo custo que utiliza visão computacional para contar desovas de coral com precisão, reduzindo drasticamente o trabalho manual e facilitando a restauração de recifes em grande escala.

Dorian Tsai, Christopher A. Brunner, Riki Lamont, F. Mikaela Nordborg, Andrea Severati, Java Terry, Karen Jackel, Matthew Dunbabin, Tobias Fischer, Scarlett Raine2026-03-11💻 cs

Mapping Historic Urban Footprints in France: Balancing Quality, Scalability and AI Techniques

Este estudo apresenta um pipeline de aprendizado profundo escalável baseado em uma abordagem U-Net de dupla passagem para extrair o primeiro conjunto de dados nacional de pegada urbana da França (1925-1950) a partir de mapas históricos Scan Histo, superando desafios de ruído e complexidade estilística para alcançar uma precisão global de 73% e liberar os dados e códigos resultantes para pesquisas futuras.

Walid Rabehi, Marion Le Texier, Rémi Lemoy2026-03-11💻 cs

Connectivity Maintenance and Recovery for Multi-Robot Motion Planning

Este artigo propõe um algoritmo de planejamento de movimento em tempo real baseado em curvas de Bézier e funções de barreira de controle (MPC-CLF-CBF) que garante a conectividade de frotas de robôs em ambientes com obstáculos, permitindo a recuperação de conexões perdidas e melhorando significativamente a taxa de sucesso na navegação, conforme validado em simulações e experimentos físicos com oito quadricópteros Crazyflie.

Yutong Wang, Lishuo Pan, Yichun Qu, Tengxiang Wang, Nora Ayanian2026-03-11💻 cs

LARA-Gen: Enabling Continuous Emotion Control for Music Generation Models via Latent Affective Representation Alignment

O artigo apresenta o LARA-Gen, um novo framework que permite o controle contínuo e de alta granularidade das emoções na geração de música, alinhando representações latentes afetivas e utilizando um espaço de valência-ativação para superar as limitações dos prompts baseados em texto, resultando em uma aderência emocional e qualidade musical superiores às abordagens existentes.

Jiahao Mei, Xuenan Xu, Zeyu Xie, Zihao Zheng, Ye Tao, Yue Ding, Mengyue Wu2026-03-11💻 cs