Why iCloud Fails: The Category Mistake of Cloud Synchronization

Este artigo argumenta que as falhas do iCloud ao sincronizar dados com ferramentas como Time Machine e Git decorrem de um erro categórico fundamental: a projeção de um grafo causal distribuído em uma cadeia temporal linear, um problema estrutural que só pode ser resolvido alinhando os protocolos de rede com a realidade física através de semânticas transacionais reversíveis, como as do Open Atomic Ethernet.

Paul Borrill2026-03-10💻 cs

See It, Say It, Sorted: An Iterative Training-Free Framework for Visually-Grounded Multimodal Reasoning in LVLMs

O artigo apresenta o "See It, Say It, Sorted", um framework leve e sem treinamento que aprimora o raciocínio multimodal em modelos LVLMs ao supervisionar iterativamente cada passo do pensamento com evidências visuais dinâmicas, reduzindo alucinações e melhorando a precisão sem necessidade de re-treinamento.

Yongchang Zhang, Oliver Ma, Tianyi Liu, Guangquan Zhou, Yang Chen2026-03-10💻 cs

ARLArena: A Unified Framework for Stable Agentic Reinforcement Learning

Este artigo apresenta o ARLArena, um framework unificado para análise e estabilização do aprendizado por reforço agêntico, que através da decomposição do gradiente de política em quatro dimensões, deriva o método SAMPO para garantir treinamento estável e de alto desempenho em tarefas complexas.

Xiaoxuan Wang, Han Zhang, Haixin Wang, Yidan Shi, Ruoyan Li, Kaiqiao Han, Chenyi Tong, Haoran Deng, Renliang Sun, Alexander Taylor, Yanqiao Zhu, Jason Cong, Yizhou Sun, Wei Wang2026-03-10💻 cs

CryoNet.Refine: A One-step Diffusion Model for Rapid Refinement of Structural Models with Cryo-EM Density Map Restraints

O artigo apresenta o CryoNet.Refine, um modelo de difusão de um único passo baseado em aprendizado profundo que automatiza e acelera o refinamento de modelos estrutuais de macromoléculas contra mapas de densidade de criomicroscopia eletrônica, superando em velocidade e qualidade as ferramentas tradicionais como o Phenix.real_space_refine.

Fuyao Huang, Xiaozhu Yu, Kui Xu, Qiangfeng Cliff Zhang2026-03-10💻 cs

Vibe Researching as Wolf Coming: Can AI Agents with Skills Replace or Augment Social Scientists?

Este artigo introduz o conceito de "vibe researching" mediado por agentes de IA, argumentando que, embora essas ferramentas possam automatizar tarefas de alta codificabilidade e acelerar o pipeline de pesquisa, elas não substituem a originalidade teórica e o conhecimento tácito dos cientistas sociais, exigindo, em vez disso, uma abordagem de augmentação responsável que considere riscos de estratificação e crises pedagógicas.

Yongjun Zhang2026-03-10💻 cs

WISER: Wider Search, Deeper Thinking, and Adaptive Fusion for Training-Free Zero-Shot Composed Image Retrieval

O WISER é um framework de recuperação de imagens composta zero-shot sem treinamento que supera os métodos existentes ao unificar as abordagens Texto-para-Imagem e Imagem-para-Imagem em um pipeline de "busca mais ampla, pensamento mais profundo e fusão adaptativa", utilizando verificação de confiança e auto-reflexão estruturada para refinar dinamicamente os resultados.

Tianyue Wang, Leigang Qu, Tianyu Yang, Xiangzhao Hao, Yifan Xu, Haiyun Guo, Jinqiao Wang2026-03-10💻 cs

PackUV: Packed Gaussian UV Maps for 4D Volumetric Video

O artigo apresenta o PackUV, um novo método de representação volumétrica 4D que mapeia atributos gaussianos em mapas UV estruturados para compatibilidade com codecs de vídeo padrão, introduzindo também o método de ajuste PackUV-GS e o conjunto de dados PackUV-2B para superar limitações de consistência temporal e escalabilidade em sequências longas.

Aashish Rai, Angela Xing, Anushka Agarwal, Xiaoyan Cong, Zekun Li, Tao Lu, Aayush Prakash, Srinath Sridhar2026-03-10💻 cs

On Sample-Efficient Generalized Planning via Learned Transition Models

Este trabalho propõe formular o planejamento generalizado como um problema de aprendizado de modelos de transição explícitos, demonstrando que prever estados intermediários em vez de ações diretas resulta em maior generalização fora da distribuição e eficiência amostral com modelos menores do que as abordagens baseadas em Transformers que predizem sequências de ações diretamente.

Nitin Gupta, Vishal Pallagani, John A. Aydin, Biplav Srivastava2026-03-10💻 cs

Self-Attention And Beyond the Infinite: Towards Linear Transformers with Infinite Self-Attention

O artigo apresenta o Infinito Self-Attention (InfSA), uma reformulação espectral que modela a atenção como um processo de difusão em grafos de tokens para superar o custo quadrático do softmax, introduzindo a variante Linear-InfSA que alcança complexidade linear, permite processamento de imagens de ultra-alta resolução (até 9216x9216) e supera os Transformers convencionais em precisão e eficiência energética no ImageNet.

Giorgio Roffo, Luke Palmer2026-03-10💻 cs

Position: Evaluation of Visual Processing Should Be Human-Centered, Not Metric-Centered

Este artigo de posicionamento defende que a avaliação de sistemas modernos de processamento visual deve abandonar a primazia de métricas objetivas de qualidade de imagem em favor de uma abordagem centrada no ser humano, contextual e detalhada, para evitar que a divergência entre resultados métricos e percepção humana restrinja a inovação e desvie o progresso da pesquisa.

Jinfan Hu, Fanghua Yu, Zhiyuan You, Xiang Yin, Hongyu An, Xinqi Lin, Chao Dong, Jinjin Gu2026-03-10💻 cs