AdaGen: Learning Adaptive Policy for Image Synthesis

O artigo apresenta o AdaGen, um framework geral e adaptável que utiliza aprendizado por reforço com recompensas adversariais para otimizar automaticamente o agendamento de parâmetros em processos de síntese de imagem iterativos, superando as limitações de regras manuais e melhorando significativamente a qualidade e a eficiência de diversos modelos generativos.

Zanlin Ni, Yulin Wang, Yeguo Hua, Renping Zhou, Jiayi Guo, Jun Song, Bo Zheng, Gao Huang2026-03-10💻 cs

Large Language Model-Driven Full-Component Evolution of Adaptive Large Neighborhood Search

Este artigo propõe um framework evolutivo fechado e impulsionado por Grandes Modelos de Linguagem que reconstrói automaticamente todos os sete componentes do Adaptive Large Neighborhood Search (ALNS), superando consistentemente as abordagens clássicas em benchmarks de otimização logística e revelando novos padrões de design através da análise de código.

Shaohua Yu, Tianyu Chen, Linyan Liu2026-03-10💻 cs

TrajPred: Trajectory-Conditioned Joint Embedding Prediction for Surgical Instrument-Tissue Interaction Recognition in Vision-Language Models

O artigo apresenta o TrajPred, um framework que melhora o reconhecimento de interações entre instrumentos e tecidos em cirurgias robóticas ao codificar trajetórias instrumentais para capturar informações temporais e gerar embeddings visuais mais precisos, resultando em melhor desempenho e alinhamento semântico no benchmark CholecT50.

Jiajun Cheng, Xiaofan Yu, Subarna, Sainan Liu, Shan Lin2026-03-10💻 cs

Privacy-Preserving Patient Identity Management Framework for Secure Healthcare Access

Este artigo apresenta um framework de gerenciamento de identidade de pacientes centrado no usuário e voltado para a privacidade, que equilibra a confiabilidade operacional com fortes proteções de privacidade através de pseudônimos anônimos e um mecanismo de rastreabilidade condicional, sendo validado formalmente e demonstrado como viável em ambientes clínicos.

Nasif Muslim, Jean-Charles Grégoire2026-03-10💻 cs

An Extended Consent-Based Access Control Framework: Pre-Commit Validation and Emergency Access

Este artigo propõe uma extensão do modelo de Controle de Acesso Baseado em Consentimento (CBAC) que substitui a resolução de conflitos em tempo de execução por uma validação prévia de consistência semântica, garantindo invariáveis de sistema e um mecanismo de acesso de emergência controlado por evidências fisiológicas, resultando em menor latência e maior precisão na proteção de dados de saúde.

Nasif Muslim, Jean-Charles Grégoire2026-03-10💻 cs

Mozart: Modularized and Efficient MoE Training on 3.5D Wafer-Scale Chiplet Architectures

O artigo apresenta o Mozart, um framework de co-projeto algoritmo-hardware que otimiza o treinamento de modelos de linguagem de grande escala com arquitetura Mixture-of-Experts (MoE) em chips de wafer escalonados 3.5D, utilizando estratégias de alocação de especialistas e agendamento granular para superar desafios de comunicação e utilização de recursos.

Shuqing Luo (Katie), Ye Han (Katie), Pingzhi Li (Katie), Jiayin Qin (Katie), Jie Peng (Katie), Yang (Katie), Zhao (Kevin), Yu (Kevin), Cao, Tianlong Chen2026-03-10💻 cs

SuperSkillsStack: Agency, Domain Knowledge, Imagination, and Taste in Human-AI Design Education

Este estudo analisa como estudantes de design integram a inteligência artificial generativa em seus projetos, revelando que, embora a ferramenta acelere fases iniciais como brainstorming e síntese, a colaboração eficaz depende fundamentalmente de competências humanas superiores — como agência, conhecimento de domínio, imaginação e bom gosto — para validar, refinar e selecionar soluções criativas.

Qian Huang, King Wang Poon2026-03-10💻 cs

OV-DEIM: Real-time DETR-Style Open-Vocabulary Object Detection with GridSynthetic Augmentation

O artigo apresenta o OV-DEIM, um detector de objetos em tempo real baseado em arquitetura DETR que alcança desempenho de ponta em detecção de vocabulário aberto através da integração do framework DEIMv2, uma estratégia de suplementação de consultas e uma técnica de aumento de dados chamada GridSynthetic para melhorar a discriminação semântica e a eficiência.

Leilei Wang, Longfei Liu, Xi Shen, Xuanlong Yu, Ying Tiffany He, Fei Richard Yu, Yingyi Chen2026-03-10💻 cs

Two Frames Matter: A Temporal Attack for Text-to-Video Model Jailbreaking

Este artigo apresenta o TFM, um novo método de ataque que explora a vulnerabilidade temporal dos modelos de texto-para-vídeo ao solicitar apenas quadros inicial e final, permitindo que o modelo gere autonomamente conteúdo nocivo nos quadros intermediários e contorne assim os filtros de segurança tradicionais.

Moyang Chen, Zonghao Ying, Wenzhuo Xu, Quancheng Zou, Deyue Zhang, Dongdong Yang, Xiangzheng Zhang2026-03-10💻 cs

SSP: Safety-guaranteed Surgical Policy via Joint Optimization of Behavioral and Spatial Constraints

O artigo propõe o framework SSP, que utiliza Equações Diferenciais Ordinárias Neurais e Funções de Barreira de Controle para garantir segurança formal em políticas cirúrgicas baseadas em aprendizado, impondo restrições comportamentais e espaciais com violações próximas de zero enquanto mantém altas taxas de sucesso em tarefas.

Jianshu Hu, ZhiYuan Guan, Lei Song, Kantaphat Leelakunwet, Hesheng Wang, Wei Xiao, Qi Dou, Yutong Ban2026-03-10💻 cs

Self-Supervised Multi-Modal World Model with 4D Space-Time Embedding

O artigo apresenta o DeepEarth, um modelo de mundo auto-supervisionado multi-modal que utiliza o codificador posicional 4D Earth4D para escalar com precisão sub-métrica e sub-segundo em escala planetária, alcançando desempenho superior em previsões ecológicas.

Lance Legel, Qin Huang, Brandon Voelker, Daniel Neamati, Patrick Alan Johnson, Favyen Bastani, Jeff Rose, James Ryan Hennessy, Robert Guralnick, Douglas Soltis, Pamela Soltis, Shaowen Wang2026-03-10💻 cs

TacDexGrasp: Compliant and Robust Dexterous Grasping with Tactile Feedback

O artigo TacDexGrasp apresenta um controlador baseado em Programação Cônica de Segunda Ordem e feedback tátil que garante a estabilidade de preensões dexterosas em objetos desconhecidos, prevenindo tanto o deslizamento translacional quanto o rotacional ao restringir ativamente a razão entre as forças tangenciais e normais em cada contato, sem a necessidade de modelagem explícita de torque ou detecção de deslizamento.

Yubin Ke, Jiayi Chen, Hang Lv, Xiao Zhou, He Wang2026-03-10💻 cs

Looking Back and Forth: Cross-Image Attention Calibration and Attentive Preference Learning for Multi-Image Hallucination Mitigation

O artigo propõe o framework CAPL, que combina calibração de atenção inter-imagem e aprendizado por preferência para mitigar alucinações em modelos de linguagem e visão grandes, melhorando a modelagem de associações entre múltiplas imagens e a fundamentação em evidências visuais autênticas.

Xiaochen Yang, Hao Fang, Jiawei Kong, Yaoxin Mao, Bin Chen, Shu-Tao Xia2026-03-10💻 cs