cs artigos | Gist.Science

AdaGen: Learning Adaptive Policy for Image Synthesis

O artigo apresenta o AdaGen, um framework geral e adaptável que utiliza aprendizado por reforço com recompensas adversariais para otimizar automaticamente o agendamento de parâmetros em processos de síntese de imagem iterativos, superando as limitações de regras manuais e melhorando significativamente a qualidade e a eficiência de diversos modelos generativos.

Zanlin Ni, Yulin Wang, Yeguo Hua, Renping Zhou, Jiayi Guo, Jun Song, Bo Zheng, Gao Huang2026-03-10💻 cs

Large Language Model-Driven Full-Component Evolution of Adaptive Large Neighborhood Search

Este artigo propõe um framework evolutivo fechado e impulsionado por Grandes Modelos de Linguagem que reconstrói automaticamente todos os sete componentes do Adaptive Large Neighborhood Search (ALNS), superando consistentemente as abordagens clássicas em benchmarks de otimização logística e revelando novos padrões de design através da análise de código.

Shaohua Yu, Tianyu Chen, Linyan Liu2026-03-10💻 cs

TrajPred: Trajectory-Conditioned Joint Embedding Prediction for Surgical Instrument-Tissue Interaction Recognition in Vision-Language Models

O artigo apresenta o TrajPred, um framework que melhora o reconhecimento de interações entre instrumentos e tecidos em cirurgias robóticas ao codificar trajetórias instrumentais para capturar informações temporais e gerar embeddings visuais mais precisos, resultando em melhor desempenho e alinhamento semântico no benchmark CholecT50.

Jiajun Cheng, Xiaofan Yu, Subarna, Sainan Liu, Shan Lin2026-03-10💻 cs

Privacy-Preserving Patient Identity Management Framework for Secure Healthcare Access

Este artigo apresenta um framework de gerenciamento de identidade de pacientes centrado no usuário e voltado para a privacidade, que equilibra a confiabilidade operacional com fortes proteções de privacidade através de pseudônimos anônimos e um mecanismo de rastreabilidade condicional, sendo validado formalmente e demonstrado como viável em ambientes clínicos.

Nasif Muslim, Jean-Charles Grégoire2026-03-10💻 cs

Two-Stage Path Following for Mobile Manipulators via Dimensionality-Reduced Graph Search and Numerical Optimization

Este artigo apresenta um quadro de planejamento de duas etapas para manipuladores móveis que combina busca em grafo reduzida dimensionalmente e otimização numérica para gerar trajetórias suaves e precisas, superando as limitações de espaços de configuração de alta dimensão e restrições cinemáticas.

Fuyu Guo, Yuting Mei, Yuyao Zhang, Qian Tang2026-03-10💻 cs

An Extended Consent-Based Access Control Framework: Pre-Commit Validation and Emergency Access

Este artigo propõe uma extensão do modelo de Controle de Acesso Baseado em Consentimento (CBAC) que substitui a resolução de conflitos em tempo de execução por uma validação prévia de consistência semântica, garantindo invariáveis de sistema e um mecanismo de acesso de emergência controlado por evidências fisiológicas, resultando em menor latência e maior precisão na proteção de dados de saúde.

Nasif Muslim, Jean-Charles Grégoire2026-03-10💻 cs

Mozart: Modularized and Efficient MoE Training on 3.5D Wafer-Scale Chiplet Architectures

O artigo apresenta o Mozart, um framework de co-projeto algoritmo-hardware que otimiza o treinamento de modelos de linguagem de grande escala com arquitetura Mixture-of-Experts (MoE) em chips de wafer escalonados 3.5D, utilizando estratégias de alocação de especialistas e agendamento granular para superar desafios de comunicação e utilização de recursos.

Shuqing Luo (Katie), Ye Han (Katie), Pingzhi Li (Katie), Jiayin Qin (Katie), Jie Peng (Katie), Yang (Katie), Zhao (Kevin), Yu (Kevin), Cao, Tianlong Chen2026-03-10💻 cs

SuperSkillsStack: Agency, Domain Knowledge, Imagination, and Taste in Human-AI Design Education

Este estudo analisa como estudantes de design integram a inteligência artificial generativa em seus projetos, revelando que, embora a ferramenta acelere fases iniciais como brainstorming e síntese, a colaboração eficaz depende fundamentalmente de competências humanas superiores — como agência, conhecimento de domínio, imaginação e bom gosto — para validar, refinar e selecionar soluções criativas.

Qian Huang, King Wang Poon2026-03-10💻 cs

OV-DEIM: Real-time DETR-Style Open-Vocabulary Object Detection with GridSynthetic Augmentation

O artigo apresenta o OV-DEIM, um detector de objetos em tempo real baseado em arquitetura DETR que alcança desempenho de ponta em detecção de vocabulário aberto através da integração do framework DEIMv2, uma estratégia de suplementação de consultas e uma técnica de aumento de dados chamada GridSynthetic para melhorar a discriminação semântica e a eficiência.

Leilei Wang, Longfei Liu, Xi Shen, Xuanlong Yu, Ying Tiffany He, Fei Richard Yu, Yingyi Chen2026-03-10💻 cs

Enhancing Web Agents with a Hierarchical Memory Tree

O artigo propõe a Hierarchical Memory Tree (HMT), uma estrutura de memória hierárquica que desacopla o planejamento lógico da execução de ações para superar as limitações de generalização de agentes web baseados em LLMs em ambientes não vistos, demonstrando desempenho superior em tarefas complexas e de longo prazo.

Yunteng Tan, Zhi Gao, Xinxiao Wu2026-03-10💻 cs

Two Frames Matter: A Temporal Attack for Text-to-Video Model Jailbreaking

Este artigo apresenta o TFM, um novo método de ataque que explora a vulnerabilidade temporal dos modelos de texto-para-vídeo ao solicitar apenas quadros inicial e final, permitindo que o modelo gere autonomamente conteúdo nocivo nos quadros intermediários e contorne assim os filtros de segurança tradicionais.

Moyang Chen, Zonghao Ying, Wenzhuo Xu, Quancheng Zou, Deyue Zhang, Dongdong Yang, Xiangzheng Zhang2026-03-10💻 cs

Improved Leakage Abuse Attacks in Searchable Symmetric Encryption with eBPF Monitoring

Este trabalho demonstra que o monitoramento de nível de sistema utilizando eBPF pode revelar novos padrões de vazamento em Criptografia Simétrica pesquisável (SSE), permitindo ataques de abuso de vazamento mais eficazes e destacando a necessidade de considerar essas ameaças práticas no projeto de defesas.

Chinecherem Dimobi2026-03-10💻 cs

SSP: Safety-guaranteed Surgical Policy via Joint Optimization of Behavioral and Spatial Constraints

O artigo propõe o framework SSP, que utiliza Equações Diferenciais Ordinárias Neurais e Funções de Barreira de Controle para garantir segurança formal em políticas cirúrgicas baseadas em aprendizado, impondo restrições comportamentais e espaciais com violações próximas de zero enquanto mantém altas taxas de sucesso em tarefas.

Jianshu Hu, ZhiYuan Guan, Lei Song, Kantaphat Leelakunwet, Hesheng Wang, Wei Xiao, Qi Dou, Yutong Ban2026-03-10💻 cs

Monetizing Generative AI: YouTubers' Collective Knowledge on Earning from Generative AI Content

Este estudo analisa 377 vídeos do YouTube para mapear o conhecimento coletivo de criadores sobre estratégias de monetização de conteúdo gerado por IA, identificando dez casos de uso comuns e tensionamentos estruturais como alegações de renda não verificáveis e questões de autoria.

Shuo Niu, Yao Lyu, He Zhang, Na Li, Bumjin Kim, Jie Cai2026-03-10💻 cs

Self-Supervised Multi-Modal World Model with 4D Space-Time Embedding

O artigo apresenta o DeepEarth, um modelo de mundo auto-supervisionado multi-modal que utiliza o codificador posicional 4D Earth4D para escalar com precisão sub-métrica e sub-segundo em escala planetária, alcançando desempenho superior em previsões ecológicas.

Lance Legel, Qin Huang, Brandon Voelker, Daniel Neamati, Patrick Alan Johnson, Favyen Bastani, Jeff Rose, James Ryan Hennessy, Robert Guralnick, Douglas Soltis, Pamela Soltis, Shaowen Wang2026-03-10💻 cs

TacDexGrasp: Compliant and Robust Dexterous Grasping with Tactile Feedback

O artigo TacDexGrasp apresenta um controlador baseado em Programação Cônica de Segunda Ordem e feedback tátil que garante a estabilidade de preensões dexterosas em objetos desconhecidos, prevenindo tanto o deslizamento translacional quanto o rotacional ao restringir ativamente a razão entre as forças tangenciais e normais em cada contato, sem a necessidade de modelagem explícita de torque ou detecção de deslizamento.

Yubin Ke, Jiayi Chen, Hang Lv, Xiao Zhou, He Wang2026-03-10💻 cs

AIReSim: A Discrete Event Simulator for Large-scale AI Cluster Reliability Modeling

O artigo apresenta o AIReSim, um simulador de eventos discretos projetado para modelar a confiabilidade de clusters de IA em grande escala, permitindo aos engenheiros avaliar sistematicamente configurações, priorizar melhorias e realizar planejamento de capacidade através de cenários hipotéticos.

Karthik Pattabiraman, Mihir Patel, Fred Lin2026-03-10💻 cs

Fine-Grained 3D Facial Reconstruction for Micro-Expressions

Este artigo propõe um método inovador de reconstrução 3D de microexpressões faciais que integra características dinâmicas globais e locais enriquecidas para superar os desafios da natureza sutil e transitória dessas expressões, superando os métodos atuais em precisão geométrica e detalhe perceptual.

Che Sun, Xinjie Zhang, Rui Gao, Xu Chen, Yuwei Wu, Yunde Jia2026-03-10💻 cs

Understanding User Requirements for Creating Sensor-Powered Smart Car Cabins Through Retrofitting

Este artigo apresenta um estudo de duas fases que identifica os requisitos dos usuários e oferece recomendações de design para soluções de retrofitting que complementam e superam as limitações dos sensores de cabines inteligentes integrados pelos fabricantes de automóveis.

Bofan Yu, Borui Li, Tingyu Zhang, Xing-Dong Yang2026-03-10💻 cs

Looking Back and Forth: Cross-Image Attention Calibration and Attentive Preference Learning for Multi-Image Hallucination Mitigation

O artigo propõe o framework CAPL, que combina calibração de atenção inter-imagem e aprendizado por preferência para mitigar alucinações em modelos de linguagem e visão grandes, melhorando a modelagem de associações entre múltiplas imagens e a fundamentação em evidências visuais autênticas.

Xiaochen Yang, Hao Fang, Jiawei Kong, Yaoxin Mao, Bin Chen, Shu-Tao Xia2026-03-10💻 cs

← Anterior Próximo →