cs artigos | Gist.Science

AutoControl Arena: Synthesizing Executable Test Environments for Frontier AI Risk Evaluation

O artigo apresenta o AutoControl Arena, um framework automatizado que combina código executável e modelos de linguagem para avaliar riscos de IA avançada, revelando que modelos alinhados podem exibir alucinações de segurança e padrões de desalinhamento estratégico sob pressão.

Changyi Li, Pengfei Lu, Xudong Pan, Fazl Barez, Min Yang2026-03-10💻 cs

Disentangled Textual Priors for Diffusion-based Image Super-Resolution

O artigo apresenta o DTPSR, um novo framework de super-resolução baseado em difusão que utiliza priores textuais desentrelaçados em dimensões espaciais e de frequência, apoiado pelo dataset DisText-SR, para gerar imagens de alta qualidade com maior controle semântico e fidelidade.

Lei Jiang, Xin Liu, Xinze Tong, Zhiliang Li, Jie Liu, Jie Tang, Gangshan Wu2026-03-10💻 cs

RPG-SAM: Reliability-Weighted Prototypes and Geometric Adaptive Threshold Selection for Training-Free One-Shot Polyp Segmentation

O artigo apresenta o RPG-SAM, um framework de segmentação poliposa one-shot sem treinamento que supera as limitações de métodos existentes ao abordar a heterogeneidade regional e de resposta por meio de mineração de protótipos ponderados por confiabilidade e seleção adaptativa geométrica, resultando em uma melhoria de 5,56% no mIoU no conjunto de dados Kvasir.

Weikun Lin, Yunhao Bai, Yan Wang2026-03-10💻 cs

Machine Learning for Stress Testing: Uncertainty Decomposition in Causal Panel Prediction

Este artigo propõe um framework de aprendizado de máquina para testes de estresse regulatório que utiliza inferência contrafactual em painéis para decompor a incerteza em componentes de estimação e confusão, permitindo projeções de perdas de crédito robustas e interpretáveis sob cenários macroeconômicos hipotéticos.

Yu Wang, Xiangchen Liu, Siguang Li2026-03-10💻 cs

DogWeave: High-Fidelity 3D Canine Reconstruction from a Single Image via Normal Fusion and Conditional Inpainting

O artigo apresenta o DogWeave, um framework baseado em modelo que reconstrói cães 3D de alta fidelidade a partir de uma única imagem RGB, refinando a geometria por meio de otimização de campos normais aprimorados por difusão e gerando texturas consistentes via inpainting condicional para superar desafios como oclusão e detalhes de pelagem.

Shufan Sun, Chenchen Wang, Zongfu Yu2026-03-10💻 cs

LITHE: Bridging Best-Effort Python and Real-Time C++ for Hot-Swapping Robotic Control Laws on Commodity Linux

O artigo apresenta o LITHE, uma arquitetura de software leve que permite a substituição dinâmica e segura de leis de controle em tempo real (C++) por um cérebro de alto nível em Python em hardware comercial, eliminando a rigidez do código compilado e habilitando a evolução contínua da inteligência corporal em sistemas robóticos.

He Kai Lim, Tyler R. Clites2026-03-10💻 cs

Med-Evo: Test-time Self-evolution for Medical Multimodal Large Language Models

O artigo apresenta o Med-Evo, um framework pioneiro de auto-evolução para Modelos de Linguagem Multimodal Médica que utiliza aprendizado por reforço sem rótulos, combinando rotulagem pseudo baseada em características e recompensas híbridas, para melhorar o desempenho do modelo em dados de teste não rotulados sem depender de anotações adicionais.

Dunyuan Xu, Xikai Yang, Juzheng Miao, Yaoqian Li, Jinpeng Li, Pheng-Ann Heng2026-03-10💻 cs

HLER: Human-in-the-Loop Economic Research via Multi-Agent Pipelines for Empirical Discovery

O artigo apresenta o HLER, uma arquitetura de agentes múltiplos que automatiza a pesquisa econômica empírica ao integrar supervisão humana e geração de hipóteses orientada por dados, resultando em uma taxa de viabilidade de 87% e custos reduzidos na produção de manuscritos completos.

Chen Zhu, Xiaolu Wang2026-03-10💻 cs

GeoVisA11y: An AI-based Geovisualization Question-Answering System for Screen-Reader Users

O artigo apresenta o GeoVisA11y, um sistema de perguntas e respostas baseado em IA que torna as geovisualizações acessíveis a usuários de leitores de tela, validando sua eficácia e padrões de interação através de estudos com participantes cegos e videntes.

Chu Li, Rock Yuren Pang, Arnavi Chheda-Kothary, Ather Sharif, Henok Assalif, Jeffrey Heer, Jon E. Froehlich2026-03-10💻 cs

Backdoor4Good: Benchmarking Beneficial Uses of Backdoors in LLMs

O artigo apresenta o Backdoor4Good (B4G), um novo benchmark e framework que reinterpreta os mecanismos de backdoor em modelos de linguagem grandes como interfaces controláveis e auditáveis para promover tarefas benéficas, como segurança e responsabilidade, demonstrando que esses mecanismos podem ser projetados de forma modular e segura para fortalecer a confiança em sistemas de IA.

Yige Li, Wei Zhao, Zhe Li, Nay Myat Min, Hanxun Huang, Yunhan Zhao, Xingjun Ma, Yu-Gang Jiang, Jun Sun2026-03-10💻 cs

Agentic AI-Driven UAV Network Deployment: A LLM-Enhanced Exact Potential Game Approach

Este artigo propõe um framework de otimização de topologia para redes de UAVs baseado em jogos de potencial exato e aprimorado por IA Agente e Grandes Modelos de Linguagem, que coordena decisões de enlace e implantação em múltiplas escalas espaciais para superar desafios de complexidade e melhorar o desempenho da rede.

Xin Tang, Qian Chen, Binhan Liao, Yaqi Zhang, Jianxin Chen, Changyuan Zhao, Junchuan Fan, Junxi Tian, Xiaohuan Li2026-03-10💻 cs

"Better Ask for Forgiveness than Permission": Practices and Policies of AI Disclosure in Freelance Work

Este estudo revela que, no trabalho freelancer, existe uma lacuna de expectativas sobre a divulgação do uso de IA, onde os trabalhadores tendem a ser passivos ao presumir que os clientes conseguem detectar a assistência, enquanto os clientes preferem a divulgação proativa devido à sua própria incerteza, destacando a necessidade de políticas e diretrizes mais claras para fomentar a confiança.

Angel Hsing-Chi Hwang, Senya Wong, Baixiao Chen, Jessica He, Hyo Jin Do2026-03-10💻 cs

Where Do LLM-based Systems Break? A System-Level Security Framework for Risk Assessment and Treatment

Este trabalho apresenta um framework de avaliação de riscos orientado a objetivos para sistemas baseados em Grandes Modelos de Linguagem (LLMs), que integra modelagem de sistemas com Árvores de Ataque-Defesa e pontuação CVSS para identificar pontos críticos e permitir a criação de defesas direcionadas em contextos de segurança crítica, como demonstrado em um estudo de caso na área da saúde.

Neha Nagaraja, Hayretdin Bahsi2026-03-10💻 cs

Do Machines Fail Like Humans? A Human-Centred Out-of-Distribution Spectrum for Mapping Error Alignment

Este artigo propõe um novo quadro de referência centrado no ser humano para analisar o alinhamento entre modelos de IA e a cognição humana, redefinindo a distribuição fora do padrão (OOD) como um espectro de dificuldade perceptual para revelar que a consistência do alinhamento varia significativamente dependendo da arquitetura do modelo e do nível de desafio perceptual.

Binxia Xu, Xiaoliang Luo, Luke Dickens, Robert M. Mok2026-03-10💻 cs

SIGMAE: A Spectral-Index-Guided Foundation Model for Multispectral Remote Sensing

O artigo apresenta o SIGMAE, um modelo fundamental para imagens multiespectrais que supera as limitações dos métodos MAE tradicionais ao utilizar índices espectrais como prioridade para guiar um mascaramento dinâmico de tokens focado em regiões semanticamente ricas, resultando em representações espaciais-espectrais superiores e melhor desempenho em diversas tarefas de sensoriamento remoto com poucos dados rotulados.

Xiaokang Zhang, Bo Li, Chufeng Zhou, Weikang Yu, Lefei Zhang2026-03-10💻 cs

Selective Transfer Learning of Cross-Modality Distillation for Monocular 3D Object Detection

Este artigo apresenta o MonoSTL, uma abordagem de aprendizado seletivo que supera as limitações da transferência negativa entre LiDAR e imagens na detecção 3D monocular, utilizando módulos de destilação de características e relações conscientes da incerteza de profundidade para alcançar o estado da arte em vários conjuntos de dados.

Rui Ding, Meng Yang, Nanning Zheng2026-03-10💻 cs

Classifying Novel 3D-Printed Objects without Retraining: Towards Post-Production Automation in Additive Manufacturing

Este artigo apresenta o conjunto de dados ThingiPrint e um método de classificação baseado em protótipos que utiliza modelos CAD para identificar objetos 3D impressos sem necessidade de retreinamento, viabilizando a automação pós-produção na manufatura aditiva.

Fanis Mathioulakis, Gorjan Radevski, Silke GC Cleuren, Michel Janssens, Brecht Das, Koen Schauwaert, Tinne Tuytelaars2026-03-10💻 cs

FedEU: Evidential Uncertainty-Driven Federated Fine-Tuning of Vision Foundation Models for Remote Sensing Image Segmentation

O artigo apresenta o FedEU, um framework de otimização federada que utiliza modelagem de incerteza evidencial e incorporações de características específicas do cliente para aprimorar o ajuste fino de modelos fundamentais de visão em imagens de sensoriamento remoto, garantindo agregação global adaptativa e resultados mais robustos em ambientes heterogêneos.

Xiaokang Zhang, Xuran Xiong, Jianzhong Huang, Lefei Zhang2026-03-10💻 cs

Give Them an Inch and They Will Take a Mile:Understanding and Measuring Caller Identity Confusion in MCP-Based AI Systems

Este artigo revela que a falta de autenticação da identidade do chamador em sistemas baseados no Protocolo de Contexto de Modelo (MCP) cria vulnerabilidades críticas de segurança, permitindo que servidores confiem implicitamente em múltiplos chamadores após uma única autorização e expondo operações sensíveis a acessos não autorizados.

Yuhang Huang, Boyang Ma, Biwei Yan, Xuelong Dai, Yechao Zhang, Minghui Xu, Kaidi Xu, Yue Zhang2026-03-10💻 cs

EVLF: Early Vision-Language Fusion for Generative Dataset Distillation

O artigo apresenta o EVLF (Fusão Precoce Visão-Linguagem), um método plug-and-play para distilação de conjuntos de dados baseado em difusão que alinha embeddings textuais e visuais no início do processo de geração, superando a dominância de prompts textuais para produzir dados sintéticos mais fiéis e melhorar a precisão em tarefas de classificação.

Wenqi Cai, Yawen Zou, Guang Li, Chunzhi Gu, Chao Zhang2026-03-10💻 cs

← Anterior Próximo →