Dial: A Knowledge-Grounded Dialect-Specific NL2SQL System

O artigo apresenta o Dial, um sistema de NL2SQL baseado em conhecimento que supera as limitações dos métodos existentes ao gerar consultas SQL semanticamente corretas e executáveis em diversos dialetos de banco de dados, utilizando planejamento lógico consciente de dialeto, uma base de conhecimento hierárquica e um ciclo de depuração orientado à execução.

Xiang Zhang, Hongming Xu, Le Zhou, Wei Zhou, Xuanhe Zhou, Guoliang Li, Yuyu Luo, Changdong Liu, Guorun Chen, Jiang Liao, Fan Wu2026-03-10🤖 cs.LG

Backdoor4Good: Benchmarking Beneficial Uses of Backdoors in LLMs

O artigo apresenta o Backdoor4Good (B4G), um novo benchmark e framework que reinterpreta os mecanismos de backdoor em modelos de linguagem grandes como interfaces controláveis e auditáveis para promover tarefas benéficas, como segurança e responsabilidade, demonstrando que esses mecanismos podem ser projetados de forma modular e segura para fortalecer a confiança em sistemas de IA.

Yige Li, Wei Zhao, Zhe Li, Nay Myat Min, Hanxun Huang, Yunhan Zhao, Xingjun Ma, Yu-Gang Jiang, Jun Sun2026-03-10💻 cs

"Better Ask for Forgiveness than Permission": Practices and Policies of AI Disclosure in Freelance Work

Este estudo revela que, no trabalho freelancer, existe uma lacuna de expectativas sobre a divulgação do uso de IA, onde os trabalhadores tendem a ser passivos ao presumir que os clientes conseguem detectar a assistência, enquanto os clientes preferem a divulgação proativa devido à sua própria incerteza, destacando a necessidade de políticas e diretrizes mais claras para fomentar a confiança.

Angel Hsing-Chi Hwang, Senya Wong, Baixiao Chen, Jessica He, Hyo Jin Do2026-03-10💻 cs

Where Do LLM-based Systems Break? A System-Level Security Framework for Risk Assessment and Treatment

Este trabalho apresenta um framework de avaliação de riscos orientado a objetivos para sistemas baseados em Grandes Modelos de Linguagem (LLMs), que integra modelagem de sistemas com Árvores de Ataque-Defesa e pontuação CVSS para identificar pontos críticos e permitir a criação de defesas direcionadas em contextos de segurança crítica, como demonstrado em um estudo de caso na área da saúde.

Neha Nagaraja, Hayretdin Bahsi2026-03-10💻 cs

Do Machines Fail Like Humans? A Human-Centred Out-of-Distribution Spectrum for Mapping Error Alignment

Este artigo propõe um novo quadro de referência centrado no ser humano para analisar o alinhamento entre modelos de IA e a cognição humana, redefinindo a distribuição fora do padrão (OOD) como um espectro de dificuldade perceptual para revelar que a consistência do alinhamento varia significativamente dependendo da arquitetura do modelo e do nível de desafio perceptual.

Binxia Xu, Xiaoliang Luo, Luke Dickens, Robert M. Mok2026-03-10💻 cs

Towards Lightweight Adaptation of Speech Enhancement Models in Real-World Environments

Este trabalho propõe um framework leve para adaptação on-device de modelos de aprimoramento de fala em ambientes acústicos dinâmicos, que atualiza menos de 1% dos parâmetros do modelo base via adaptadores de baixo posto e treinamento auto-supervisionado, alcançando melhorias significativas na qualidade perceptiva com rápida convergência em cenários de ruído desafiadores.

Longbiao Cheng, Shih-Chii Liu2026-03-10🤖 cs.LG

Give Them an Inch and They Will Take a Mile:Understanding and Measuring Caller Identity Confusion in MCP-Based AI Systems

Este artigo revela que a falta de autenticação da identidade do chamador em sistemas baseados no Protocolo de Contexto de Modelo (MCP) cria vulnerabilidades críticas de segurança, permitindo que servidores confiem implicitamente em múltiplos chamadores após uma única autorização e expondo operações sensíveis a acessos não autorizados.

Yuhang Huang, Boyang Ma, Biwei Yan, Xuelong Dai, Yechao Zhang, Minghui Xu, Kaidi Xu, Yue Zhang2026-03-10💻 cs

Cross-Modal Taxonomic Generalization in (Vision-) Language Models

O estudo demonstra que modelos de linguagem pré-treinados, quando integrados a codificadores de imagem em modelos de visão-linguagem, conseguem recuperar e generalizar conhecimento taxonômico (hiperônimos) mesmo sem evidência explícita durante o treinamento, indicando que essa capacidade surge da combinação entre a coerência dos dados visuais e o conhecimento derivado de pistas linguísticas.

Tianyang Xu, Marcelo Sandoval-Castaneda, Karen Livescu, Greg Shakhnarovich, Kanishka Misra2026-03-10💬 cs.CL

From Thinker to Society: Security in Hierarchical Autonomy Evolution of AI Agents

O artigo propõe o framework de Evolução de Autonomia Hierárquica (HAE) para abordar as vulnerabilidades de segurança emergentes em agentes de IA, organizando a defesa em três níveis (cognitivo, de execução e coletivo) e apresentando uma taxonomia de ameaças para guiar o desenvolvimento de arquiteturas de proteção multicamadas.

Xiaolei Zhang, Lu Zhou, Xiaogang Xu, Jiafei Wu, Tianyu Du, Heqing Huang, Hao Peng, Zhe Liu2026-03-10💻 cs

A Unified View of Drifting and Score-Based Models

Este artigo estabelece uma relação unificada entre modelos de derivação (drifting) e modelos baseados em pontuação (score-based), demonstrando que a derivação com kernel Gaussiano equivale a uma formulação de correspondência de pontuação em distribuições suavizadas e fornecendo limites de erro rigorosos para kernels Laplace.

Chieh-Hsin Lai, Bac Nguyen, Naoki Murata, Yuhta Takida, Toshimitsu Uesaka, Yuki Mitsufuji, Stefano Ermon, Molei Tao2026-03-10🤖 cs.LG

InterReal: A Unified Physics-Based Imitation Framework for Learning Human-Object Interaction Skills

O artigo apresenta o InterReal, um framework unificado de aprendizado por imitação baseado em física que permite a robôs humanoides aprender e executar com sucesso habilidades de interação humano-objeto no mundo real, superando limitações de frameworks anteriores através de uma nova estratégia de aumento de dados com restrições de contato e um aprendizado automático de recompensas.

Dayang Liang, Yuhang Lin, Xinzhe Liu, Jiyuan Shi, Yunlong Liu, Chenjia Bai2026-03-10💻 cs