cs.AI artigos | Gist.Science

OrthoFormer: Instrumental Variable Estimation in Transformer Hidden States via Neural Control Functions

O artigo apresenta o OrthoFormer, uma nova arquitetura baseada em Transformers que integra estimação de variáveis instrumentais via funções de controle neural para separar causalidade de correlações espúrias, garantindo maior robustez e generalização em cenários fora da distribuição.

Charles Luo2026-03-10🤖 cs.LG

Machine Learning for Stress Testing: Uncertainty Decomposition in Causal Panel Prediction

Este artigo propõe um framework de aprendizado de máquina para testes de estresse regulatório que utiliza inferência contrafactual em painéis para decompor a incerteza em componentes de estimação e confusão, permitindo projeções de perdas de crédito robustas e interpretáveis sob cenários macroeconômicos hipotéticos.

Yu Wang, Xiangchen Liu, Siguang Li2026-03-10💻 cs

HLER: Human-in-the-Loop Economic Research via Multi-Agent Pipelines for Empirical Discovery

O artigo apresenta o HLER, uma arquitetura de agentes múltiplos que automatiza a pesquisa econômica empírica ao integrar supervisão humana e geração de hipóteses orientada por dados, resultando em uma taxa de viabilidade de 87% e custos reduzidos na produção de manuscritos completos.

Chen Zhu, Xiaolu Wang2026-03-10💻 cs

Dial: A Knowledge-Grounded Dialect-Specific NL2SQL System

O artigo apresenta o Dial, um sistema de NL2SQL baseado em conhecimento que supera as limitações dos métodos existentes ao gerar consultas SQL semanticamente corretas e executáveis em diversos dialetos de banco de dados, utilizando planejamento lógico consciente de dialeto, uma base de conhecimento hierárquica e um ciclo de depuração orientado à execução.

Xiang Zhang, Hongming Xu, Le Zhou, Wei Zhou, Xuanhe Zhou, Guoliang Li, Yuyu Luo, Changdong Liu, Guorun Chen, Jiang Liao, Fan Wu2026-03-10🤖 cs.LG

Backdoor4Good: Benchmarking Beneficial Uses of Backdoors in LLMs

O artigo apresenta o Backdoor4Good (B4G), um novo benchmark e framework que reinterpreta os mecanismos de backdoor em modelos de linguagem grandes como interfaces controláveis e auditáveis para promover tarefas benéficas, como segurança e responsabilidade, demonstrando que esses mecanismos podem ser projetados de forma modular e segura para fortalecer a confiança em sistemas de IA.

Yige Li, Wei Zhao, Zhe Li, Nay Myat Min, Hanxun Huang, Yunhan Zhao, Xingjun Ma, Yu-Gang Jiang, Jun Sun2026-03-10💻 cs

Image Generation Models: A Technical History

Este artigo oferece uma pesquisa abrangente sobre a evolução técnica dos modelos de geração de imagens, detalhando desde VAEs e GANs até métodos baseados em difusão, abordando também avanços na geração de vídeo e as questões de responsabilidade e robustez no seu uso.

Rouzbeh Shirvani2026-03-10💬 cs.CL

"Better Ask for Forgiveness than Permission": Practices and Policies of AI Disclosure in Freelance Work

Este estudo revela que, no trabalho freelancer, existe uma lacuna de expectativas sobre a divulgação do uso de IA, onde os trabalhadores tendem a ser passivos ao presumir que os clientes conseguem detectar a assistência, enquanto os clientes preferem a divulgação proativa devido à sua própria incerteza, destacando a necessidade de políticas e diretrizes mais claras para fomentar a confiança.

Angel Hsing-Chi Hwang, Senya Wong, Baixiao Chen, Jessica He, Hyo Jin Do2026-03-10💻 cs

Where Do LLM-based Systems Break? A System-Level Security Framework for Risk Assessment and Treatment

Este trabalho apresenta um framework de avaliação de riscos orientado a objetivos para sistemas baseados em Grandes Modelos de Linguagem (LLMs), que integra modelagem de sistemas com Árvores de Ataque-Defesa e pontuação CVSS para identificar pontos críticos e permitir a criação de defesas direcionadas em contextos de segurança crítica, como demonstrado em um estudo de caso na área da saúde.

Neha Nagaraja, Hayretdin Bahsi2026-03-10💻 cs

The Dual-Stream Transformer: Channelized Architecture for Interpretable Language Modeling

O artigo apresenta o Transformer de Duplo Fluxo, uma arquitetura que separa o fluxo residual em componentes de token e contexto para criar um trade-off ajustável entre interpretabilidade e desempenho, permitindo que modelos de linguagem mantenham robustez funcional e aprendam algoritmos discretos enquanto expõem sua estrutura interna por design.

J. Clayton Kerce, Alexis Fox2026-03-10🤖 cs.LG

Do Machines Fail Like Humans? A Human-Centred Out-of-Distribution Spectrum for Mapping Error Alignment

Este artigo propõe um novo quadro de referência centrado no ser humano para analisar o alinhamento entre modelos de IA e a cognição humana, redefinindo a distribuição fora do padrão (OOD) como um espectro de dificuldade perceptual para revelar que a consistência do alinhamento varia significativamente dependendo da arquitetura do modelo e do nível de desafio perceptual.

Binxia Xu, Xiaoliang Luo, Luke Dickens, Robert M. Mok2026-03-10💻 cs

Towards Lightweight Adaptation of Speech Enhancement Models in Real-World Environments

Este trabalho propõe um framework leve para adaptação on-device de modelos de aprimoramento de fala em ambientes acústicos dinâmicos, que atualiza menos de 1% dos parâmetros do modelo base via adaptadores de baixo posto e treinamento auto-supervisionado, alcançando melhorias significativas na qualidade perceptiva com rápida convergência em cenários de ruído desafiadores.

Longbiao Cheng, Shih-Chii Liu2026-03-10🤖 cs.LG

Contact-Guided 3D Genome Structure Generation of E. coli via Diffusion Transformers

Este estudo apresenta um framework condicional baseado em difusão e transformadores que gera um conjunto diversificado de conformações tridimensionais do genoma de *Escherichia coli*, guiado por mapas de contato Hi-C, superando a limitação de modelos determinísticos ao produzir estruturas heterogêneas consistentes com os dados experimentais.

Mingxin Zhang, Xiaofeng Dai, Yu Yao, Ziqi Yin2026-03-10🤖 cs.LG

Give Them an Inch and They Will Take a Mile:Understanding and Measuring Caller Identity Confusion in MCP-Based AI Systems

Este artigo revela que a falta de autenticação da identidade do chamador em sistemas baseados no Protocolo de Contexto de Modelo (MCP) cria vulnerabilidades críticas de segurança, permitindo que servidores confiem implicitamente em múltiplos chamadores após uma única autorização e expondo operações sensíveis a acessos não autorizados.

Yuhang Huang, Boyang Ma, Biwei Yan, Xuelong Dai, Yechao Zhang, Minghui Xu, Kaidi Xu, Yue Zhang2026-03-10💻 cs

Cross-Modal Taxonomic Generalization in (Vision-) Language Models

O estudo demonstra que modelos de linguagem pré-treinados, quando integrados a codificadores de imagem em modelos de visão-linguagem, conseguem recuperar e generalizar conhecimento taxonômico (hiperônimos) mesmo sem evidência explícita durante o treinamento, indicando que essa capacidade surge da combinação entre a coerência dos dados visuais e o conhecimento derivado de pistas linguísticas.

Tianyang Xu, Marcelo Sandoval-Castaneda, Karen Livescu, Greg Shakhnarovich, Kanishka Misra2026-03-10💬 cs.CL

Interpretable-by-Design Transformers via Architectural Stream Independence

O artigo apresenta a Arquitetura de Fusão Tardia (LFA), que impõe a independência de fluxos arquitetônicos para separar a estrutura simbólica da semântica contextual, demonstrando que essa restrição estrutural garante interpretabilidade por design, modularidade funcional e maior estabilidade de aprendizado em comparação aos transformers tradicionais.

Clayton Kerce, Alexis Fox2026-03-10🤖 cs.LG

A Joint Neural Baseline for Concept, Assertion, and Relation Extraction from Clinical Text

Este artigo propõe um sistema neural end-to-end inovador para a extração conjunta de conceitos, asserções e relações em textos clínicos, demonstrando desempenho superior ao dos modelos em pipeline tradicionais e estabelecendo uma forte linha de base para pesquisas futuras na área.

Fei Cheng, Ribeka Tanaka, Sadao Kurohashi2026-03-10💬 cs.CL

From Thinker to Society: Security in Hierarchical Autonomy Evolution of AI Agents

O artigo propõe o framework de Evolução de Autonomia Hierárquica (HAE) para abordar as vulnerabilidades de segurança emergentes em agentes de IA, organizando a defesa em três níveis (cognitivo, de execução e coletivo) e apresentando uma taxonomia de ameaças para guiar o desenvolvimento de arquiteturas de proteção multicamadas.

Xiaolei Zhang, Lu Zhou, Xiaogang Xu, Jiafei Wu, Tianyu Du, Heqing Huang, Hao Peng, Zhe Liu2026-03-10💻 cs

SeDa: A Unified System for Dataset Discovery and Multi-Entity Augmented Semantic Exploration

O artigo apresenta o SeDa, um sistema unificado que integra mais de 7,6 milhões de conjuntos de dados de diversas fontes para facilitar sua descoberta e exploração semântica por meio de anotação padronizada, verificação de procedência e navegação contextual baseada em entidades.

Kan Ling, Zhen Qin, Yichi Zhu, Hengrun Zhang, Huiqun Yu, Guisheng Fan2026-03-10💻 cs

A Unified View of Drifting and Score-Based Models

Este artigo estabelece uma relação unificada entre modelos de derivação (drifting) e modelos baseados em pontuação (score-based), demonstrando que a derivação com kernel Gaussiano equivale a uma formulação de correspondência de pontuação em distribuições suavizadas e fornecendo limites de erro rigorosos para kernels Laplace.

Chieh-Hsin Lai, Bac Nguyen, Naoki Murata, Yuhta Takida, Toshimitsu Uesaka, Yuki Mitsufuji, Stefano Ermon, Molei Tao2026-03-10🤖 cs.LG

InterReal: A Unified Physics-Based Imitation Framework for Learning Human-Object Interaction Skills

O artigo apresenta o InterReal, um framework unificado de aprendizado por imitação baseado em física que permite a robôs humanoides aprender e executar com sucesso habilidades de interação humano-objeto no mundo real, superando limitações de frameworks anteriores através de uma nova estratégia de aumento de dados com restrições de contato e um aprendizado automático de recompensas.

Dayang Liang, Yuhang Lin, Xinzhe Liu, Jiyuan Shi, Yunlong Liu, Chenjia Bai2026-03-10💻 cs

← Anterior Próximo →