cs.AI artigos | Gist.Science

Reactive Writers: How Co-Writing with AI Changes How We Engage with Ideas

Este estudo introduz o conceito de "escrita reativa" para descrever como a colaboração com IA altera o processo criativo, transformando a avaliação de sugestões em uma atividade central que, embora os autores percebam estar no controle, acaba por moldar suas ideias e opiniões de forma sutil e não percebida.

Advait Bhat, Marianne Aubin Le Quéré, Mor Naaman, Maurice Jakesch2026-03-12🤖 cs.AI

Causal Concept Graphs in LLM Latent Space for Stepwise Reasoning

O artigo propõe os Grafos de Conceitos Causais (CCG), uma estrutura que mapeia dependências causais entre conceitos em espaços latentes de modelos de linguagem para aprimorar o raciocínio passo a passo, demonstrando superioridade sobre métodos existentes em tarefas de raciocínio lógico.

Md Muntaqim Meherab, Noor Islam S. Mohammad, Faiza Feroz2026-03-12🤖 cs.LG

Optimal Expert-Attention Allocation in Mixture-of-Experts: A Scalable Law for Dynamic Model Design

Este artigo propõe uma nova lei de escalonamento para modelos Mixture-of-Experts (MoE) que define uma relação de potência para a alocação ótima de computação entre camadas de atenção e especialistas, permitindo o ajuste preciso de arquiteturas escaláveis dentro de orçamentos de computação fixos.

Junzhuo Li, Peijie Jiang, Changxin Tian, Jia Liu, Zhiqiang Zhang, Xuming Hu2026-03-12🤖 cs.LG

Beyond Scalars: Evaluating and Understanding LLM Reasoning via Geometric Progress and Stability

O artigo apresenta o TRACED, um framework que avalia a qualidade do raciocínio de LLMs através de uma abordagem geométrica, decompondo os traços de raciocínio em "Progresso" (deslocamento) e "Estabilidade" (curvatura) para distinguir trajetórias corretas de alucinações com base em suas dinâmicas topológicas.

Xinyan Jiang, Ninghao Liu, Di Wang, Lijie Hu2026-03-12🤖 cs.AI

Safe Probabilistic Planning for Human-Robot Interaction using Conformal Risk Control

Este artigo apresenta um novo framework de controle probabilístico seguro para interação humano-robô que combina funções de barreira de controle com controle de risco conformal para fornecer garantias formais de segurança, ajustando dinamicamente as margens de segurança e demonstrando, em experimentos, uma redução significativa nas colisões e violações de segurança em comparação com métodos de base.

Jake Gonzales, Kazuki Mizuta, Karen Leung, Lillian J. Ratliff2026-03-12🤖 cs.AI

Verbalizing LLM's Higher-order Uncertainty via Imprecise Probabilities

Este artigo propõe novas técnicas de elicitação de incerteza baseadas em probabilidades imprecisas para capturar a incerteza de primeira e segunda ordem em Grandes Modelos de Linguagem (LLMs), superando as limitações dos métodos probabilísticos clássicos e melhorando a confiabilidade das respostas em cenários ambíguos e complexos.

Anita Yang, Krikamol Muandet, Michele Caprio, Siu Lun Chau, Masaki Adachi2026-03-12🤖 cs.AI

On the Learning Dynamics of Two-layer Linear Networks with Label Noise SGD

Este artigo investiga a dinâmica de aprendizado de redes lineares de duas camadas treinadas com SGD e ruído de rótulos, revelando um comportamento bifásico no qual o ruído impulsiona a transição do regime "lazy" para o "rich", melhorando a generalização e oferecendo insights aplicáveis a algoritmos como SAM.

Tongcheng Zhang, Zhanpeng Zhou, Mingze Wang, Andi Han, Wei Huang, Taiji Suzuki, Junchi Yan2026-03-12🤖 cs.LG

Designing Service Systems from Textual Evidence

Este artigo apresenta o algoritmo PP-LUCB, que otimiza a seleção de configurações de sistemas de serviço baseando-se em evidências textuais ao combinar avaliações de modelos de linguagem com auditorias humanas seletivas para corrigir vieses sistemáticos e reduzir significativamente os custos de verificação.

Ruicheng Ao, Hongyu Chen, Siyang Gao, Hanwei Li, David Simchi-Levi2026-03-12🤖 cs.LG

Effective Dataset Distillation for Spatio-Temporal Forecasting with Bi-dimensional Compression

O artigo apresenta o STemDist, o primeiro método de destilação de dados especializado para previsão espaço-temporal, que comprime simultaneamente as dimensões espacial e temporal para reduzir significativamente o tempo de treinamento e o uso de memória, mantendo ou melhorando a precisão das previsões.

Taehyung Kwon, Yeonje Choi, Yeongho Kim, Kijung Shin2026-03-12🤖 cs.LG

Enhancing Network Intrusion Detection Systems: A Multi-Layer Ensemble Approach to Mitigate Adversarial Attacks

Este trabalho propõe um mecanismo de defesa em camadas, combinando classificadores empilhados, autoencoders e treinamento adversarial, para aumentar a robustez de Sistemas de Detecção de Intrusão em Redes (NIDS) contra ataques gerados por GANs e FGSM, demonstrando maior resiliência nos conjuntos de dados UNSW-NB15 e NSL-KDD.

Nasim Soltani, Shayan Nejadshamsi, Zakaria Abou El Houda, Raphael Khoury, Kelton A. P. Costa, Tiago H. Falk, Anderson R. Avila2026-03-12🤖 cs.AI

Domain-Adaptive Health Indicator Learning with Degradation-Stage Synchronized Sampling and Cross-Domain Autoencoder

Este artigo propõe um framework de aprendizado adaptativo de domínio que combina amostragem de lotes sincronizada por estágio de degradação e um autoencoder de fusão alinhada com mecanismos de atenção cruzada para superar as discrepâncias de distribuição e capturar dependências temporais de longo prazo, resultando em indicadores de saúde significativamente mais precisos para monitoramento de condições industriais.

Jungho Choo, Hanbyeol Park, Gawon Lee, Yunkyung Park, Hyerim Bae2026-03-12🤖 cs.LG

The Curse and Blessing of Mean Bias in FP4-Quantized LLM Training

O artigo demonstra que a remoção simples do viés de média (mean bias), que é o principal fator de instabilidade numérica e anisotropia no treinamento de LLMs com baixa precisão (FP4), restaura a estabilidade e o desempenho do modelo de forma eficiente, eliminando a necessidade de métodos espectrais complexos como SVD.

Hengjie Cao, Zhendong Huang, Mengyi Chen, Yifeng Yang, Fanqi Yu, Ruijun Huang, Fang Dong, Xin Zhang, Jixian Zhou, Anrui Chen, Mingzhi Dong, Yujiang Wang, Jinlong Hou, Qin Lv, Yuan Cheng, Tun Lu, Fan Yang, Li Shang2026-03-12🤖 cs.LG

FAR-Dex: Few-shot Data Augmentation and Adaptive Residual Policy Refinement for Dexterous Manipulation

O artigo apresenta o FAR-Dex, um framework hierárquico que combina geração de dados aumentados via simulação e refinamento adaptativo de políticas residuais para superar a escassez de demonstrações e alcançar manipulação destreza robusta e precisa com braços e mãos robóticas.

Yushan Bai, Fulin Chen, Hongzheng Sun, Yuchuang Tong, En Li, Zhengtao Zhang2026-03-12🤖 cs.AI

UniPINN: A Unified PINN Framework for Multi-task Learning of Diverse Navier-Stokes Equations

O artigo apresenta o UniPINN, uma estrutura unificada de Redes Neurais Informadas por Física (PINNs) que resolve os desafios de aprendizado multi-tarefa em diferentes regimes de equações de Navier-Stokes através de uma arquitetura compartilhada-especializada, um mecanismo de atenção entre fluxos e uma estratégia de alocação dinâmica de pesos, resultando em maior precisão e estabilidade de treinamento.

Dengdi Sun, Jie Chen, Xiao Wang, Jin Tang2026-03-12🤖 cs.AI

G-STAR: End-to-End Global Speaker-Tracking Attributed Recognition

O artigo apresenta o G-STAR, um sistema de ponta a ponta que integra um módulo de rastreamento de falantes temporalmente consciente com um modelo de linguagem de fala (Speech-LLM) para realizar reconhecimento de fala atribuído a falantes com carimbo de tempo em conversas longas e sobrepostas, garantindo consistência de identidade em nível de reunião.

Jing Peng, Ziyi Chen, Haoyu Li, Yucheng Wang, Duo Ma, Mengtian Li, Yunfan Du, Dezhu Xu, Kai Yu, Shuai Wang2026-03-12⚡ eess

Modeling Stage-wise Evolution of User Interests for News Recommendation

O artigo propõe um quadro unificado para recomendação de notícias que modela a evolução dos interesses do usuário em estágios, combinando a modelagem de preferências de longo prazo com a análise de dinâmicas de curto prazo em subgrafos temporais para superar as limitações dos métodos estáticos existentes.

Zhiyong Cheng, Yike Jin, Zhijie Zhang, Huilin Chen, Zhangling Duan, Meng Wang2026-03-12🤖 cs.AI

Aligning Large Language Models with Searcher Preferences

Este artigo apresenta o SearchLLM, o primeiro modelo de linguagem grande para busca generativa aberta, que utiliza um sistema de recompensa hierárquico e a otimização GRPO para alinhar a síntese de respostas com as preferências dos usuários, garantindo segurança e robustez, com resultados validados por testes online no RedNote que demonstraram melhorias na qualidade de geração e no engajamento.

Wei Wu, Peilun Zhou, Liyi Chen, Qimeng Wang, Chengqiang Lu, Yan Gao, Yi Wu, Yao Hu, Hui Xiong2026-03-12💬 cs.CL

Learning to Negotiate: Multi-Agent Deliberation for Collective Value Alignment in LLMs

Este trabalho propõe um framework de alinhamento baseado em negociação multiagente que utiliza treinamento auto-competitivo e RLAIF para otimizar a capacidade de resolução de conflitos e o alinhamento com a Agência Coletiva em modelos de linguagem, sem comprometer suas habilidades gerais.

Panatchakorn Anantaprayoon, Nataliia Babina, Nima Asgharbeygi, Jad Tarifi2026-03-12💬 cs.CL

JEDI: Jointly Embedded Inference of Neural Dynamics

O artigo apresenta o JEDI, um modelo hierárquico que infere dinâmicas neurais generalizáveis e específicas de contexto a partir de gravações experimentais, aprendendo um espaço de incorporação compartilhado sobre pesos de redes neurais recorrentes para superar as limitações de métodos anteriores em tarefas múltiplas.

Anirudh Jamkhandi, Ali Korojy, Olivier Codol, Guillaume Lajoie, Matthew G. Perich2026-03-12🧬 q-bio

Naïve Exposure of Generative AI Capabilities Undermines Deepfake Detection

Este trabalho demonstra que a exposição ingênua das capacidades de refinamento e raciocínio de sistemas de IA generativa comercial, acessíveis por meio de prompts benignos, mina fundamentalmente os detectores de deepfake modernos ao permitir a criação de imagens que evitam a detecção, preservam a identidade e possuem alta qualidade perceptual, revelando uma lacuna crítica entre os modelos de ameaça atuais e as capacidades reais dessas ferramentas.

Sunpill Kim, Chanwoo Hwang, Minsu Kim, Jae Hong Seo2026-03-12🤖 cs.AI

← Anterior Próximo →