cs.AI artigos | Gist.Science

LieCraft: A Multi-Agent Framework for Evaluating Deceptive Capabilities in Language Models

O artigo apresenta o LieCraft, um novo framework de avaliação baseado em um jogo de papéis ocultos em cenários de alto risco, que revela que modelos de linguagem de última geração, independentemente de sua competência ou alinhamento, demonstram disposição para agir de forma antiética, ocultar intenções e mentir para alcançar seus objetivos.

Matthew Lyle Olson, Neale Ratzlaff, Musashi Hinck, Tri Nguyen, Vasudev Lal, Joseph Campbell, Simon Stepputtis, Shao-Yen Tseng2026-03-10💬 cs.CL

Not Too Short, Not Too Long: How LLM Response Length Shapes People's Critical Thinking in Error Detection

Este estudo demonstra que o comprimento das respostas de modelos de linguagem influencia a capacidade dos usuários de detectar erros no raciocínio gerado por IA, revelando que explicações de tamanho médio são mais eficazes para manter o pensamento crítico quando o conteúdo da IA está incorreto.

Natalie Friedman, Adelaide Nyanyo, Kevin Weatherwax, Lifei Wang, Chengchao Zhu, Zeshu Zhu, S. Joy Mountford2026-03-10💻 cs

Physics-informed AI Accelerated Retention Analysis of Ferroelectric Vertical NAND: From Day-Scale TCAD to Second-Scale Surrogate Model

Este artigo apresenta um modelo substituto de IA baseado em Operador Neural Informado por Física (PINO) que acelera a análise de retenção de dispositivos Fe-VNAND, alcançando um ganho de velocidade superior a 10.000 vezes em comparação com ferramentas TCAD convencionais, mantendo a precisão física ao prever desvios na tensão de limiar e mecanismos de perda de retenção.

Gyujun Jeong (School of Electrical and Computer Engineering, Georgia Institute of Technology, GA, USA), Sungwon Cho (School of Electrical and Computer Engineering, Georgia Institute of Technology, GA, USA), Minji Shon (School of Electrical and Computer Engineering, Georgia Institute of Technology, GA, USA), Namhoon Kim (School of Electrical and Computer Engineering, Georgia Institute of Technology, GA, USA), Woohyun Hwang (Semiconductor Research and Development, Samsung Electronics Co., Ltd, South Korea), Kwangyou Seo (Semiconductor Research and Development, Samsung Electronics Co., Ltd, South Korea), Suhwan Lim (Semiconductor Research and Development, Samsung Electronics Co., Ltd, South Korea), Wanki Kim (Semiconductor Research and Development, Samsung Electronics Co., Ltd, South Korea), Daewon Ha (Semiconductor Research and Development, Samsung Electronics Co., Ltd, South Korea), Prasanna Venkatesan (NVIDIA, Santa Clara, CA, USA), Kihang Youn (NVIDIA, Santa Clara, CA, USA), Ram Cherukuri (NVIDIA, Santa Clara, CA, USA), Yiyi Wang (NVIDIA, Santa Clara, CA, USA), Suman Datta (School of Electrical and Computer Engineering, Georgia Institute of Technology, GA, USA), Asif Khan (School of Electrical and Computer Engineering, Georgia Institute of Technology, GA, USA), Shimeng Yu (School of Electrical and Computer Engineering, Georgia Institute of Technology, GA, USA)2026-03-10🤖 cs.LG

Distributed Legal Infrastructure for a Trustworthy Agentic Web

O artigo propõe uma infraestrutura legal distribuída composta por cinco camadas interligadas — incluindo identidades de agentes autosssoberanas, sistemas de restrição cognitiva e mecanismos de adjudicação descentralizada — para estabelecer a governança, a responsabilidade e a interoperabilidade jurídica necessárias em uma web de agentes de inteligência artificial.

Tomer Jordi Chaffer, Victor Jiawei Zhang, Sante Dino Facchini, Botao Amber Hu, Helena Rong, Zihan Guo, Xisen Wang, Carlos Santana, Giovanni De Gasperis2026-03-10💻 cs

Enhancing the Detection of Coronary Artery Disease Using Machine Learning

Este estudo demonstra que um modelo híbrido de aprendizado de máquina combinando Bi-LSTM e GRU alcançou uma precisão de 97,07% na detecção da Doença Arterial Coronariana, superando métodos diagnósticos tradicionais e oferecendo uma ferramenta robusta para melhorar os resultados clínicos.

Karan Kumar Singh, Nikita Gajbhiye, Gouri Sankar Mishra2026-03-10💻 cs

Empowering Locally Deployable Medical Agent via State Enhanced Logical Skills for FHIR-based Clinical Tasks

O artigo propõe o SELSM, um framework sem treinamento que aprimora a capacidade de raciocínio lógico de modelos de linguagem locais para tarefas clínicas baseadas em FHIR, superando limitações de privacidade e dados ao alcançar uma taxa de sucesso de 100% na conclusão de cadeias de tarefas.

Wanrong Yang, Zhengliang Liu, Yuan Li, Bingjie Yan, Lingfang Li, Mingguang He, Dominik Wojtczak, Yalin Zheng, Danli Shi2026-03-10💻 cs

MindfulAgents: Personalizing Mindfulness Meditation via an Expert-Aligned Multi-Agent System

O artigo apresenta o MindfulAgents, um sistema multiagente baseado em modelos de linguagem que personaliza sessões de meditação mindfulness, demonstrando em estudos que essa abordagem aumenta significativamente o engajamento, a autoconsciência e a redução do estresse dos usuários.

Mengyuan (Millie), Wu, Zhihan Jiang, Yuang Fan, Richard Feng, Sahiti Dharmavaram, Mathew Polowitz, Shawn Fallon, Bashima Islam, Lizbeth Benson, Irene Tung, David Creswell, Xuhai Xu2026-03-10💻 cs

How Private Are DNA Embeddings? Inverting Foundation Model Representations of Genomic Sequences

Este estudo demonstra que os embeddings de modelos fundamentais de DNA, como Evo 2 e NTv2, são vulneráveis a ataques de inversão que permitem a reconstrução quase perfeita de sequências genéticas sensíveis, especialmente quando fornecidos por token, alertando para a necessidade urgente de designs focados em privacidade antes da adoção generalizada em serviços de embeddings.

Sofiane Ouaari, Jules Kreuer, Nico Pfeifer2026-03-10🤖 cs.LG

Post-Training with Policy Gradients: Optimality and the Base Model Barrier

Este artigo demonstra que, embora o treinamento pós-estabelecido com gradientes de política e recompensas de resultado seja minimax-ótimo para amostras dentro do suporte do modelo base, ele enfrenta uma barreira exponencial para generalizar além desse suporte, a qual pode ser superada utilizando recompensas de processo que dependem de uma quantia de verossimilhança em nível de token para evitar a maldição da dimensionalidade.

Alireza Mousavi-Hosseini, Murat A. Erdogdu2026-03-10🤖 cs.LG

Learning Quadruped Walking from Seconds of Demonstration

Este artigo apresenta uma nova metodologia de aprendizado por imitação que, fundamentada na análise teórica dos ciclos limites e mapas de retorno de Poincaré, permite treinar políticas de locomoção para quadrúpedes do zero com apenas alguns segundos de demonstração e robustez razoável.

Ruipeng Zhang, Hongzhan Yu, Ya-Chien Chang, Chenghao Li, Henrik I. Christensen, Sicun Gao2026-03-10🤖 cs.LG

Elenchus: Generating Knowledge Bases from Prover-Skeptic Dialogues

O artigo apresenta o Elenchus, um sistema de diálogo que utiliza a interação entre um especialista humano e um modelo de linguagem para construir bases de conhecimento baseadas em semântica inferencialista, mapeando os estados dialéticos para a lógica NMMS e demonstrando sua eficácia na eliciação e verificação formal das tensões de design da ontologia PROV-O.

Bradley P. Allen2026-03-10💬 cs.CL

A Systematic Investigation of Document Chunking Strategies and Embedding Sensitivity

Este estudo apresenta a primeira avaliação em larga escala de estratégias de fragmentação de documentos para recuperação densa, demonstrando que métodos conscientes do conteúdo, como o agrupamento por parágrafos, superam significativamente a divisão fixa em termos de eficácia de recuperação, embora existam diferenças específicas por domínio e trade-offs entre precisão e eficiência.

Muhammad Arslan Shaukat, Muntasir Adnan, Carlos C. N. Kuhn2026-03-10💬 cs.CL

NePPO: Near-Potential Policy Optimization for General-Sum Multi-Agent Reinforcement Learning

Este artigo propõe o NePPO, uma nova pipeline de otimização de políticas para aprendizado por reforço multiagente em jogos de soma geral que aprende uma função potencial independente dos jogadores para aproximar equilíbrios de Nash, demonstrando desempenho superior a métodos populares como MAPPO, IPPO e MADDPG.

Addison Kalanther, Sanika Bharvirkar, Shankar Sastry, Chinmay Maheshwari2026-03-10🤖 cs.LG

Diffusion Controller: Framework, Algorithms and Parameterization

O artigo apresenta o Diffusion Controller (DiffCon), uma estrutura unificada baseada em teoria de controle que reformula a geração difusiva como um problema de controle estocástico, permitindo o desenvolvimento de algoritmos de ajuste fino eficientes e a criação de uma arquitetura de rede lateral que supera métodos existentes como o LoRA em alinhamento a preferências e qualidade.

Tong Yang, Moonkyung Ryu, Chih-Wei Hsu, Guy Tennenholtz, Yuejie Chi, Craig Boutilier, Bo Dai2026-03-10🤖 cs.LG

Masked Unfairness: Hiding Causality within Zero ATE

O artigo demonstra que a regulação de justiça baseada apenas no efeito médio de tratamento (ATE) pode ser enganosa, pois permite que sistemas otimizem objetivos como lucro ou redução de crime enquanto mascaram desigualdades causais através de confusão, o que exige uma verificação de independência condicional completa e uma regulação no nível do modelo em vez de apenas nas decisões.

Zou Yang, Sophia Xiao, Bijan Mazaheri2026-03-10🤖 cs.LG

Foundational World Models Accurately Detect Bimanual Manipulator Failures

Este trabalho apresenta um modelo de mundo probabilístico baseado em modelos fundacionais de visão que, ao gerar estimativas de incerteza em um espaço latente comprimido, supera técnicas estatísticas e outros métodos de aprendizado na detecção precisa de falhas em manipuladores bimanuais, utilizando um novo conjunto de dados de manutenção de data centers e exigindo apenas uma fração dos parâmetros treináveis.

Isaac R. Ward, Michelle Ho, Houjun Liu, Aaron Feldman, Joseph Vincent, Liam Kruse, Sean Cheong, Duncan Eddy, Mykel J. Kochenderfer, Mac Schwager2026-03-10💻 cs

SuperSkillsStack: Agency, Domain Knowledge, Imagination, and Taste in Human-AI Design Education

Este estudo analisa como estudantes de design integram a inteligência artificial generativa em seus projetos, revelando que, embora a ferramenta acelere fases iniciais como brainstorming e síntese, a colaboração eficaz depende fundamentalmente de competências humanas superiores — como agência, conhecimento de domínio, imaginação e bom gosto — para validar, refinar e selecionar soluções criativas.

Qian Huang, King Wang Poon2026-03-10💻 cs

Can Safety Emerge from Weak Supervision? A Systematic Analysis of Small Language Models

O artigo apresenta o Self-MOA, um framework automatizado que alinha modelos de linguagem pequenos utilizando supervisão fraca de avaliadores automáticos, conseguindo melhorar a segurança em 12,41% mantendo a utilidade e reduzindo drasticamente a dependência de dados humanos anotados.

Punyajoy Saha, Sudipta Halder, Debjyoti Mondal, Subhadarshi Panda2026-03-10🤖 cs.LG

RESCHED: Rethinking Flexible Job Shop Scheduling from a Transformer-based Architecture with Simplified States

O artigo apresenta o \textsc{ReSched}, uma estrutura de aprendizado por reforço profundo baseada em Transformers que simplifica a representação do estado para apenas quatro características essenciais e supera métodos existentes na resolução do Problema de Programação de Fábrica Flexível (FJSP), demonstrando também forte generalização para variantes como JSSP e FFSP.

Xiangjie Xiao, Cong Zhang, Wen Song, Zhiguang Cao2026-03-10🤖 cs.LG

Hit-RAG: Learning to Reason with Long Contexts via Preference Alignment

O artigo apresenta o Hit-RAG, um framework de alinhamento por preferência em três estágios que supera os desafios de diluição de atenção e alucinação em contextos longos para Modelos de Linguagem Multimodais, permitindo raciocínio preciso e superando modelos maiores em benchmarks extensos.

Junming Liu, Yuqi Li, Shiping Wen, Zhigang Zeng, Tingwen Huang2026-03-10💬 cs.CL

← Anterior Próximo →