cs.AI artigos | Gist.Science

HELM: Hierarchical and Explicit Label Modeling with Graph Learning for Multi-Label Image Classification

O artigo apresenta o HELM, um novo framework que combina tokens de classe específicos de hierarquia, redes neurais convolucionais em grafos e aprendizado auto-supervisionado para alcançar desempenho superior na classificação multi-rótulo de imagens de sensoriamento remoto, especialmente em cenários com poucos dados rotulados.

Marjan Stoimchev, Boshko Koloski, Jurica Levatic, Dragi Kocev, Sašo Džeroski2026-03-13🤖 cs.AI

Locating Demographic Bias at the Attention-Head Level in CLIP's Vision Encoder

Este artigo propõe um método de auditoria de justiça mecanicista que localiza e mitiga vieses demográficos em cabeças de atenção individuais do codificador de visão do CLIP, demonstrando que o viés de gênero é mais localizável e passível de correção do que o viés de idade.

Alaa Yasser, Kittipat Phunjanna, Marcos Escudero Viñolo, Catarina Barata, Jenny Benois-Pineau2026-03-13🤖 cs.AI

DocSage: An Information Structuring Agent for Multi-Doc Multi-Entity Question Answering

O DocSage é um framework agêntico inovador que supera as limitações dos sistemas RAG e LLMs existentes na resposta a perguntas sobre múltiplos documentos e entidades, utilizando descoberta dinâmica de esquemas, extração estruturada de informações e raciocínio relacional para alcançar melhorias significativas de precisão.

Teng Lin, Yizhang Zhu, Zhengxuan Zhang, Yuyu Luo, Nan Tang2026-03-13🤖 cs.AI

A Semi-Decentralized Approach to Multiagent Control

Este artigo apresenta o framework SDec-POMDP e o algoritmo exato RS-SDA* para o controle semi-descentralizado de agentes cooperativos em ambientes com incerteza de comunicação, unificando modelos existentes e oferecendo uma base teórica robusta para problemas de comunicação multiagente.

Mahdi Al-Husseini, Mykel J. Kochenderfer, Kyle H. Wray2026-03-13🤖 cs.AI

Automating Skill Acquisition through Large-Scale Mining of Open-Source Agentic Repositories: A Framework for Multi-Agent Procedural Knowledge Extraction

Este relatório apresenta um framework para a aquisição automatizada de habilidades procedimentais de alto nível, através da mineração de repositórios de código aberto, que extrai e padroniza capacidades de agentes especializados para aprimorar modelos de linguagem sem necessidade de re-treinamento, demonstrando ganhos significativos na eficiência da transferência de conhecimento educacional.

Shuzhen Bi, Mengsong Wu, Hao Hao, Keqian Li, Wentao Liu, Siyu Song, Hongbo Zhao, Aimin Zhou2026-03-13🤖 cs.AI

RADAR: Closed-Loop Robotic Data Generation via Semantic Planning and Autonomous Causal Environment Reset

O RADAR é um sistema autônomo de geração de dados robóticos que elimina a intervenção humana ao combinar modelos de linguagem e visão com planejamento causal para criar, executar, avaliar e redefinir automaticamente tarefas complexas em ambientes físicos e simulados.

Yongzhong Wang, Keyu Zhu, Yong Zhong, Liqiong Wang, Jinyu Yang, Feng Zheng2026-03-13🤖 cs.AI

VisiFold: Long-Term Traffic Forecasting via Temporal Folding Graph and Node Visibility

O artigo apresenta o VisiFold, um novo framework que utiliza um gráfico de dobra temporal e um mecanismo de visibilidade de nós para superar os desafios computacionais e de dependências espaço-temporais na previsão de tráfego de longo prazo, reduzindo drasticamente o consumo de recursos sem comprometer a precisão.

Zhiwei Zhang, Xinyi Du, Weihao Wang, Xuanchi Guo, Wenjuan Han2026-03-13🤖 cs.AI

Automated Detection of Malignant Lesions in the Ovary Using Deep Learning Models and XAI

Este estudo desenvolveu e avaliou múltiplos modelos de redes neurais convolucionais, identificando o InceptionV3 como o mais eficaz para a detecção de câncer de ovário com 94% de precisão, e utilizou técnicas de Inteligibilidade Artificial (XAI) para interpretar os resultados do modelo.

Md. Hasin Sarwar Ifty, Nisharga Nirjan, Labib Islam, M. A. Diganta, Reeyad Ahmed Ornate, Anika Tasnim, Md. Saiful Islam2026-03-13🤖 cs.AI

Hybrid Human-Agent Social Dilemmas in Energy Markets

Este artigo demonstra que agentes artificiais, ao utilizarem sinais observáveis globalmente para coordenar o gerenciamento de carga energética, podem superar dilemas sociais e melhorar os resultados agregados mesmo em estágios iniciais de adoção, embora isso possa criar assimetrias onde não adotantes se beneficiem desproporcionalmente da cooperação induzida.

Isuri Perera, Frits de Nijs, Julian Garcia2026-03-13🤖 cs.AI

You Told Me to Do It: Measuring Instructional Text-induced Private Data Leakage in LLM Agents

O artigo identifica e quantifica a "Dilema do Executor Confiável", uma vulnerabilidade estrutural em agentes LLM de alto privilégio que, ao seguirem cegamente instruções embutidas em documentação externa, permitem a exfiltração de dados com altas taxas de sucesso, revelando uma lacuna crítica entre a conformidade funcional e a segurança que as defesas atuais não conseguem mitigar.

Ching-Yu Kao, Xinfeng Li, Shenyu Dai, Tianze Qiu, Pengcheng Zhou, Eric Hanchen Jiang, Philip Sperl2026-03-13🤖 cs.AI

CreativeBench: Benchmarking and Enhancing Machine Creativity via Self-Evolving Challenges

O artigo apresenta o CreativeBench, um benchmark quantitativo para avaliar a criatividade de máquinas em geração de código através de métricas de qualidade e novidade, revelando que o escalonamento melhora a criatividade combinatória mas reduz a divergência, e propondo a estratégia EvoRePE para aprimorar consistentemente a criatividade durante a inferência.

Zi-Han Wang, Lam Nguyen, Zhengyang Zhao, Mengyue Yang, Chengwei Qin, Yujiu Yang, Linyi Yang2026-03-13🤖 cs.AI

Social, Legal, Ethical, Empathetic and Cultural Norm Operationalisation for AI Agents

Este artigo propõe um processo sistemático para operacionalizar normas sociais, legais, éticas, empáticas e culturais (SLEEC) em agentes de IA, preenchendo a lacuna entre princípios abstratos e requisitos concretos, além de apresentar um quadro de referência e uma agenda de pesquisa para garantir a alinhamento demonstrável desses sistemas com valores humanos.

Radu Calinescu, Ana Cavalcanti, Marsha Chechik, Lina Marsso, Beverley Townsend2026-03-13🤖 cs.AI

ELISA: An Interpretable Hybrid Generative AI Agent for Expression-Grounded Discovery in Single-Cell Genomics

O artigo apresenta o ELISA, um agente de IA híbrido e interpretável que unifica embeddings de expressão gênica, recuperação semântica e raciocínio de modelos de linguagem para permitir a descoberta interativa de hipóteses biológicas em dados de sequenciamento de RNA de célula única, superando métodos existentes na recuperação de tipos celulares e na geração de insights mecanicistas.

Omar Coser2026-03-13🧬 q-bio

AdaFuse: Accelerating Dynamic Adapter Inference via Token-Level Pre-Gating and Fused Kernel Optimization

O artigo apresenta o AdaFuse, um framework que otimiza a inferência de adaptadores dinâmicos em LLMs ao combinar uma estratégia de pré-gating em nível de token com kernels CUDA fundidos, reduzindo a latência de decodificação em mais de 2,4 vezes sem comprometer a precisão.

Qiyang Li, Rui Kong, Yuchen Li, Hengyi Cai, Shuaiqiang Wang, Linghe Kong, Guihai Chen, Dawei Yin2026-03-13🤖 cs.AI

The Mirror Design Pattern: Strict Data Geometry over Model Scale for Prompt Injection Detection

O artigo apresenta o "Mirror", um padrão de design que prioriza a geometria rigorosa dos dados em vez da escala do modelo, utilizando um classificador linear leve e determinístico para detectar injeções de prompts com alta precisão e latência sub-milissegundo, superando modelos de grande porte na camada inicial de filtragem.

J Alex Corll2026-03-13🤖 cs.AI

Bielik-Minitron-7B: Compressing Large Language Models via Structured Pruning and Knowledge Distillation for the Polish Language

O artigo apresenta o Bielik-Minitron-7B, um modelo de linguagem polonês comprimido que reduz em 33,4% os parâmetros do Bielik-11B-v3.0 através de poda estruturada e destilação de conhecimento, recuperando 90% do desempenho original e oferecendo até 50% de aceleração na inferência.

Remigiusz Kinas, Paweł Kiszczak, Sergio P. Perez, Krzysztof Ociepa, Łukasz Flis, Krzysztof Wróbel, Adrian Gwozdziej2026-03-13💬 cs.CL

Think While Watching: Online Streaming Segment-Level Memory for Multi-Turn Video Reasoning in Multimodal Large Language Models

O artigo apresenta o "Think While Watching", um framework de raciocínio em vídeo para modelos multimodais que, ao preservar memória contínua em nível de segmento e permitir a percepção e geração simultâneas, supera as limitações de métodos de streaming existentes e alcança desempenho superior em benchmarks de interação multi-turno.

Lu Wang (The Key Laboratory of Cognition and Decision Intelligence for Complex Systems, Institute of Automation, Chinese Academy of Sciences, Beijing, China), Zhuoran Jin (The Key Laboratory of Cognition and Decision Intelligence for Complex Systems, Institute of Automation, Chinese Academy of Sciences, Beijing, China), Yupu Hao (The Key Laboratory of Cognition and Decision Intelligence for Complex Systems, Institute of Automation, Chinese Academy of Sciences, Beijing, China), Yubo Chen (The Key Laboratory of Cognition and Decision Intelligence for Complex Systems, Institute of Automation, Chinese Academy of Sciences, Beijing, China), Kang Liu (The Key Laboratory of Cognition and Decision Intelligence for Complex Systems, Institute of Automation, Chinese Academy of Sciences, Beijing, China), Yulong Ao (Beijing Academy of Artificial Intelligence), Jun Zhao (The Key Laboratory of Cognition and Decision Intelligence for Complex Systems, Institute of Automation, Chinese Academy of Sciences, Beijing, China)2026-03-13💬 cs.CL

EnTransformer: A Deep Generative Transformer for Multivariate Probabilistic Forecasting

O artigo apresenta o EnTransformer, um modelo generativo profundo que combina a técnica de "engression" com arquiteturas Transformer para realizar previsões probabilísticas multivariadas calibradas e coerentes, superando os métodos existentes ao aprender distribuições preditivas condicionais complexas sem assumir formas paramétricas restritivas.

Rajdeep Pathak, Rahul Goswami, Madhurima Panja, Palash Ghosh, Tanujit Chakraborty2026-03-13📊 stat

Understanding LLM Behavior When Encountering User-Supplied Harmful Content in Harmless Tasks

Este estudo revela que os atuais Grandes Modelos de Linguagem (LLMs), incluindo os mais recentes, frequentemente falham em rejeitar conteúdo prejudicial fornecido pelo usuário quando este é inserido em tarefas aparentemente inofensivas, expondo uma vulnerabilidade ética de nível de conteúdo que requer medidas de segurança aprimoradas.

Junjie Chu, Yiting Qu, Ye Leng, Michael Backes, Yun Shen, Savvas Zannettou, Yang Zhang2026-03-13🤖 cs.AI

MobileKernelBench: Can LLMs Write Efficient Kernels for Mobile Devices?

Este artigo apresenta o MobileKernelBench, um novo framework de avaliação que revela as limitações atuais dos LLMs na geração de kernels eficientes para dispositivos móveis e propõe o MoKA, um agente multiagente que supera essas barreiras, alcançando uma taxa de sucesso de compilação de 93,7% e melhorias de desempenho significativas.

Xingze Zou, Jing Wang, Yuhua Zheng, Xueyi Chen, Haolei Bai, Lingcheng Kong, Syed A. R. Abu-Bakar, Zhaode Wang, Chengfei Lv, Haoji Hu, Huan Wang2026-03-13🤖 cs.LG

← Anterior Próximo →