cs.AI artigos | Gist.Science

Automated Detection of Malignant Lesions in the Ovary Using Deep Learning Models and XAI

Este estudo desenvolveu e avaliou múltiplos modelos de redes neurais convolucionais, identificando o InceptionV3 como o mais eficaz para a detecção de câncer de ovário com 94% de precisão, e utilizou técnicas de Inteligibilidade Artificial (XAI) para interpretar os resultados do modelo.

Md. Hasin Sarwar Ifty, Nisharga Nirjan, Labib Islam, M. A. Diganta, Reeyad Ahmed Ornate, Anika Tasnim, Md. Saiful Islam2026-03-13🤖 cs.AI

Hybrid Human-Agent Social Dilemmas in Energy Markets

Este artigo demonstra que agentes artificiais, ao utilizarem sinais observáveis globalmente para coordenar o gerenciamento de carga energética, podem superar dilemas sociais e melhorar os resultados agregados mesmo em estágios iniciais de adoção, embora isso possa criar assimetrias onde não adotantes se beneficiem desproporcionalmente da cooperação induzida.

Isuri Perera, Frits de Nijs, Julian Garcia2026-03-13🤖 cs.AI

You Told Me to Do It: Measuring Instructional Text-induced Private Data Leakage in LLM Agents

O artigo identifica e quantifica a "Dilema do Executor Confiável", uma vulnerabilidade estrutural em agentes LLM de alto privilégio que, ao seguirem cegamente instruções embutidas em documentação externa, permitem a exfiltração de dados com altas taxas de sucesso, revelando uma lacuna crítica entre a conformidade funcional e a segurança que as defesas atuais não conseguem mitigar.

Ching-Yu Kao, Xinfeng Li, Shenyu Dai, Tianze Qiu, Pengcheng Zhou, Eric Hanchen Jiang, Philip Sperl2026-03-13🤖 cs.AI

CreativeBench: Benchmarking and Enhancing Machine Creativity via Self-Evolving Challenges

O artigo apresenta o CreativeBench, um benchmark quantitativo para avaliar a criatividade de máquinas em geração de código através de métricas de qualidade e novidade, revelando que o escalonamento melhora a criatividade combinatória mas reduz a divergência, e propondo a estratégia EvoRePE para aprimorar consistentemente a criatividade durante a inferência.

Zi-Han Wang, Lam Nguyen, Zhengyang Zhao, Mengyue Yang, Chengwei Qin, Yujiu Yang, Linyi Yang2026-03-13🤖 cs.AI

Social, Legal, Ethical, Empathetic and Cultural Norm Operationalisation for AI Agents

Este artigo propõe um processo sistemático para operacionalizar normas sociais, legais, éticas, empáticas e culturais (SLEEC) em agentes de IA, preenchendo a lacuna entre princípios abstratos e requisitos concretos, além de apresentar um quadro de referência e uma agenda de pesquisa para garantir a alinhamento demonstrável desses sistemas com valores humanos.

Radu Calinescu, Ana Cavalcanti, Marsha Chechik, Lina Marsso, Beverley Townsend2026-03-13🤖 cs.AI

ELISA: An Interpretable Hybrid Generative AI Agent for Expression-Grounded Discovery in Single-Cell Genomics

O artigo apresenta o ELISA, um agente de IA híbrido e interpretável que unifica embeddings de expressão gênica, recuperação semântica e raciocínio de modelos de linguagem para permitir a descoberta interativa de hipóteses biológicas em dados de sequenciamento de RNA de célula única, superando métodos existentes na recuperação de tipos celulares e na geração de insights mecanicistas.

Omar Coser2026-03-13🧬 q-bio

AdaFuse: Accelerating Dynamic Adapter Inference via Token-Level Pre-Gating and Fused Kernel Optimization

O artigo apresenta o AdaFuse, um framework que otimiza a inferência de adaptadores dinâmicos em LLMs ao combinar uma estratégia de pré-gating em nível de token com kernels CUDA fundidos, reduzindo a latência de decodificação em mais de 2,4 vezes sem comprometer a precisão.

Qiyang Li, Rui Kong, Yuchen Li, Hengyi Cai, Shuaiqiang Wang, Linghe Kong, Guihai Chen, Dawei Yin2026-03-13🤖 cs.AI

The Mirror Design Pattern: Strict Data Geometry over Model Scale for Prompt Injection Detection

O artigo apresenta o "Mirror", um padrão de design que prioriza a geometria rigorosa dos dados em vez da escala do modelo, utilizando um classificador linear leve e determinístico para detectar injeções de prompts com alta precisão e latência sub-milissegundo, superando modelos de grande porte na camada inicial de filtragem.

J Alex Corll2026-03-13🤖 cs.AI

Bielik-Minitron-7B: Compressing Large Language Models via Structured Pruning and Knowledge Distillation for the Polish Language

O artigo apresenta o Bielik-Minitron-7B, um modelo de linguagem polonês comprimido que reduz em 33,4% os parâmetros do Bielik-11B-v3.0 através de poda estruturada e destilação de conhecimento, recuperando 90% do desempenho original e oferecendo até 50% de aceleração na inferência.

Remigiusz Kinas, Paweł Kiszczak, Sergio P. Perez, Krzysztof Ociepa, Łukasz Flis, Krzysztof Wróbel, Adrian Gwozdziej2026-03-13💬 cs.CL

Think While Watching: Online Streaming Segment-Level Memory for Multi-Turn Video Reasoning in Multimodal Large Language Models

O artigo apresenta o "Think While Watching", um framework de raciocínio em vídeo para modelos multimodais que, ao preservar memória contínua em nível de segmento e permitir a percepção e geração simultâneas, supera as limitações de métodos de streaming existentes e alcança desempenho superior em benchmarks de interação multi-turno.

Lu Wang (The Key Laboratory of Cognition and Decision Intelligence for Complex Systems, Institute of Automation, Chinese Academy of Sciences, Beijing, China), Zhuoran Jin (The Key Laboratory of Cognition and Decision Intelligence for Complex Systems, Institute of Automation, Chinese Academy of Sciences, Beijing, China), Yupu Hao (The Key Laboratory of Cognition and Decision Intelligence for Complex Systems, Institute of Automation, Chinese Academy of Sciences, Beijing, China), Yubo Chen (The Key Laboratory of Cognition and Decision Intelligence for Complex Systems, Institute of Automation, Chinese Academy of Sciences, Beijing, China), Kang Liu (The Key Laboratory of Cognition and Decision Intelligence for Complex Systems, Institute of Automation, Chinese Academy of Sciences, Beijing, China), Yulong Ao (Beijing Academy of Artificial Intelligence), Jun Zhao (The Key Laboratory of Cognition and Decision Intelligence for Complex Systems, Institute of Automation, Chinese Academy of Sciences, Beijing, China)2026-03-13💬 cs.CL

EnTransformer: A Deep Generative Transformer for Multivariate Probabilistic Forecasting

O artigo apresenta o EnTransformer, um modelo generativo profundo que combina a técnica de "engression" com arquiteturas Transformer para realizar previsões probabilísticas multivariadas calibradas e coerentes, superando os métodos existentes ao aprender distribuições preditivas condicionais complexas sem assumir formas paramétricas restritivas.

Rajdeep Pathak, Rahul Goswami, Madhurima Panja, Palash Ghosh, Tanujit Chakraborty2026-03-13📊 stat

Understanding LLM Behavior When Encountering User-Supplied Harmful Content in Harmless Tasks

Este estudo revela que os atuais Grandes Modelos de Linguagem (LLMs), incluindo os mais recentes, frequentemente falham em rejeitar conteúdo prejudicial fornecido pelo usuário quando este é inserido em tarefas aparentemente inofensivas, expondo uma vulnerabilidade ética de nível de conteúdo que requer medidas de segurança aprimoradas.

Junjie Chu, Yiting Qu, Ye Leng, Michael Backes, Yun Shen, Savvas Zannettou, Yang Zhang2026-03-13🤖 cs.AI

MobileKernelBench: Can LLMs Write Efficient Kernels for Mobile Devices?

Este artigo apresenta o MobileKernelBench, um novo framework de avaliação que revela as limitações atuais dos LLMs na geração de kernels eficientes para dispositivos móveis e propõe o MoKA, um agente multiagente que supera essas barreiras, alcançando uma taxa de sucesso de compilação de 93,7% e melhorias de desempenho significativas.

Xingze Zou, Jing Wang, Yuhua Zheng, Xueyi Chen, Haolei Bai, Lingcheng Kong, Syed A. R. Abu-Bakar, Zhaode Wang, Chengfei Lv, Haoji Hu, Huan Wang2026-03-13🤖 cs.LG

Fair Learning for Bias Mitigation and Quality Optimization in Paper Recommendation

O artigo apresenta o Fair-PaperRec, um modelo baseado em MLP que utiliza critérios interseccionais e uma função de perda personalizada para mitigar disparidades demográficas nas decisões de aceitação de artigos, aumentando a participação de grupos sub-representados em 42,03% e melhorando a utilidade geral em 3,16% sem comprometer o rigor acadêmico.

Uttamasha Anjally Oyshi, Susan Gauch2026-03-13🤖 cs.AI

Prototype-Based Knowledge Guidance for Fine-Grained Structured Radiology Reporting

O artigo apresenta o ProtoSR, uma abordagem que utiliza um pipeline de extração automática para construir uma base de conhecimento multimodal baseada em protótipos a partir de relatórios de radiografia em texto livre, permitindo que um modelo de IA refine suas previsões para relatórios estruturados de radiologia com maior precisão em atributos detalhados.

Chantal Pellegrini, Adrian Delchev, Ege Özsoy, Nassir Navab, Matthias Keicher2026-03-13🤖 cs.AI

Effective Resistance Rewiring: A Simple Topological Correction for Over-Squashing

O artigo apresenta a Reconfiguração por Resistência Efetiva (ERR), uma estratégia simples e sem parâmetros que utiliza a resistência elétrica global para identificar e corrigir gargalos estruturais em Redes Neurais de Grafos, melhorando a propagação de informações de longo alcance e o desempenho preditivo ao equilibrar o super-achatamento com o super-suavização através da reconfiguração da topologia do grafo.

Bertran Miquel-Oliver, Manel Gil-Sorribes, Victor Guallar, Alexis Molina2026-03-13🤖 cs.LG

Geometry-Aware Probabilistic Circuits via Voronoi Tessellations

Este artigo propõe a integração de tesselações de Voronoi em circuitos probabilísticos para capturar a geometria local dos dados, abordando o desafio da perda de tratabilidade através de um framework de inferência aproximada com limites garantidos e de uma condição estrutural que recupera a inferência exata, além de introduzir uma relaxação diferenciável para aprendizado baseado em gradiente.

Sahil Sidheekh, Sriraam Natarajan2026-03-13🤖 cs.LG

Delayed Backdoor Attacks: Exploring the Temporal Dimension as a New Attack Surface in Pre-Trained Models

Este artigo introduz os Ataques de Backdoor Adiado (DBA), uma nova classe de ameaças que desacopla a ativação maliciosa da exposição ao gatilho no tempo, demonstrando através do protótipo DND que é possível usar palavras comuns como gatilhos para manter os modelos inativos por um período controlado antes de desencadear uma falha generalizada com alta precisão.

Zikang Ding, Haomiao Yang, Meng Hao, Wenbo Jiang, Kunlan Xiang, Runmeng Du, Yijing Liu, Ruichen Zhang, Dusit Niyato2026-03-13🤖 cs.AI

Learning Transferable Sensor Models via Language-Informed Pretraining

O artigo apresenta o SLIP, um framework de pré-treinamento auto-supervisionado que alinha dados de sensores multivariados com linguagem natural para aprender representações transferíveis que superam as limitações de configurações fixas e alcançam desempenho superior em tarefas de classificação, legendagem e resposta a perguntas em diversos conjuntos de dados.

Yuliang Chen, Arvind Pillai, Yu Yvonne Wu, Tess Z. Griffin, Lisa Marsch, Michael V. Heinz, Nicholas C. Jacobson, Andrew Campbell2026-03-13🤖 cs.AI

Multimodal Emotion Recognition via Bi-directional Cross-Attention and Temporal Modeling

Este artigo apresenta um framework de reconhecimento multimodal de emoções para o desafio ABAW 10, que combina modelos pré-treinados de áudio e vídeo com uma rede de convolução temporal e um módulo de atenção cruzada bidirecional para superar as limitações de abordagens unimodais em ambientes não controlados.

Junhyeong Byeon, Jeongyeol Kim, Sejoon Lim2026-03-13🤖 cs.AI

← Anterior Próximo →