cs.AI artigos | Gist.Science

RedFuser: An Automatic Operator Fusion Framework for Cascaded Reductions on AI Accelerators

O artigo apresenta o RedFuser, um framework automático que utiliza uma metodologia teórica para fundir operações de redução em cascata em um único loop, gerando kernels otimizados que superam compiladores de IA existentes e igualam o desempenho de soluções manuais.

Xinsheng Tang, Yangcheng Li, Nan Wang, Zhiyi Shu, Xingyu Ling, Junna Xing, Peng Zhou, Qiang Liu2026-03-12🤖 cs.AI

A Governance and Evaluation Framework for Deterministic, Rule-Based Clinical Decision Support in Empiric Antibiotic Prescribing

Este trabalho propõe um framework de governança e avaliação para sistemas de suporte à decisão clínica determinísticos e baseados em regras, focado na prescrição empírica de antibióticos, que prioriza transparência, auditabilidade e a abstenção de recomendações quando as condições de governança não são atendidas, utilizando casos sintéticos para validar o alinhamento comportamental com as regras em vez de eficácia clínica.

Francisco José Gárate, Paloma Chausa, Diego Moreno, Judit López Luque, Vicens Díaz-Brito, Enrique Javier Gómez2026-03-12🤖 cs.AI

How to Count AIs: Individuation and Liability for AI Agents

Este artigo diagnostica a dificuldade jurídica de identificar agentes de IA devido à sua natureza volátil e sem corpo, propondo a criação de uma "Corporação Algorítmica" (A-corp) como entidade legal fictícia que, ao possuir recursos e operar sob incentivos de responsabilidade civil, resolve simultaneamente os problemas de identificação "fina" (vinculando ações a humanos) e "grossa" (estabelecendo unidades de IA persistentes e coerentes).

Yonathan Arbel, Peter Salib, Simon Goldstein2026-03-12🤖 cs.AI

The DMA Streaming Framework: Kernel-Level Buffer Orchestration for High-Performance AI Data Paths

O artigo apresenta o *dmaplane*, um módulo do kernel Linux que orquestra a gestão de buffers e a transferência de dados via DMA para otimizar pipelines de IA, oferecendo recursos como compartilhamento de memória *dma-buf*, controle de fluxo baseado em créditos e integração com GPU, permitindo inferência distribuída eficiente entre máquinas.

Marco Graziano2026-03-12🤖 cs.AI

Architecture-Aware LLM Inference Optimization on AMD Instinct GPUs: A Comprehensive Benchmark and Deployment Study

Este estudo apresenta uma avaliação abrangente da inferência de LLMs em GPUs AMD Instinct MI325X, demonstrando que otimizações específicas da arquitetura (como o uso seletivo do runtime AITER e configurações de cache) são essenciais para maximizar o desempenho, alcançando altas taxas de processamento e estabilidade em workloads de texto e visão.

Athos Georgiou2026-03-12🤖 cs.AI

HTM-EAR: Importance-Preserving Tiered Memory with Hybrid Routing under Saturation

O artigo apresenta o HTM-EAR, um sistema de memória hierárquica que combina armazenamento de trabalho baseado em HNSW com armazenamento de arquivo e um mecanismo de roteamento híbrido para preservar informações essenciais e manter alta precisão em consultas sob condições de saturação, superando significativamente abordagens tradicionais como LRU.

Shubham Kumar Singh2026-03-12🤖 cs.AI

Evaluating Progress in Graph Foundation Models: A Comprehensive Benchmark and New Insights

Este artigo apresenta um novo benchmark abrangente que avalia modelos fundamentais de grafos (GFM) considerando simultaneamente as dimensões de domínio temático e de formato, permitindo uma análise mais precisa da transferência de conhecimento e fornecendo novas perspectivas empíricas para o campo.

Xingtong Yu, Shenghua Ye, Ruijuan Liang, Chang Zhou, Hong Cheng, Xinming Zhang, Yuan Fang2026-03-12💬 cs.CL

Targeted Bit-Flip Attacks on LLM-Based Agents

O artigo apresenta o Flip-Agent, o primeiro framework de ataque de inversão de bits direcionado capaz de manipular tanto as respostas finais quanto as invocações de ferramentas em agentes baseados em modelos de linguagem, revelando uma vulnerabilidade crítica nesses sistemas.

Jialai Wang, Ya Wen, Zhongmou Liu, Yuxiao Wu, Bingyi He, Zongpeng Li, Ee-Chien Chang2026-03-12🤖 cs.AI

AMB-DSGDN: Adaptive Modality-Balanced Dynamic Semantic Graph Differential Network for Multimodal Emotion Recognition

O artigo propõe a AMB-DSGDN, uma rede neural que utiliza grafos semânticos dinâmicos específicos para cada modalidade e um mecanismo de atenção diferencial para filtrar ruídos e equilibrar adaptativamente a contribuição dos sinais de texto, áudio e vídeo, melhorando assim o reconhecimento de emoções em diálogos multimodais.

Yunsheng Wang, Yuntao Shou, Yilong Tan, Wei Ai, Tao Meng, Keqin Li2026-03-12🤖 cs.AI

Safety Under Scaffolding: How Evaluation Conditions Shape Measured Safety

Este estudo demonstra que as condições de avaliação, particularmente o formato das perguntas (múltipla escolha versus aberto), têm um impacto maior na segurança medida dos modelos de linguagem do que as arquiteturas de scaffolding em si, revelando que as classificações de segurança não são generalizáveis e variam drasticamente dependendo do modelo e da configuração de implantação.

David Gringras2026-03-12🤖 cs.AI

Gated Adaptation for Continual Learning in Human Activity Recognition

Este artigo propõe um framework de aprendizado contínuo eficiente em parâmetros para reconhecimento de atividades humanas em dispositivos IoT, que utiliza modulação por portas em canais de representações pré-treinadas congeladas para adaptar modelos a novos sujeitos com alta precisão e estabilidade, minimizando drasticamente o esquecimento catastrófico sem a necessidade de buffers de replay ou transmissão de dados sensíveis.

Reza Rahimi Azghan, Gautham Krishna Gudur, Mohit Malu, Edison Thomaz, Giulia Pedrielli, Pavan Turaga, Hassan Ghasemzadeh2026-03-12🤖 cs.LG

Toward Epistemic Stability: Engineering Consistent Procedures for Industrial LLM Hallucination Reduction

Este artigo apresenta e avalia cinco estratégias de engenharia de prompts para reduzir alucinações em modelos de linguagem grandes em contextos industriais, demonstrando que métodos como o Registro de Dados Aprimorado e a Especialização de Agentes de Tarefa Única aumentam significativamente a estabilidade e a consistência dos resultados sem modificar os pesos do modelo.

Brian Freeman, Adam Kicklighter, Matt Erdman, Zach Gordon2026-03-12🤖 cs.AI

Revisiting Sharpness-Aware Minimization: A More Faithful and Effective Implementation

Este artigo propõe o XSAM, uma implementação aprimorada e mais fiel da Minimização Sensível à Acurácia (SAM) que supera as limitações das abordagens atuais ao estimar explicitamente a direção do máximo e otimizar o espaço de busca, resultando em melhor generalização com custo computacional insignificante.

Jianlong Chen, Zhiming Zhou2026-03-12🤖 cs.LG

InFusionLayer: a CFA-based ensemble tool to generate new classifiers for learning and modeling

Este artigo apresenta o \texttt{InFusionLayer}, uma ferramenta de ensemble em Python baseada na Análise de Fusão Combinatória (CFA) que integra funções de característica de pontuação-rank (RSC) e diversidade cognitiva (CD) para otimizar problemas de classificação multiclasse em fluxos de trabalho de aprendizado de máquina, como PyTorch, TensorFlow e Scikit-learn.

Eric Roginek, Jingyan Xu, D. Frank. Hsu2026-03-12🤖 cs.LG

Where Do Flow Semantics Reside? A Protocol-Native Tabular Pretraining Paradigm for Encrypted Traffic Classification

O artigo propõe o FlowSem-MAE, um paradigma de pré-treinamento tabular nativo de protocolos que, ao tratar as unidades semânticas de fluxo como prioridades arquitetônicas e corrigir vieses indutivos da modelagem baseada em bytes, supera significativamente os métodos atuais de classificação de tráfego criptografado com apenas metade dos dados rotulados.

Sizhe Huang, Shujie Yang2026-03-12🤖 cs.AI

Training Language Models via Neural Cellular Automata

O artigo propõe o uso de autômatos celulares neurais para gerar dados sintéticos não linguísticos que, ao serem utilizados em uma fase de pré-pré-treinamento, melhoram significativamente a eficiência, a convergência e o desempenho em tarefas de raciocínio de modelos de linguagem grandes, superando até mesmo o pré-treinamento com grandes volumes de texto natural.

Dan Lee, Seungwook Han, Akarsh Kumar, Pulkit Agrawal2026-03-12🤖 cs.LG

SBOMs into Agentic AIBOMs: Schema Extensions, Agentic Orchestration, and Reproducibility Evaluation

Este artigo apresenta os AIBOMs (Artificial Intelligence Bills of Materials), uma evolução dos SBOMs baseada em uma arquitetura multiagente autônoma que estende os esquemas CycloneDX e SPDX para capturar comportamento em tempo real, monitorar desvios de ambiente e gerar afirmações estruturadas de explorabilidade, garantindo maior reprodutibilidade e precisão na avaliação de vulnerabilidades da cadeia de suprimentos de software.

Petar Radanliev, Carsten Maple, Omar Santos, Kayvan Atefi2026-03-12🤖 cs.AI

Tool Receipts, Not Zero-Knowledge Proofs: Practical Hallucination Detection for AI Agents

O artigo apresenta o NabaOS, um framework de verificação leve inspirado na epistemologia indiana Nyaya Shastra que utiliza recibos de execução de ferramentas assinados por HMAC para detectar alucinações em agentes de IA em tempo real com baixa latência, oferecendo uma alternativa prática e eficiente aos pesados e lentos protocolos de prova de conhecimento zero.

Abhinaba Basu2026-03-12🤖 cs.AI

Multi-Agent Memory from a Computer Architecture Perspective: Visions and Challenges Ahead

Este artigo de posição enquadra a memória de sistemas multiagentes como um problema de arquitetura de computadores, propondo uma hierarquia de três camadas e destacando a consistência da memória como o desafio mais urgente para garantir a confiabilidade e escalabilidade desses sistemas.

Zhongming Yu, Naicheng Yu, Hejia Zhang, Wentao Ni, Mingrui Yin, Jiaying Yang, Yujie Zhao, Jishen Zhao2026-03-12🤖 cs.AI

The Epistemic Support-Point Filter: Jaynesian Maximum Entropy Meets Popperian Falsification

Este artigo demonstra que o Filtro de Pontos de Suporte Epistêmico (ESPF) é o filtro ótimo e único que sintetiza o princípio de máxima entropia de Jaynes na propagação e o falsificacionismo de Popper na atualização, minimizando a entropia possibilística no pior caso ao rejeitar a influência de priores e validando-se numericamente em rastreamento orbital.

Moriba Kemessia Jah2026-03-12🔢 math

← Anterior Próximo →