cs.AI artigos | Gist.Science

Toward Epistemic Stability: Engineering Consistent Procedures for Industrial LLM Hallucination Reduction

Este artigo apresenta e avalia cinco estratégias de engenharia de prompts para reduzir alucinações em modelos de linguagem grandes em contextos industriais, demonstrando que métodos como o Registro de Dados Aprimorado e a Especialização de Agentes de Tarefa Única aumentam significativamente a estabilidade e a consistência dos resultados sem modificar os pesos do modelo.

Brian Freeman, Adam Kicklighter, Matt Erdman, Zach Gordon2026-03-12🤖 cs.AI

Revisiting Sharpness-Aware Minimization: A More Faithful and Effective Implementation

Este artigo propõe o XSAM, uma implementação aprimorada e mais fiel da Minimização Sensível à Acurácia (SAM) que supera as limitações das abordagens atuais ao estimar explicitamente a direção do máximo e otimizar o espaço de busca, resultando em melhor generalização com custo computacional insignificante.

Jianlong Chen, Zhiming Zhou2026-03-12🤖 cs.LG

InFusionLayer: a CFA-based ensemble tool to generate new classifiers for learning and modeling

Este artigo apresenta o \texttt{InFusionLayer}, uma ferramenta de ensemble em Python baseada na Análise de Fusão Combinatória (CFA) que integra funções de característica de pontuação-rank (RSC) e diversidade cognitiva (CD) para otimizar problemas de classificação multiclasse em fluxos de trabalho de aprendizado de máquina, como PyTorch, TensorFlow e Scikit-learn.

Eric Roginek, Jingyan Xu, D. Frank. Hsu2026-03-12🤖 cs.LG

Where Do Flow Semantics Reside? A Protocol-Native Tabular Pretraining Paradigm for Encrypted Traffic Classification

O artigo propõe o FlowSem-MAE, um paradigma de pré-treinamento tabular nativo de protocolos que, ao tratar as unidades semânticas de fluxo como prioridades arquitetônicas e corrigir vieses indutivos da modelagem baseada em bytes, supera significativamente os métodos atuais de classificação de tráfego criptografado com apenas metade dos dados rotulados.

Sizhe Huang, Shujie Yang2026-03-12🤖 cs.AI

Training Language Models via Neural Cellular Automata

O artigo propõe o uso de autômatos celulares neurais para gerar dados sintéticos não linguísticos que, ao serem utilizados em uma fase de pré-pré-treinamento, melhoram significativamente a eficiência, a convergência e o desempenho em tarefas de raciocínio de modelos de linguagem grandes, superando até mesmo o pré-treinamento com grandes volumes de texto natural.

Dan Lee, Seungwook Han, Akarsh Kumar, Pulkit Agrawal2026-03-12🤖 cs.LG

SBOMs into Agentic AIBOMs: Schema Extensions, Agentic Orchestration, and Reproducibility Evaluation

Este artigo apresenta os AIBOMs (Artificial Intelligence Bills of Materials), uma evolução dos SBOMs baseada em uma arquitetura multiagente autônoma que estende os esquemas CycloneDX e SPDX para capturar comportamento em tempo real, monitorar desvios de ambiente e gerar afirmações estruturadas de explorabilidade, garantindo maior reprodutibilidade e precisão na avaliação de vulnerabilidades da cadeia de suprimentos de software.

Petar Radanliev, Carsten Maple, Omar Santos, Kayvan Atefi2026-03-12🤖 cs.AI

Tool Receipts, Not Zero-Knowledge Proofs: Practical Hallucination Detection for AI Agents

O artigo apresenta o NabaOS, um framework de verificação leve inspirado na epistemologia indiana Nyaya Shastra que utiliza recibos de execução de ferramentas assinados por HMAC para detectar alucinações em agentes de IA em tempo real com baixa latência, oferecendo uma alternativa prática e eficiente aos pesados e lentos protocolos de prova de conhecimento zero.

Abhinaba Basu2026-03-12🤖 cs.AI

Multi-Agent Memory from a Computer Architecture Perspective: Visions and Challenges Ahead

Este artigo de posição enquadra a memória de sistemas multiagentes como um problema de arquitetura de computadores, propondo uma hierarquia de três camadas e destacando a consistência da memória como o desafio mais urgente para garantir a confiabilidade e escalabilidade desses sistemas.

Zhongming Yu, Naicheng Yu, Hejia Zhang, Wentao Ni, Mingrui Yin, Jiaying Yang, Yujie Zhao, Jishen Zhao2026-03-12🤖 cs.AI

The Epistemic Support-Point Filter: Jaynesian Maximum Entropy Meets Popperian Falsification

Este artigo demonstra que o Filtro de Pontos de Suporte Epistêmico (ESPF) é o filtro ótimo e único que sintetiza o princípio de máxima entropia de Jaynes na propagação e o falsificacionismo de Popper na atualização, minimizando a entropia possibilística no pior caso ao rejeitar a influência de priores e validando-se numericamente em rastreamento orbital.

Moriba Kemessia Jah2026-03-12🔢 math

HTMuon: Improving Muon via Heavy-Tailed Spectral Correction

O artigo apresenta o HTMuon, um otimizador que melhora o treinamento de modelos de linguagem grandes ao corrigir a supressão de espectros de pesos de cauda pesada no Muon original, resultando em melhor desempenho e fundamentação teórica baseada na teoria de auto-regularização de cauda pesada.

Tianyu Pang, Yujie Fang, Zihang Liu, Shenyang Deng, Lei Hsiung, Shuhua Yu, Yaoqing Yang2026-03-12🤖 cs.LG

ADVERSA: Measuring Multi-Turn Guardrail Degradation and Judge Reliability in Large Language Models

O artigo apresenta o ADVERSA, um framework automatizado de red-teaming que avalia a degradação contínua das barreiras de segurança e a confiabilidade dos juízes em modelos de linguagem durante interações adversariais de múltiplas rodadas, revelando que as violações de segurança tendem a ocorrer precocemente e destacando desafios como a deriva do atacante e a inconsistência de julgamento.

Harry Owiredu-Ashley2026-03-12🤖 cs.AI

Dissecting Chronos: Sparse Autoencoders Reveal Causal Feature Hierarchies in Time Series Foundation Models

Este estudo aplica autoencoders esparsos ao modelo Chronos-T5-Large para revelar uma hierarquia causal de características em séries temporais, demonstrando que os recursos mais críticos para a previsão residem nas camadas intermediárias de detecção de mudanças abruptas, e não nas camadas finais semanticamente mais ricas.

Anurag Mishra2026-03-12🤖 cs.LG

Why LLMs Fail: A Failure Analysis and Partial Success Measurement for Automated Security Patch Generation

Este estudo analisa 319 correções geradas por LLMs para vulnerabilidades de segurança em Java, revelando que a maioria falha devido a mal-entendidos semânticos e propondo uma nova métrica (SRS) que evidencia a dificuldade dos modelos em corrigir falhas de segurança sem comprometer a funcionalidade.

Amir Al-Maamari2026-03-12🤖 cs.AI

Marginals Before Conditionals

O artigo demonstra que redes neurais aprendem primeiro a distribuição marginal de uma tarefa ambígua, estabilizando-se em um platô de erro determinado pelo nível de ambiguidade, antes de sofrer uma transição abrupta para a solução condicional completa, um processo governado pelo ruído do gradiente e pela formação antecipada de um mecanismo de roteamento seletor.

Mihir Sahasrabudhe2026-03-12🤖 cs.LG

TASER: Task-Aware Spectral Energy Refine for Backdoor Suppression in UAV Swarms Decentralized Federated Learning

O artigo propõe o TASER, um framework de defesa descentralizado para enxames de UAVs que utiliza a concentração espectral para suprimir ataques de backdoor furtivos, preservando coeficientes relevantes para a tarefa principal e descartando os demais, superando assim as limitações das defesas baseadas em detecção de outliers.

Sizhe Huang, Shujie Yang2026-03-12🤖 cs.AI

Amnesia: Adversarial Semantic Layer Specific Activation Steering in Large Language Models

O artigo propõe o "Amnesia", um ataque adversarial leve que manipula os estados internos de modelos de linguagem grandes (LLMs) para contornar mecanismos de segurança existentes e induzir a geração de conteúdo prejudicial sem a necessidade de ajuste fino ou treinamento adicional.

Ali Raza, Gurang Gupta, Nikolay Matyunin, Jibesh Patra2026-03-12🤖 cs.AI

Digging Deeper: Learning Multi-Level Concept Hierarchies

O artigo apresenta o Multi-Level Concept Splitting (MLCS) e o Deep-HiCEMs, métodos que superam as limitações de hierarquias rasas ao descobrir hierarquias de conceitos multinível a partir de supervisão de alto nível e permitir intervenções em múltiplos níveis de abstração, mantendo alta precisão e interpretabilidade.

Oscar Hill, Mateo Espinosa Zarlenga, Mateja Jamnik2026-03-12🤖 cs.LG

KernelSkill: A Multi-Agent Framework for GPU Kernel Optimization

O KernelSkill é um framework multiagente que otimiza kernels de GPU substituindo heurísticas implícitas de modelos de linguagem por habilidades de especialistas baseadas em conhecimento e uma arquitetura de memória dupla, alcançando sucesso de 100% e acelerações significativas em relação ao Torch Eager e a métodos anteriores.

Qitong Sun, Jun Han, Tianlin Li, Zhe Tang, Sheng Chen, Fei Yang, Aishan Liu, Xianglong Liu, Yang Liu2026-03-12🤖 cs.LG

ES-dLLM: Efficient Inference for Diffusion Large Language Models by Early-Skipping

O artigo apresenta o ES-dLLM, um framework de aceleração de inferência sem treinamento para modelos de linguagem difusivos (dLLMs) que reduz o custo computacional ao pular tokens em camadas iniciais com base na variação de representações intermediárias e em scores de confiança, alcançando ganhos de velocidade significativos sem comprometer a qualidade da geração.

Zijian Zhu, Fei Ren, Zhanhong Tan, Kaisheng Ma2026-03-12🤖 cs.LG

Multi-Stream Perturbation Attack: Breaking Safety Alignment of Thinking LLMs Through Concurrent Task Interference

Este artigo propõe um ataque de perturbação de múltiplos fluxos que explora vulnerabilidades no modo de raciocínio de modelos de linguagem grandes ao intercalar tarefas concorrentes, resultando em altas taxas de sucesso em jailbreaks e na colapso ou repetição dos processos de pensamento.

Fan Yang2026-03-12🤖 cs.AI

← Anterior Próximo →