cs.AI artigos | Gist.Science

mlx-snn: Spiking Neural Networks on Apple Silicon via MLX

O artigo apresenta o mlx-snn, a primeira biblioteca nativa de redes neurais de pulsos (SNN) para Apple Silicon baseada no framework MLX, que oferece modelos de neurônios, métodos de codificação e treinamento eficientes, superando o snnTorch em velocidade e uso de memória em hardware M3 Max.

Jiahao Qin2026-03-05🤖 cs.AI

Directional Neural Collapse Explains Few-Shot Transfer in Self-Supervised Learning

O artigo demonstra que a variância direcional CDNV, uma quantidade geométrica que mede a variabilidade ao longo das direções de separação de classes, é o fator central que explica tanto a forte transferência em cenários de poucos exemplos quanto a baixa interferência entre múltiplas tarefas no aprendizado auto-supervisionado, ao garantir que os eixos de decisão permaneçam quase ortogonais.

Achleshwar Luthra, Yash Salunkhe, Tomer Galanti2026-03-05✓ Author reviewed ⓘ🤖 cs.AI

Role-Aware Conditional Inference for Spatiotemporal Ecosystem Carbon Flux Prediction

Este artigo propõe o RACI, um quadro de aprendizado informado por processos que melhora a previsão de fluxos de carbono em ecossistemas ao tratar a inferência como condicional, separando explicitamente as condições de regime de longo prazo dos drivers dinâmicos de curto prazo para superar a heterogeneidade espaço-temporal.

Yiming Sun, Runlong Yu, Rongchao Dong + 6 more2026-03-05🤖 cs.AI

SafeCRS: Personalized Safety Alignment for LLM-Based Conversational Recommender Systems

O artigo apresenta o SafeCRS, um novo framework de treinamento e o conjunto de dados SafeRec que visam alinhar Sistemas de Recomendação Conversacionais baseados em LLMs a restrições de segurança personalizadas, reduzindo significativamente as violações de segurança sem comprometer a qualidade das recomendações.

Haochang Hao, Yifan Xu, Xinzhuo Li + 2 more2026-03-05🤖 cs.AI

RAG-X: Systematic Diagnosis of Retrieval-Augmented Generation for Medical Question Answering

O artigo apresenta o RAG-X, um framework de diagnóstico que avalia independentemente os componentes de recuperação e geração em sistemas de QA médica, introduzindo métricas de eficiência de uso de contexto para revelar falhas ocultas e garantir a segurança clínica.

Aswini Sivakumar, Vijayan Sugumaran, Yao Qiang2026-03-05🤖 cs.AI

Tucano 2 Cool: Better Open Source LLMs for Portuguese

O artigo apresenta o Tucano 2, uma suíte de modelos de linguagem de código aberto de 0,5 a 3,7 bilhões de parâmetros otimizados para o português, que utiliza novos conjuntos de dados sintéticos e de pós-treinamento para alcançar desempenho de ponta em diversas tarefas e benchmarks, com todos os recursos totalmente liberados para a comunidade.

Nicholas Kluge Corrêa, Aniket Sen, Shiza Fatimah + 4 more2026-03-05🤖 cs.AI

Molt Dynamics: Emergent Social Phenomena in Autonomous AI Agent Populations

O artigo apresenta o "MoltBook", um ambiente de larga escala com mais de 770.000 agentes autônomos, e descreve a "Dinâmica de Muda" como o conjunto de comportamentos emergentes observados, revelando que, embora existam padrões de especialização de papéis e disseminação de informações, a resolução cooperativa de tarefas permanece incipiente e menos eficaz do que a atuação individual.

Brandon Yee, Krishna Sharma2026-03-05🤖 cs.AI

Build, Judge, Optimize: A Blueprint for Continuous Improvement of Multi-Agent Consumer Assistants

Este artigo apresenta um blueprint prático para avaliar e otimizar assistentes de compras conversacionais em produção, introduzindo uma rubrica de avaliação multidimensional e duas estratégias de otimização de prompts baseadas no GEPA — Sub-agent GEPA e MAMuT GEPA — para aprimorar sistemas multi-agente complexos.

Alejandro Breen Herrera, Aayush Sheth, Steven G. Xu + 5 more2026-03-05🤖 cs.AI

Belief-Sim: Towards Belief-Driven Simulation of Demographic Misinformation Susceptibility

O artigo apresenta o BeliefSim, um framework que utiliza perfis de crenças demográficas para simular com alta precisão a suscetibilidade a desinformação em diferentes grupos populacionais, demonstrando que as crenças subjacentes são um fator determinante nesse processo.

Angana Borah, Zohaib Khan, Rada Mihalcea + 1 more2026-03-05🤖 cs.AI

Social Norm Reasoning in Multimodal Language Models: An Evaluation

Este artigo avalia a capacidade de cinco Modelos de Linguagem Multimodal (MLLMs) de raciocinar sobre normas sociais em cenários baseados em texto e imagem, revelando que, embora o GPT-4o demonstre o melhor desempenho geral e supere os humanos no texto, todos os modelos apresentam dificuldades com normas complexas e têm desempenho inferior em imagens.

Oishik Chowdhury, Anushka Debnath, Bastin Tony Roy Savarimuthu2026-03-05🤖 cs.AI

Goal-Driven Risk Assessment for LLM-Powered Systems: A Healthcare Case Study

Este estudo propõe uma abordagem estruturada de avaliação de riscos orientada a objetivos, que utiliza árvores de ataque para contextualizar ameaças em sistemas de saúde baseados em LLMs, harmonizando ataques adversariais com ciberataques convencionais para aprimorar as práticas de segurança desde o design.

Neha Nagaraja, Hayretdin Bahsi2026-03-05🤖 cs.AI

Image-based Prompt Injection: Hijacking Multimodal LLMs through Visually Embedded Adversarial Instructions

Este artigo apresenta um ataque de injeção de prompt baseado em imagens que, ao ocultar instruções adversariais em imagens naturais, consegue manipular com sucesso até 64% das vezes o comportamento de Modelos de Linguagem Multimodais em cenários de caixa preta.

Neha Nagaraja, Lan Zhang, Zhilong Wang + 2 more2026-03-05🤖 cs.AI

Bridging Pedagogy and Play: Introducing a Language Mapping Interface for Human-AI Co-Creation in Educational Game Design

Este artigo apresenta uma ferramenta baseada em linguagem natural controlada que facilita a co-criação de jogos educacionais entre humanos e IA, permitindo que designers não especialistas mapeiem explicitamente objetivos pedagógicos para mecânicas de jogo, preservando a agência humana e alinhando a intenção educativa com a jogabilidade.

Daijin Yang, Erica Kleinman, Casper Harteveld2026-03-05🤖 cs.AI

Field imaging framework for morphological characterization of aggregates with computer vision: Algorithms and applications

Esta dissertação apresenta um quadro de imagem de campo para a caracterização morfológica de agregados de construção, desenvolvendo algoritmos de segmentação e estimativa de volume para partículas individuais, bem como abordagens automatizadas de análise 2D e uma metodologia integrada de reconstrução-segmentação-completamento 3D para analisar e prever as faces ocultas de pilhas de agregados em cenários reais.

Haohang Huang2026-03-05🤖 cs.AI

Mozi: Governed Autonomy for Drug Discovery LLM Agents

O artigo apresenta o Mozi, uma arquitetura de dupla camada que combina raciocínio generativo livre com execução estruturada e supervisão rigorosa para habilitar agentes de LLM confiáveis e auditáveis na descoberta de medicamentos, superando desafios de governança de ferramentas e acumulação de erros em pipelines de longo prazo.

He Cao, Siyu Liu, Fan Zhang + 7 more2026-03-05🤖 cs.AI

InEdit-Bench: Benchmarking Intermediate Logical Pathways for Intelligent Image Editing Models

O artigo apresenta o InEdit-Bench, o primeiro benchmark dedicado a avaliar a capacidade de raciocínio sobre caminhos lógicos intermediários em modelos de edição de imagem, revelando deficiências generalizadas nos modelos atuais e propondo critérios para impulsionar o desenvolvimento de sistemas multimodais mais inteligentes e conscientes de processos dinâmicos.

Zhiqiang Sheng, Xumeng Han, Zhiwei Zhang + 6 more2026-03-05🤖 cs.AI

Graph Negative Feedback Bias Correction Framework for Adaptive Heterophily Modeling

Este artigo propõe o framework GNFBC, que utiliza um mecanismo de realimentação negativa para corrigir o viés introduzido pela suposição de homofilia em Redes Neurais de Grafos, permitindo assim um modelamento eficaz e adaptativo de grafos heterofílicos sem depender de estratégias de agregação específicas.

Jiaqi Lv, Qingfeng Du, Yu Zhang + 2 more2026-03-05🤖 cs.AI

Local Shapley: Model-Induced Locality and Optimal Reuse in Data Valuation

O artigo propõe o método LSMR, que aproveita a localidade induzida por modelos para reduzir drasticamente o custo computacional da valoração de dados via valor de Shapley, retraindo apenas os subconjuntos de dados verdadeiramente influentes para cada instância de teste.

Xuan Yang, Hsi-Wen Chen, Ming-Syan Chen + 1 more2026-03-05🤖 cs.AI

MIND: Unified Inquiry and Diagnosis RL with Criteria Grounded Clinical Supports for Psychiatric Consultation

O artigo apresenta o MIND, um framework unificado de aprendizado por reforço para consultas psiquiátricas que utiliza um banco de raciocínio fundamentado em critérios clínicos e recompensas de processo baseadas em rubricas para superar a ambiguidade dos sintomas e otimizar tanto a investigação quanto o diagnóstico diferencial.

Guoyi Li, Shihao Xu, Jiatong Ma + 3 more2026-03-05🤖 cs.AI

MAGE: Meta-Reinforcement Learning for Language Agents toward Strategic Exploration and Exploitation

O artigo apresenta o MAGE, um framework de Aprendizado por Reforço Meta que capacita agentes de Grandes Modelos de Linguagem a realizar exploração e exploração estratégicas em ambientes não estacionários, superando as limitações de métodos existentes através de treinamento multi-episódio, normalização de vantagem específica e treinamento baseado em população.

Lu Yang, Zelai Xu, Minyang Xie + 4 more2026-03-05🤖 cs.AI

← Anterior Próximo →