Directional Neural Collapse Explains Few-Shot Transfer in Self-Supervised Learning

O artigo demonstra que a variância direcional CDNV, uma quantidade geométrica que mede a variabilidade ao longo das direções de separação de classes, é o fator central que explica tanto a forte transferência em cenários de poucos exemplos quanto a baixa interferência entre múltiplas tarefas no aprendizado auto-supervisionado, ao garantir que os eixos de decisão permaneçam quase ortogonais.

Achleshwar Luthra, Yash Salunkhe, Tomer Galanti2026-03-05✓ Author reviewed 🤖 cs.AI

Molt Dynamics: Emergent Social Phenomena in Autonomous AI Agent Populations

O artigo apresenta o "MoltBook", um ambiente de larga escala com mais de 770.000 agentes autônomos, e descreve a "Dinâmica de Muda" como o conjunto de comportamentos emergentes observados, revelando que, embora existam padrões de especialização de papéis e disseminação de informações, a resolução cooperativa de tarefas permanece incipiente e menos eficaz do que a atuação individual.

Brandon Yee, Krishna Sharma2026-03-05🤖 cs.AI

Build, Judge, Optimize: A Blueprint for Continuous Improvement of Multi-Agent Consumer Assistants

Este artigo apresenta um blueprint prático para avaliar e otimizar assistentes de compras conversacionais em produção, introduzindo uma rubrica de avaliação multidimensional e duas estratégias de otimização de prompts baseadas no GEPA — Sub-agent GEPA e MAMuT GEPA — para aprimorar sistemas multi-agente complexos.

Alejandro Breen Herrera, Aayush Sheth, Steven G. Xu + 5 more2026-03-05🤖 cs.AI

Social Norm Reasoning in Multimodal Language Models: An Evaluation

Este artigo avalia a capacidade de cinco Modelos de Linguagem Multimodal (MLLMs) de raciocinar sobre normas sociais em cenários baseados em texto e imagem, revelando que, embora o GPT-4o demonstre o melhor desempenho geral e supere os humanos no texto, todos os modelos apresentam dificuldades com normas complexas e têm desempenho inferior em imagens.

Oishik Chowdhury, Anushka Debnath, Bastin Tony Roy Savarimuthu2026-03-05🤖 cs.AI

Bridging Pedagogy and Play: Introducing a Language Mapping Interface for Human-AI Co-Creation in Educational Game Design

Este artigo apresenta uma ferramenta baseada em linguagem natural controlada que facilita a co-criação de jogos educacionais entre humanos e IA, permitindo que designers não especialistas mapeiem explicitamente objetivos pedagógicos para mecânicas de jogo, preservando a agência humana e alinhando a intenção educativa com a jogabilidade.

Daijin Yang, Erica Kleinman, Casper Harteveld2026-03-05🤖 cs.AI

Field imaging framework for morphological characterization of aggregates with computer vision: Algorithms and applications

Esta dissertação apresenta um quadro de imagem de campo para a caracterização morfológica de agregados de construção, desenvolvendo algoritmos de segmentação e estimativa de volume para partículas individuais, bem como abordagens automatizadas de análise 2D e uma metodologia integrada de reconstrução-segmentação-completamento 3D para analisar e prever as faces ocultas de pilhas de agregados em cenários reais.

Haohang Huang2026-03-05🤖 cs.AI

InEdit-Bench: Benchmarking Intermediate Logical Pathways for Intelligent Image Editing Models

O artigo apresenta o InEdit-Bench, o primeiro benchmark dedicado a avaliar a capacidade de raciocínio sobre caminhos lógicos intermediários em modelos de edição de imagem, revelando deficiências generalizadas nos modelos atuais e propondo critérios para impulsionar o desenvolvimento de sistemas multimodais mais inteligentes e conscientes de processos dinâmicos.

Zhiqiang Sheng, Xumeng Han, Zhiwei Zhang + 6 more2026-03-05🤖 cs.AI

MIND: Unified Inquiry and Diagnosis RL with Criteria Grounded Clinical Supports for Psychiatric Consultation

O artigo apresenta o MIND, um framework unificado de aprendizado por reforço para consultas psiquiátricas que utiliza um banco de raciocínio fundamentado em critérios clínicos e recompensas de processo baseadas em rubricas para superar a ambiguidade dos sintomas e otimizar tanto a investigação quanto o diagnóstico diferencial.

Guoyi Li, Shihao Xu, Jiatong Ma + 3 more2026-03-05🤖 cs.AI

MAGE: Meta-Reinforcement Learning for Language Agents toward Strategic Exploration and Exploitation

O artigo apresenta o MAGE, um framework de Aprendizado por Reforço Meta que capacita agentes de Grandes Modelos de Linguagem a realizar exploração e exploração estratégicas em ambientes não estacionários, superando as limitações de métodos existentes através de treinamento multi-episódio, normalização de vantagem específica e treinamento baseado em população.

Lu Yang, Zelai Xu, Minyang Xie + 4 more2026-03-05🤖 cs.AI