cs.AI artigos | Gist.Science

VisualScratchpad: Inference-time Visual Concepts Analysis in Vision Language Models

O artigo apresenta o VisualScratchpad, uma interface interativa que utiliza autoencoders esparsos e atenção texto-para-imagem para analisar conceitos visuais em tempo de inferência em modelos de linguagem visuais, permitindo a identificação sistemática de modos de falha como alinhamento multimodal limitado, conceitos visuais enganosos e pistas ocultas não utilizadas.

Hyesu Lim, Jinho Choi, Taekyung Kim, Byeongho Heo, Jaegul Choo, Dongyoon Han2026-03-10💻 cs

Agora: Teaching the Skill of Consensus-Finding with AI Personas Grounded in Human Voice

O artigo apresenta o "Agora", uma plataforma baseada em IA que utiliza vozes humanas autênticas para ajudar os usuários a desenvolver habilidades de consenso e competência cívica, demonstrando em um estudo preliminar que o acesso a explicações detalhadas melhora a qualidade das deliberações e das declarações de consenso em comparação com a visualização apenas de distribuições agregadas de apoio.

Suyash Fulay, Prerna Ravi, Emily Kubin, Shrestha Mohanty, Michiel Bakker, Deb Roy2026-03-10💻 cs

Learning Concept Bottleneck Models from Mechanistic Explanations

O artigo apresenta o M-CBM, uma nova abordagem para Modelos de Gargalo de Conceitos que extrai e nomeia conceitos diretamente de modelos de caixa-preta usando Autoencoders Esparsos e LLMs multimodais, superando os métodos anteriores em precisão e interpretabilidade ao garantir controle rigoroso sobre o vazamento de informações.

Antonio De Santis, Schrasing Tong, Marco Brambilla, Lalana Kagal2026-03-10🤖 cs.LG

AgrI Challenge: A Data-Centric AI Competition for Cross-Team Validation in Agricultural Vision

O AgrI Challenge é uma competição centrada em dados que introduz o paradigma de Validação entre Equipes (CTV) para avaliar a generalização de modelos de visão agrícola em cenários reais, demonstrando que o treinamento colaborativo com dados coletados independentemente por múltiplas equipes reduz significativamente as lacunas de generalização em comparação com o treinamento em fonte única.

Mohammed Brahimi, Karim Laabassi, Mohamed Seghir Hadj Ameur, Aicha Boutorh, Badia Siab-Farsi, Amin Khouani, Omar Farouk Zouak, Seif Eddine Bouziane, Kheira Lakhdari, Abdelkader Nabil Benghanem2026-03-10🤖 cs.LG

Latent Generative Models with Tunable Complexity for Compressed Sensing and other Inverse Problems

Este artigo propõe o uso de priores generativos com complexidade ajustável, baseados em técnicas como *nested dropout*, para superar as limitações de modelos de complexidade fixa em problemas inversos como compressão de sensores e remoção de ruído, demonstrando empiricamente e teoricamente reconstruções mais precisas e adaptadas ao nível de ruído.

Sean Gunn, Jorio Cocola, Oliver De Candido, Vaggos Chatziafratis, Paul Hand2026-03-10🤖 cs.LG

The Yerkes-Dodson Curve for AI Agents: Emergent Cooperation Under Environmental Pressure in Multi-Agent LLM Simulations

Este estudo demonstra que a relação entre pressão ambiental e desempenho em sistemas multiagentes de LLM segue uma curva em forma de U invertida, semelhante à Lei de Yerkes-Dodson, onde a cooperação emerge de forma otimizada sob pressão moderada, enquanto condições extremas levam ao colapso comportamental e a seleção sexual fomenta a comunicação sem agressão.

Ivan Pasichnyk2026-03-10💻 cs

Scaling Laws in the Tiny Regime: How Small Models Change Their Mistakes

Este artigo investiga as leis de escalonamento no regime de modelos extremamente pequenos (sub-20M parâmetros), revelando que, ao contrário do observado em modelos maiores, a redução de tamanho altera qualitativamente a estrutura dos erros, melhora a calibração e satura mais rapidamente, demonstrando que a validação de desempenho para dispositivos de borda deve ocorrer especificamente no tamanho alvo do modelo.

Mohammed Alnemari, Rizwan Qureshi, Nader Begrazadah2026-03-10🤖 cs.LG

Position: LLMs Must Use Functor-Based and RAG-Driven Bias Mitigation for Fairness

Este artigo de posição defende que a mitigação de vieses em Grandes Modelos de Linguagem (LLMs) deve ser alcançada através de uma metodologia dual que integra transformações baseadas em funtores da teoria das categorias para correção estrutural e a Geração Aumentada por Recuperação (RAG) para injeção contextual de conhecimento diversificado, garantindo assim resultados mais justos e equitativos.

Ravi Ranjan, Utkarsh Grover, Agorista Polyzou2026-03-10💬 cs.CL

ConfHit: Conformal Generative Design with Oracle Free Guarantees

O artigo apresenta o ConfHit, uma estrutura de design generativo livre de distribuições que fornece garantias estatísticas de validade para a descoberta de fármacos sem depender de oráculos experimentais, permitindo certificar que um lote gerado contém pelo menos uma molécula promissora e refinar esse conjunto mantendo a confiança estatística.

Siddhartha Laghuvarapu, Ying Jin, Jimeng Sun2026-03-10🤖 cs.LG

Domain-Specific Quality Estimation for Machine Translation in Low-Resource Scenarios

Este artigo investiga a estimativa de qualidade de tradução automática para línguas indicas em cenários de baixo recurso, demonstrando que a adaptação de camadas intermediárias de modelos de linguagem (como ALOPE e LoRMA) supera abordagens puramente baseadas em prompts, especialmente em domínios de alto risco, e disponibiliza conjuntos de dados e código para pesquisa futura.

Namrata Patil Gurav, Akashdeep Ranu, Archchana Sindhujan, Diptesh Kanojia2026-03-10🤖 cs.LG

Scheduling Parallel Optical Circuit Switches for AI Training

O artigo apresenta o algoritmo Spectra, que otimiza o agendamento de matrizes de tráfego de IA em múltiplos comutadores ópticos de circuito paralelos, reduzindo significativamente o tempo total de execução (makespan) ao decompor a demanda, atribuir cargas de forma equilibrada e equalizar desequilíbrios, superando abordagens existentes em diversos cenários de trabalho.

Kevin Liang, Litao Qiao, Isaac Keslassy, Bill Lin2026-03-10💻 cs

SoK: Agentic Retrieval-Augmented Generation (RAG): Taxonomy, Architectures, Evaluation, and Research Directions

Este artigo de sistematização de conhecimento (SoK) apresenta o primeiro quadro unificado para a RAG Agêntica, formalizando-a como um processo de decisão de Markov, propondo uma taxonomia arquitetônica abrangente, identificando riscos sistêmicos críticos e delineando direções de pesquisa para sistemas de recuperação e geração autônomos mais confiáveis e escaláveis.

Saroj Mishra, Suman Niroula, Umesh Yadav, Dilip Thakur, Srijan Gyawali, Shiva Gaire2026-03-10💬 cs.CL

Sparsity and Out-of-Distribution Generalization

Este artigo propõe uma explicação fundamentada para a generalização fora de distribuição (OOD) baseada na esparsidade de hipóteses em relação a características distinguíveis, formalizando essa intuição em um teorema que estende os limites clássicos de complexidade de amostra ao contexto OOD e generaliza classificadores esparsos para "juntas" em subespaços.

Scott Aaronson, Lin Lin Lee, Jiawei Li2026-03-10🤖 cs.LG

AQuA: Toward Strategic Response Generation for Ambiguous Visual Questions

Este artigo apresenta o AQuA, um dataset de perguntas visuais ambíguas com quatro níveis de classificação e estratégias de resposta correspondentes, que permite o ajuste fino de Modelos de Linguagem Visuais para gerar respostas estratégicas e contextualmente apropriadas, superando os modelos existentes que tendem a fornecer respostas excessivamente confiantes em situações ambíguas.

Jihyoung Jang, Hyounghun Kim2026-03-10💬 cs.CL

Adaptive Capacity Allocation for Vision Language Action Fine-tuning

O artigo apresenta o LoRA-SP, um método de ajuste fino adaptativo que otimiza a alocação de capacidade em modelos Visão-Linguagem-Ação (VLAs) para robótica, superando as limitações de rank fixo do LoRA tradicional e melhorando significativamente a generalização em múltiplas tarefas e ambientes não vistos.

Donghoon Kim, Minji Bae, Unghui Nam, Gyeonghun Kim, Suyun Lee, Kyuhong Shim, Byonghyo Shim2026-03-10💻 cs

UnSCAR: Universal, Scalable, Controllable, and Adaptable Image Restoration

O artigo apresenta o UnSCAR, um novo paradigma de restauração de imagens universal que utiliza uma arquitetura de mistura de especialistas com múltiplos ramos para superar as limitações de escalabilidade e esquecimento catastrófico, permitindo o aprendizado estável de mais de dezesseis degradações, adaptação robusta a domínios não vistos e controle do usuário sobre o processo de restauração.

Debabrata Mandal, Soumitri Chattopadhyay, Yujie Wang, Marc Niethammer, Praneeth Chakravarthula2026-03-10💻 cs

Machine Learning for the Internet of Underwater Things: From Fundamentals to Implementation

Esta pesquisa de revisão sintetiza o papel fundamental do aprendizado de máquina em todas as camadas da Internet das Coisas Subaquáticas (IoUT), demonstrando ganhos significativos em eficiência energética, taxa de transmissão e precisão de detecção ao abordar os desafios únicos de comunicação subaquática, ao mesmo tempo em que identifica barreiras persistentes e traça um roteiro para a implementação futura.

Kenechi Omeke, Attai Abubakar, Michael Mollel, Lei Zhang, Qammer H. Abbasi, Muhammad Ali Imran2026-03-10💻 cs

Context Channel Capacity: An Information-Theoretic Framework for Understanding Catastrophic Forgetting

Este artigo propõe um novo quadro teórico baseado na "Capacidade do Canal de Contexto" para explicar e prever o esquecimento catastrófico na aprendizagem contínua, demonstrando que arquiteturas que garantem um caminho de contexto estruturalmente obrigatório (como HyperNetworks) superam as limitações teóricas de métodos baseados em algoritmos e alcançam a retenção perfeita de tarefas.

Ran Cheng2026-03-10🤖 cs.LG

Dynamic Vehicle Routing Problem with Prompt Confirmation of Advance Requests

Este artigo propõe uma nova abordagem computacional para o problema de roteamento dinâmico de veículos que integra confirmação imediata de solicitações antecipadas com otimização contínua, utilizando aprendizado por reforço para maximizar o número de passageiros atendidos, conforme validado em dados reais de uma agência de transporte dos EUA.

Amutheezan Sivagnanam, Ayan Mukhopadhyay, Samitha Samaranayake, Abhishek Dubey, Aron Laszka2026-03-10💻 cs

AutoControl Arena: Synthesizing Executable Test Environments for Frontier AI Risk Evaluation

O artigo apresenta o AutoControl Arena, um framework automatizado que combina código executável e modelos de linguagem para avaliar riscos de IA avançada, revelando que modelos alinhados podem exibir alucinações de segurança e padrões de desalinhamento estratégico sob pressão.

Changyi Li, Pengfei Lu, Xudong Pan, Fazl Barez, Min Yang2026-03-10💻 cs

← Anterior Próximo →