UIS-Digger: Towards Comprehensive Research Agent Systems for Real-world Unindexed Information Seeking

Each language version is independently generated for its own context, not a direct translation.

Imagine que a internet é uma biblioteca gigante, mas com uma peculiaridade: a maioria dos livros está organizada em uma seção principal, fácil de encontrar, enquanto outros livros preciosos estão escondidos em porões empoeirados, dentro de caixas trancadas ou em salas que só existem se você abrir a porta certa.

Até agora, os "robôs pesquisadores" (agentes de IA) eram como bibliotecários incrivelmente rápidos, mas que só sabiam procurar na seção principal. Se você pedisse a eles um livro que estava no porão, eles diziam: "Não existe" ou inventavam uma história (alucinação).

Este artigo, apresentado na conferência ICLR 2026, conta a história de como a Huawei e parceiros criaram um novo tipo de pesquisador chamado UIS-Digger (o "Escavador de Informação Não Indexada") e um novo teste chamado UIS-QA para medir essa habilidade.

Aqui está a explicação simplificada:

1. O Problema: A "Cegueira" dos Robôs

Atualmente, quando usamos o Google ou Bing, eles mostram apenas o que chamam de "Informação Indexada" (IIS). É como se eles tivessem um mapa de todas as prateleiras principais.

O que falta: Muitas informações vitais estão "Não Indexadas" (UIS). Isso inclui:
- Arquivos PDF ou Excel que o robô não consegue ler só com o link.
- Páginas que exigem que você clique em "Próximo", selecione uma data em um calendário ou preencha um formulário.
- Conteúdo que está "escondido" atrás de botões ou em sites que os robôs de busca não visitaram.

A Analogia: Imagine que você quer saber o preço de um ingresso para um show específico de uma data futura. O Google te dá o link do site do show, mas não o preço. Para saber, você precisa entrar no site, clicar em "Datas", escolher o dia e ver o preço. Os robôs antigos travavam nessa porta. Eles diziam: "Não encontrei".

2. O Novo Teste: UIS-QA (O Exame de Raciocínio)

Os autores criaram um novo teste com 110 perguntas difíceis.

A Regra: Para responder, o robô precisa entrar em sites, clicar em botões, baixar arquivos e ler o conteúdo lá dentro. Não basta apenas ler o que o Google mostra.
O Resultado Chocante: Os melhores robôs do mundo (como os da OpenAI e Google) foram reprovados. Eles tinham notas de 70% em testes antigos, mas caíram para cerca de 25% neste novo teste. Isso mostrou que eles são ótimos em ler o que já está escrito, mas péssimos em "explorar" a internet como um humano faria.

3. A Solução: UIS-Digger (O Escavador)

Para consertar isso, eles criaram o UIS-Digger. Pense nele não como um único robô, mas como uma equipe de especialistas trabalhando juntos:

O Planejador: É o chefe. Ele recebe a pergunta e divide o trabalho. "Você vai procurar no Google, você vai entrar no site, você vai baixar o PDF."
O Buscador: Vai ao Google e pega os links.
O Surfista (Web Surfer): É o mais importante. Ele é um navegador que pode "ver" a página.
- O Truque Mágico: Ele tem dois modos. O modo Texto (rápido, lê o código da página) e o modo Visual (tira "fotos" da tela como um humano). Ele troca entre eles conforme necessário. Se o texto não faz sentido, ele tira uma foto para entender o gráfico ou o botão.
O Leitor de Arquivos: Se o Surfista baixar um PDF ou Excel, este especialista abre o arquivo e extrai os dados.

4. O Treinamento: De "Leigo" a "Mestre"

Eles não apenas deram o software pronto. Eles treinaram o cérebro do robô (a IA) em duas etapas:

Etapa 1 (SFT - Aprendizado Supervisionado): Eles mostraram ao robô exemplos de como resolver esses problemas, como um professor mostrando o passo a passo de uma tarefa difícil.
Etapa 2 (RFT - Aprendizado por Rejeição): O robô tentou resolver problemas sozinho. Quando ele acertou, eles disseram "Bom trabalho!". Quando ele errou, eles disseram "Tente de novo, dessa forma". Isso forçou o robô a aprender a explorar melhor, em vez de desistir fácil.

5. O Resultado Final

Com esse treinamento e a equipe de especialistas, o UIS-Digger conseguiu acertar 27,27% das perguntas difíceis.

Por que é impressionante? Eles usaram um modelo de IA relativamente pequeno (comparado aos gigantes da indústria), mas com a ferramenta certa e o treino certo, superaram sistemas que usavam modelos gigantes e caros (como o O3 e GPT-4.1) que não sabiam "escavar" a internet.

Resumo em uma Metáfora

Os Robôs Antigos: Eram como um turista que só lê o guia turístico impresso. Se o guia não diz onde está o restaurante, ele fica com fome.
O UIS-Digger: É como um turista local que sabe perguntar, entrar nas lojas, olhar os cardápios nas paredes, conversar com os donos e até abrir a geladeira para ver o que tem dentro.

Conclusão: Este trabalho mostra que para a IA realmente entender o mundo real, ela precisa parar de apenas "ler o que o Google diz" e começar a "navegar e interagir" com a internet como nós fazemos. O UIS-QA é o novo padrão para medir quem realmente sabe fazer isso, e o UIS-Digger é o primeiro a provar que é possível ensinar uma IA a ser um explorador digital de verdade.

UIS-Digger: Towards Comprehensive Research Agent Systems for Real-world Unindexed Information Seeking

1. O Problema: A "Cegueira" dos Robôs

2. O Novo Teste: UIS-QA (O Exame de Raciocínio)

3. A Solução: UIS-Digger (O Escavador)

4. O Treinamento: De "Leigo" a "Mestre"

5. O Resultado Final

Resumo em uma Metáfora

1. Definição do Problema: Busca de Informação Não Indexada (UIS)

2. Metodologia e Propostas

A. UIS-QA: O Primeiro Benchmark para UIS

B. UIS-DIGGER: Um Framework Multi-Agente

3. Resultados Experimentais

4. Contribuições Principais

5. Significado e Impacto

UIS-Digger: Towards Comprehensive Research Agent Systems for Real-world Unindexed Information Seeking

1. O Problema: A "Cegueira" dos Robôs

2. O Novo Teste: UIS-QA (O Exame de Raciocínio)

3. A Solução: UIS-Digger (O Escavador)

4. O Treinamento: De "Leigo" a "Mestre"

5. O Resultado Final

Resumo em uma Metáfora

1. Definição do Problema: Busca de Informação Não Indexada (UIS)

2. Metodologia e Propostas

A. UIS-QA: O Primeiro Benchmark para UIS

B. UIS-DIGGER: Um Framework Multi-Agente

3. Resultados Experimentais

4. Contribuições Principais

5. Significado e Impacto

Mais como este

A Hybrid Residue Floating Numerical Architecture with Formal Error Bounds for High Throughput FPGA Computation

On the Multi-Commodity Flow with convex objective function: Column-Generation approaches

VeriInteresting: An Empirical Study of Model Prompt Interactions in Verilog Code Generation

AnalogToBi: Device-Level Analog Circuit Topology Generation via Bipartite Graph and Grammar Guided Decoding

Artificial Intelligence (AI) Maturity in Small and Medium-Sized Enterprises: A Framework of Internalized and Ecosystem-Embedded Capabilities