DriverGaze360: OmniDirectional Driver Attention with Object-Level Guidance

Este artigo apresenta o DriverGaze360, um novo conjunto de dados em escala massiva com visão de 360 graus e o método DriverGaze360-Net, que utilizam orientação por objetos para superar as limitações de campo de visão frontal e alcançar um estado da arte na previsão da atenção do motorista em ambientes de condução panorâmicos.

Shreedhar Govil, Didier Stricker, Jason Rambach

Publicado 2026-03-06
📖 4 min de leitura☕ Leitura rápida

Each language version is independently generated for its own context, not a direct translation.

Imagine que você está dirigindo um carro. Você não olha apenas para a frente, certo? Você olha para os lados para mudar de faixa, olha no retrovisor para ver quem está atrás e verifica os espelhos para ver se há pedestres ou ciclistas.

O problema é que, até agora, a inteligência artificial (IA) que tenta entender o que o motorista está olhando era como uma pessoa com uma venda nos olhos, só conseguindo ver um pequeno quadrado bem na frente do carro. Ela perdia tudo o que acontecia ao redor.

Este artigo apresenta uma solução genial chamada DriverGaze360. Vamos explicar como funciona usando algumas analogias simples:

1. O Novo "Mapa do Tesouro" (O Dataset)

Os pesquisadores criaram um banco de dados gigante, chamado DriverGaze360.

  • A Analogia: Imagine que os estudos antigos eram como tirar uma foto de uma única janela de um carro. O novo estudo é como colocar câmeras em 360 graus ao redor do carro, capturando tudo: frente, trás, esquerda e direita.
  • O que eles fizeram: Eles colocaram 19 motoristas reais em um simulador de direção (como um videogame super realista) e usaram óculos especiais para rastrear exatamente para onde os olhos deles se moviam.
  • O resultado: Eles coletaram cerca de 1 milhão de "fotos" de onde os olhos estavam olhando. Isso inclui momentos críticos, como quando o motorista olha para o espelho lateral antes de mudar de faixa ou para trás para ver um pedestre. Antes, a IA não sabia que esse movimento existia; agora, ela aprendeu com dados reais.

2. O "Detetive Inteligente" (O Modelo DriverGaze360-Net)

Com esses dados, eles criaram um novo cérebro de IA chamado DriverGaze360-Net.

  • A Analogia: Pense em um detetive antigo que só olhava para a estrada e tentava adivinhar onde o motorista estava olhando. Ele muitas vezes errava porque não tinha contexto.
  • A Nova Abordagem: O novo "detetive" (o modelo) tem um superpoder: ele não olha apenas para a imagem, ele também identifica os objetos. Ele sabe: "Ah, aquele é um pedestre, aquele é um carro, aquele é um sinal de pare".
  • Como funciona: O modelo é treinado para fazer duas coisas ao mesmo tempo:
    1. Desenhar um mapa de calor mostrando onde o motorista está olhando.
    2. Pintar de cores diferentes os objetos que o motorista está olhando (ex: pintar o pedestre de vermelho se o motorista estiver olhando para ele).
  • Por que é melhor? Ao ensinar a IA a reconhecer o que está sendo olhado (o objeto), ela se torna muito melhor em prever para onde o motorista vai olhar. É como ensinar um aluno não apenas a decorar a resposta, mas a entender a lógica por trás dela.

3. Por que isso é importante? (A Aplicação Prática)

Por que nos importamos se a IA sabe para onde o motorista olha?

  • Segurança: Se o carro autônomo ou o sistema de assistência (como o alerta de colisão) sabe que o motorista está distraído olhando para o celular e não para o pedestre que está cruzando a rua, ele pode alertar o motorista ou até frear sozinho.
  • Carros Autônomos: Para um carro autônomo entender o que um motorista humano vai fazer (ex: "ele está olhando para o espelho, então vai mudar de faixa"), ele precisa entender a visão de 360 graus, não apenas a frente.

Resumo em uma frase

Os pesquisadores criaram o primeiro "olho de águia" de 360 graus para ensinar a inteligência artificial a entender exatamente para onde os motoristas olham em todas as direções, usando um novo método que ensina a IA a reconhecer os objetos (como carros e pessoas) para prever o olhar com muito mais precisão.

Isso é um grande passo para tornar as estradas mais seguras e os carros autônomos mais inteligentes e humanos.