Dual-Interaction-Aware Cooperative Control Strategy for Alleviating Mixed Traffic Congestion

Este artigo propõe a estratégia de controle cooperativo DIACC, baseada em Aprendizado por Reforço Multiagente, que mitiga o congestionamento em tráfego misto através de módulos de percepção de interação local e global, um design de recompensa adaptativo e um mecanismo de refinamento de segurança para otimizar a eficiência do tráfego em cenários de gargalo.

Zhengxuan Liu, Yuxin Cai, Yijing Wang, Xiangkun He, Chen Lv, Zhiqiang Zuo

Publicado 2026-03-06
📖 4 min de leitura☕ Leitura rápida

Each language version is independently generated for its own context, not a direct translation.

Imagine que o trânsito é como uma grande festa de dança onde dois tipos de pessoas estão misturados:

  1. Os Dançarinos Automáticos (CAVs): São carros inteligentes que se comunicam entre si, sabem exatamente o que vão fazer e podem se coordenar perfeitamente.
  2. Os Dançarinos Humanos (HDVs): São os carros comuns, dirigidos por pessoas. Eles são imprevisíveis: alguns são agressivos (cortam a frente), outros são tímidos (demoram a acelerar) e ninguém sabe ao certo qual será o próximo passo deles.

O problema acontece quando a pista encolhe (como em um gargalo de obra ou uma entrada de rodovia). Os humanos, por serem egoístas ou inseguros, tendem a empurrar e travar a dança, criando engarrafamentos. Os carros automáticos, sozinhos, muitas vezes não sabem como "conversar" com os humanos para desatar o nó.

Este artigo apresenta uma nova estratégia chamada DIACC (uma espécie de "Super Maestro" para o trânsito misto). O objetivo é fazer os carros automáticos dançarem tão bem que o trânsito flua, mesmo com humanos ao redor.

Aqui está como essa estratégia funciona, dividida em três partes mágicas:

1. O Olho que Diferencia (D-IADM)

Imagine que você está em uma sala cheia de gente. Você precisa saber quem é seu amigo (outro carro automático) e quem é um estranho (um carro humano).

  • O Problema: Antes, os carros automáticos tratavam todos iguais, o que confundia a estratégia.
  • A Solução: O sistema DIACC ensina o carro a olhar para os lados e pensar: "Ah, aquele carro azul é meu parceiro, vamos combinar o passo. Aquele carro vermelho é um humano, ele é imprevisível, então vou apenas observar e me adaptar, sem tentar coordenar com ele."
  • A Analogia: É como um maestro que sabe diferenciar os músicos da orquestra (que seguem a partitura) dos espectadores que estão apenas batendo palmas. Ele não tenta fazer os espectadores seguirem a partitura, mas usa o ritmo deles para não tropeçar.

2. O Maestro com Visão de Águia (C-IEC)

Durante o treinamento, os carros precisam de um professor que veja a dança inteira, não apenas o que está na frente deles.

  • O Problema: Um carro sozinho só vê o que está logo à sua frente. Ele pode achar que está fazendo o certo, mas sem querer está criando um engarrafamento lá na frente.
  • A Solução: O sistema tem um "Critic" (crítico) que é como um Maestro no topo de uma torre. Ele vê a dança de todos os carros, entende como a interação entre eles afeta o fluxo total e diz aos carros: "Ei, se vocês fizerem isso agora, o trânsito vai travar. Mudem de ideia!"
  • A Analogia: É a diferença entre um jogador de futebol que só olha para a bola e um técnico que vê o campo inteiro e grita instruções táticas para todos os jogadores ao mesmo tempo.

3. O Treinador que Foca nos Difíceis (Recompensa Inteligente)

Quando você está aprendendo a dançar, você pratica muito o básico, mas também precisa focar nos passos difíceis.

  • O Problema: Se o sistema de aprendizado apenas olhar para o "médio", ele ignora os momentos de caos onde o acidente quase acontece.
  • A Solução: O sistema usa um truque matemático (chamado softmin com resfriamento) que funciona como um treinador que grita mais alto quando o aluno está errando.
    • No começo, ele deixa todos tentarem coisas novas (exploração).
    • Depois, ele foca a atenção nos carros que estão em situações perigosas ou difíceis, forçando-os a aprender a resolver esses nós específicos.
  • A Analogia: Imagine um professor de matemática que, em vez de dar a mesma lição para todos, identifica os alunos que estão travados em problemas difíceis e dedica mais tempo a ajudá-los, garantindo que ninguém fique para trás.

O "Segurança de Bordo" (PSAR)

Além disso, existe um pequeno módulo de segurança que age como um freio de emergência inteligente. Se o carro automático planeja fazer uma manobra arriscada (como mudar de faixa muito rápido), esse módulo intervém e corrige a ação antes que aconteça algo ruim, garantindo que o carro nunca faça algo que possa causar uma colisão.

O Resultado Final?

Os testes mostraram que, ao usar essa estratégia:

  • O trânsito flui mais rápido: Menos tempo parado em filas.
  • É mais seguro: Quase zero acidentes ou situações de perigo crítico.
  • Funciona em qualquer lugar: O sistema aprendeu a lidar com humanos agressivos, tímidos ou normais, e continua funcionando bem mesmo em cenários novos que ele nunca viu antes.

Em resumo, o DIACC é como dar aos carros automáticos "inteligência social" e uma "visão global", permitindo que eles convivam harmoniosamente com os motoristas humanos, transformando um caos de engarrafamento em uma dança fluida e segura.