Online Minimization of Polarization and Disagreement via Low-Rank Matrix Bandits
Este artigo propõe um algoritmo de duas etapas baseado em bandits de matriz de baixo posto para minimizar a polarização e o desacordo no modelo de dinâmica de opiniões de Friedkin-Johnsen em um cenário online com informações incompletas, alcançando um limite de arrependimento cumulativo que supera abordagens lineares existentes.