Is Position Bias in Dense Retrievers Built In-or Learned from Data?
Este trabajo demuestra que el sesgo posicional en los recuperadores densos se aprende principalmente de la distribución de la evidencia en los datos de entrenamiento y no es inherente a la arquitectura del modelo, mostrando que una curación equilibrada de los datos puede mitigar significativamente este sesgo al tiempo que mantiene un rendimiento de recuperación competitivo.