Is Position Bias in Dense Retrievers Built In-or Learned from Data?
Diese Arbeit zeigt, dass die Positionsverzerrung in dichten Retrieval-Modellen primär aus der Verteilung der Evidenz in den Trainingsdaten gelernt wird und nicht inhärent zur Modellarchitektur gehört, und belegt, dass eine ausgewogene Kuratierung der Daten diese Verzerrung erheblich abschwächen kann, ohne dabei die wettbewerbsfähige Retrieval-Leistung zu beeinträchtigen.