What Is the Alignment Tax?
Dieses Papier charakterisiert den Alignment-Tax erstmals formal durch eine geometrische Theorie im Repräsentationsraum, die eine exakte Pareto-Grenze für den Trade-off zwischen Sicherheit und Leistungsfähigkeit in Abhängigkeit vom Winkel zwischen den entsprechenden Unterräumen herleitet und eine Skalierungsgesetz-Zerlegung in einen irreduziblen strukturellen Anteil sowie einen mit der Modelldimension verschwindenden Restanteil liefert.