DepthCharge: A Domain-Agnostic Framework for Measuring Depth-Dependent Knowledge in Large Language Models
O artigo apresenta o DepthCharge, um framework agnóstico a domínios que mede a profundidade do conhecimento de Grandes Modelos de Linguagem através de sondagem adaptativa e verificação de fatos, revelando variações de desempenho dependentes do domínio que benchmarks padrão não capturam.