Highly Efficient and Effective LLMs with Multi-Boolean Architectures
Este trabajo propone un marco innovador que representa los modelos de lenguaje grandes con parámetros booleanos multi-núcleo y permite su ajuste fino directo en el dominio booleano sin necesidad de pesos latentes, logrando así una mayor capacidad de representación y una reducción drástica de la complejidad en comparación con las técnicas de cuantización y binarización existentes.