Entropic-Time Inference: Self-Organizing Large Language Model Decoding Beyond Attention
O artigo propõe a "inferência de tempo entrópico", uma nova arquitetura de auto-organização que substitui a progressão linear de tokens por um processo termodinâmico inteligente, onde o agendamento, a esparsificação da atenção e a temperatura de amostragem são controlados unificadamente pelo fluxo de incerteza para otimizar a alocação de recursos computacionais em modelos de linguagem grandes.