cs.LG artigos | Gist.Science

DepthCharge: A Domain-Agnostic Framework for Measuring Depth-Dependent Knowledge in Large Language Models

O artigo apresenta o DepthCharge, um framework agnóstico a domínios que mede a profundidade do conhecimento de Grandes Modelos de Linguagem através de sondagem adaptativa e verificação de fatos, revelando variações de desempenho dependentes do domínio que benchmarks padrão não capturam.

Alexander Sheppert2026-03-26💬 cs.CL

Beyond Accuracy: Introducing a Symbolic-Mechanistic Approach to Interpretable Evaluation

Este artigo de posição propõe uma abordagem de avaliação interpretável baseada em regras simbólicas e interpretabilidade mecanicista para superar as limitações das métricas de precisão, demonstrando como essa metodologia consegue distinguir a generalização genuína da memorização em tarefas de NL-to-SQL, onde as métricas tradicionais falham.

Reza Habibi, Darian Lee, Magy Seif El-Nasr2026-03-26🤖 cs.LG

Did You Forget What I Asked? Prospective Memory Failures in Large Language Models

O artigo investiga como grandes modelos de linguagem sofrem falhas de memória prospectiva ao executar tarefas complexas, demonstrando que a conformidade com instruções de formatação diminui sob carga cognitiva, mas pode ser significativamente recuperada por meio de lembretes salientes, enquanto as restrições de formatação também podem prejudicar a precisão da tarefa principal.

Avni Mittal2026-03-26💬 cs.CL

MDKeyChunker: Single-Call LLM Enrichment with Rolling Keys and Key-Based Restructuring for High-Accuracy RAG

O MDKeyChunker é um pipeline de três etapas para documentos Markdown que realiza o fatiamento estrutural, a extração de metadados em uma única chamada LLM com propagação de chaves rolantes e a reestruturação de chunks por agrupamento semântico, resultando em alta precisão para sistemas RAG.

Bhavik Mangla2026-03-26💬 cs.CL

Not All Pretraining are Created Equal: Threshold Tuning and Class Weighting for Imbalanced Polarization Tasks in Low-Resource Settings

Abass Oguntade2026-03-26💬 cs.CL

PLDR-LLMs Reason At Self-Organized Criticality

O artigo demonstra que LLMs pré-treinados em criticidade auto-organizada (PLDR-LLMs) exibem raciocínio durante a inferência, caracterizado por uma transição de fase de segunda ordem onde a proximidade do parâmetro de ordem a zero indica maior capacidade de raciocínio, permitindo quantificar essa habilidade apenas através de estatísticas globais dos parâmetros do modelo sem necessidade de benchmarks externos.

Burc Gokden2026-03-26🌀 nlin

DeepOFW: Deep Learning-Driven OFDM-Flexible Waveform Modulation for Peak-to-Average Power Ratio Reduction

Este artigo apresenta o DeepOFW, um framework de modulação de forma de onda flexível baseado em aprendizado profundo que reduz o pico para potência média (PAPR) e melhora a taxa de erro de bits em sistemas OFDM, otimizando a geração de ondas de forma de dados offline para garantir eficiência de hardware e compatibilidade com transceptores convencionais.

Ran Greidi, Kobi Cohen2026-03-26🔢 math

PDGMM-VAE: A Variational Autoencoder with Adaptive Per-Dimension Gaussian Mixture Model Priors for Nonlinear ICA

O artigo apresenta o PDGMM-VAE, um modelo de autoencoder variacional que utiliza priores de mistura gaussiana adaptativos e independentes para cada dimensão latente, permitindo a recuperação eficaz de sinais fonte não lineares através da aprendizagem end-to-end de estatísticas não gaussianas diversas.

Yuan-Hao Wei, Yan-Jie Sun2026-03-26📊 stat

Implicit Turn-Wise Policy Optimization for Proactive User-LLM Interaction

O artigo apresenta a Otimização Implícita de Política por Turno (ITPO), um método que utiliza um modelo de recompensa de processo implícito para derivar recompensas granulares por turno a partir de sinais esparsos, melhorando significativamente a estabilidade e a convergência em interações colaborativas multi-turno entre humanos e LLMs em tarefas como tutoria, redação e recomendação médica.

Haoyu Wang, Yuxin Chen, Liang Luo, Buyun Zhang, Ellie Dingqiao Wen, Pan Li2026-03-26🤖 cs.LG

Upper Entropy for 2-Monotone Lower Probabilities

Este artigo apresenta uma análise exaustiva de complexidade e um algoritmo de solução fortemente polinomial para o cálculo da entropia superior em probabilidades inferiores 2-monótonas, oferecendo melhorias significativas em relação aos métodos anteriores.

Tuan-Anh Vu, Sébastien Destercke, Frédéric Pichon2026-03-26🤖 cs.LG

← Anterior Próximo →