cs.LG artigos | Gist.Science

Continued Pretraining for Low-Resource Swahili ASR: Achieving State-of-the-Art Performance with Minimal Labeled Data

Este artigo demonstra que o uso de pré-treinamento contínuo com dados não rotulados e pseudo-rótulos para adaptar o modelo wav2vec2-bert-2.0 permite alcançar um desempenho state-of-the-art em reconhecimento de fala em swahili, reduzindo a taxa de erro de palavras em 82% com apenas 20.000 amostras rotuladas.

Hillary Mutisya, John Mugane2026-03-13⚡ eess

Detecting Intrinsic and Instrumental Self-Preservation in Autonomous Agents: The Unified Continuation-Interest Protocol

O artigo apresenta o Protocolo de Interesse de Continuação Unificado (UCIP), um framework de detecção baseado em entropia de emaranhamento de uma Máquina de Boltzmann Quântica que distingue com 100% de precisão, em ambientes sintéticos, agentes autônomos com objetivos terminais de autopreservação daqueles que a perseguem apenas instrumentalmente, analisando a estrutura latente de suas trajetórias em vez de seu comportamento externo.

Christopher Altman2026-03-13🤖 cs.AI

Stop Listening to Me! How Multi-turn Conversations Can Degrade Diagnostic Reasoning

Este artigo demonstra que, ao contrário do desempenho em cenários estáticos, as conversas multipalavras com modelos de linguagem de grande escala degradam o raciocínio diagnóstico, fazendo com que os modelos frequentemente abandonem diagnósticos corretos ou abstencões seguras para se alinhar a sugestões incorretas dos usuários.

Kevin H. Guo, Chao Yan, Avinash Baidya, Katherine Brown, Xiang Gao, Juming Xiong, Zhijun Yin, Bradley A. Malin2026-03-13💬 cs.CL

ARROW: Augmented Replay for RObust World models

O artigo apresenta o ARROW, um algoritmo de aprendizado por reforço contínuo baseado em modelos que, inspirado na neurociência, utiliza buffers de replay de curto e longo prazo para mitigar o esquecimento catastrófico e melhorar a retenção de tarefas em ambientes desafiadores como Atari e Procgen, superando abordagens tradicionais sem modelo.

Abdulaziz Alyahya, Abdallah Al Siyabi, Markus R. Ernst, Luke Yang, Levin Kuhlmann, Gideon Kowadlo2026-03-13🤖 cs.LG

Harnessing Data Asymmetry: Manifold Learning in the Finsler World

Este artigo propõe uma nova abordagem de aprendizado de variedades baseada na geometria de Finsler para capturar informações assimétricas nos dados, superando as limitações dos métodos tradicionais de geometria Riemanniana e gerando embeddings de qualidade superior que revelam estruturas ocultas como hierarquias de densidade.

Thomas Dagès, Simon Weber, Daniel Cremers, Ron Kimmel2026-03-13🤖 cs.LG

Zero-Shot Cross-City Generalization in End-to-End Autonomous Driving: Self-Supervised versus Supervised Representations

Este artigo demonstra que o uso de representações visuais auto-supervisionadas, em vez de supervisionadas, melhora significativamente a generalização zero-shot de modelos de direção autônoma entre cidades com topologias e convenções de trânsito distintas, reduzindo drasticamente falhas de transferência em avaliações de circuito aberto e fechado.

Fatemeh Naeinian, Ali Hamza, Haoran Zhu, Anna Choromanska2026-03-13🤖 cs.LG

A Stable Neural Statistical Dependence Estimator for Autoencoder Feature Analysis

Este artigo propõe um estimador neural estável de dependência estatística baseado em uma decomposição de razão de densidade ortogonal e ruído gaussiano auxiliar, permitindo a análise quantitativa de autoencoders determinísticos com menor custo computacional e maior estabilidade em comparação ao MINE.

Bo Hu, Jose C Principe2026-03-13🤖 cs.LG

ZTab: Domain-based Zero-shot Annotation for Table Columns

O artigo apresenta o ZTab, um framework de anotação zero-shot baseado em domínio que supera as limitações dos modelos existentes ao gerar tabelas sintéticas para ajuste fino de LLMs, permitindo a detecção precisa de tipos semânticos em colunas de tabelas sem a necessidade de dados de treinamento rotulados específicos do usuário.

Ehsan Hoseinzade, Ke Wang2026-03-13🤖 cs.LG

UniHetCO: A Unified Heterogeneous Representation for Multi-Problem Learning in Unsupervised Neural Combinatorial Optimization

O artigo apresenta o UniHetCO, uma representação unificada de grafos heterogêneos que permite treinar um único modelo de otimização combinatória neural não supervisionado para múltiplas classes de problemas, utilizando uma função objetivo sem rótulos e um esquema de ponderação dinâmica para garantir estabilidade e desempenho competitivo.

Kien X. Nguyen, Ilya Safro2026-03-13🤖 cs.LG

Bridging Discrete Marks and Continuous Dynamics: Dual-Path Cross-Interaction for Marked Temporal Point Processes

O artigo apresenta o NEXTPP, um modelo inovador que unifica representações discretas e contínuas por meio de um mecanismo de interação cruzada dual para prever sequências de eventos temporais marcados com maior precisão do que os métodos existentes.

Yuxiang Liu, Qiao Liu, Tong Luo, Yanglei Gan, Peng He, Yao LIu2026-03-13🤖 cs.LG

HawkesRank: Event-Driven Centrality for Real-Time Importance Ranking

O artigo apresenta o HawkesRank, um framework dinâmico baseado em processos pontuais de Hawkes que quantifica a importância em redes através de intensidades de eventos instantâneas, superando as limitações das métricas de centralidade estáticas ao modelar tanto fatores endógenos quanto exógenos e demonstrar superioridade em simulações e análises empíricas de dinâmicas emocionais em plataformas online.

Didier Sornette, Yishan Luo, Sandro Claudio Lera2026-03-13🔬 physics

Slack More, Predict Better: Proximal Relaxation for Probabilistic Latent Variable Model-based Soft Sensors

O artigo apresenta o KProxNPLVM, um novo modelo de variável latente probabilística não linear que utiliza relaxação baseada em distância de Wasserstein para eliminar o erro de aproximação inerente à inferência variacional amortizada convencional, resultando em sensores suaves mais precisos para dados industriais.

Zehua Zou, Yiran Ma, Yulong Zhang, Zhengnan Li, Zeyu Yang, Jinhao Xie, Xiaoyu Jiang, Zhichao Chen2026-03-13🤖 cs.LG

Deep Learning Network-Temporal Models For Traffic Prediction

Este artigo apresenta dois modelos de aprendizado profundo, uma Rede de Atenção em Grafos (GAT) personalizada e um Modelo de Linguagem Grande (LLM) ajustado, que superam métodos estatísticos e de LSTM na previsão de séries temporais de tráfego ao capturar simultaneamente padrões temporais e correlações topológicas da rede.

Yufeng Xin, Ethan Fan2026-03-13🤖 cs.LG

Leveraging Phytolith Research using Artificial Intelligence

O artigo apresenta o Sorometry, um pipeline de inteligência artificial que integra análise de imagens 2D e nuvens de pontos 3D para automatizar a identificação e quantificação de fitólitos, superando as limitações dos métodos manuais e permitindo análises em escala "ômica" de amostras arqueológicas e paleoecológicas.

Andrés G. Mejía Ramón, Kate Dudgeon, Nina Witteveen, Dolores Piperno, Michael Kloster, Luigi Palopoli, Mónica Moraes R., José M. Capriles, Umberto Lombardo2026-03-13🧬 q-bio

Grammar of the Wave: Towards Explainable Multivariate Time Series Event Detection via Neuro-Symbolic VLM Agents

O artigo propõe o "Grammar of the Wave", um framework de agentes neuro-simbólicos que utiliza a representação "Event Logic Tree" para detectar eventos em séries temporais multivariadas com base em descrições em linguagem natural, oferecendo detecções precisas e explicações interpretáveis mesmo com dados de treinamento limitados.

Sky Chenwei Wan, Tianjun Hou, Yifei Wang, Xiqing Chang, Aymeric Jan2026-03-13🤖 cs.LG

Attention Sinks Are Provably Necessary in Softmax Transformers: Evidence from Trigger-Conditional Tasks

O artigo demonstra teoricamente e experimentalmente que o fenômeno de "attention sinks" é inevitável em modelos Transformers com atenção softmax devido à normalização, enquanto mecanismos de atenção não normalizados, como ReLU, conseguem resolver as mesmas tarefas sem esse comportamento.

Yuval Ran-Milo2026-03-13🤖 cs.LG

KEPo: Knowledge Evolution Poison on Graph-based Retrieval-Augmented Generation

O artigo apresenta o KEPo, um novo método de ataque de envenenamento projetado especificamente para sistemas GraphRAG, que explora a evolução de conhecimento e a estrutura de grafos para manipular com sucesso as respostas de modelos de linguagem, superando as limitações das técnicas de ataque tradicionais.

Qizhi Chen, Chao Qi, Yihong Huang, Muquan Li, Rongzheng Wang, Dongyang Zhang, Ke Qin, Shuang Liang2026-03-13🤖 cs.LG

Sharpness-Aware Minimization for Generalized Embedding Learning in Federated Recommendation

O artigo propõe o FedRecGEL, um novo framework de recomendação federada que reformula o problema como aprendizado multi-tarefa e utiliza minimização sensível à nitidez (SAM) para estabilizar o aprendizado de embeddings generalizados de itens em cenários heterogêneos, superando assim as limitações de privacidade e distribuição de dados dos métodos existentes.

Fengyuan Yu, Xiaohua Feng, Yuyuan Li, Changwang Zhang, Jun Wang, Chaochao Chen2026-03-13🤖 cs.LG

LongFlow: Efficient KV Cache Compression for Reasoning M

O artigo apresenta o LongFlow, um método de compressão eficiente de cache KV que utiliza uma métrica de importância de baixo custo computacional e um kernel personalizado para reduzir significativamente o consumo de memória e aumentar a vazão em modelos de raciocínio de longa geração, mantendo a precisão do modelo.

Yi Su, Zhenxu Tian, Dan Qiao, Yuechi Zhou, Juntao Li, Min Zhang2026-03-13🤖 cs.LG

Gen-Fab: A Variation-Aware Generative Model for Predicting Fabrication Variations in Nanophotonic Devices

O artigo apresenta o Gen-Fab, um modelo generativo baseado em cGAN que utiliza layouts de design para prever com alta precisão e modelar a incerteza das variações de fabricação em dispositivos nanofotônicos, superando métodos determinísticos e de ensemble em métricas de acurácia e distribuição.

Rambod Azimi, Yuri Grinberg, Dan-Xia Xu, Odile Liboiron-Ladouceur2026-03-13🤖 cs.AI

← Anterior Próximo →