cs.LG artigos | Gist.Science

Exploring Embedding Priors in Prompt-Tuning for Improved Interpretability and Control

Este artigo investiga o fenômeno de colapso de embeddings no Prompt-Tuning, demonstrando que priores de embedding influenciam significativamente a posição dos embeddings ajustados e que as trajetórias geradas formam clusters distintos para tarefas distantes, levantando questões sobre a importância de um único cluster de ativação para a generalização dos modelos de linguagem.

Sergey Sedov, Sumanth Bharadwaj Hachalli Karanam, Venu Gopal Kadamba2026-03-10🤖 cs.LG

From Pixels to Predicates: Learning Symbolic World Models via Pretrained Vision-Language Models

Este artigo propõe um método que utiliza modelos de visão e linguagem pré-treinados para aprender modelos de mundo simbólicos abstratos a partir de demonstrações curtas, permitindo que robôs generalizem para zero-shot e resolvam problemas de tomada de decisão de longo horizonte em cenários complexos e variados através de planejamento.

Ashay Athalye, Nishanth Kumar, Tom Silver, Yichao Liang, Jiuguang Wang, Tomás Lozano-Pérez, Leslie Pack Kaelbling2026-03-10🤖 cs.LG

UFGraphFR: Graph Federation Recommendation System based on User Text description features

Este artigo apresenta o UFGraphFR, um sistema de recomendação federado que supera as limitações da fragmentação de dados ao reconstruir grafos de relacionamento de usuários de forma segura no servidor, utilizando vetores semânticos derivados de descrições de texto para capturar similaridades de preferência e melhorar a precisão das recomendações sem comprometer a privacidade.

Xudong Wang, Qingbo Hao, Yingyuan Xiao2026-03-10🤖 cs.LG

Efficient Semi-Supervised Adversarial Training via Latent Clustering-Based Data Reduction

Este artigo propõe estratégias de redução de dados baseadas em agrupamento no espaço latente para otimizar o treinamento adversário semi-supervisionado, permitindo alcançar robustez comparável com 5 a 10 vezes menos dados não rotulados e reduzir o tempo de execução em 3 a 4 vezes.

Somrita Ghosh, Yuelin Xu, Xiao Zhang2026-03-10🤖 cs.LG

The Exploration of Error Bounds in Classification with Noisy Labels

Este artigo estabelece limites teóricos para o risco excessivo em problemas de classificação com rótulos ruidosos no contexto de aprendizado profundo, decompondo-os em erros estatísticos e de aproximação e refinando-os sob a hipótese de variedades de baixa dimensão para mitigar a maldição da dimensionalidade.

Haixia Liu, Boxiao Li, Can Yang, Yang Wang2026-03-10🤖 cs.LG

Strengthening Generative Robot Policies through Predictive World Modeling

O artigo apresenta o GPC (Generative Predictive Control), um framework de aprendizado que combina clonagem de comportamento, modelagem preditiva do mundo e planejamento online para superar consistentemente a clonagem de comportamento em diversas tarefas de manipulação robótica, tanto em simulação quanto no mundo real.

Han Qi, Haocheng Yin, Aris Zhu, Yilun Du, Heng Yang2026-03-10🤖 cs.LG

General Coded Computing in a Probabilistic Straggler Regime

Este artigo analisa teoricamente e valida experimentalmente como os esquemas de computação codificada aproximada BACC e LeTCC superam o problema de servidores lentos (stragglers) em um regime probabilístico, demonstrando que o erro de aproximação converge para zero à medida que o número total de servidores aumenta, mesmo na presença de stragglers.

Parsa Moradi, Mohammad Ali Maddah-Ali2026-03-10🤖 cs.LG

GRADIEND: Feature Learning within Neural Networks Exemplified through Biases

O artigo apresenta o GRADIEND, um método inovador de codificação e decodificação que utiliza gradientes de modelos para identificar e reescrever pesos neurais, permitindo a remoção de vieses sociais (como gênero, raça e religião) em sistemas de IA sem comprometer suas outras capacidades.

Jonathan Drechsel, Steffen Herbold2026-03-10🤖 cs.LG

Security and Quality in LLM-Generated Code: A Multi-Language, Multi-Model Analysis

Este artigo analisa a segurança e a qualidade do código gerado por modelos de linguagem de grande escala (LLMs) em múltiplas linguagens, revelando que, embora a automação seja eficaz, os modelos frequentemente falham ao adotar recursos de segurança modernos e ainda empregam métodos desatualizados, especialmente em C++ e Java 17.

Mohammed Kharma, Soohyeon Choi, Mohammed AlKhanafseh, David Mohaisen2026-03-10🤖 cs.LG

An Efficient Local Search Approach for Polarized Community Discovery in Signed Networks

Este artigo propõe um novo algoritmo de busca local eficiente para a descoberta de comunidades polarizadas em redes assinadas, que resolve o problema de desequilíbrio de tamanho das comunidades, permite a existência de vértices neutros e garante uma taxa de convergência linear, superando os métodos atuais em qualidade da solução.

Linus Aronsson, Morteza Haghir Chehreghani2026-03-10🤖 cs.LG

Controllable Sequence Editing for Biological and Clinical Trajectories

O artigo apresenta o CLEF, um modelo que permite a edição controlada e direcionada de sequências longitudinais biológicas e clínicas, superando métodos existentes ao especificar com precisão o momento e o escopo das intervenções para gerar trajetórias contrafactuais realistas.

Michelle M. Li, Kevin Li, Yasha Ektefaie, Ying Jin, Yepeng Huang, Shvat Messica, Tianxi Cai, Marinka Zitnik2026-03-10🤖 cs.LG

Mitigating Unintended Memorization with LoRA in Federated Learning for LLMs

Este artigo demonstra que a adaptação de baixo rank (LoRA) reduz significativamente a memorização indesejada em modelos de linguagem grandes treinados por aprendizado federado, preservando o desempenho e podendo ser combinada com outras técnicas de privacidade para proteger dados sensíveis em domínios críticos.

Thierry Bossy, Julien Vignoud, Tahseen Rabbani, Juan R. Troncoso Pastoriza, Martin Jaggi2026-03-10🤖 cs.LG

Active Advantage-Aligned Online Reinforcement Learning with Offline Data

O artigo apresenta o A3RL, um método que integra aprendizado por reforço online e offline através de uma estratégia de amostragem ativa consciente da confiança para priorizar dados alinhados às necessidades da política, superando desafios como esquecimento catastrófico e ineficiência de amostragem.

Xuefeng Liu, Hung T. C. Le, Siyu Chen, Rick Stevens, Zhuoran Yang, Matthew R. Walter, Yuxin Chen2026-03-10🤖 cs.LG

Language in the Flow of Time: Time-Series-Paired Texts Weaved into a Unified Temporal Narrative

O artigo apresenta o framework "Texts as Time Series" (TaTS), que aproveita as propriedades periódicas de textos pareados com séries temporais para aprimorar a previsão e imputação multimodal em modelos existentes, sem a necessidade de alterar suas arquiteturas.

Zihao Li, Xiao Lin, Zhining Liu, Jiaru Zou, Ziwei Wu, Lecheng Zheng, Dongqi Fu, Yada Zhu, Hendrik Hamann, Hanghang Tong, Jingrui He2026-03-10🤖 cs.LG

LaVCa: LLM-assisted Visual Cortex Captioning

O artigo apresenta o LaVCa, uma abordagem baseada em modelos de linguagem grandes (LLMs) que gera legendas em linguagem natural para descrever com maior precisão e detalhe a seletividade de voxels no córtex visual humano, superando métodos anteriores e revelando diferenciações funcionais de alta granularidade.

Takuya Matsuyama, Shinji Nishimoto, Yu Takagi2026-03-10🤖 cs.LG

Unveiling Downstream Performance Scaling of LLMs: A Clustering-Based Perspective

Este artigo propõe o framework COD (Clustering-On-Difficulty), que agrupa tarefas por características de escalabilidade de dificuldade para prever com alta precisão o desempenho de modelos de linguagem grandes em benchmarks downstream, superando as limitações das metodologias atuais devido ao fenômeno de emergência e à variabilidade de métricas.

Chengyin Xu, Kaiyuan Chen, Xiao Li, Ke Shen, Chenggang Li2026-03-10🤖 cs.LG

Subclass Classification of Gliomas Using MRI Fusion Technique

Este estudo propõe um algoritmo que funde imagens de ressonância magnética multimodais (T1, T2, T1ce e FLAIR) segmentadas por redes U-Net em 2D e 3D e classificadas por um modelo ResNet50, alcançando uma precisão de 99,25% na subclasse de gliomas e superando técnicas existentes.

Kiranmayee Janardhan, Christy Bobby Thomas2026-03-10💻 cs

A Simple and Effective Reinforcement Learning Method for Text-to-Image Diffusion Fine-tuning

Este trabalho propõe o método LOOP (Leave-One-Out PPO), uma nova abordagem de aprendizado por reforço para o ajuste fino de modelos de difusão texto-para-imagem que combina técnicas de redução de variância do REINFORCE com a robustez e eficiência amostral do PPO, superando as limitações de ambos ao alcançar um melhor equilíbrio entre eficiência de amostragem e desempenho final.

Shashank Gupta, Chaitanya Ahuja, Tsung-Yu Lin + 4 more2026-03-10🤖 cs.AI

Go Beyond Your Means: Unlearning with Per-Sample Gradient Orthogonalization

O artigo propõe o OrthoGrad, um método inovador de desaprendizagem de máquina que projeta o gradiente dos dados a serem esquecidos no subespaço ortogonal aos gradientes de um pequeno conjunto de retenção, mitigando assim a interferência e preservando o desempenho do modelo mesmo quando o conjunto de treinamento completo não está disponível.

Aviv Shamsian, Eitan Shaar, Aviv Navon, Gal Chechik, Ethan Fetaya2026-03-10🤖 cs.LG

LLM-Powered Prediction of Hyperglycemia and Discovery of Behavioral Treatment Pathways from Wearables and Diet

Este estudo apresenta o GlucoLens, um sistema de aprendizado de máquina explicável que utiliza dados de wearables e registros de dieta para prever a hiperglicemia pós-prandial e sugerir caminhos comportamentais personalizados para sua prevenção.

Abdullah Mamun, Asiful Arefeen, Susan B. Racette + 4 more2026-03-10🤖 cs.AI

← Anterior Próximo →