cs.LG artigos | Gist.Science

Ditto: Motion-Space Diffusion for Controllable Realtime Talking Head Synthesis

O artigo apresenta o Ditto, um framework de síntese de cabeças falantes baseado em difusão que, ao gerar representações em um espaço de movimento específico e otimizar sua arquitetura para processamento em streaming, permite a criação de vídeos realistas com controle fino e inferência em tempo real.

Tianqi Li, Ruobing Zheng, Minghui Yang + 2 more2026-03-09⚡ eess

L0-Regularized Quadratic Surface Support Vector Machines

Este artigo propõe variantes esparsas de Máquinas de Vetores de Suporte com Superfície Quadrática (QSVM) que utilizam uma restrição de cardinalidade ( $\ell_0$ ) para mitigar o sobreajuste e melhorar a interpretabilidade, desenvolvendo um algoritmo de decomposição de penalidade eficiente com garantias de convergência e demonstrando eficácia em benchmarks públicos e aplicações de crédito.

Ahmad Mousavi, Ramin Zandvakili, Zheming Gao2026-03-09🤖 cs.LG

Transforming Science with Large Language Models: A Survey on AI-assisted Scientific Discovery, Experimentation, Content Generation, and Evaluation

Esta pesquisa oferece uma visão geral estruturada sobre como os modelos de linguagem multimodais estão transformando o ciclo de vida científico, abrangendo desde a descoberta e experimentação até a geração de conteúdo e avaliação, ao mesmo tempo que discute técnicas, tendências, desafios éticos e o potencial de integração em futuros sistemas de "IA para Ciência".

Steffen Eger, Yong Cao, Jennifer D'Souza, Andreas Geiger, Christian Greisinger, Stephanie Gross, Yufang Hou, Brigitte Krenn, Anne Lauscher, Yizhi Li, Chenghua Lin, Nafise Sadat Moosavi, Wei Zhao, Tristan Miller2026-03-09🤖 cs.AI

FragFM: Hierarchical Framework for Efficient Molecule Generation via Fragment-Level Discrete Flow Matching

O artigo apresenta o FragFM, uma nova estrutura hierárquica baseada em correspondência de fluxo discreto em nível de fragmentos que permite a geração eficiente e escalável de moléculas com melhor controle de propriedades, além de propor o benchmark NPGen para avaliar a capacidade de modelos generativos de criar moléculas semelhantes a produtos naturais.

Joongwon Lee, Seonghwan Kim, Seokhyun Moon, Hyunwoo Kim, Woo Youn Kim2026-03-09🤖 cs.AI

Aligning Compound AI Systems via System-level DPO

O artigo apresenta o SysDPO, um framework que alinha sistemas de IA compostos com preferências humanas ao modelá-los como grafos acíclicos direcionados e estender a Otimização Direta de Preferências (DPO) para superar desafios como interações não diferenciáveis e a dificuldade de traduzir preferências de nível de sistema para componentes individuais.

Xiangwen Wang, Yibo Jacky Zhang, Zhoujie Ding, Katherine Tsai, Haolun Wu, Sanmi Koyejo2026-03-09🤖 cs.AI

Adversarial Robustness of Partitioned Quantum Classifiers

Este artigo investiga a robustez adversarial de classificadores quânticos particionados, demonstrando que perturbações direcionadas a técnicas de divisão de circuitos ou teletransporte equivalem à implementação de portas adversariais em camadas intermediárias, analisando esse fenômeno tanto teoricamente quanto experimentalmente.

Pouya Kananian, Hans-Arno Jacobsen2026-03-09⚛️ quant-ph

CAPS: Context-Aware Priority Sampling for Enhanced Imitation Learning in Autonomous Driving

Este artigo apresenta o CAPS, um método inovador que utiliza VQ-VAEs para criar representações estruturadas e reequilibrar conjuntos de dados desbalanceados em aprendizado por imitação, resultando em melhorias significativas no desempenho e na generalização de sistemas de direção autônoma no simulador CARLA.

Hamidreza Mirkhani, Behzad Khamidehi, Ehsan Ahmadi, Mohammed Elmahgiubi, Weize Zhang, Fazel Arasteh, Umar Rajguru, Kasra Rezaee, Dongfeng Bai2026-03-09🤖 cs.LG

From Tokenizer Bias to Backbone Capability: A Controlled Study of LLMs for Time Series Forecasting

Este estudo controlado demonstra que, embora modelos de linguagem pré-treinados (LLMs) apresentem potencial para previsão de séries temporais, sua eficácia real é frequentemente mascarada por viés de pequenos conjuntos de dados e, em avaliações rigorosas, eles não superam consistentemente modelos especializados treinados em grandes volumes de dados temporais.

Xinyu Zhang, Shanshan Feng, Xutao Li, Kenghong Lin, Fan Li, Pengfei Jia2026-03-09🤖 cs.AI

The Malicious Technical Ecosystem: Exposing Limitations in Technical Governance of AI-Generated Non-Consensual Intimate Images of Adults

Este artigo adota uma abordagem centrada nas sobreviventes para expor como o atual ecossistema técnico malicioso, composto por modelos de código aberto e softwares de "nudificação", e as falhas nas práticas de governança de IA, como as refletidas no relatório NIST AI 100-4, falham em prevenir eficazmente a criação de imagens íntimas não consensuais geradas por IA de adultos.

Michelle L. Ding, Harini Suresh2026-03-09🤖 cs.AI

Federated Learning: A Survey on Privacy-Preserving Collaborative Intelligence

Este artigo de revisão oferece uma visão abrangente sobre o Aprendizado Federado, abordando sua arquitetura, desafios técnicos como dados não-IID e heterogeneidade, mecanismos de privacidade, tendências emergentes e aplicações práticas para orientar o desenvolvimento de sistemas colaborativos escaláveis e seguros.

Ratun Rahman2026-03-09🤖 cs.AI

FourierSpecNet: Neural Collision Operator Approximation Inspired by the Fourier Spectral Method for Solving the Boltzmann Equation

Este artigo apresenta o FourierSpecNet, uma arquitetura híbrida que integra o método espectral de Fourier com aprendizado profundo para aproximar com eficiência o operador de colisão da equação de Boltzmann, oferecendo precisão competitiva, redução significativa de custo computacional e capacidade de super-resolução zero-shot para cenários elásticos e inelásticos.

Jae Yong Lee, Gwang Jae Jung, Byung Chan Lim, Hyung Ju Hwang2026-03-09🤖 cs.AI

Scalable Multi-Task Learning for Particle Collision Event Reconstruction with Heterogeneous Graph Neural Networks

Este artigo propõe uma nova arquitetura de Rede Neural em Grafos Heterogêneos que, ao integrar aprendizado multi-tarefa e camadas de poda de grafos, melhora significativamente a reconstrução de hádrons de beleza e a associação de vértices em colisões de partículas do LHC, superando desafios de escalabilidade e latência.

William Sutcliffe, Marta Calvi, Simone Capelli + 5 more2026-03-09⚛️ hep-ex

RM-R1: Reward Modeling as Reasoning

O artigo apresenta o RM-R1, uma nova classe de Modelos de Recompensa de Raciocínio (ReasRMs) que integra cadeias de raciocínio e o mecanismo de "cadeia de rubricas" para melhorar a interpretabilidade e o desempenho na modelagem de recompensas, superando modelos proprietários e de grande porte em benchmarks padrão.

Xiusi Chen, Gaotang Li, Ziqi Wang, Bowen Jin, Cheng Qian, Yu Wang, Hongru Wang, Yu Zhang, Denghui Zhang, Tong Zhang, Hanghang Tong, Heng Ji2026-03-09🤖 cs.AI

Entropic Mirror Descent for Linear Systems: Polyak's Stepsize and Implicit Bias

Este artigo apresenta uma variante do passo de Polyak para o método de descida do espelho entrópico na resolução de sistemas lineares, superando desafios de convergência devido à natureza ilimitada do domínio, aprimorando os limites de viés implícito e estabelecendo garantias de convergência para funções convexas suaves.

Yura Malitsky, Alexander Posch2026-03-09🤖 cs.LG

Maximizing Asynchronicity in Event-based Neural Networks

Este artigo apresenta o EVA, um novo framework de aprendizado de características assíncronas inspirado em modelos de linguagem que supera métodos anteriores em tarefas de reconhecimento e detecção, permitindo o processamento eficiente e expressivo de dados de câmeras de eventos.

Haiqing Hao, Nikola Zubic, Weihua He, Zhipeng Sui, Davide Scaramuzza, Wenhui Wang2026-03-09🤖 cs.AI

ESGenius: Benchmarking LLMs on Environmental, Social, and Governance (ESG) and Sustainability Knowledge

O artigo apresenta o ESGenius, o primeiro benchmark abrangente para avaliar o conhecimento de modelos de linguagem em ESG e sustentabilidade, demonstrando que, embora os modelos de ponta apresentem desempenho moderado em cenários zero-shot, a integração de métodos de Geração Aumentada por Recuperação (RAG) com um corpus de fontes autoritativas eleva significativamente a precisão, especialmente em modelos menores.

Chaoyue He, Xin Zhou, Yi Wu + 9 more2026-03-09💬 cs.CL

ContextBench: Modifying Contexts for Targeted Latent Activation

O artigo apresenta o ContextBench, um benchmark que avalia métodos de modificação de contexto para ativar características latentes específicas em modelos de linguagem, demonstrando que variantes aprimoradas do EPO alcançam o estado da arte ao equilibrar eficazmente a força de elicitação e a fluência linguística.

Robert Graham, Edward Stevinson, Leo Richter, Alexander Chia, Joseph Miller, Joseph Isaac Bloom2026-03-09🤖 cs.AI

Sysformer: Safeguarding Frozen Large Language Models with Adaptive System Prompts

O artigo apresenta o Sysformer, uma abordagem inovadora que utiliza um modelo transformador para adaptar dinamicamente os prompts de sistema de grandes modelos de linguagem (LLMs) congelados, melhorando significativamente sua robustez contra ataques de jailbreak e garantindo respostas seguras sem a necessidade de custosos ajustes nos parâmetros do modelo.

Kartik Sharma, Yiqiao Jin, Vineeth Rakesh, Yingtong Dou, Menghai Pan, Mahashweta Das, Srijan Kumar2026-03-09🤖 cs.AI

SPoT: Subpixel Placement of Tokens in Vision Transformers

O artigo propõe o SPoT, uma estratégia inovadora de tokenização que posiciona tokens continuamente dentro das imagens, superando as limitações das grades discretas e permitindo que os Vision Transformers explorem regimes de esparsidade para obter ganhos significativos de desempenho e eficiência.

Martine Hjelkrem-Tan, Marius Aasan, Gabriel Y. Arteaga, Adín Ramírez Rivera2026-03-09🤖 cs.LG

Quantifying Cross-Attention Interaction in Transformers for Interpreting TCR-pMHC Binding

Este artigo apresenta o QCAI, um novo método pós-hoc para interpretar mecanismos de atenção cruzada em transformadores, que alcança desempenho superior em precisão e interpretabilidade na previsão de ligações TCR-pMHC ao ser validado pelo novo benchmark TCR-XAI.

Jiarui Li, Zixiang Yin, Haley Smith, Zhengming Ding, Samuel J. Landry, Ramgopal R. Mettu2026-03-09🤖 cs.LG

← Anterior Próximo →