cs.LG artigos | Gist.Science

HURRI-GAN: A Novel Approach for Hurricane Bias-Correction Beyond Gauge Stations using Generative Adversarial Networks

O artigo apresenta o HURRI-GAN, uma abordagem inovadora baseada em Redes Adversariais Generativas (GANs) que corrige vieses sistemáticos do modelo de simulação física ADCIRC para prever com precisão impactos de furacões em regiões costeiras além das estações de medição, permitindo previsões mais rápidas e eficientes sem perda de acurácia.

Noujoud Nadera, Hadi Majed, Stefanos Giaremis, Rola El Osta, Clint Dawson, Carola Kaiser, Hartmut Kaiser2026-03-10🤖 cs.LG

Geodesic Gradient Descent: A Generic and Learning-rate-free Optimizer on Objective Function-induced Manifolds

O artigo propõe o Descenso de Gradiente Geodésico (GGD), um otimizador genérico e sem taxa de aprendizado que utiliza esferas n-dimensionais para aproximar a geometria local da função objetivo, garantindo que as trajetórias de atualização permaneçam na hipersuperfície e demonstrando reduções significativas no erro em comparação ao algoritmo Adam em conjuntos de dados como Burgers' e MNIST.

Liwei Hu, Guangyao Li, Wenyong Wang, Xiaoming Zhang, Yu Xiang2026-03-10🤖 cs.LG

How the Graph Construction Technique Shapes Performance in IoT Botnet Detection

Este estudo avalia como diferentes técnicas de construção de grafos impactam a detecção de botnets IoT usando Redes Neurais de Atenção em Grafos (GAT) e Autoencoders Variacionais (VAE) no conjunto de dados N-BaIoT, demonstrando que a abordagem baseada em Grafos de Gabriel atinge a melhor precisão de 97,56%, superando significativamente outros métodos como o Vizinho Mais Próximo Compartilhado.

Hassan Wasswa, Hussein Abbass, Timothy Lynar2026-03-10🤖 cs.LG

Approximate Nearest Neighbor Search for Modern AI: A Projection-Augmented Graph Approach

Este artigo apresenta o PAG (Projection-Augmented Graph), um novo framework de busca aproximada de vizinhos mais próximos que integra técnicas de projeção a índices gráficos para atender a seis demandas críticas de aplicações de IA moderna, oferecendo desempenho de consulta significativamente superior ao HNSW, indexação rápida, baixo uso de memória e robustez em alta dimensionalidade.

Kejing Lu, Zhenpeng Pan, Jianbin Qin, Yoshiharu Ishikawa, Chuan Xiao2026-03-10🤖 cs.LG

EnsAug: Augmentation-Driven Ensembles for Human Motion Sequence Analysis

O artigo apresenta o EnsAug, uma nova abordagem que supera os métodos tradicionais de aumento de dados ao treinar um conjunto de modelos especialistas, cada um focado em uma transformação geométrica distinta, resultando em maior precisão e eficiência na análise de sequências de movimento humano.

Bikram De, Habib Irani, Vangelis Metsis2026-03-10🤖 cs.LG

HyperTokens: Controlling Token Dynamics for Continual Video-Language Understanding

O artigo apresenta o HyperTokens, um gerador de tokens baseado em transformadores que controla dinamicamente a atualização de prompts em modelos de linguagem multimodal para compreensão contínua de vídeo, utilizando regularizadores inspirados em meta-aprendizado e supervisão auxiliar multimodal para reduzir o esquecimento e melhorar a retenção de tarefas.

Toan Nguyen, Yang Liu, Celso De Melo, Flora D. Salim2026-03-10🤖 cs.LG

ERP-RiskBench: Leakage-Safe Ensemble Learning for Financial Risk

Este artigo apresenta o ERP-RiskBench, um novo framework experimental e reprodutível para detecção de riscos financeiros em sistemas ERP, que utiliza um ensemble de aprendizado de máquina com protocolos rigorosos de prevenção de vazamento de dados para superar as limitações de estudos anteriores e fornecer um modelo robusto e interpretável para auditoria e governança.

Sanjay Mishra2026-03-10🤖 cs.LG

Unmixing microinfrared spectroscopic images of cross-sections of historical oil paintings

Este artigo propõe um autoencoder CNN não supervisionado com uma função de perda de distância angular espectral ponderada (WSAD) para realizar a separação cega de imagens hiperespectrais de micro-FTIR em seções transversais de pinturas a óleo históricas, permitindo uma análise automatizada e mais interpretável dos materiais constituintes, como demonstrado no caso do Políptico de São Bavo.

Shivam Pande, Nicolas Nadisic, Francisco Mederos-Henry, Aleksandra Pizurica2026-03-10🤖 cs.LG

GNN For Muon Particle Momentum estimation

Este artigo demonstra que o uso de Redes Neurais em Grafos (GNNs) para estimar o momento de múons no experimento CMS supera modelos tradicionais como o TabNet, destacando a importância da dimensão das características dos nós para a eficiência do modelo.

Vishak K Bhat, Eric A. F. Reinhardt, Sergei Gleyzer2026-03-10🤖 cs.LG

XAI and Few-shot-based Hybrid Classification Model for Plant Leaf Disease Prognosis

Este trabalho apresenta um modelo híbrido de classificação baseado em aprendizado de poucos exemplos e inteligência artificial explicável (XAI) que integra redes Siamesas e Prototípicas com Grad-CAM para diagnosticar com alta precisão e transparência doenças em folhas de milho, arroz e trigo, mesmo com dados anotados limitados.

Diana Susan Joseph, Pranav M Pawar, Raja Muthalagu, Mithun Mukharjee2026-03-10🤖 cs.LG

Chart Deep Research in LVLMs via Parallel Relative Policy Optimization

O artigo propõe o PRPO, um método de otimização de política relativa paralela para resolver conflitos de treinamento em LVLMs voltados a gráficos, e o MCDR-Bench, um novo benchmark para avaliação objetiva de capacidades de pesquisa profunda, estabelecendo assim um quadro unificado para avançar a inteligência de dados em visualizações.

Jiajin Tang, Gaoyang, Wenjie Wang, Sibei Yang, Xing Chen2026-03-10🤖 cs.LG

One step further with Monte-Carlo sampler to guide diffusion better

Este artigo propõe uma estratégia plug-and-play que combina um passo de remoção de ruído reverso adicional com amostragem Monte Carlo para reduzir erros de estimativa e melhorar a qualidade da geração guiada em modelos de difusão baseados em equações diferenciais estocásticas, demonstrando eficácia em diversas tarefas como geração de trajetórias, resolução de problemas inversos de imagem e design molecular.

Minsi Ren, Wenhao Deng, Ruiqi Feng, Tailin Wu2026-03-10🤖 cs.LG

High-Resolution Image Reconstruction with Unsupervised Learning and Noisy Data Applied to Ion-Beam Dynamics for Particle Accelerators

Este artigo apresenta um novo quadro de aprendizado não supervisionado, baseado em filtragem por convolução e redes neurais com estratégias de parada antecipada, que permite a reconstrução de alta fidelidade de imagens de feixes de partículas e a detecção de halos além de sete desvios padrão em condições de dados ruidosos e sem conjuntos de treinamento.

Francis Osswald (IPHC), Mohammed Chahbaoui (UNISTRA), Xinyi Liang (SU)2026-03-10🤖 cs.LG

Soft Equivariance Regularization for Invariant Self-Supervised Learning

O artigo propõe a Regularização de Equivariância Suave (SER), um método plug-in que desacopla a imposição de invariância e equivariância em diferentes camadas de redes de aprendizado auto-supervisionado, melhorando significativamente o desempenho em tarefas de classificação, robustez a perturbações e detecção de objetos sem a necessidade de cabeças auxiliares ou rótulos de transformação.

Joohyung Lee, Changhun Kim, Hyunsu Kim, Kwanhyung Lee, Juho Lee2026-03-10🤖 cs.LG

On the Generalization Capacities of MLLMs for Spatial Intelligence

O artigo propõe um framework de MLLM consciente da câmera que, ao integrar parâmetros intrínsecos, aplicar aumento de dados sintéticos e destilar prios geométricos, supera as abordagens baseadas apenas em RGB para alcançar uma generalização robusta em tarefas de inteligência espacial entre diferentes câmeras.

Gongjie Zhang, Wenhao Li, Quanhao Qian, Jiuniu Wang, Deli Zhao, Shijian Lu, Ran Xu2026-03-10🤖 cs.LG

Uncertainty-Aware Solar Flare Regression

Este estudo demonstra que a aplicação de regressão quantílica conformalizada a modelos de aprendizado profundo para previsão de erupções solares melhora significativamente a confiabilidade das previsões ao gerar intervalos de confiança com maior cobertura e comprimentos mais favoráveis.

Jinsu Hong, Chetraj Pandey, Berkay Aydin2026-03-10🔭 astro-ph

Scaling Agentic Capabilities, Not Context: Efficient Reinforcement Finetuning for Large Toolspaces

O artigo apresenta o ATLAS, um framework de ajuste fino por reforço que permite que modelos de linguagem pequenos operem eficazmente em grandes ecossistemas de ferramentas, tratando o controle de contexto e a estrutura de execução como decisões aprendíveis e utilizando um refinamento baseado em rubricas para superar limitações de contexto e recompensas esparsas.

Karan Gupta, Pranav Vajreshwari, Yash Pandya, Raghav Magazine, Akshay Nambi, Ahmed Awadallah2026-03-10🤖 cs.LG

From Statistical Fidelity to Clinical Consistency: Scalable Generation and Auditing of Synthetic Patient Trajectories

Este artigo apresenta um pipeline integrado que combina geração de alta fidelidade e auditoria automatizada com modelos de linguagem para produzir trajetórias de pacientes sintéticos clinicamente consistentes e seguros, superando as limitações de métodos anteriores e permitindo o treinamento eficaz de modelos downstream sem riscos de privacidade.

Guanglin Zhou, Armin Catic, Motahare Shabestari, Matthew Young, Chaiquan Li, Katrina Poppe, Sebastiano Barbieri2026-03-10🤖 cs.LG

ProtAlign: Contrastive learning paradigm for Sequence and structure alignment

O artigo apresenta o ProtAlign, um framework de aprendizado contrastivo que alinha sequências e estruturas de proteínas em um espaço de representação compartilhado, superando as limitações dos métodos tradicionais e melhorando tarefas como recuperação cruzada, anotação funcional e estimativa de estabilidade.

Aditya Ranganath, Hasin Us Sami, Kowshik Thopalli, Bhavya Kailkhura, Wesam Sakla2026-03-10🤖 cs.LG

Bi Directional Feedback Fusion for Activity Aware Forecasting of Indoor CO2 and PM2.5

Este artigo apresenta um framework de fusão com feedback bidirecional que integra dados ambientais e comportamentais para melhorar a previsão de CO2 e PM2.5 em ambientes internos, superando os modelos tradicionais ao capturar dinâmicas complexas e oferecer estimativas de incerteza interpretáveis.

Harshala Gammulle, Lidia Morawska, Sridha Sridharan, Clinton Fookes2026-03-10🤖 cs.LG

← Anterior Próximo →