HURRI-GAN: A Novel Approach for Hurricane Bias-Correction Beyond Gauge Stations using Generative Adversarial Networks

O artigo apresenta o HURRI-GAN, uma abordagem inovadora baseada em Redes Adversariais Generativas (GANs) que corrige vieses sistemáticos do modelo de simulação física ADCIRC para prever com precisão impactos de furacões em regiões costeiras além das estações de medição, permitindo previsões mais rápidas e eficientes sem perda de acurácia.

Noujoud Nadera, Hadi Majed, Stefanos Giaremis, Rola El Osta, Clint Dawson, Carola Kaiser, Hartmut Kaiser2026-03-10🤖 cs.LG

Geodesic Gradient Descent: A Generic and Learning-rate-free Optimizer on Objective Function-induced Manifolds

O artigo propõe o Descenso de Gradiente Geodésico (GGD), um otimizador genérico e sem taxa de aprendizado que utiliza esferas n-dimensionais para aproximar a geometria local da função objetivo, garantindo que as trajetórias de atualização permaneçam na hipersuperfície e demonstrando reduções significativas no erro em comparação ao algoritmo Adam em conjuntos de dados como Burgers' e MNIST.

Liwei Hu, Guangyao Li, Wenyong Wang, Xiaoming Zhang, Yu Xiang2026-03-10🤖 cs.LG

How the Graph Construction Technique Shapes Performance in IoT Botnet Detection

Este estudo avalia como diferentes técnicas de construção de grafos impactam a detecção de botnets IoT usando Redes Neurais de Atenção em Grafos (GAT) e Autoencoders Variacionais (VAE) no conjunto de dados N-BaIoT, demonstrando que a abordagem baseada em Grafos de Gabriel atinge a melhor precisão de 97,56%, superando significativamente outros métodos como o Vizinho Mais Próximo Compartilhado.

Hassan Wasswa, Hussein Abbass, Timothy Lynar2026-03-10🤖 cs.LG

Approximate Nearest Neighbor Search for Modern AI: A Projection-Augmented Graph Approach

Este artigo apresenta o PAG (Projection-Augmented Graph), um novo framework de busca aproximada de vizinhos mais próximos que integra técnicas de projeção a índices gráficos para atender a seis demandas críticas de aplicações de IA moderna, oferecendo desempenho de consulta significativamente superior ao HNSW, indexação rápida, baixo uso de memória e robustez em alta dimensionalidade.

Kejing Lu, Zhenpeng Pan, Jianbin Qin, Yoshiharu Ishikawa, Chuan Xiao2026-03-10🤖 cs.LG

HyperTokens: Controlling Token Dynamics for Continual Video-Language Understanding

O artigo apresenta o HyperTokens, um gerador de tokens baseado em transformadores que controla dinamicamente a atualização de prompts em modelos de linguagem multimodal para compreensão contínua de vídeo, utilizando regularizadores inspirados em meta-aprendizado e supervisão auxiliar multimodal para reduzir o esquecimento e melhorar a retenção de tarefas.

Toan Nguyen, Yang Liu, Celso De Melo, Flora D. Salim2026-03-10🤖 cs.LG

Unmixing microinfrared spectroscopic images of cross-sections of historical oil paintings

Este artigo propõe um autoencoder CNN não supervisionado com uma função de perda de distância angular espectral ponderada (WSAD) para realizar a separação cega de imagens hiperespectrais de micro-FTIR em seções transversais de pinturas a óleo históricas, permitindo uma análise automatizada e mais interpretável dos materiais constituintes, como demonstrado no caso do Políptico de São Bavo.

Shivam Pande, Nicolas Nadisic, Francisco Mederos-Henry, Aleksandra Pizurica2026-03-10🤖 cs.LG

XAI and Few-shot-based Hybrid Classification Model for Plant Leaf Disease Prognosis

Este trabalho apresenta um modelo híbrido de classificação baseado em aprendizado de poucos exemplos e inteligência artificial explicável (XAI) que integra redes Siamesas e Prototípicas com Grad-CAM para diagnosticar com alta precisão e transparência doenças em folhas de milho, arroz e trigo, mesmo com dados anotados limitados.

Diana Susan Joseph, Pranav M Pawar, Raja Muthalagu, Mithun Mukharjee2026-03-10🤖 cs.LG

One step further with Monte-Carlo sampler to guide diffusion better

Este artigo propõe uma estratégia plug-and-play que combina um passo de remoção de ruído reverso adicional com amostragem Monte Carlo para reduzir erros de estimativa e melhorar a qualidade da geração guiada em modelos de difusão baseados em equações diferenciais estocásticas, demonstrando eficácia em diversas tarefas como geração de trajetórias, resolução de problemas inversos de imagem e design molecular.

Minsi Ren, Wenhao Deng, Ruiqi Feng, Tailin Wu2026-03-10🤖 cs.LG

High-Resolution Image Reconstruction with Unsupervised Learning and Noisy Data Applied to Ion-Beam Dynamics for Particle Accelerators

Este artigo apresenta um novo quadro de aprendizado não supervisionado, baseado em filtragem por convolução e redes neurais com estratégias de parada antecipada, que permite a reconstrução de alta fidelidade de imagens de feixes de partículas e a detecção de halos além de sete desvios padrão em condições de dados ruidosos e sem conjuntos de treinamento.

Francis Osswald (IPHC), Mohammed Chahbaoui (UNISTRA), Xinyi Liang (SU)2026-03-10🤖 cs.LG

Soft Equivariance Regularization for Invariant Self-Supervised Learning

O artigo propõe a Regularização de Equivariância Suave (SER), um método plug-in que desacopla a imposição de invariância e equivariância em diferentes camadas de redes de aprendizado auto-supervisionado, melhorando significativamente o desempenho em tarefas de classificação, robustez a perturbações e detecção de objetos sem a necessidade de cabeças auxiliares ou rótulos de transformação.

Joohyung Lee, Changhun Kim, Hyunsu Kim, Kwanhyung Lee, Juho Lee2026-03-10🤖 cs.LG

Scaling Agentic Capabilities, Not Context: Efficient Reinforcement Finetuning for Large Toolspaces

O artigo apresenta o ATLAS, um framework de ajuste fino por reforço que permite que modelos de linguagem pequenos operem eficazmente em grandes ecossistemas de ferramentas, tratando o controle de contexto e a estrutura de execução como decisões aprendíveis e utilizando um refinamento baseado em rubricas para superar limitações de contexto e recompensas esparsas.

Karan Gupta, Pranav Vajreshwari, Yash Pandya, Raghav Magazine, Akshay Nambi, Ahmed Awadallah2026-03-10🤖 cs.LG

From Statistical Fidelity to Clinical Consistency: Scalable Generation and Auditing of Synthetic Patient Trajectories

Este artigo apresenta um pipeline integrado que combina geração de alta fidelidade e auditoria automatizada com modelos de linguagem para produzir trajetórias de pacientes sintéticos clinicamente consistentes e seguros, superando as limitações de métodos anteriores e permitindo o treinamento eficaz de modelos downstream sem riscos de privacidade.

Guanglin Zhou, Armin Catic, Motahare Shabestari, Matthew Young, Chaiquan Li, Katrina Poppe, Sebastiano Barbieri2026-03-10🤖 cs.LG