cs.LG artigos | Gist.Science

Akkumula: Evidence accumulation driver models with Spiking Neural Networks

O artigo apresenta o Akkumula, um novo framework de modelagem para condutores que utiliza Redes Neurais de Spiking e técnicas de aprendizado profundo para simular realisticamente a acumulação de evidências e as ações de direção, superando as limitações dos métodos existentes em termos de adaptabilidade e eficiência computacional.

Alberto Morando2026-03-05🤖 cs.LG

Healthy LLMs? Benchmarking LLM Knowledge of UK Government Public Health Information

Este artigo apresenta o PubHealthBench, um novo benchmark com mais de 8000 perguntas derivadas de diretrizes do governo do Reino Unido para avaliar o conhecimento de modelos de linguagem em saúde pública, revelando que, embora os modelos proprietários mais recentes superem os humanos em testes de múltipla escolha, seu desempenho em respostas livres permanece abaixo do ideal, indicando a necessidade de salvaguardas adicionais.

Joshua Harris, Fan Grayson, Felix Feldman + 8 more2026-03-05🤖 cs.LG

Emotion-Gradient Metacognitive RSI (Part I): Theoretical Foundations and Single-Agent Architecture

Este artigo estabelece as fundações teóricas e a arquitetura de um único agente do framework EG-MRSI, que integra metacognição introspectiva, motivação intrínseca baseada em emoções e modificação recursiva segura para orientar o desenvolvimento de uma AGI aberta e segura.

Rintaro Ando2026-03-05🤖 cs.AI

Unsupervised Representation Learning - an Invariant Risk Minimization Perspective

Os autores propõem um novo framework de aprendizado de representação não supervisionado baseado em Minimização de Risco Invariante (IRM), introduzindo os métodos PICA e VIAE para aprender representações robustas e invariantes a mudanças de distribuição em dados não rotulados, validando sua eficácia em diversos conjuntos de dados sintéticos e reais.

Yotam Norman, Ron Meir2026-03-05✓ Author reviewed ⓘ🤖 cs.AI

TSPulse: Tiny Pre-Trained Models with Disentangled Representations for Rapid Time-Series Analysis

O artigo apresenta o TSPulse, uma família de modelos pré-treinados ultra-leves com representações disjuntas que, através de um novo framework de pré-treinamento e estratégias de fusão adaptativas, alcança desempenho superior em diversas tarefas de diagnóstico de séries temporais com eficiência computacional e capacidade zero-shot, superando modelos significativamente maiores.

Vijay Ekambaram, Subodh Kumar, Arindam Jati + 5 more2026-03-05🤖 cs.AI

Optimal Best-Arm Identification under Fixed Confidence with Multiple Optima

Este artigo estabelece um novo limite inferior de complexidade de amostragem e propõe uma regra de parada modificada para o algoritmo Track-and-Stop que atinge otimalidade assintótica na identificação da melhor braço em banditos estocásticos com múltiplos ótimos quando o número de braços ótimos é conhecido.

Lan V. Truong2026-03-05🤖 cs.LG

Extremely Simple Multimodal Outlier Synthesis for Out-of-Distribution Detection and Segmentation

Este artigo apresenta o "Feature Mixing", um método simples e rápido para síntese de outliers multimodais que alcança desempenho de última geração na detecção e segmentação de dados fora de distribuição, além de introduzir o novo conjunto de dados CARLA-OOD para essa finalidade.

Moru Liu, Hao Dong, Jessica Kelly + 2 more2026-03-05🤖 cs.AI

Convergence, Sticking and Escape: Stochastic Dynamics Near Critical Points in SGD

Este artigo analisa as propriedades de convergência e as dinâmicas de escape do Gradiente Estocástico (SGD) em paisagens unidimensionais, demonstrando como a variância do ruído e a geometria da função influenciam o tempo de permanência próximo a máximos locais e a probabilidade de transição para mínimos adjacentes.

Dmitry Dudukalov, Artem Logachov, Vladimir Lotov + 3 more2026-03-05🤖 cs.LG

BAH Dataset for Ambivalence/Hesitancy Recognition in Videos for Digital Behavioural Change

Este artigo apresenta o conjunto de dados BAH, um recurso multimodal com 1.427 vídeos de 300 participantes, destinado ao reconhecimento automático de ambivalência e hesitação em intervenções digitais de mudança comportamental, incluindo anotações de especialistas e resultados de benchmarks que destacam a necessidade de modelos avançados para essa tarefa.

Manuela González-González, Soufiane Belharbi, Muhammad Osama Zeeshan + 6 more2026-03-05🤖 cs.LG

SafeDPO: A Simple Approach to Direct Preference Optimization with Enhanced Safety

O artigo apresenta o SafeDPO, um método leve e baseado em teoria que otimiza diretamente a segurança de Grandes Modelos de Linguagem (LLMs) sem a necessidade de modelos de recompensa ou pipelines complexos, alcançando um equilíbrio competitivo entre segurança e utilidade.

Geon-Hyeong Kim, Yu Jin Kim, Byoungjip Kim + 4 more2026-03-05🤖 cs.AI

Do We Need All the Synthetic Data? Targeted Image Augmentation via Diffusion Models

O artigo apresenta o TADA, um framework que utiliza modelos de difusão para realizar aumento de dados direcionado apenas em exemplos não aprendidos precocemente, demonstrando que essa abordagem seletiva melhora a generalização de classificadores de imagem com menor custo computacional do que a augmentação de todo o conjunto de dados.

Dang Nguyen, Jiping Li, Jinghao Zheng + 1 more2026-03-05🤖 cs.LG

A Copula Based Supervised Filter for Feature Selection in Diabetes Risk Prediction Using Machine Learning

Este artigo propõe um filtro supervisionado baseado em cópula Gumbel para seleção de características na previsão de risco de diabetes, demonstrando que sua métrica de concordância de cauda superior (lambda U) identifica preditores clinicamente relevantes de forma eficiente e robusta em grandes conjuntos de dados, superando filtros padrão e competindo com métodos mais complexos.

Agnideep Aich, Md Monzur Murshed, Sameera Hewage + 1 more2026-03-05🤖 cs.LG

Boosting In-Context Learning in LLMs Through the Lens of Classical Supervised Learning

Este artigo propõe a Calibração Supervisionada (SC), uma nova estrutura baseada em minimização de perda que supera as limitações dos métodos de calibração existentes em Aprendizado em Contexto (ICL) ao aprender transformações afins otimizadas para corrigir vieses sistemáticos e alterar a orientação das fronteiras de decisão de Grandes Modelos de Linguagem, alcançando desempenho superior em diversos conjuntos de dados e modelos.

Korel Gundem, Juncheng Dong, Dennis Zhang + 2 more2026-03-05🤖 cs.AI

An Approximation Theory Perspective on Machine Learning

Este artigo de revisão examina a lacuna entre a teoria de aproximação e a prática do aprendizado de máquina, discute tendências emergentes como redes profundas e operadores neurais, e apresenta uma nova pesquisa para realizar aproximação de funções em variedades desconhecidas sem a necessidade de aprender características específicas da variedade.

Hrushikesh N. Mhaskar, Efstratios Tsoukanis, Ameya D. Jagtap2026-03-05🤖 cs.LG

Structural Vibration Monitoring with Diffractive Optical Processors

Este artigo apresenta um sistema de monitoramento de vibrações estruturais de baixo custo e potência, que integra uma camada difrativa otimizada com uma rede neural rasa para extrair remotamente espectros de vibração 3D de estruturas, superando as limitações de soluções convencionais em precisão e escalabilidade.

Yuntian Wang, Zafer Yilmaz, Yuhang Li + 5 more2026-03-05🔬 physics.optics

AutoQD: Automatic Discovery of Diverse Behaviors with Quality-Diversity Optimization

O artigo apresenta o AutoQD, um método que automatiza a descoberta de comportamentos diversos em otimização Qualidade-Diversidade (QD) ao gerar descritores comportamentais automaticamente a partir de medidas de ocupação de políticas, eliminando a necessidade de descritores manuais pré-definidos.

Saeed Hedayatian, Stefanos Nikolaidis2026-03-05🤖 cs.AI

Robust Adversarial Quantification via Conflict-Aware Evidential Deep Learning

O artigo apresenta o C-EDL, uma abordagem pós-hoc leve para quantificação de incerteza que mitiga a vulnerabilidade do Aprendizado Profundo Evidencial a entradas adversariais e fora de distribuição ao gerar transformações diversas e ajustar previsões com base em conflitos, melhorando significativamente a robustez sem necessidade de retreinamento.

Charmaine Barker, Daniel Bethell, Simos Gerasimou2026-03-05🤖 cs.AI

Honesty in Causal Forests: When It Helps and When It Hurts

O artigo demonstra que a estimativa honesta em florestas causais, embora padrão para evitar overfitting, pode prejudicar a precisão das estimativas de efeitos de tratamento individuais ao limitar a detecção de heterogeneidade, sugerindo que sua adoção deve ser guiada por objetivos específicos e avaliação empírica em vez de ser reflexiva.

Yanfang Hou, Carlos Fernández-Loría2026-03-05🤖 cs.LG

Federated ADMM from Bayesian Duality

Os autores propõem uma nova abordagem bayesiana que generaliza o método federado ADMM ao demonstrar que a estrutura de dualidade de objetivos variacionais de Bayes não apenas recupera as atualizações do ADMM, mas também gera extensões não triviais, como variantes do tipo Newton e Adam, que melhoram a precisão em cenários heterogêneos.

Thomas Möllenhoff, Siddharth Swaroop, Finale Doshi-Velez + 1 more2026-03-05🤖 cs.LG

On the Limits of Sparse Autoencoders: A Theoretical Framework and Reweighted Remedy

Este artigo apresenta uma análise teórica que revela as limitações dos autoencoders esparsos (SAEs) na recuperação de características monossêmicas e propõe uma estratégia de reponderação (WSAE) com princípios teóricos de seleção de pesos para melhorar significativamente a interpretabilidade e a monosssemânticidade das características.

Jingyi Cui, Qi Zhang, Yifei Wang + 1 more2026-03-05🤖 cs.LG

← Anterior Próximo →