cs.LG artigos | Gist.Science

A Benchmark Study of Neural Network Compression Methods for Hyperspectral Image Classification

Este estudo apresenta uma avaliação sistemática de métodos de compressão de redes neurais — especificamente poda, quantização e destilação de conhecimento — para classificação de imagens hiperespectrais, demonstrando que é possível reduzir significativamente o tamanho e o custo computacional dos modelos mantendo um desempenho competitivo em plataformas de recursos limitados.

Sai Shi2026-03-06💻 cs

Model Medicine: A Clinical Framework for Understanding, Diagnosing, and Treating AI Models

Este artigo apresenta o "Model Medicine", um novo paradigma de pesquisa que aplica uma estrutura clínica sistemática para entender, diagnosticar e tratar desordens em modelos de IA, introduzindo contribuições como uma taxonomia de disciplinas, o Modelo de Quatro Camadas, a ferramenta de diagnóstico Neural MRI e frameworks padronizados para avaliação e relato de casos.

Jihoon Jeong2026-03-06💻 cs

Count Bridges enable Modeling and Deconvolving Transcriptomic Data

O artigo apresenta o "Count Bridges", um processo de ponte estocástica sobre inteiros que permite a modelagem generativa e a deconvolução de dados transcriptômicos agregados, oferecendo um método preciso para inferir perfis de contagem de células individuais a partir de medições em massa ou espaciais.

Nic Fishman, Gokul Gowri, Tanush Kumar + 4 more2026-03-06💻 cs

When Priors Backfire: On the Vulnerability of Unlearnable Examples to Pretraining

Este artigo revela que os Exemplos Inaprendíveis (UEs) falham ao proteger dados quando modelos pré-treinados utilizam seus priores semânticos para ignorar as perturbações, e propõe o método BAIT, que utiliza otimização bi-nível para forçar a associação entre perturbações e rótulos incorretos, restaurando assim a proteção dos dados.

Zhihao Li, Gezheng Xu, Jiale Cai + 5 more2026-03-06💻 cs

Distribution-Conditioned Transport

O artigo apresenta a Distribuição-Condicionada de Transporte (DCT), um framework que condiciona mapas de transporte a representações aprendidas de distribuições de origem e destino, permitindo a generalização para pares não vistos e o aprendizado semi-supervisionado em diversas aplicações biológicas.

Nic Fishman, Gokul Gowri, Paolo L. B. Fischer + 3 more2026-03-06💻 cs

Interactive Benchmarks

O artigo propõe os "Interactive Benchmarks", um novo paradigma de avaliação unificado que testa a capacidade de raciocínio de modelos sob restrições orçamentárias em cenários interativos de provas e jogos, demonstrando que essa abordagem oferece uma avaliação mais robusta e fiel da inteligência artificial do que os benchmarks padrão.

Baoqing Yue, Zihan Zhu, Yifan Zhang + 3 more2026-03-06💻 cs

CONE: Embeddings for Complex Numerical Data Preserving Unit and Variable Semantics

O artigo apresenta o CONE, um modelo híbrido pré-treinado que utiliza um algoritmo inovador de embeddings compostos para codificar números, intervalos e gaussianas junto com suas unidades e atributos, preservando semântica e distância e demonstrando capacidades superiores de raciocínio numérico em diversos domínios.

Gyanendra Shrestha, Anna Pyayt, Michael Gubanov2026-03-06💻 cs

KindSleep: Knowledge-Informed Diagnosis of Obstructive Sleep Apnea from Oximetry

O artigo apresenta o KindSleep, um quadro de aprendizado profundo que integra conhecimento clínico e sinais de oximetria para diagnosticar com alta precisão e transparência a apneia obstrutiva do sono, superando os métodos existentes em múltiplos conjuntos de dados independentes.

Micky C Nnamdi, Wenqi Shi, Cheng Wan + 4 more2026-03-06💻 cs

Evaluating GPT-5 as a Multimodal Clinical Reasoner: A Landscape Commentary

Este comentário de panorama avalia a família GPT-5 como raciocinador clínico multimodal, demonstrando avanços significativos na síntese de dados textuais e de imagem que superam o GPT-4o, mas revelando que, embora represente um progresso em direção ao raciocínio integrado, os modelos generalistas ainda não substituem sistemas especializados em tarefas críticas de percepção como neurorradiologia e mamografia.

Alexandru Florea, Shansong Wang, Mingzhe Hu + 5 more2026-03-06💻 cs

ConTSG-Bench: A Unified Benchmark for Conditional Time Series Generation

Este artigo apresenta o ConTSG-Bench, um benchmark unificado e em grande escala que fornece um conjunto abrangente de métricas e um conjunto de dados alinhado para avaliar sistematicamente modelos de geração de séries temporais condicionais, revelando as limitações atuais e direções futuras para o controle estrutural preciso e a utilidade em tarefas downstream.

Shaocheng Lan, Shuqi Gu, Zhangzhi Xiong + 1 more2026-03-06💻 cs

Distributional Reinforcement Learning with Information Bottleneck for Uncertainty-Aware DRAM Equalization

Este artigo propõe um framework de aprendizado por reforço distribuído e sensível ao risco, que integra o gargalo de informação e otimização de Conditional Value-at-Risk para otimizar parâmetros de equalização de DRAM com garantias de pior caso, quantificação de incerteza e uma aceleração de 51 vezes em comparação com métodos tradicionais.

Muhammad Usama, Dong Eui Chang2026-03-06💻 cs

Distributional Equivalence in Linear Non-Gaussian Latent-Variable Cyclic Causal Models: Characterization and Learning

Este trabalho apresenta a primeira caracterização de equivalência distribucional e um método de aprendizado estruturalmente livre para modelos causais lineares não-Gaussianos com variáveis latentes e ciclos, estabelecendo critérios gráficos e um algoritmo para recuperar modelos a partir de dados sem assumir restrições estruturais prévias.

Haoyue Dai, Immanuel Albrecht, Peter Spirtes + 1 more2026-03-06💻 cs

Diffusion Policy through Conditional Proximal Policy Optimization

Este artigo propõe o Diffusion Policy through Conditional Proximal Policy Optimization, um método eficiente que permite o treinamento de políticas de difusão em cenários de aprendizado por reforço on-policy ao alinhar a iteração da política com o processo de difusão, eliminando a necessidade de cálculos complexos de verossimilhança e permitindo a regularização por entropia, resultando em desempenho superior em diversas tarefas de robótica.

Ben Liu, Shunpeng Yang, Hua Chen2026-03-06💻 cs

Guiding Diffusion-based Reconstruction with Contrastive Signals for Balanced Visual Representation

Este artigo propõe o método DCR (Diffusion Contrastive Reconstruction), que integra sinais contrastivos derivados das imagens reconstruídas em vez das originais no processo de difusão para superar as limitações do CLIP, equilibrando simultaneamente a capacidade discriminativa e a percepção de detalhes na representação visual.

Boyu Han, Qianqian Xu, Shilong Bao + 4 more2026-03-06💻 cs

The Inductive Bias of Convolutional Neural Networks: Locality and Weight Sharing Reshape Implicit Regularization

Este artigo demonstra que a localidade e o compartilhamento de pesos em redes neurais convolucionais alteram fundamentalmente a regularização implícita, permitindo a generalização em dados esféricos de alta dimensão onde redes totalmente conectadas falham, ao acoplar os filtros aprendidos a uma variedade de patches de baixa dimensão.

Tongtong Liang, Esha Singh, Rahul Parhi + 2 more2026-03-06💻 cs

WhisperAlign: Word-Boundary-Aware ASR and WhisperX-Anchored Pyannote Diarization for Long-Form Bengali Speech

Este artigo apresenta a solução "WhisperAlign" para o DL Sprint 4.0, que combina uma estratégia de fragmentação de áudio baseada em WhisperX para reconhecimento de fala e um modelo de diarização de fala ajustado especificamente para o dataset da competição, resultando em reduções significativas nas taxas de erro para transcrição e identificação de falantes em longas gravações de áudio em bengali.

Aurchi Chowdhury, Rubaiyat -E-Zaman, Sk. Ashrafuzzaman Nafees2026-03-06💻 cs

Quadratic polarity and polar Fenchel-Young divergences from the canonical Legendre polarity

Este artigo estabelece uma conexão entre polaridade quadrática e divergências de Fenchel-Young polares, demonstrando que transformações de Legendre-Fenchel podem ser manipuladas via álgebra linear em coordenadas homogêneas e revelando uma nova dualidade de referência na geometria da informação através da generalização de divergências de Bregman.

Frank Nielsen, Basile Plus-Gourdon, Mahito Sugiyama2026-03-06💻 cs

On the Strengths and Weaknesses of Data for Open-set Embodied Assistance

Este artigo investiga as capacidades de generalização de modelos fundacionais corporativos para assistência corretiva em conjunto aberto, demonstrando através de dados sintéticos no Overcooked que o desempenho ideal requer conjuntos de dados diversificados que abranjam fundamentação multimodal, inferência de defeitos e exposição a cenários variados.

Pradyumna Tambwekar, Andrew Silva, Deepak Gopinath + 3 more2026-03-06🤖 cs.AI

Mitigating Instance Entanglement in Instance-Dependent Partial Label Learning

O artigo propõe o framework CAD (Class-specific Augmentation based Disentanglement), que mitiga o emaranhamento de instâncias no aprendizado de rótulos parciais dependente de instância (ID-PLL) através de regulamentações intra e interclasse para melhorar a clareza dos limites entre classes e reduzir a confusão.

Rui Zhao, Bin Shi, Kai Sun + 1 more2026-03-06🤖 cs.LG

Multilevel Training for Kolmogorov Arnold Networks

Este artigo propõe um método de treinamento multiescala para Redes de Kolmogorov-Arnold (KANs) que explora sua estrutura de base de splines para criar uma hierarquia de modelos aninhados, resultando em aceleração significativa no treinamento e em ganhos substanciais de precisão, especialmente em redes neurais informadas por física.

Ben S. Southworth, Jonas A. Actor, Graham Harper + 1 more2026-03-06🔢 math

← Anterior Próximo →