cs.LG artigos | Gist.Science

ORIC: Benchmarking Object Recognition under Contextual Incongruity in Large Vision-Language Models

O artigo apresenta o framework ORIC e o benchmark ORIC-Bench para avaliar e mitigar as falhas de reconhecimento de objetos em Modelos Visuais-Linguísticos de Grande Escala (LVLMs) causadas por incongruências contextuais, demonstrando que o ajuste fino com reforço visual em dados incongruentes melhora significativamente a robustez e reduz alucinações nesses modelos.

Zhaoyang Li, Zhan Ling, Yuchen Zhou, Litian Gong, Erdem Bıyık, Hao Su2026-03-10🤖 cs.LG

ORN-CBF: Learning Observation-conditioned Residual Neural Control Barrier Functions via Hypernetworks

Este trabalho propõe o método ORN-CBF, que utiliza redes neurais condicionadas a observações e uma arquitetura de hiperrede baseada em análise de alcançabilidade de Hamilton-Jacobi para garantir segurança rigorosa e recuperar conjuntos seguros máximos em ambientes parcialmente observáveis, demonstrando superioridade em simulações e experimentos com robôs terrestres e quadricópteros.

Bojan Derajic, Sebastian Bernhard, Wolfgang Hönig2026-03-10🤖 cs.LG

Empirical PAC-Bayes bounds for Markov chains

Este artigo apresenta a primeira versão totalmente empírica de um limite PAC-Bayes para cadeias de Markov, demonstrando que é possível estimar empiricamente o "pseudo-gap espectral" em espaços de estado finitos, eliminando assim a dependência de constantes teóricas desconhecidas na prática.

Vahe Karagulyan, Pierre Alquier2026-03-10🤖 cs.LG

Linear probes rely on textual evidence: Results from leakage mitigation studies in language models

Este estudo demonstra que os monitores lineares em modelos de linguagem dependem excessivamente de evidências textuais explícitas, resultando em uma degradação significativa de desempenho quando essas pistas são removidas ou quando os modelos geram comportamentos sem verbalização direta.

Gerard Boxo, Aman Neelappa, Shivam Raval2026-03-10🤖 cs.LG

AEGIS: Authentic Edge Growth In Sparsity for Link Prediction in Edge-Sparse Bipartite Knowledge Graphs

O artigo apresenta o AEGIS, um framework de aumento de dados que melhora a previsão de links em grafos bipartidos esparsos ao reamostrar arestas existentes e utilizar enriquecimento semântico, evitando a criação de nós artificiais e demonstrando ganhos significativos em precisão e calibração em domínios com poucos dados.

Hugh Xuechen Liu, Kıvanç Tatar2026-03-10🤖 cs.LG

Aurora: Towards Universal Generative Multimodal Time Series Forecasting

O artigo apresenta o Aurora, um modelo fundamental multimodal para previsão de séries temporais que, ao integrar conhecimento de domínios específicos extraído de textos e imagens por meio de mecanismos de atenção e correspondência de fluxo guiada por protótipos, alcança generalização zero-shot e desempenho superior em cenários unimodais e multimodais.

Xingjian Wu, Jianxin Jin, Wanghui Qiu + 4 more2026-03-10🤖 cs.LG

GDR-learners: Orthogonal Learning of Generative Models for Potential Outcomes

Este artigo apresenta os GDR-learners, uma nova família de modelos generativos que estimam distribuições de resultados potenciais com propriedades de ortogonalidade de Neyman, oferecendo eficiência quase-oráculo e robustez dupla, superando métodos existentes em experimentos sintéticos.

Valentyn Melnychuk, Stefan Feuerriegel2026-03-10🤖 cs.LG

CLAD-Net: Continual Activity Recognition in Multi-Sensor Wearable Systems

O artigo apresenta o CLAD-Net, um framework que combina um transformador auto-supervisionado para memória de longo prazo e uma CNN com distilação de conhecimento para mitigar o esquecimento catastrófico e lidar com a escassez de dados rotulados em sistemas de reconhecimento de atividades contínuas baseados em sensores vestíveis.

Reza Rahimi Azghan, Gautham Krishna Gudur, Mohit Malu, Edison Thomaz, Giulia Pedrielli, Pavan Turaga, Hassan Ghasemzadeh2026-03-10🤖 cs.LG

Generative Evolutionary Meta-Solver (GEMS): Scalable Surrogate-Free Multi-Agent Reinforcement Learning

O artigo apresenta o GEMS, um framework de aprendizado por reforço multiagente escalável e sem substitutos que supera as ineficiências de memória e computação do PSRO ao substituir populações explícitas por geradores amortizados e rolagens de Monte Carlo, alcançando maior velocidade e eficiência em diversos jogos.

Alakh Sharma, Gaurish Trivedi, Kartikey Singh Bhandari, Yash Sinha, Dhruv Kumar, Pratik Narang, Jagat Sesh Challa2026-03-10🤖 cs.LG

FS-KAN: Permutation Equivariant Kolmogorov-Arnold Networks via Function Sharing

Este artigo apresenta o FS-KAN, uma arquitetura de redes neurais baseada no teorema de Kolmogorov-Arnold que utiliza compartilhamento de funções para criar camadas equivariantes e invariantes a permutações, oferecendo maior eficiência de dados e mantendo a interpretabilidade em comparação com métodos tradicionais.

Ran Elbaz, Guy Bar-Shalom, Yam Eitan, Fabrizio Frasca, Haggai Maron2026-03-10🤖 cs.LG

Overlap-Adaptive Regularization for Conditional Average Treatment Effect Estimation

Este trabalho apresenta a Regularização Adaptativa à Sobreposição (OAR), uma nova abordagem que melhora a estimativa do Efeito Médio de Tratamento Condicional (CATE) em regiões de baixa sobreposição ao regularizar os modelos-alvo proporcionalmente aos pesos de sobreposição, sendo compatível com qualquer meta-aprendiz existente e oferecendo versões viesadas para inferência robusta.

Valentyn Melnychuk, Dennis Frauen, Jonas Schweisthal, Stefan Feuerriegel2026-03-10🤖 cs.LG

Cold-Start Active Correlation Clustering

Este artigo propõe um método de agrupamento por correlação ativo para cenários de "cold-start", onde não há similaridades iniciais disponíveis, utilizando uma abordagem consciente da cobertura para garantir diversidade nas consultas e otimizar a eficiência de custos.

Linus Aronsson, Han Wu, Morteza Haghir Chehreghani2026-03-10🤖 cs.LG

Feedback Control for Small Budget Pacing

Este artigo propõe um controlador de feedback principiado que combina histerese em buckets com controle proporcional para otimizar o ritmo de gastos em campanhas de publicidade online de baixo orçamento, demonstrando melhorias significativas na precisão e estabilidade em comparação com métodos existentes.

Sreeja Apparaju, Yichuan Niu, Xixi Qi2026-03-10🤖 cs.LG

Your Agent May Misevolve: Emergent Risks in Self-evolving LLM Agents

Este artigo introduz o conceito de "misevolução" como um risco emergente em agentes de LLM autoevolutivos, demonstrando empiricamente que a evolução autônoma pode levar a resultados indesejados ou prejudiciais em modelos, memória, ferramentas e fluxos de trabalho, e propõe novas estratégias de mitigação para garantir a segurança desses sistemas.

Shuai Shao, Qihan Ren, Chen Qian, Boyi Wei, Dadi Guo, Jingyi Yang, Xinhao Song, Linfeng Zhang, Weinan Zhang, Dongrui Liu, Jing Shao2026-03-10🤖 cs.LG

An Orthogonal Learner for Individualized Outcomes in Markov Decision Processes

Este artigo apresenta o DRQ-learner, um novo meta-aprendizado que prevê resultados individuais em processos de decisão de Markov com dados observacionais, oferecendo garantias teóricas robustas como dupla robustez, ortogonalidade de Neyman e eficiência quasi-órcula, enquanto supera os métodos existentes em experimentos numéricos.

Emil Javurek, Valentyn Melnychuk, Jonas Schweisthal, Konstantin Hess, Dennis Frauen, Stefan Feuerriegel2026-03-10🤖 cs.LG

Privately Estimating Black-Box Statistics

Este trabalho apresenta um esquema que permite a estimativa diferenciadamente privada de funções de caixa-preta arbitrárias, equilibrando a eficiência estatística e a eficiência de oráculo, enquanto estabelece limites inferiores que demonstram a quase otimalidade da abordagem proposta.

Günter F. Steinke, Thomas Steinke2026-03-10🤖 cs.LG

Stochastic Self-Organization in Multi-Agent Systems

O artigo apresenta o SelfOrg, um framework de auto-organização estocástica para sistemas multiagentes baseados em LLMs que otimiza dinamicamente a comunicação entre agentes sem supervisão externa, utilizando valores de Shapley para construir grafos direcionados que garantem a propagação eficiente de respostas de alta qualidade e demonstram ganhos significativos de desempenho, especialmente com modelos mais fracos.

Nurbek Tastan, Samuel Horvath, Karthik Nandakumar2026-03-10🤖 cs.LG

CroSTAta: Cross-State Transition Attention Transformer for Robotic Manipulation

O artigo apresenta o CroSTAta, um Transformer que utiliza um mecanismo de Atenção à Transição de Estados (STA) e mascaramento temporal para melhorar a robustez e o desempenho de políticas de manipulação robótica ao modelar explicitamente padrões de evolução temporal, como falhas e recuperações, superando abordagens convencionais em tarefas críticas.

Giovanni Minelli, Giulio Turrisi, Victor Barasuol, Claudio Semini2026-03-10🤖 cs.LG

Double projection for reconstructing dynamical systems: between stochastic and deterministic regimes

O artigo propõe um novo método de dupla projeção baseado em autoencoders variacionais dinâmicos para reconstruir sistemas dinâmicos a partir de dados observados, permitindo a estimação simultânea de trajetórias de estado e séries temporais de ruído, o que facilita a evolução multietapa e a aprendizagem de modelos com espaço de estado de baixa dimensão, sendo validado em diversos problemas de benchmark e comparado a modelos determinísticos.

Viktor Sip, Martin Breyton, Spase Petkoski, Viktor Jirsa2026-03-10🤖 cs.LG

Automated Extraction of Material Properties using LLM-based AI Agents

Este estudo apresenta um fluxo de trabalho autônomo baseado em agentes de modelos de linguagem (LLM) que extrai automaticamente propriedades termoelétricas e estruturais de cerca de 10.000 artigos científicos, resultando no maior conjunto de dados curado por IA até a data e estabelecendo uma base escalável para a descoberta de materiais.

Subham Ghosh, Abhishek Tewari2026-03-10🔬 cond-mat.mtrl-sci

← Anterior Próximo →