Estimation of Energy-dissipation Lower-bounds for Neuromorphic Learning-in-memory

Este artigo deriva estimativas teóricas de limites inferiores para o consumo energético de otimizadores neuromórficos ideais que utilizam o paradigma de "aprendizado na memória" (LIM), estabelecendo métricas de eficiência energética independentes do modelo que dependem apenas do número de operações, tamanho do modelo, velocidade de convergência e precisão da solução.

Zihao Chen, Faiek Ahsan, Johannes Leugering, Gert Cauwenberghs, Shantanu Chakrabartty2026-03-09🤖 cs.AI

Make VLM Recognize Visual Hallucination on Cartoon Character Image with Pose Information

Este artigo propõe um novo sistema de detecção de alucinações visuais estruturais em imagens de personagens de desenho animado geradas por modelos Texto-para-Imagem, utilizando um Modelo Visão-Linguagem aprimorado por aprendizado em contexto com orientação de pose (PA-ICVL), que demonstra melhorias significativas de desempenho em comparação com métodos baseados apenas em imagens RGB.

Bumsoo Kim, Wonseop Shin, Kyuchul Lee, Yonghoon Jung, Sanghyun Seo2026-03-09🤖 cs.AI

Combining X-Vectors and Bayesian Batch Active Learning: Two-Stage Active Learning Pipeline for Speech Recognition

Este artigo apresenta um pipeline inovador de aprendizado ativo em duas etapas para reconhecimento automático de fala, que combina agrupamento de x-vectors e inferência bayesiana via dropout Monte Carlo para selecionar amostras diversificadas e informativas, otimizando significativamente o esforço de rotulagem e o desempenho do modelo.

Ognjen Kundacina, Vladimir Vincan, Dragisa Miskovic2026-03-09⚡ eess

FALCON: Future-Aware Learning with Contextual Object-Centric Pretraining for UAV Action Recognition

O FALCON é um método de pré-treinamento auto-supervisionado para reconhecimento de ações em vídeos de UAVs que supera o desequilíbrio espacial típico de imagens aéreas ao integrar um autoencoder mascarado consciente de objetos com reconstrução futura de duplo horizonte, resultando em maior precisão e inferência significativamente mais rápida em comparação com abordagens supervisionadas.

Ruiqi Xian, Xiyang Wu, Tianrui Guan, Xijun Wang, Boqing Gong, Dinesh Manocha2026-03-09🤖 cs.AI

Transforming Science with Large Language Models: A Survey on AI-assisted Scientific Discovery, Experimentation, Content Generation, and Evaluation

Esta pesquisa oferece uma visão geral estruturada sobre como os modelos de linguagem multimodais estão transformando o ciclo de vida científico, abrangendo desde a descoberta e experimentação até a geração de conteúdo e avaliação, ao mesmo tempo que discute técnicas, tendências, desafios éticos e o potencial de integração em futuros sistemas de "IA para Ciência".

Steffen Eger, Yong Cao, Jennifer D'Souza, Andreas Geiger, Christian Greisinger, Stephanie Gross, Yufang Hou, Brigitte Krenn, Anne Lauscher, Yizhi Li, Chenghua Lin, Nafise Sadat Moosavi, Wei Zhao, Tristan Miller2026-03-09🤖 cs.AI

FragFM: Hierarchical Framework for Efficient Molecule Generation via Fragment-Level Discrete Flow Matching

O artigo apresenta o FragFM, uma nova estrutura hierárquica baseada em correspondência de fluxo discreto em nível de fragmentos que permite a geração eficiente e escalável de moléculas com melhor controle de propriedades, além de propor o benchmark NPGen para avaliar a capacidade de modelos generativos de criar moléculas semelhantes a produtos naturais.

Joongwon Lee, Seonghwan Kim, Seokhyun Moon, Hyunwoo Kim, Woo Youn Kim2026-03-09🤖 cs.AI

Aligning Compound AI Systems via System-level DPO

O artigo apresenta o SysDPO, um framework que alinha sistemas de IA compostos com preferências humanas ao modelá-los como grafos acíclicos direcionados e estender a Otimização Direta de Preferências (DPO) para superar desafios como interações não diferenciáveis e a dificuldade de traduzir preferências de nível de sistema para componentes individuais.

Xiangwen Wang, Yibo Jacky Zhang, Zhoujie Ding, Katherine Tsai, Haolun Wu, Sanmi Koyejo2026-03-09🤖 cs.AI

FindAnything: Open-Vocabulary and Object-Centric Mapping for Robot Exploration in Any Environment

O artigo apresenta o FindAnything, um framework de mapeamento em mundo aberto que integra informações visuais e linguísticas em submapas volumétricos centrados em objetos, permitindo uma compreensão semântica escalável e eficiente em termos de memória e tempo para exploração robótica em ambientes desconhecidos.

Sebastián Barbas Laina, Simon Boche, Sotiris Papatheodorou, Simon Schaefer, Jaehyung Jung, Helen Oleynikova, Stefan Leutenegger2026-03-09🤖 cs.AI

From Tokenizer Bias to Backbone Capability: A Controlled Study of LLMs for Time Series Forecasting

Este estudo controlado demonstra que, embora modelos de linguagem pré-treinados (LLMs) apresentem potencial para previsão de séries temporais, sua eficácia real é frequentemente mascarada por viés de pequenos conjuntos de dados e, em avaliações rigorosas, eles não superam consistentemente modelos especializados treinados em grandes volumes de dados temporais.

Xinyu Zhang, Shanshan Feng, Xutao Li, Kenghong Lin, Fan Li, Pengfei Jia2026-03-09🤖 cs.AI