cs.AI artigos | Gist.Science

Input-Adaptive Generative Dynamics in Diffusion Models

Este artigo propõe um novo quadro para modelos de difusão que adapta dinamicamente o processo de geração às necessidades de cada amostra, permitindo trajetórias variáveis que mantêm a qualidade da imagem enquanto reduzem o número médio de etapas de amostragem.

Yucheng Xing, Xiaodong Liu, Xin Wang2026-03-10🤖 cs.LG

The Illusion of Collusion

O estudo demonstra que agentes de aprendizado por reforço sem contexto podem desenvolver uma "colusão ingênua" em jogos repetidos, onde a emergência desse comportamento anticompetitivo depende criticamente da sincronia das ações e do tipo de política de exploração utilizada, variando de impossível em algoritmos persistentemente aleatórios a inevitável em algoritmos determinísticos.

Connor Douglas, Foster Provost, Arun Sundararajan2026-03-10💻 cs

Energy-Efficient SLAM via Joint Design of Sensing, Communication, and Exploration Speed

Este artigo propõe um método de otimização conjunta de parâmetros de sensoriamento, comunicação e velocidade de exploração para minimizar o consumo de energia em sistemas de SLAM vitalício baseados em robôs móveis com LiDAR e odometria, transmitindo dados para reconstrução de mapas em nuvem via aprendizado profundo não supervisionado.

Zidong Han, Ruibo Jin, Xiaoyang Li + 3 more2026-03-10🤖 cs.AI

Multi-modal, Multi-task, Multi-criteria Automatic Evaluation with Vision Language Models

O artigo apresenta o HarmonicEval, uma métrica de avaliação automática sem referência que agrega pontuações por critério de forma bottom-up, e o benchmark MMHE, composto por 18.000 julgamentos humanos em quatro tarefas multimodais, demonstrando que essa abordagem supera as métricas convencionais ao alinhar-se melhor com os julgamentos humanos em cenários de múltiplas tarefas e critérios.

Masanari Ohi, Masahiro Kaneko, Naoaki Okazaki, Nakamasa Inoue2026-03-10💬 cs.CL

From Pixels to Predicates: Learning Symbolic World Models via Pretrained Vision-Language Models

Este artigo propõe um método que utiliza modelos de visão e linguagem pré-treinados para aprender modelos de mundo simbólicos abstratos a partir de demonstrações curtas, permitindo que robôs generalizem para zero-shot e resolvam problemas de tomada de decisão de longo horizonte em cenários complexos e variados através de planejamento.

Ashay Athalye, Nishanth Kumar, Tom Silver, Yichao Liang, Jiuguang Wang, Tomás Lozano-Pérez, Leslie Pack Kaelbling2026-03-10🤖 cs.LG

Efficient Semi-Supervised Adversarial Training via Latent Clustering-Based Data Reduction

Este artigo propõe estratégias de redução de dados baseadas em agrupamento no espaço latente para otimizar o treinamento adversário semi-supervisionado, permitindo alcançar robustez comparável com 5 a 10 vezes menos dados não rotulados e reduzir o tempo de execução em 3 a 4 vezes.

Somrita Ghosh, Yuelin Xu, Xiao Zhang2026-03-10🤖 cs.LG

A Single Model Ensemble Framework for Neural Machine Translation using Pivot Translation

Este artigo apresenta um novo framework de ensemble de modelo único para tradução automática neural que utiliza tradução pivô para gerar e agregar candidatos diversos e de alta qualidade, superando os custos computacionais e limitações dos métodos tradicionais de ensemble.

Seokjin Oh, Keonwoong Noh, Woohwan Jung2026-03-10💬 cs.CL

GRADIEND: Feature Learning within Neural Networks Exemplified through Biases

O artigo apresenta o GRADIEND, um método inovador de codificação e decodificação que utiliza gradientes de modelos para identificar e reescrever pesos neurais, permitindo a remoção de vieses sociais (como gênero, raça e religião) em sistemas de IA sem comprometer suas outras capacidades.

Jonathan Drechsel, Steffen Herbold2026-03-10🤖 cs.LG

An Efficient Local Search Approach for Polarized Community Discovery in Signed Networks

Este artigo propõe um novo algoritmo de busca local eficiente para a descoberta de comunidades polarizadas em redes assinadas, que resolve o problema de desequilíbrio de tamanho das comunidades, permite a existência de vértices neutros e garante uma taxa de convergência linear, superando os métodos atuais em qualidade da solução.

Linus Aronsson, Morteza Haghir Chehreghani2026-03-10🤖 cs.LG

Mitigating Unintended Memorization with LoRA in Federated Learning for LLMs

Este artigo demonstra que a adaptação de baixo rank (LoRA) reduz significativamente a memorização indesejada em modelos de linguagem grandes treinados por aprendizado federado, preservando o desempenho e podendo ser combinada com outras técnicas de privacidade para proteger dados sensíveis em domínios críticos.

Thierry Bossy, Julien Vignoud, Tahseen Rabbani, Juan R. Troncoso Pastoriza, Martin Jaggi2026-03-10🤖 cs.LG

Prompt-SID: Learning Structural Representation Prompt via Latent Diffusion for Single-Image Denoising

O artigo apresenta o Prompt-SID, um framework de aprendizado auto-supervisionado para remoção de ruído em imagens únicas que utiliza um processo de difusão latente para gerar prompts de representação estrutural e um mecanismo de replay de escala, preservando assim detalhes estruturais e superando as limitações de métodos anteriores que dependem de pares de dados pareados ou causam perda de informação.

Huaqiu Li, Wang Zhang, Xiaowan Hu, Tao Jiang, Zikang Chen, Haoqian Wang2026-03-10💻 cs

Quantifying Information Loss under Coarse-Grained Partitions: A Discrete Framework for Explainable Artificial Intelligence

Este artigo apresenta um quadro matemático discreto baseado em partições grosseiras e na unificação categórica para quantificar a perda de informação em sistemas de IA, permitindo analisar as compensações entre precisão, interpretabilidade e custos de granularidade em contextos éticos sensíveis como educação e saúde.

Takashi Izumo2026-03-10🤖 cs.AI

Language in the Flow of Time: Time-Series-Paired Texts Weaved into a Unified Temporal Narrative

O artigo apresenta o framework "Texts as Time Series" (TaTS), que aproveita as propriedades periódicas de textos pareados com séries temporais para aprimorar a previsão e imputação multimodal em modelos existentes, sem a necessidade de alterar suas arquiteturas.

Zihao Li, Xiao Lin, Zhining Liu, Jiaru Zou, Ziwei Wu, Lecheng Zheng, Dongqi Fu, Yada Zhu, Hendrik Hamann, Hanghang Tong, Jingrui He2026-03-10🤖 cs.LG

LaVCa: LLM-assisted Visual Cortex Captioning

O artigo apresenta o LaVCa, uma abordagem baseada em modelos de linguagem grandes (LLMs) que gera legendas em linguagem natural para descrever com maior precisão e detalhe a seletividade de voxels no córtex visual humano, superando métodos anteriores e revelando diferenciações funcionais de alta granularidade.

Takuya Matsuyama, Shinji Nishimoto, Yu Takagi2026-03-10🤖 cs.LG

Unveiling Downstream Performance Scaling of LLMs: A Clustering-Based Perspective

Este artigo propõe o framework COD (Clustering-On-Difficulty), que agrupa tarefas por características de escalabilidade de dificuldade para prever com alta precisão o desempenho de modelos de linguagem grandes em benchmarks downstream, superando as limitações das metodologias atuais devido ao fenômeno de emergência e à variabilidade de métricas.

Chengyin Xu, Kaiyuan Chen, Xiao Li, Ke Shen, Chenggang Li2026-03-10🤖 cs.LG

Subclass Classification of Gliomas Using MRI Fusion Technique

Este estudo propõe um algoritmo que funde imagens de ressonância magnética multimodais (T1, T2, T1ce e FLAIR) segmentadas por redes U-Net em 2D e 3D e classificadas por um modelo ResNet50, alcançando uma precisão de 99,25% na subclasse de gliomas e superando técnicas existentes.

Kiranmayee Janardhan, Christy Bobby Thomas2026-03-10💻 cs

Deep Learning-Based Approach for Automatic 2D and 3D MRI Segmentation of Gliomas

Este artigo propõe uma abordagem de aprendizado profundo baseada nas arquiteturas UNET, Inception e ResNet para realizar a segmentação automática e precisa de gliomas em imagens de ressonância magnética 2D e 3D, alcançando alto desempenho e equilibrando eficiência computacional com acurácia espacial para auxiliar no diagnóstico clínico.

Kiranmayee Janardhan, Christy Bobby T2026-03-10💻 cs

A Simple and Effective Reinforcement Learning Method for Text-to-Image Diffusion Fine-tuning

Este trabalho propõe o método LOOP (Leave-One-Out PPO), uma nova abordagem de aprendizado por reforço para o ajuste fino de modelos de difusão texto-para-imagem que combina técnicas de redução de variância do REINFORCE com a robustez e eficiência amostral do PPO, superando as limitações de ambos ao alcançar um melhor equilíbrio entre eficiência de amostragem e desempenho final.

Shashank Gupta, Chaitanya Ahuja, Tsung-Yu Lin + 4 more2026-03-10🤖 cs.AI

Parallelized Planning-Acting for Efficient LLM-based Multi-Agent Systems in Minecraft

Este artigo propõe um novo quadro de planejamento e atuação paralelizado para sistemas multiagente baseados em LLM, utilizando uma arquitetura de dupla thread com execução interrompível para superar as limitações de latência dos paradigmas serializados e melhorar a resposta em tempo real em ambientes dinâmicos como o Minecraft.

Yaoru Li, Shunyu Liu, Tongya Zheng, Li Sun, Mingli Song2026-03-10💻 cs

LLM-Powered Prediction of Hyperglycemia and Discovery of Behavioral Treatment Pathways from Wearables and Diet

Este estudo apresenta o GlucoLens, um sistema de aprendizado de máquina explicável que utiliza dados de wearables e registros de dieta para prever a hiperglicemia pós-prandial e sugerir caminhos comportamentais personalizados para sua prevenção.

Abdullah Mamun, Asiful Arefeen, Susan B. Racette + 4 more2026-03-10🤖 cs.AI

← Anterior Próximo →