Artificial Intelligence for Detecting Fetal Orofacial Clefts and Advancing Medical Education

Este estudo apresenta um sistema de inteligência artificial treinado em mais de 45.000 imagens de ultrassom que não apenas diagnostica fendas orofaciais fetais com precisão superior à de radiologistas júnior e comparável à de especialistas seniores, mas também atua como um copiloto médico para aumentar a sensibilidade diagnóstica e acelerar o desenvolvimento de expertise clínica em condições raras.

Yuanji Zhang, Yuhao Huang, Haoran Dou, Xiliang Zhu, Chen Ling, Zhong Yang, Lianying Liang, Jiuping Li, Siying Liang, Rui Li, Yan Cao, Yuhan Zhang, Jiewei Lai, Yongsong Zhou, Hongyu Zheng, Xinru Gao, Cheng Yu, Liling Shi, Mengqin Yuan, Honglong Li, Xiaoqiong Huang, Chaoyu Chen, Jialin Zhang, Wenxiong Pan, Alejandro F. Frangi, Guangzhi He, Xin Yang, Yi Xiong, Linliang Yin, Xuedong Deng, Dong Ni2026-03-09🤖 cs.AI

RAMoEA-QA: Hierarchical Specialization for Robust Respiratory Audio Question Answering

O artigo apresenta o RAMoEA-QA, um modelo generativo hierárquico que utiliza especialização condicional em duas etapas (combinando um Mixture-of-Experts para áudio e um Mixture-of-Adapters para linguagem) para superar as limitações de sistemas monolíticos existentes, oferecendo uma resposta robusta e generalizável a perguntas sobre áudio respiratório em diversos cenários clínicos.

Gaia A. Bertolino, Yuwei Zhang, Tong Xia, Domenico Talia, Cecilia Mascolo2026-03-09🤖 cs.AI

SUREON: A Benchmark and Vision-Language-Model for Surgical Reasoning

O artigo apresenta o SUREON, um grande conjunto de dados de perguntas e respostas sobre vídeos cirúrgicos extraídos de aulas acadêmicas, e dois modelos de visão e linguagem (SureonVLM e SureonVLM-R1) que demonstram capacidades superiores de raciocínio cirúrgico, superando modelos gerais em tarefas de percepção e previsão de procedimentos.

Alejandra Perez, Anita Rau, Lee White, Busisiwe Mlambo, Chinedu Nwoye, Muhammad Abdullah Jamal, Omid Mohareri2026-03-09🤖 cs.AI

BEVLM: Distilling Semantic Knowledge from LLMs into Bird's-Eye View Representations

O artigo apresenta o BEVLM, um framework que integra representações de Visão de Pássaro (BEV) com Modelos de Linguagem de Grande Escala (LLMs) para superar limitações de consistência espacial e riqueza semântica, resultando em melhorias significativas de 46% na precisão de raciocínio em cenas de direção e de 29% no desempenho de condução autônoma em cenários críticos de segurança.

Thomas Monninger, Shaoyuan Xie, Qi Alfred Chen, Sihao Ding2026-03-09🤖 cs.AI

EHRSQL: A Practical Text-to-SQL Benchmark for Electronic Health Records

O artigo apresenta o EHRSQL, um novo benchmark prático de texto-para-SQL para registros eletrônicos de saúde, construído a partir de consultas reais de profissionais hospitalares e adaptado para os bancos de dados MIMIC-III e eICU, visando abordar desafios específicos como a geração de consultas complexas, a compreensão de expressões temporais e a distinção entre perguntas respondíveis e não respondíveis.

Gyubok Lee, Hyeonji Hwang, Seongsu Bae + 6 more2026-03-06💻 cs

Deep Learning Meets Mechanism Design: Key Results and Some Novel Applications

Este artigo apresenta uma revisão dos detalhes técnicos e resultados fundamentais da aplicação de aprendizado profundo para projetar mecanismos que aproximadamente satisfazem propriedades desejadas, demonstrando sua eficácia em estudos de caso de gestão de energia veicular, alocação de recursos em redes móveis e leilões de compras agrícolas.

V. Udaya Sankar, Vishisht Srihari Rao, Mayank Ratan Bhardwaj + 1 more2026-03-06💻 cs

Seeing Through Uncertainty: A Free-Energy Approach for Real-Time Perceptual Adaptation in Robust Visual Navigation

O artigo apresenta o FEP-Nav, um quadro inspirado biologicamente que utiliza o Princípio da Energia Livre para permitir a adaptação perceptiva em tempo real e melhorar a navegação robótica sob condições sensoriais ruidosas, minimizando a energia variacional sem necessidade de atualizações baseadas em gradiente.

Maytus Piriyajitakonkij, Rishabh Dev Yadav, Mingfei Sun + 2 more2026-03-06💻 cs

Distilling Privileged Information for Dubins Traveling Salesman Problems with Neighborhoods

Este artigo apresenta um novo método de aprendizado que, ao utilizar duas fases de treinamento para distilar informações privilegiadas de um algoritmo heurístico, resolve o Problema do Caixeiro Viajante com Vizinhanças para veículos não holonômicos de forma 50 vezes mais rápida que o método original, superando outras abordagens de aprendizado por imitação e reforço.

Min Kyu Shin, Su-Jeong Park, Seung-Keol Ryu + 2 more2026-03-06💻 cs

Path Planning for Masked Diffusion Model Sampling

Este artigo apresenta o Path Planning (P2), uma nova estratégia de amostragem para Modelos de Difusão Mascaramento (MDMs) que generaliza métodos existentes ao introduzir um estágio de planejamento para selecionar e refinar tokens, resultando em melhorias significativas no desempenho generativo em diversas tarefas como biologia, raciocínio matemático e geração de código.

Fred Zhangzhi Peng, Zachary Bezemek, Sawan Patel + 5 more2026-03-06💻 cs

FBFL: A Field-Based Coordination Approach for Data Heterogeneity in Federated Learning

Este artigo propõe o FBFL, uma abordagem de aprendizado federado baseada em campos que utiliza macroprogramação e coordenação espacial para criar uma arquitetura hierárquica auto-organizada, superando os desafios de heterogeneidade de dados não-IID e falhas de servidor, enquanto supera métodos existentes como FedAvg, FedProx e Scaffold em cenários não-IID.

Davide Domini, Gianluca Aguzzi, Lukas Esterle + 1 more2026-03-06💻 cs

Generative Models in Decision Making: A Survey

Esta pesquisa apresenta uma revisão abrangente que propõe uma taxonomia unificada baseada no raciocínio probabilístico para classificar modelos generativos em quatro funções distintas (controladores, modeladores, otimizadores e avaliadores) no contexto da tomada de decisão, analisando seus desafios de aplicação em domínios de alto risco e traçando o caminho para a Inteligência Física Generalista.

Xinyu Shao, Jianping Zhang, Haozhi Wang + 9 more2026-03-06💻 cs

Heuristics for AI-driven Graphical Asset Generation Tools in Game Design and Development Pipelines: A User-Centred Approach

Este estudo apresenta um conjunto de heurísticas para ferramentas de geração de ativos gráficos impulsionadas por IA, derivadas de uma pesquisa com 16 designers e desenvolvedores de jogos, que identificou a preferência pela fase inicial de design, a necessidade de integração fluida em pipelines existentes e a prioridade na geração de variações em massa para posterior refinamento.

Kaisei Fukaya, Damon Daylamani-Zad, Harry Agius2026-03-06💻 cs

The StudyChat Dataset: Analyzing Student Dialogues With ChatGPT in an Artificial Intelligence Course

Este artigo apresenta o dataset StudyChat, que analisa interações reais de estudantes com um chatbot de IA em um curso universitário, revelando que o uso da ferramenta para compreensão conceitual e ajuda com código correlaciona-se com melhores resultados, enquanto seu uso para contornar objetivos de aprendizado está associado a desempenho inferior.

Hunter McNichols, Fareya Ikram, Andrew Lan2026-03-06💻 cs