TextPecker: Rewarding Structural Anomaly Quantification for Enhancing Visual Text Rendering

O artigo apresenta o TextPecker, uma estratégia de aprendizado por reforço que utiliza um conjunto de dados com anotações de anomalias estruturais e um motor de síntese de edição de traços para superar as limitações dos modelos atuais na avaliação e otimização da renderização de texto visual, alcançando novos patamares de fidelidade estrutural e alinhamento semântico.

Hanshen Zhu, Yuliang Liu, Xuecheng Wu + 7 more2026-02-27💻 cs

EndoDDC: Learning Sparse to Dense Reconstruction for Endoscopic Robotic Navigation via Diffusion Depth Completion

O artigo apresenta o EndoDDC, um método inovador que utiliza modelos de difusão para integrar imagens, profundidade esparsa e características de gradiente, permitindo a reconstrução precisa de mapas de profundidade densos em ambientes endoscópicos complexos e superando as limitações de técnicas existentes relacionadas a texturas fracas e reflexos de luz.

Yinheng Lin, Yiming Huang, Beilei Cui + 4 more2026-02-27💻 cs

CrossLLM-Mamba: Multimodal State Space Fusion of LLMs for RNA Interaction Prediction

O artigo apresenta o CrossLLM-Mamba, um novo framework que utiliza codificadores Mamba bidirecionais para reformular a previsão de interações de RNA como um problema de alinhamento de espaço de estados, alcançando desempenho superior ao estado da arte na previsão de interações RNA-proteína, RNA-pequenas moléculas e RNA-RNA com complexidade computacional linear.

Rabeya Tus Sadia, Qiang Ye, Qiang Cheng2026-02-27🧬 q-bio

Enabling clinical use of foundation models in histopathology

Este artigo demonstra que a introdução de novas funções de perda robustas durante o treinamento de modelos específicos para tarefas, utilizando características de modelos fundamentais em histopatologia, reduz a sensibilidade à variabilidade técnica e melhora a precisão, permitindo a aplicação clínica desses sistemas em dados do mundo real sem a necessidade de re-treinar os modelos fundamentais.

Audun L. Henriksen, Ole-Johan Skrede, Lisa van der Schee + 31 more2026-02-27🤖 cs.AI

Enhancing Renal Tumor Malignancy Prediction: Deep Learning with Automatic 3D CT Organ Focused Attention

Este estudo apresenta um framework de aprendizado profundo com uma função de perda de atenção focada no órgão (OFA) que prevê a malignidade de tumores renais em imagens de TC 3D sem a necessidade de segmentação manual, alcançando desempenho superior aos modelos tradicionais e oferecendo uma abordagem mais eficiente para o diagnóstico clínico.

Zhengkang Fan, Chengkun Sun, Russell Terry + 2 more2026-02-27🤖 cs.AI

Exploring Multimodal LMMs for Online Episodic Memory Question Answering on the Edge

Este artigo investiga a viabilidade de usar Modelos de Linguagem Multimodal (MLLMs) em dispositivos de borda para responder perguntas sobre memória episódica em tempo real, demonstrando que uma configuração local com GPU de consumo atinge 51,76% de precisão com baixa latência, oferecendo uma alternativa privada e competitiva às soluções baseadas em nuvem.

Giuseppe Lando, Rosario Forte, Antonino Furnari2026-02-27💻 cs

MammoWise: Multi-Model Local RAG Pipeline for Mammography Report Generation

O artigo apresenta o MammoWise, um pipeline local e reprodutível que utiliza modelos de linguagem visão (VLMs) de código aberto, aprimorados por técnicas como RAG e fine-tuning (QLoRA), para gerar relatórios de mamografia e realizar classificações médicas precisas, oferecendo uma alternativa privada e adaptável aos sistemas em nuvem.

Raiyan Jahangir, Nafiz Imtiaz Khan, Amritanand Sudheerkumar + 1 more2026-02-27💻 cs