cs artigos | Gist.Science

MAviS: A Multimodal Conversational Assistant For Avian Species

O artigo apresenta o MAviS, um assistente conversacional multimodal especializado em aves, composto pelo conjunto de dados MAviS-Dataset, pelo modelo MAviS-Chat e pelo benchmark MAviS-Bench, que juntos superam os modelos de base existentes ao oferecer compreensão detalhada e respostas precisas para mais de 1.000 espécies de aves, integrando áudio, visão e texto para aplicações em conservação da biodiversidade.

Yevheniia Kryklyvets, Mohammed Irfan Kurpath, Sahal Shaji Mullappilly, Jinxing Zhou, Fahad Shabzan Khan, Rao Anwer, Salman Khan, Hisham Cholakkal2026-03-10💻 cs

A Cortically Inspired Architecture for Modular Perceptual AI

Este artigo propõe uma arquitetura de IA perceptual modular inspirada no córtex cerebral, que supera as limitações de interpretabilidade e generalização dos modelos monolíticos atuais ao decompor a percepção em módulos especializados que utilizam loops de feedback preditivo para criar sistemas mais transparentes e robustos.

Prerna Luthra2026-03-10💻 cs

Training for Trustworthy Saliency Maps: Adversarial Training Meets Feature-Map Smoothing

Este artigo propõe uma abordagem que combina treinamento adversarial com um bloco de suavização de mapas de características para gerar mapas de saliência mais esparsos, estáveis e confiáveis, superando as limitações de ruído e instabilidade dos métodos tradicionais.

Dipkamal Bhusal, Md Tanvirul Alam, Nidhi Rastogi2026-03-10💻 cs

Tursio for Credit Unions: Powering Structured Data Search with Automated Context Graph

O artigo apresenta o Tursio, uma plataforma de busca de banco de dados segura e local que permite a usuários de cooperativas de crédito consultarem sistemas complexos usando linguagem natural, inferindo automaticamente um grafo de conhecimento semântico e gerando planos de consulta precisos e conformes por meio da integração de Modelos de Linguagem de Grande Escala (LLMs).

Shivani Tripathi, Ravi Shetye, Shi Qiao, Alekh Jindal2026-03-10💻 cs

Seeing the Reasoning: How LLM Rationales Influence User Trust and Decision-Making in Factual Verification Tasks

Este estudo demonstra que, em tarefas de verificação factual, a precisão e o enquadramento de certeza das justificativas de modelos de linguagem influenciam significativamente a confiança e a adoção de decisões pelos usuários, enquanto o formato de apresentação tem impacto menor, revelando que justificativas mal projetadas podem tanto apoiar quanto descalibrar a confiança.

Xin Sun, Shu Wei, Jos A Bosch, Isao Echizen, Saku Sugawara, Abdallah El Ali2026-03-10💻 cs

Soft Rigid Hybrid Gripper with Inflatable Silicone Pockets for Tunable Frictional Grasping

Este artigo apresenta um dedo de garra híbrido (macio-rígido) com bolsos de silicone infláveis que modula ativamente o atrito da superfície através da pressão interna, permitindo agarrar objetos pesados, escorregadios ou frágeis com segurança sem aumentar a força de preensão.

Hoang Hiep Ly, Cong-Nhat Nguyen, Doan-Quang Tran, Quoc-Khanh Dang, Ngoc Duy Tran, Thi Thoa Mac, Anh Nguyen, Xuan-Thuan Nguyen, Tung D. Ta2026-03-10💻 cs

Impact of 5G Latency and Jitter on TAS Scheduling in a 5G-TSN Network: An Empirical Study

Este estudo empírico avalia o impacto da latência e do jitter do 5G na programação TAS em redes 5G-TSN, demonstrando que a garantia de determinismo de ponta a ponta exige o ajuste cuidadoso do deslocamento da janela de transmissão TAS com base em percentis de alta ordem da latência do 5G para evitar atrasos excessivos ou perda de determinismo.

Pablo Rodriguez-Martin, Oscar Adamuz-Hinojosa, Pablo Muñoz, Julia Caleya-Sanchez, Pablo Ameigeiras2026-03-10💻 cs

Data-Driven Hints in Intelligent Tutoring Systems

Este capítulo explora a evolução da geração de dicas orientada por dados em sistemas tutores inteligentes, destacando como técnicas como a Fábrica de Dicas e Redes de Interação permitem a criação de sugestões de próximos passos e a identificação do momento ideal para intervenções, além de investigar futuras adaptações baseadas em dados comportamentais e na integração de Modelos de Linguagem de Grande Escala (LLMs).

Sutapa Dey Tithi, Kimia Fazeli, Dmitri Droujkov, Tahreem Yasir, Xiaoyi Tian, Tiffany Barnes2026-03-10💻 cs

Faster-HEAL: An Efficient and Privacy-Preserving Collaborative Perception Framework for Heterogeneous Autonomous Vehicles

O artigo apresenta o Faster-HEAL, um framework colaborativo leve e que preserva a privacidade, capaz de alinhar eficientemente características de veículos autônomos heterogêneos em um espaço unificado por meio de prompts visuais de baixo rank e fusão em pirâmide, superando as limitações de métodos anteriores sem a necessidade de retreinar modelos completos.

Armin Maleki, Hayder Radha2026-03-10💻 cs

FinSheet-Bench: From Simple Lookups to Complex Reasoning, Where LLMs Break on Financial Spreadsheets

O artigo apresenta o FinSheet-Bench, um benchmark de dados financeiros sintéticos que demonstra que os atuais Grandes Modelos de Linguagem (LLMs) ainda não atingem a precisão necessária para uso não supervisionado em aplicações financeiras profissionais devido a erros significativos em spreadsheets complexos, sugerindo que soluções confiáveis exigirão abordagens arquitetônicas que separem a compreensão de documentos da computação determinística.

Jan Ravnik, Matjaž Ličen, Felix Bührmann, Bithiah Yuan, Felix Stinson, Tanvi Singh2026-03-10💻 cs

A method for the automated generation of proof exercises with comparable levels of proving complexity

Este artigo apresenta um método para a geração automatizada de exercícios de prova matemática em linguagem de primeira ordem, com níveis de complexidade comparáveis, utilizando tabelas analíticas livres de símbolos lógicos para capturar formalmente o esforço necessário para a resolução.

João Mendes, João Marcos, Patrick Terrematte2026-03-10💻 cs

Echo: Graph-Enhanced Retrieval and Execution Feedback for Issue Reproduction Test Generation

O artigo apresenta o Echo, um agente inovador que utiliza recuperação aprimorada por grafos de código e feedback de execução automática para gerar casos de teste de reprodução de bugs com alta eficiência, estabelecendo um novo estado da arte com uma taxa de sucesso de 66,28% no conjunto de dados SWT-Bench Verified.

Zhiwei Fei, Yue Pan, Federica Sarro, Jidong Ge, Marc Liu, Vincent Ng, He Ye2026-03-10💻 cs

Offer of a reward does not always promote trust in spatial games

O estudo demonstra que, em jogos espaciais de confiança, a oferta de recompensas não promove necessariamente a confiança, pois recompensas excessivas podem incentivar estratégias de não retorno que suprimem a evolução da confiança, enquanto recompensas moderadas e mais custosas, mas não exageradas, são mais eficazes para consolidar a cooperação.

Haidong Zhang, Chaoqian Wang, Shuo Liu, Charo I. del Genio, Stefano Boccaletti, Xin Lu2026-03-10💻 cs

Self-Supervised Evolutionary Learning of Neurodynamic Progression and Identity Manifolds from EEG During Safety-Critical Decision Making

Este trabalho propõe um framework de aprendizado evolutivo auto-supervisionado (SSEL) que, a partir de sinais de EEG contínuos durante tarefas de decisão crítica, descobre progressões neurodinâmicas individualizadas e variedades de identidade intrínsecas para autenticação segura e detecção de anomalias em sistemas de interação humano-veículo.

Xiaoshan Zhou, Carol C. Menassa, Vineet R. Kamat2026-03-10💻 cs

VisualScratchpad: Inference-time Visual Concepts Analysis in Vision Language Models

O artigo apresenta o VisualScratchpad, uma interface interativa que utiliza autoencoders esparsos e atenção texto-para-imagem para analisar conceitos visuais em tempo de inferência em modelos de linguagem visuais, permitindo a identificação sistemática de modos de falha como alinhamento multimodal limitado, conceitos visuais enganosos e pistas ocultas não utilizadas.

Hyesu Lim, Jinho Choi, Taekyung Kim, Byeongho Heo, Jaegul Choo, Dongyoon Han2026-03-10💻 cs

A Lightweight Digital-Twin-Based Framework for Edge-Assisted Vehicle Tracking and Collision Prediction

Este artigo apresenta um framework leve baseado em gêmeo digital para rastreamento de veículos e previsão de colisões em sistemas de transporte inteligentes, que utiliza apenas detecção de objetos e mapas de trajetória pré-construídos para alcançar alta precisão com baixo custo computacional em dispositivos de borda.

Murat Arda Onsu, Poonam Lohan, Burak Kantarci, Aisha Syed, Matthew Andrews, Sean Kennedy2026-03-10💻 cs

Agora: Teaching the Skill of Consensus-Finding with AI Personas Grounded in Human Voice

O artigo apresenta o "Agora", uma plataforma baseada em IA que utiliza vozes humanas autênticas para ajudar os usuários a desenvolver habilidades de consenso e competência cívica, demonstrando em um estudo preliminar que o acesso a explicações detalhadas melhora a qualidade das deliberações e das declarações de consenso em comparação com a visualização apenas de distribuições agregadas de apoio.

Suyash Fulay, Prerna Ravi, Emily Kubin, Shrestha Mohanty, Michiel Bakker, Deb Roy2026-03-10💻 cs

Uber's Failover Architecture: Reconciling Reliability and Efficiency in Hyperscale Microservice Infrastructure

O artigo apresenta a Arquitetura de Failover da Uber (UFA), uma solução que substitui o modelo de capacidade 2x por uma abordagem diferenciada baseada em criticidade, reduzindo o provisionamento de 2x para 1,3x e eliminando mais de um milhão de núcleos de CPU enquanto mantém uma disponibilidade de 99,97% através da preempção seletiva de serviços não críticos e da automação de salvaguardas.

Mayank Bansal, Milind Chabbi, Kenneth Bogh, Srikanth Prodduturi, Kevin Xu, Amit Kumar, David Bell, Ranjib Dey, Yufei Ren, Sachin Sharma, Juan Marcano, Shriniket Kale, Subhav Pradhan, Ivan Beschastnikh, Miguel Covarrubias, Chien-Chih Liao, Sandeep Koushik Sheshadri, Wen Luo, Kai Song, Ashish Samant, Sahil Rihan, Nimish Sheth, Uday Kiran Medisetty2026-03-10💻 cs

Pre-Clinical Latency Characterization of VRxBioRelax: A Real-Time EMG Biofeedback System for Muscle Relaxation in Virtual Reality

O artigo apresenta o VRxBioRelax, um sistema de biofeedback em realidade virtual que utiliza dados de eletromiografia para promover o relaxamento muscular e demonstrou, através de testes pré-clínicos, uma latência de ponta a ponta média de 25,34 ms, mantendo-se significativamente abaixo dos limites de conforto e benchmarks clínicos.

Melanie Baumgartner, Raphael Weibel, Tobias Hoesli, Aydin Javadov, Rayna Ney, Helen Schwerdt, Florian von Wangenheim, Joseph Ollier2026-03-10💻 cs

Collaboration by Mandate: How Shared Data Infrastructure Shapes Coordination and Control in U.S. Homelessness Services

Este estudo analisa como o sistema de dados HMIS, ao ser mandado pelo governo federal para coordenar serviços de combate à sem-teto nos EUA, atua simultaneamente como ferramenta de colaboração e instrumento de controle, facilitando a coordenação enquanto reproduz assimetrias de poder que limitam a participação equitativa e deslocam alguns atores para papéis focados em conformidade.

Lingwei Cheng, Saerim Kim, Andrew Sullivan2026-03-10💻 cs

← Anterior Próximo →