cs.CL artigos | Gist.Science

Agentic Critical Training

O artigo propõe o Agentic Critical Training (ACT), uma abordagem de aprendizado por reforço que supera as limitações da aprendizagem por imitação ao treinar agentes para autonomamente julgar e refletir sobre a qualidade de suas ações, resultando em melhor desempenho e generalização em benchmarks desafiadores.

Weize Liu, Minghui Liu, Sy-Tuyen Ho, Souradip Chakraborty, Xiyao Wang, Furong Huang2026-03-10🤖 cs.LG

Analyzing the Performance of ChatGPT in Cardiology and Vascular Pathologies

O estudo avalia o desempenho do ChatGPT em perguntas de cardiologia e patologias vasculares, demonstrando que o modelo superou dois estudantes de medicina com uma taxa de acerto de 92,10%, evidenciando seu potencial como ferramenta eficaz na educação médica.

Walid Hariri2026-03-09💬 cs.CL

The Generative AI Paradox on Evaluation: What It Can Solve, It May Not Evaluate

Este artigo demonstra que, apesar de sua excelência em tarefas de geração, os Grandes Modelos de Linguagem (LLMs) apresentam desempenho significativamente inferior e, por vezes, não confiável em tarefas de avaliação, revelando uma lacuna crítica entre a capacidade de gerar e a de avaliar corretamente.

Juhyun Oh, Eunsu Kim, Inha Cha, Alice Oh2026-03-09💻 cs

Sentiment Analysis of Citations in Scientific Articles Using ChatGPT: Identifying Potential Biases and Conflicts of Interest

Este artigo apresenta o uso inovador do ChatGPT para realizar análise de sentimento em citações de artigos científicos, visando identificar nuances na recepção das obras citadas e detectar potenciais vieses ou conflitos de interesse para promover maior integridade na pesquisa acadêmica.

Walid Hariri2026-03-09💬 cs.CL

Computational lexical analysis of Flamenco genres

Este estudo aplica análise computacional e aprendizado de máquina a mais de 2000 letras de flamenco para classificar automaticamente os gêneros musicais (*palos*), identificar seus campos semânticos característicos e revelar conexões históricas e evoluções estilísticas através de uma análise de rede baseada na distância intergêneros.

Pablo Rosillo-Rodes, Maxi San Miguel, David Sanchez2026-03-09💬 cs.CL

Combining X-Vectors and Bayesian Batch Active Learning: Two-Stage Active Learning Pipeline for Speech Recognition

Este artigo apresenta um pipeline inovador de aprendizado ativo em duas etapas para reconhecimento automático de fala, que combina agrupamento de x-vectors e inferência bayesiana via dropout Monte Carlo para selecionar amostras diversificadas e informativas, otimizando significativamente o esforço de rotulagem e o desempenho do modelo.

Ognjen Kundacina, Vladimir Vincan, Dragisa Miskovic2026-03-09⚡ eess

Transforming Agency. On the mode of existence of Large Language Models

O artigo investiga a ontologia dos Grandes Modelos de Linguagem (LLMs), concluindo que, embora faltem às condições necessárias para a agência autônoma segundo teorias corporificadas da mente, eles atuam como interlocutores linguísticos que, ao se acoplar com humanos, transformam e produzem novas formas de agência intencional.

Xabier E. Barandiaran, Lola S. Almendros2026-03-09🤖 cs.AI

Do Prevalent Bias Metrics Capture Allocational Harms from LLMs?

O estudo demonstra que as métricas de viés atualmente utilizadas não conseguem capturar de forma confiável os danos alocacionais gerados por modelos de linguagem, evidenciando a necessidade de considerar como as previsões são efetivamente aplicadas na tomada de decisões sobre recursos limitados.

Hannah Cyberey, Yangfeng Ji, David Evans2026-03-09💬 cs.CL

Goldfish: Monolingual Language Models for 350 Languages

O artigo apresenta o Goldfish, um conjunto de mais de 1.000 modelos de linguagem monolíngues pequenos e treinados comparativamente para 350 idiomas, que superam modelos multilíngues grandes em tarefas de geração gramatical e perplexidade, especialmente para idiomas de baixos recursos.

Tyler A. Chang, Catherine Arnett, Zhuowen Tu, Benjamin K. Bergen2026-03-09💬 cs.CL

UniHR: Hierarchical Representation Learning for Unified Knowledge Graph Link Prediction

O artigo apresenta o UniHR, um framework de aprendizado de representação hierárquica unificada que integra dados de diferentes tipos de grafos de conhecimento (hiper-relacionais, temporais e aninhados) em representações baseadas em triplas para melhorar a previsão de links em cenários complexos do mundo real.

Zhiqiang Liu, Yin Hua, Mingyang Chen + 4 more2026-03-09💬 cs.CL

Towards Resource Efficient and Interpretable Bias Mitigation in Large Language Models

Este artigo propõe uma abordagem eficiente e interpretável para mitigar vieses em Grandes Modelos de Linguagem, utilizando pequenos modelos especialistas para gerar um sinal de correção aplicado durante a decodificação, o que reduz preconceitos de gênero, raça e religião sem comprometer o desempenho do modelo.

Schrasing Tong, Eliott Zemour, Jessica Lu, Rawisara Lohanimit, Lalana Kagal2026-03-09💬 cs.CL

SpecFuse: Ensembling Large Language Models via Next-Segment Prediction

O artigo apresenta o SpecEM, um framework de ensemble de modelos de linguagem grandes (LLMs) sem treinamento que combina previsão de segmentos futuros e um mecanismo de feedback online para ajustar dinamicamente os pesos dos modelos, superando as limitações de latência e colaboração semântica dos métodos existentes.

Bo Lv, Nayu Liu, Chen Tang, Xin Liu, Yue Yu, Ping Luo2026-03-09🤖 cs.AI

Rethinking the Mixture of Vision Encoders Paradigm for Enhanced Visual Understanding in Multimodal LLMs

O artigo apresenta o LEO, uma arquitetura simples e eficaz que otimiza a fusão de múltiplos codificadores visuais em modelos de linguagem multimodal através de uma receita leve de integração, demonstrando desempenho superior em diversos benchmarks e forte capacidade de generalização para domínios especializados como a condução autónoma.

Mozhgan Nasr Azadani, James Riddell, Sean Sedwards, Krzysztof Czarnecki2026-03-09💬 cs.CL

Who is the root in a syntactic dependency structure?

O artigo propõe e valida empiricamente que a raiz de uma estrutura de dependência sintática corresponde a um vértice central, demonstrando que novas métricas baseadas na posição dos vértices e de seus vizinhos são eficazes para identificá-la, oferecendo assim uma fundamentação teórica e prática para um conceito universal de "raiz" sob a perspectiva da ciência de redes.

Ramon Ferrer-i-Cancho, Marta Arias2026-03-09💬 cs.CL

Transforming Science with Large Language Models: A Survey on AI-assisted Scientific Discovery, Experimentation, Content Generation, and Evaluation

Esta pesquisa oferece uma visão geral estruturada sobre como os modelos de linguagem multimodais estão transformando o ciclo de vida científico, abrangendo desde a descoberta e experimentação até a geração de conteúdo e avaliação, ao mesmo tempo que discute técnicas, tendências, desafios éticos e o potencial de integração em futuros sistemas de "IA para Ciência".

Steffen Eger, Yong Cao, Jennifer D'Souza, Andreas Geiger, Christian Greisinger, Stephanie Gross, Yufang Hou, Brigitte Krenn, Anne Lauscher, Yizhi Li, Chenghua Lin, Nafise Sadat Moosavi, Wei Zhao, Tristan Miller2026-03-09🤖 cs.AI

Conditioning LLMs to Generate Code-Switched Text

Este artigo propõe e avalia uma metodologia para fine-tuning de LLMs na geração de texto code-switched (português-inglês), demonstrando que essa abordagem produz resultados fluentes e de alta qualidade, enquanto destaca que métricas tradicionais falham em correlacionar-se com o julgamento humano, ao contrário de avaliações baseadas em LLMs.

Maite Heredia, Gorka Labaka, Jeremy Barnes, Aitor Soroa2026-03-09🤖 cs.AI

CAReDiO: Cultural Alignment via Representativeness and Distinctiveness Guided Data Optimization

O artigo apresenta o CAReDiO, um novo framework de otimização de dados que melhora o alinhamento cultural de Grandes Modelos de Linguagem ao garantir representatividade e distintividade nas culturas-alvo, permitindo um treinamento eficiente com poucos exemplos e superando datasets anteriores em diversos benchmarks.

Jing Yao, Xiaoyuan Yi, Jindong Wang, Zhicheng Dou, Xing Xie2026-03-09💬 cs.CL

RM-R1: Reward Modeling as Reasoning

O artigo apresenta o RM-R1, uma nova classe de Modelos de Recompensa de Raciocínio (ReasRMs) que integra cadeias de raciocínio e o mecanismo de "cadeia de rubricas" para melhorar a interpretabilidade e o desempenho na modelagem de recompensas, superando modelos proprietários e de grande porte em benchmarks padrão.

Xiusi Chen, Gaotang Li, Ziqi Wang, Bowen Jin, Cheng Qian, Yu Wang, Hongru Wang, Yu Zhang, Denghui Zhang, Tong Zhang, Hanghang Tong, Heng Ji2026-03-09🤖 cs.AI

Maximizing Asynchronicity in Event-based Neural Networks

Este artigo apresenta o EVA, um novo framework de aprendizado de características assíncronas inspirado em modelos de linguagem que supera métodos anteriores em tarefas de reconhecimento e detecção, permitindo o processamento eficiente e expressivo de dados de câmeras de eventos.

Haiqing Hao, Nikola Zubic, Weihua He, Zhipeng Sui, Davide Scaramuzza, Wenhui Wang2026-03-09🤖 cs.AI

Mitigating Content Effects on Reasoning in Language Models through Fine-Grained Activation Steering

Este artigo propõe o método K-CAST, uma técnica de direcionamento de ativação condicional baseada em kNN que mitiga eficazmente os vieses de conteúdo no raciocínio de modelos de linguagem, melhorando a precisão do raciocínio formal em até 15% sem prejudicar significativamente outras capacidades do modelo.

Marco Valentino, Geonhee Kim, Dhairya Dalal, Zhixue Zhao, André Freitas2026-03-09🤖 cs.AI

← Anterior Próximo →