cs.CL artigos | Gist.Science

MemeIntel: Explainable Detection of Propagandistic and Hateful Memes

O artigo apresenta o MemeIntel, um novo conjunto de dados explicativo e uma abordagem de otimização multiestágio com modelos de visão e linguagem que superam o estado da arte na detecção de memes propagandísticos em árabe e de discurso de ódio em inglês, ao mesmo tempo que geram justificativas para suas previsões.

Mohamed Bayan Kmainasi, Abul Hasnat, Md Arid Hasan + 2 more2026-03-03💬 cs.CL

Rewarding Doubt: A Reinforcement Learning Approach to Calibrated Confidence Expression of Large Language Models

Este artigo propõe uma abordagem inovadora de Aprendizado por Reforço que ajusta finamente Grandes Modelos de Linguagem para expressar estimativas de confiança calibradas junto às suas respostas, integrando a calibração ao processo generativo e demonstrando melhorias significativas na precisão e generalização sem necessidade de ajuste adicional.

David Bani-Harouni, Chantal Pellegrini, Paul Stangel + 4 more2026-03-03💬 cs.CL

Not-Just-Scaling Laws: Towards a Better Understanding of the Downstream Impact of Language Model Design Decisions

Este artigo apresenta uma meta-análise de 92 modelos de linguagem que demonstra que incorporar decisões de design, como a composição dos dados e escolhas arquiteturais, melhora significativamente a previsão do desempenho downstream em comparação com o uso exclusivo da escala do modelo.

Emmy Liu, Amanda Bertsch, Lintang Sutawika + 9 more2026-03-03💬 cs.CL

Large Language Models in Bioinformatics: A Survey

Esta pesquisa oferece uma revisão sistemática sobre como os Modelos de Linguagem de Grande Escala (LLMs) estão revolucionando a bioinformática ao analisar dados genômicos e proteicos, abordando desafios atuais e explorando futuras aplicações clínicas e multimodais.

Zhenyu Wang, Zikang Wang, Jiyue Jiang + 3 more2026-03-03🧬 q-bio

LLaVE: Large Language and Vision Embedding Models with Hardness-Weighted Contrastive Learning

O artigo apresenta o LLaVE, um modelo de incorporação multimodal que supera o estado da arte ao utilizar aprendizado contrastivo ponderado por dificuldade para melhorar a distinção de pares negativos, alcançando desempenho superior com maior eficiência e generalização zero-shot.

Zhibin Lan, Liqiang Niu, Fandong Meng + 2 more2026-03-03💬 cs.CL

Vision-R1: Incentivizing Reasoning Capability in Multimodal Large Language Models

O artigo apresenta o Vision-R1, um modelo de linguagem multimodal que aprimora o raciocínio complexo por meio de aprendizado por reforço, utilizando um conjunto de dados de cadeia de pensamento gerado automaticamente e uma estratégia de supressão progressiva do pensamento excessivo para alcançar desempenho competitivo em benchmarks matemáticos.

Wenxuan Huang, Bohan Jia, Zijie Zhai + 7 more2026-03-03💬 cs.CL

I Predict Therefore I Am: Is Next Token Prediction Enough to Learn Human-Interpretable Concepts from Data?

Este artigo apresenta um modelo teórico que demonstra que a previsão do próximo token em LLMs permite aprender conceitos latentes discretos interpretáveis por humanos, provando que suas representações correspondem aproximadamente aos logaritmos das probabilidades posteriores desses conceitos e oferecendo uma base teórica unificada para entender a hipótese de representações lineares e avaliar autoencoders esparsos.

Yuhang Liu, Dong Gong, Yichao Cai + 6 more2026-03-03💬 cs.CL

A Foundational Individual Mobility Prediction Model based on Open-Source Large Language Models

Este artigo apresenta o MoBLLM, um modelo fundamental de previsão de mobilidade individual baseado em modelos de linguagem grandes (LLM) de código aberto e técnicas de ajuste fino eficientes em parâmetros, que supera os métodos tradicionais em precisão, robustez e transferabilidade entre diferentes contextos espaciais e temporais, oferecendo uma solução custo-eficiente para serviços de transporte personalizados.

Zhenlin Qin, Leizhen Wang, Yancheng Ling + 2 more2026-03-03💬 cs.CL

Chain of Correction for Full-text Speech Recognition with Large Language Models

Este artigo propõe o "Chain of Correction" (CoC), um método que utiliza um formato de chat multi-turno e grandes modelos de linguagem para corrigir erros de reconhecimento de fala em texto completo de forma segmentada e contextualizada, demonstrando desempenho superior a sistemas existentes ao equilibrar precisão e fluidez.

Zhiyuan Tang, Dong Wang, Zhikai Zhou + 3 more2026-03-03💬 cs.CL

AnesSuite: A Comprehensive Benchmark and Dataset Suite for Anesthesiology Reasoning in LLMs

Este artigo apresenta o AnesSuite, a primeira suíte abrangente de conjuntos de dados e benchmarks para raciocínio em anestesiologia em modelos de linguagem, e introduz o Morpheus, um modelo baseline que, mesmo com treinamento limitado, demonstra desempenho superior em tarefas de anestesiologia e em benchmarks médicos gerais.

Xiang Feng, Wentao Jiang, Zengmao Wang + 5 more2026-03-03💬 cs.CL

DRA-GRPO: Your GRPO Needs to Know Diverse Reasoning Paths for Mathematical Reasoning

O artigo propõe o DRA-GRPO, uma abordagem que utiliza o Submodular Mutual Information para ajustar as recompensas no GRPO e promover a diversidade de caminhos de raciocínio, superando a inconsistência entre qualidade e variedade e demonstrando ganhos significativos em benchmarks matemáticos com alta eficiência de dados e custo.

Xiwen Chen, Wenhui Zhu, Peijie Qiu + 7 more2026-03-03💬 cs.CL

When Large Language Models are More PersuasiveThan Incentivized Humans, and Why

O estudo demonstra que a superioridade persuasiva de Grandes Modelos de Linguagem (LLMs) em relação a humanos incentivados é contextual, dependendo da veracidade da mensagem e do modelo específico, com os LLMs mostrando maior convicção linguística e influenciando a precisão das respostas de forma variável conforme o cenário de interação.

Philipp Schoenegger, Francesco Salvi, Jiacheng Liu + 37 more2026-03-03💬 cs.CL

mCLM: A Modular Chemical Language Model that Generates Functional and Makeable Molecules

O artigo apresenta o mCLM, um modelo de linguagem química modular que tokeniza moléculas em blocos funcionais compatíveis com síntese automatizada, permitindo a geração de novos fármacos com propriedades aprimoradas e alta viabilidade sintética, superando métodos existentes como o GPT-5.

Carl Edwards, Chi Han, Gawon Lee + 11 more2026-03-03🧬 q-bio

Dynamic Token Reweighting for Robust Vision-Language Models

Este artigo apresenta o DTR, uma defesa inovadora em tempo de inferência que mitiga ataques de jailbreak multimodal em modelos visão-linguagem ao otimizar dinamicamente os pesos dos tokens visuais nos caches de chave-valor, melhorando a robustez sem comprometer o desempenho em tarefas benignas.

Tanqiu Jiang, Jiacheng Liang, Rongyi Zhu + 3 more2026-03-03💬 cs.CL

Chain-of-Lure: A Universal Jailbreak Attack Framework using Unconstrained Synthetic Narratives

Este artigo apresenta o "Chain-of-Lure", um novo framework de ataque universal de jailbreak que utiliza narrativas sintéticas não restritas e otimização por meio de um modelo LLM auxiliar para contornar as defesas de segurança de modelos de linguagem, demonstrando altas taxas de sucesso e propondo estratégias de defesa para mitigar tais riscos.

Wenhan Chang, Tianqing Zhu, Yu Zhao + 3 more2026-03-03💬 cs.CL

NFT: Bridging Supervised Learning and Reinforcement Learning in Math Reasoning

O artigo propõe o Negative-aware Fine-Tuning (NFT), uma abordagem de aprendizado supervisionado que permite que grandes modelos de linguagem melhorem autonomamente em raciocínio matemático ao aproveitar feedback negativo de suas próprias falhas, alcançando desempenho comparável ou superior a métodos de aprendizado por reforço e estabelecendo uma equivalência teórica entre as duas técnicas.

Huayu Chen, Kaiwen Zheng, Qinsheng Zhang + 8 more2026-03-03💬 cs.CL

SQUiD: Synthesizing Relational Databases from Unstructured Text

O artigo apresenta o SQUiD, um novo framework neurosimbólico que utiliza modelos de linguagem grandes para sintetizar automaticamente esquemas e dados de bancos de dados relacionais a partir de textos não estruturados, superando consistentemente as abordagens existentes.

Mushtari Sadia, Zhenning Yang, Yunming Xiao + 2 more2026-03-03💬 cs.CL

Learning to Reason without External Rewards

O artigo apresenta o Intuitor, um método de Aprendizado por Reforço a partir de Feedback Interno (RLIF) que utiliza a autoconfiança do modelo como único sinal de recompensa, permitindo que grandes modelos de linguagem aprendam raciocínio complexo de forma totalmente não supervisionada, alcançando desempenho comparável a métodos com recompensas externas e melhor generalização em tarefas como geração de código.

Xuandong Zhao, Zhewei Kang, Aosong Feng + 2 more2026-03-03💬 cs.CL

RPM: Reasoning-Level Personalization for Black-Box Large Language Models

Este trabalho apresenta o RPM, um novo framework que supera as limitações da personalização em nível de resposta ao introduzir a personalização em nível de raciocínio, permitindo que modelos de linguagem de caixa-preta descubram automaticamente estruturas de raciocínio específicas do usuário a partir de dados comportamentais brutos para guiar inferências personalizadas e interpretáveis.

Jieyong Kim, Tongyoung Kim, Soojin Yoon + 2 more2026-03-03💬 cs.CL

Augmenting Research Ideation with Data: An Empirical Investigation in Social Science

Este estudo demonstra que a augmentação de modelos de linguagem com dados relevantes e validação automatizada melhora significativamente a viabilidade e a qualidade das ideias de pesquisa em ciências sociais, além de inspirar pesquisadores a gerar propostas superiores em comparação com a ideação sem assistência.

Xiao Liu, Xinyi Dong, Xinyang Gao + 2 more2026-03-03💬 cs.CL

← Anterior Próximo →