cs.CL artigos | Gist.Science

RexDrug: Reliable Multi-Drug Combination Extraction through Reasoning-Enhanced LLMs

O artigo apresenta o RexDrug, um framework aprimorado por raciocínio baseado em grandes modelos de linguagem que supera os métodos existentes na extração precisa de combinações de múltiplos fármacos (n-ários) a partir de literatura biomédica, utilizando uma estratégia de treinamento em duas etapas com colaboração multiagente e aprendizado por reforço.

Zhijun Wang, Ling Luo, Dinghao Pan, Huan Zhuang, Lejing Yu, Yuanyuan Sun, Hongfei Lin2026-03-10💬 cs.CL

Is continuous CoT better suited for multi-lingual reasoning?

O estudo demonstra que o raciocínio em cadeia contínuo (Continuous Chain-of-Thought) supera o raciocínio explícito em idiomas de baixa recursos, oferecendo maior robustez em cenários zero-shot e uma compressão de eficiência de 29 a 50 vezes, graças à invariância linguística inerente às representações latentes contínuas.

Ali Hamza Bashir, Behzad Shomali, Markus Frey, Mehdi Ali, Rafet Sifa, David Berghaus2026-03-10🤖 cs.LG

TildeOpen LLM: Leveraging Curriculum Learning to Achieve Equitable Language Representation

O artigo apresenta o TildeOpen LLM, um modelo de linguagem aberto de 30 bilhões de parâmetros treinado com aprendizado curricular e técnicas de reamostragem para promover a equidade linguística e superar modelos existentes em 34 línguas europeias, especialmente nas línguas bálticas, fino-úgricas e eslavas, sem exigir aumento no tamanho do modelo ou no volume de treinamento.

Toms Bergmanis, Martins Kronis, Ingus J\=anis Pretkalninš, D\=avis Nicmanis, Jelizaveta Jelinska, Roberts Rozis, Rinalds V\=iksna, M\=arcis Pinnis2026-03-10💬 cs.CL

Supporting Workflow Reproducibility by Linking Bioinformatics Tools across Papers and Executable Code

O artigo apresenta o CoPaLink, uma abordagem automatizada que integra reconhecimento de entidades nomeadas e vinculação a bases de conhecimento para conectar menções de ferramentas bioinformáticas em textos científicos às suas implementações em código executável, visando aprimorar a reprodutibilidade e a compreensão de fluxos de trabalho.

Clémence Sebe, Olivier Ferret, Aurélie Névéol, Mahdi Esmailoghli, Ulf Leser, Sarah Cohen-Boulakia2026-03-10💬 cs.CL

The Conundrum of Trustworthy Research on Attacking Personally Identifiable Information Removal Techniques

O artigo argumenta que as avaliações atuais de ataques de reconstrução contra técnicas de remoção de informações pessoalmente identificáveis (PII) são superestimadas devido a vazamentos e contaminação de dados, e conclui que a falta de acesso a dados privados impede que a comunidade de pesquisa avalie de forma transparente e confiável a eficácia real dessas técnicas de proteção de privacidade.

Sebastian Ochs, Ivan Habernal2026-03-10💬 cs.CL

DualTurn: Learning Turn-Taking from Dual-Channel Generative Speech Pretraining

O artigo apresenta o DualTurn, um modelo pré-treinado generativo em áudio conversacional de dois canais que supera os métodos existentes na previsão de ações de agente e na antecipação de limites de turno, permitindo uma interação mais natural e eficiente sem depender de timeouts de silêncio.

Shangeth Rajaa2026-03-10💬 cs.CL

Quantifying Cross-Lingual Transfer in Paralinguistic Speech Tasks

Este artigo apresenta a Matriz de Transferência Cross-Lingual (CLTM), um método sistemático para quantificar como os dados de línguas-fonte afetam o desempenho em tarefas paralinguísticas como identificação de gênero e verificação de locutor, revelando padrões de transferência distintos e dependentes da língua ao utilizar um codificador multilíngue baseado em HuBERT.

Pol Buitrago, Oriol Pareras, Federico Costa, Javier Hernando2026-03-10💬 cs.CL

Fibration Policy Optimization

Este artigo apresenta o Fibration Policy Optimization (FiberPO), um novo quadro teórico e prático que unifica o controle de estabilidade em múltiplas escalas para modelos de linguagem grandes, combinando uma reformulação exata de objetivos de confiança com uma estrutura algébrica de fibrados para otimizar a eficiência e a estabilidade do treinamento em sistemas heterogêneos.

Chang Li, Tshihao Tsu, Yaren Zhang, Chao Xue, Xiaodong He2026-03-10🤖 cs.LG

Sensivity of LLMs' Explanations to the Training Randomness:Context, Class & Task Dependencies

Este artigo investiga como o contexto sintático, as classes e as tarefas influenciam a sensibilidade das explicações de modelos Transformer à aleatoriedade do treinamento, demonstrando que todos os fatores têm impacto estatisticamente significativo, sendo o efeito mais forte nas tarefas e o mais fraco no contexto.

Romain Loncour, Jérémie Bogaert, François-Xavier Standaert2026-03-10💬 cs.CL

Bootstrapping Audiovisual Speech Recognition in Zero-AV-Resource Scenarios with Synthetic Visual Data

O artigo propõe um framework de reconhecimento de fala audiovisual para cenários sem recursos que utiliza dados visuais sintéticos gerados por sincronização labial de imagens estáticas com áudio real, demonstrando eficácia ao alcançar desempenho próximo ao estado da arte em catalão com menos dados e parâmetros que os métodos tradicionais.

Pol Buitrago, Pol Gàlvez, Oriol Pareras, Javier Hernando2026-03-10💬 cs.CL

Not All Queries Need Deep Thought: CoFiCot for Adaptive Coarse-to-fine Stateful Refinement

O artigo apresenta o CoFiCot, um framework adaptativo de refinamento do grosseiro ao fino que utiliza um classificador multimétrico para direcionar recursos de inferência de forma diferenciada, aplicando correções sequenciais com estado e modelos de recompensa de processo para otimizar o raciocínio de LLMs conforme a complexidade da tarefa.

Dongxu Zhang, Hongqiang Lin, Yiding Sun, Pengyu Wang, Qirui Wang, Ning Yang, Jihua Zhu2026-03-10💬 cs.CL

NCL-UoR at SemEval-2026 Task 5: Embedding-Based Methods, Fine-Tuning, and LLMs for Word Sense Plausibility Rating

Este artigo apresenta a abordagem da NCL-UoR para a tarefa de avaliação de plausibilidade de sentido de palavras no SemEval-2026, demonstrando que uma estratégia de *prompting* estruturado com regras de decisão explícitas supera tanto métodos baseados em *embeddings* quanto modelos *transformers* ajustados, evidenciando que o design do *prompt* é mais crucial que a escala do modelo para essa tarefa.

Tong Wu, Thanet Markchom, Huizhi Liang2026-03-10💬 cs.CL

How Much Do LLMs Hallucinate in Document Q&A Scenarios? A 172-Billion-Token Study Across Temperatures, Context Lengths, and Hardware Platforms

Este estudo de 172 bilhões de tokens revela que, embora a seleção do modelo seja o fator mais crítico para a precisão, as alucinações em tarefas de Q&A com documentos aumentam drasticamente com o tamanho do contexto (ultrapassando 10% em 200K tokens), enquanto configurações de temperatura mais altas podem reduzir a perda de coerência sem comprometer significativamente a precisão, e os resultados permanecem consistentes independentemente da plataforma de hardware.

JV Roig2026-03-10💬 cs.CL

AdaCultureSafe: Adaptive Cultural Safety Grounded by Cultural Knowledge in Large Language Models

O artigo propõe o framework AdaCultureSafe, que integra conhecimento cultural e segurança em Grandes Modelos de Linguagem (LLMs) através de um novo conjunto de dados verificado manualmente, revelando a ausência de correlação entre segurança e proficiência cultural nos modelos atuais e apresentando um método baseado em conhecimento para aprimorar a segurança cultural.

Hankun Kang, Di Lin, Zhirong Liao, Pengfei Bai, Xinyi Zeng, Jiawei Jiang, Yuanyuan Zhu, Tieyun Qian2026-03-10💬 cs.CL

Evaluating LLM-Based Grant Proposal Review via Structured Perturbations

Este artigo avalia a capacidade de modelos de linguagem (LLMs) de revisar propostas de financiamento do EPSRC através de perturbações estruturadas, descobrindo que a abordagem de análise seção por seção supera outras arquiteturas, embora os sistemas atuais ainda apresentem variabilidade significativa e priorizem a verificação de conformidade em detrimento de uma avaliação holística.

William Thorne, Joseph James, Yang Wang, Chenghua Lin, Diana Maynard2026-03-10💬 cs.CL

Using Multimodal and Language-Agnostic Sentence Embeddings for Abstractive Summarization

O artigo apresenta o SBARThez, um novo framework para sumarização abstrativa que utiliza embeddings de sentenças multimodais e multilíngues, combinados com um mecanismo de injeção de entidades nomeadas, para gerar resumos mais concisos e factualmente consistentes em textos e fala, inclusive para idiomas de baixos recursos.

Chaimae Chellaf, Salima Mdhaffar, Yannick Estève, Stéphane Huet2026-03-10💬 cs.CL

LAMUS: A Large-Scale Corpus for Legal Argument Mining from U.S. Caselaw using LLMs

Este artigo apresenta o LAMUS, um corpus de grande escala para mineração de argumentos jurídicos em decisões dos EUA, construído por meio de um pipeline que combina coleta de dados, anotação automatizada com LLMs e refinamento humano, demonstrando que o *chain-of-thought* e a verificação assistida por IA melhoram significativamente a qualidade e a consistência dos dados.

Serene Wang, Lavanya Pobbathi, Haihua Chen2026-03-10💬 cs.CL

Learning Multiple Utterance-Level Attribute Representations with a Unified Speech Encoder

Este trabalho propõe um quadro de pós-treinamento unificado que estende modelos fundamentais de fala para gerar múltiplas representações de nível de enunciado, como semânticas e de locutor, demonstrando sua eficácia em tarefas de recuperação de fala multilingue e reconhecimento de locutor.

Maryem Bouziane, Salima Mdhaffar, Yannick Estève2026-03-10💬 cs.CL

SlowBA: An efficiency backdoor attack towards VLM-based GUI agents

O artigo apresenta o SlowBA, um ataque de backdoor inovador que compromete a eficiência de agentes de interface gráfica baseados em modelos de linguagem e visão (VLM) ao induzir cadeias de raciocínio excessivamente longas sob gatilhos específicos, aumentando significativamente a latência de resposta sem prejudicar a precisão das tarefas.

Junxian Li, Tu Lan, Haozhen Tan, Yan Meng, Haojin Zhu2026-03-10💬 cs.CL

SPD-RAG: Sub-Agent Per Document Retrieval-Augmented Generation

O SPD-RAG é um framework hierárquico de múltiplos agentes que melhora a qualidade e a escalabilidade da resposta a perguntas complexas em grandes corpora documentais, superando métodos tradicionais de RAG e modelos de contexto longo ao processar documentos individualmente e sintetizar suas respostas de forma eficiente e econômica.

Yagiz Can Akay, Muhammed Yusuf Kartal, Esra Alparslan, Faruk Ortakoyluoglu, Arda Akpinar2026-03-10💬 cs.CL

← Anterior Próximo →