cs.CL artigos | Gist.Science

Feature Resemblance: On the Theoretical Understanding of Analogical Reasoning in Transformers

Este artigo demonstra teoricamente e experimentalmente que o raciocínio analógico em transformadores emerge da aprendizagem de representações alinhadas para entidades com propriedades semelhantes, sendo facilitado por um currículo de treinamento específico e pela presença explícita de pontes de identidade nos dados.

Ruichen Xu, Wenjing Yan, Ying-Jun Angela Zhang2026-03-06🤖 cs.LG

C2-Faith: Benchmarking LLM Judges for Causal and Coverage Faithfulness in Chain-of-Thought Reasoning

Este artigo apresenta o C2-Faith, um benchmark derivado do PRM800K para avaliar a fidelidade causal e de cobertura de modelos de linguagem atuando como juízes de raciocínio passo a passo, revelando que a confiabilidade desses modelos varia significativamente conforme a tarefa e que eles frequentemente falham em localizar erros ou identificar lacunas no raciocínio.

Avni Mittal, Rauno Arike2026-03-06🤖 cs.AI

Sparse-BitNet: 1.58-bit LLMs are Naturally Friendly to Semi-Structured Sparsity

O artigo apresenta o Sparse-BitNet, um quadro unificado que demonstra que modelos de 1,58 bits (BitNet) são naturalmente mais compatíveis com a esparsidade N:M semi-estruturada do que modelos de precisão total, permitindo treinar e inferir com maior eficiência e aceleração de até 1,30x sem degradação significativa de desempenho.

Di Zhang, Xun Wu, Shaohan Huang + 9 more2026-03-06💬 cs.CL

Guidelines for the Annotation and Visualization of Legal Argumentation Structures in Chinese Judicial Decisions

Este documento estabelece diretrizes sistemáticas para a anotação e visualização da estrutura de argumentação jurídica em decisões judiciais chinesas, definindo tipos de proposições, relações argumentativas e fluxos de trabalho padronizados para viabilizar a análise computacional e o modelamento de raciocínio legal.

Kun Chen, Xianglei Liao, Kaixue Fei + 2 more2026-03-06🤖 cs.AI

Transducing Language Models

Este artigo apresenta um quadro teórico e algoritmos para transformar modelos de linguagem pré-treinados em novos modelos funcionais através da composição com transdutores de estado finito, permitindo a adaptação de inferência para diferentes formatos de saída (como bytes, palavras ou aminoácidos) sem alterar os parâmetros do modelo original.

Vésteinn Snæbjarnarson, Samuel Kiegeland, Tianyu Liu + 3 more2026-03-06💬 cs.CL

Diffusion LLMs can think EoS-by-EoS

O artigo demonstra que os Modelos de Linguagem de Difusão (Diffusion LLMs) utilizam tokens de fim de sequência (EoS) como um "rascunho" oculto para realizar cálculos intermediários, melhorando significativamente seu desempenho em tarefas de raciocínio complexo quando o comprimento da geração é expandido com esses tokens.

Sarah Breckner, Sebastian Schuster2026-03-06💬 cs.CL

Distilling Formal Logic into Neural Spaces: A Kernel Alignment Approach for Signal Temporal Logic

Este artigo apresenta um framework que utiliza uma abordagem de alinhamento de kernel em um setup professor-aluno para distilar a semântica de lógica temporal em representações neurais contínuas e invertíveis, permitindo raciocínio neuro-simbólico eficiente e escalável para especificações formais.

Sara Candussio, Gabriele Sarti, Gaia Saveri + 1 more2026-03-06💬 cs.CL

Core-based Hierarchies for Efficient GraphRAG

Este artigo propõe o GraphRAG baseado em k-core, uma abordagem determinista e eficiente que substitui a clusterização Leiden por decomposição de k-core para superar a não reprodutibilidade em grafos esparsos, melhorando a compreensão global e reduzindo custos de tokens.

Jakir Hossain, Ahmet Erdem Sarıyüce2026-03-06💬 cs.CL

Balancing Coverage and Draft Latency in Vocabulary Trimming for Faster Speculative Decoding

Este artigo propõe uma abordagem de otimização para o recorte do vocabulário em modelos de rascunho de decodificação especulativa, equilibrando a cobertura de tokens e a latência de inferência para alcançar ganhos significativos de throughput e redução de atraso, especialmente em cargas de trabalho específicas de domínio.

Ofir Ben Shoham2026-03-06🤖 cs.AI

VietJobs: A Vietnamese Job Advertisement Dataset

O artigo apresenta o VietJobs, o primeiro grande corpus público de anúncios de emprego vietnamitas com mais de 48 mil postagens, que serve como um novo marco para pesquisa em PLN e análise de mercado de trabalho, incluindo benchmarks de modelos de linguagem generativa para tarefas como classificação de categorias e estimativa de salários.

Hieu Pham Dinh, Hung Nguyen Huy, Mo El-Haj2026-03-06💬 cs.CL

Oral to Web: Digitizing 'Zero Resource'Languages of Bangladesh

Este artigo apresenta o Multilingual Cloud Corpus, o primeiro conjunto de dados linguísticos multimodais e paralelos em escala nacional das línguas étnicas e indígenas do Bangladesh, coletado através de trabalho de campo sistemático para documentar variedades de "recursos zero" e apoiar a preservação digital e o processamento de linguagem natural.

Mohammad Mamun Or Rashid2026-03-06💬 cs.CL

SarcasmMiner: A Dual-Track Post-Training Framework for Robust Audio-Visual Sarcasm Reasoning

O artigo apresenta o SarcasmMiner, um framework de pós-treinamento baseado em aprendizado por reforço que utiliza uma estratégia de destilação dual e otimização GRPO para melhorar o raciocínio sobre sarcasmo multimodal, alcançando um F1 de 70,22% no conjunto de dados MUStARD++.

Zhu Li, Yongjian Chen, Huiyuan Lai + 3 more2026-03-06💬 cs.CL

Knowledge Divergence and the Value of Debate for Scalable Oversight

Este artigo estabelece uma conexão formal entre debate e RLAIF, demonstrando que o valor do debate para a supervisão escalável de IA depende geometricamente da divergência de conhecimento entre os modelos, variando de regimes onde é desnecessário a outros onde é essencial para acessar informações latentes inacessíveis a um único agente.

Robin Young2026-03-06🤖 cs.LG

WavSLM: Single-Stream Speech Language Modeling via WavLM Distillation

O artigo apresenta o WavSLM, um modelo de linguagem de fala de fluxo único que, ao quantizar e destilar representações do WavLM em um único código e otimizar a previsão autoregressiva de próximos blocos, consegue modelar conjuntamente informações semânticas e acústicas sem supervisão textual, alcançando desempenho competitivo com menos parâmetros e dados.

Luca Della Libera, Cem Subakan, Mirco Ravanelli2026-03-06🤖 cs.AI

Med-V1: Small Language Models for Zero-shot and Scalable Biomedical Evidence Attribution

O artigo apresenta o Med-V1, uma família de modelos de linguagem pequenos e eficientes que, apesar de terem apenas três bilhões de parâmetros, superam seus modelos base e competem com modelos de ponta como o GPT-5 na atribuição de evidências biomédicas e na detecção de alucinações, oferecendo uma alternativa escalável e de baixo custo para aplicações práticas.

Qiao Jin, Yin Fang, Lauren He + 12 more2026-03-06🤖 cs.AI

PersianPunc: A Large-Scale Dataset and BERT-Based Approach for Persian Punctuation Restoration

Este artigo apresenta o PersianPunc, um grande conjunto de dados de 17 milhões de amostras para restauração de pontuação em persa, e demonstra que uma abordagem baseada no modelo ParsBERT supera modelos de linguagem grandes em precisão e eficiência, evitando edições indesejadas em pipelines de reconhecimento de fala.

Mohammad Javad Ranjbar Kalahroodi, Heshaam Faili, Azadeh Shakery2026-03-06🤖 cs.AI

A Multilingual Human Annotated Corpus of Original and Easy-to-Read Texts to Support Access to Democratic Participatory Processes

Este artigo apresenta um corpus multilingue de textos originais e suas versões simplificadas para "Leitura Fácil", anotados por especialistas humanos em espanhol, catalão e italiano, criado para apoiar o acesso a processos democráticos participativos e preencher a lacuna de recursos de alta qualidade para essas línguas.

Stefan Bott, Verena Riegler, Horacio Saggion + 2 more2026-03-06💬 cs.CL

Exploring the potential and limitations of Model Merging for Multi-Domain Adaptation in ASR

Este estudo avalia 11 algoritmos de fusão de modelos para adaptação multido-mínio em reconhecimento automático de fala (ASR) em português europeu, propondo o novo método BoostedTSV-M que supera o ajuste fino completo em precisão e estabilidade numérica enquanto preserva a generalização.

Carlos Carvalho, Francisco Teixeira, Thomas Rolland + 1 more2026-03-06💬 cs.CL

DiSCTT: Consensus-Guided Self-Curriculum for Efficient Test-Time Adaptation in Reasoning

O artigo apresenta o DiSCTT, um framework de auto-curriculum guiado por consenso que melhora a eficiência e a estabilidade da adaptação em tempo de teste para modelos de raciocínio ao atribuir dinamicamente estratégias de otimização baseadas na incerteza epistêmica e no nível de acordo entre trajetórias de raciocínio amostradas.

Mohammad Mahdi Moradi, Sudhir Mudur2026-03-06💬 cs.CL

Progressive Residual Warmup for Language Model Pretraining

O artigo propõe o método Progressive Residual Warmup (ProRes), que estabiliza e acelera o pré-treinamento de modelos de linguagem ao adiar o aprendizado das camadas mais profundas até que as camadas iniciais se estabilizem, resultando em melhor convergência e desempenho downstream.

Tianhao Chen, Xin Xu, Lu Yin + 4 more2026-03-06💬 cs.CL

← Anterior Próximo →