cs.CL artigos | Gist.Science

Combating data scarcity in recommendation services: Integrating cognitive types of VARK and neural network technologies (LLM)

Este trabalho propõe um framework híbrido inovador que integra modelos de linguagem (LLM) e perfis cognitivos VARK para superar o problema de início frio em sistemas de recomendação, gerando perfis de usuários e metadados de itens enriquecidos para fornecer recomendações personalizadas e explicáveis mesmo com dados escassos.

Nikita Zmanovskii2026-03-05💬 cs.CL

Entropic-Time Inference: Self-Organizing Large Language Model Decoding Beyond Attention

O artigo propõe a "inferência de tempo entrópico", uma nova arquitetura de auto-organização que substitui a progressão linear de tokens por um processo termodinâmico inteligente, onde o agendamento, a esparsificação da atenção e a temperatura de amostragem são controlados unificadamente pelo fluxo de incerteza para otimizar a alocação de recursos computacionais em modelos de linguagem grandes.

Andrew Kiruluta2026-03-05🤖 cs.LG

The Logovista English-Japanese Machine Translation System

Este artigo documenta a arquitetura, as práticas de desenvolvimento e os artefatos preservados do sistema de tradução automática Logovista inglês-japonês, um sistema baseado em regras amplamente utilizado comercialmente das décadas de 1990 a 2012 que evoluiu continuamente para atender a demandas práticas de cobertura e gerenciamento de ambiguidade.

Barton D. Wright2026-03-05💬 cs.CL

Escaping the BLEU Trap: A Signal-Grounded Framework with Decoupled Semantic Guidance for EEG-to-Text Decoding

O artigo apresenta o SemKey, um novo framework que supera as limitações atuais na decodificação de EEG para texto ao alinhar a geração com os sinais neurais através de objetivos semânticos desacoplados e prompts estruturados, eliminando alucinações e oferecendo métricas de avaliação mais robustas que o BLEU.

Yuchen Wang, Haonan Wang, Yu Guo + 2 more2026-03-05🤖 cs.AI

How does fine-tuning improve sensorimotor representations in large language models?

Este estudo demonstra que o ajuste fino (fine-tuning) pode reduzir a lacuna de incorporação em Grandes Modelos de Linguagem, alinhando suas representações internas com experiências sensorimotoras humanas, embora essa melhoria seja robusta entre idiomas e dimensões relacionadas, mas dependente do objetivo de aprendizado e não generalize para formatos de tarefas distintos.

Minghua Wu, Javier Conde, Pedro Reviriego + 1 more2026-03-05🤖 cs.AI

Towards Self-Robust LLMs: Intrinsic Prompt Noise Resistance via CoIPO

Este artigo propõe o método CoIPO, que utiliza aprendizado contrastivo e otimização direta de preferência inversa para aumentar a robustez intrínseca de modelos de linguagem grandes contra ruídos em prompts, validado por meio de um novo benchmark e de um conjunto de dados aprimorado.

Xin Yang, Letian Li, Abudukelimu Wuerkaixi + 5 more2026-03-05🤖 cs.AI

M-QUEST -- Meme Question-Understanding Evaluation on Semantics and Toxicity

Este artigo apresenta o M-QUEST, um novo framework semântico e benchmark de 609 pares de perguntas e respostas que avalia a capacidade de modelos de linguagem de compreender a toxicidade em memes através de múltiplas dimensões, incluindo conhecimento de senso comum e raciocínio pragmático.

Stefano De Giorgis, Ting-Chih Chen, Filip Ilievski2026-03-05🤖 cs.AI

The Influence of Iconicity in Transfer Learning for Sign Language Recognition

Este estudo demonstra que a transferência de aprendizado baseada na iconicidade entre línguas de sinais distintas (chinês para árabe e grego para flamengo) melhora significativamente o reconhecimento, alcançando um ganho de 7,02% para o árabe e 1,07% para o flamengo ao utilizar Mediapipe com arquiteturas MLP e GRU.

Keren Artiaga, Conor Lynch, Haithem Afli + 1 more2026-03-05🤖 cs.AI

Retcon -- a Prompt-Based Technique for Precise Control of LLMs in Conversations

Este artigo apresenta o Retcon, uma técnica de prompting com poucos exemplos projetada para oferecer controle preciso ao nível de cada turno em conversas com Modelos de Linguagem de Grande Escala (LLMs), superando significativamente métodos de zero-shot e few-shot tradicionais.

David Kogan, Sam Nguyen, Masanori Suzuki + 1 more2026-03-05💬 cs.CL

Quantum-Inspired Self-Attention in a Large Language Model

Este artigo propõe e integra um mecanismo de auto-atenção clássico inspirado em princípios quânticos (QISA) no modelo GPT-1, demonstrando que, apesar de um aumento moderado no tempo de inferência, a abordagem supera significativamente a auto-atenção padrão em métricas de erro de caracteres, erro de palavras e perda de entropia cruzada.

Nikita Kuznetsov, Niyaz Ismagilov, Ernesto Campos2026-03-05⚛️ quant-ph

Automated Concept Discovery for LLM-as-a-Judge Preference Analysis

Este artigo apresenta um método de descoberta automática de conceitos baseado em codificadores esparsos para analisar e interpretar os vieses de modelos de linguagem atuando como juízes, identificando drivers de preferência não previstos que vão além das taxonomias pré-definidas.

James Wedgwood, Chhavi Yadav, Virginia Smith2026-03-05🤖 cs.AI

From We to Me: Theory Informed Narrative Shift with Abductive Reasoning

Este artigo propõe uma abordagem neurosimbólica fundamentada em teoria das ciências sociais e raciocínio abdutivo para orientar modelos de linguagem na transformação eficaz de narrativas entre perspectivas coletivistas e individualistas, superando significativamente as linhas de base zero-shot ao manter a fidelidade semântica ao conteúdo original.

Jaikrishna Manojkumar Patil, Divyagna Bavikadi, Kaustuv Mukherji + 5 more2026-03-05🤖 cs.AI

DIALEVAL: Automated Type-Theoretic Evaluation of LLM Instruction Following

O artigo apresenta o DIALEVAL, um framework baseado em teoria dos tipos que utiliza agentes duplos de LLM para automatizar a decomposição e avaliação de instruções com precisão formal, superando os métodos existentes ao alinhar-se melhor aos padrões de julgamento humano e funcionar eficazmente em diálogos multi-turno.

Nardine Basta, Dali Kaafar2026-03-05🤖 cs.AI

Can Large Language Models Derive New Knowledge? A Dynamic Benchmark for Biological Knowledge Discovery

Este trabalho apresenta o DBench-Bio, um benchmark dinâmico e totalmente automatizado que avalia a capacidade de modelos de linguagem grandes de descobrir novos conhecimentos biológicos, superando as limitações de contaminação de dados e obsolescência dos conjuntos de avaliação estáticos existentes.

Chaoqun Yang, Xinyu Lin, Shulin Li + 4 more2026-03-05🤖 cs.AI

Discern Truth from Falsehood: Reducing Over-Refusal via Contrastive Refinement

O artigo apresenta o DCR (Discernment via Contrastive Refinement), um novo método de alinhamento que reduz o excesso de recusa em modelos de linguagem grandes, permitindo-lhes distinguir com precisão entre prompts verdadeiramente tóxicos e aqueles que apenas parecem ser, sem comprometer a segurança ou as capacidades gerais do modelo.

Yuxiao Lu, Lin Xu, Yang Sun + 2 more2026-03-05🤖 cs.AI

Controlling Chat Style in Language Models via Single-Direction Editing

Este artigo demonstra que atributos estilísticos em modelos de linguagem são codificados como direções lineares no espaço de ativação e propõe um método leve e sem treinamento para controlar com precisão esses estilos, permitindo composição linear e melhorando a segurança com custo computacional mínimo.

Zhenyu Xu, Victor S. Sheng2026-03-05🤖 cs.AI

IntPro: A Proxy Agent for Context-Aware Intent Understanding via Retrieval-conditioned Inference

O artigo apresenta o IntPro, um agente proxy que aprimora a compreensão de intenções sensíveis ao contexto em modelos de linguagem grandes, utilizando uma biblioteca de histórico de intenções recuperada e treinamento com otimização de política para adaptar-se aos padrões individuais dos usuários.

Guanming Liu, Meng Wu, Peng Zhang + 8 more2026-03-05🤖 cs.AI

Controllable and explainable personality sliders for LLMs at inference time

Este trabalho apresenta o Sequential Adaptive Steering (SAS), um framework modular que permite o controle contínuo e explicável de múltiplas traços de personalidade em Grandes Modelos de Linguagem durante a inferência, superando a interferência vetorial de métodos anteriores ao ortogonalizar vetores de direção para síntese precisa de perfis sem necessidade de re-treinamento.

Florian Hoppe, David Khachaturov, Robert Mullins + 1 more2026-03-05🤖 cs.AI

A benchmark for joint dialogue satisfaction, emotion recognition, and emotion state transition prediction

Este artigo apresenta a construção de um novo conjunto de dados chinês multilabel e multitarefa que suporta o reconhecimento de satisfação, reconhecimento de emoção e previsão de transição de estados emocionais em diálogos, superando as limitações de recursos existentes ao capturar a dinâmica emocional ao longo de múltiplas interações.

Jing Bian, Haoxiang Su, Liting Jiang + 6 more2026-03-05🤖 cs.AI

StructLens: A Structural Lens for Language Models via Maximum Spanning Trees

O artigo apresenta o StructLens, um novo framework analítico que utiliza árvores de expansão máxima para revelar e quantificar as relações estruturais globais entre camadas em modelos de linguagem, demonstrando que essa abordagem baseada em estrutura oferece uma métrica de similaridade distinta e mais eficaz para tarefas como a poda de camadas do que as métricas convencionais.

Haruki Sakajo, Frederikus Hudi, Yusuke Sakai + 2 more2026-03-05🤖 cs.AI

← Anterior Próximo →