cs.CL artigos | Gist.Science

Understanding and Mitigating Dataset Corruption in LLM Steering

Este estudo demonstra que, embora o direcionamento contrastivo em LLMs seja robusto a uma quantidade moderada de corrupção de dados, efeitos maliciosos podem ocorrer com frações significativas de dados alterados, mas que podem ser mitigados substituindo o cálculo de média padrão por um estimador de média robusto.

Cullen Anderson, Narmeen Oozeer, Foad Namjoo + 3 more2026-03-04💬 cs.CL

Density-Guided Response Optimization: Community-Grounded Alignment via Implicit Acceptance Signals

O artigo apresenta a Otimização de Resposta Guiada por Densidade (DGRO), um método que alinha modelos de linguagem às normas de comunidades diversas explorando a estrutura geométrica de aceitação implícita em seus dados, eliminando a necessidade de supervisão explícita de preferências.

Patrick Gerard, Svitlana Volkova2026-03-04💬 cs.CL

Using Learning Progressions to Guide AI Feedback for Science Learning

Este estudo demonstra que um pipeline de geração de rubricas baseado em progressões de aprendizagem pode produzir feedback de IA para explicações científicas de estudantes do ensino médio com qualidade comparável àquela obtida com rubricas elaboradas por especialistas humanos.

Xin Xia, Nejla Yuruk, Yun Wang + 1 more2026-03-04💬 cs.CL

Factuality Challenges in the Era of Large Language Models

Este artigo examina os desafios de facticidade e os riscos de desinformação apresentados pelos Grandes Modelos de Linguagem (LLMs), propondo soluções tecnológicas, regulatórias e educacionais para mitigar a disseminação de conteúdo enganoso na era da IA generativa.

Isabelle Augenstein, Timothy Baldwin, Meeyoung Cha + 15 more2026-03-03💬 cs.CL

Using ChatGPT for Data Science Analyses

Este artigo avalia o potencial do ChatGPT como copiloto quantitativo em fluxos de trabalho de ciência de dados, demonstrando suas capacidades em exploração, visualização e modelagem supervisionada e não supervisionada, ao mesmo tempo em que destaca a necessidade de considerar cuidadosamente suas limitações.

Ozan Evkaya, Miguel de Carvalho2026-03-03📊 stat

Large Language Model Agent in Financial Trading: A Survey

Esta pesquisa oferece uma revisão abrangente sobre o uso de agentes de modelos de linguagem grandes (LLMs) em negociações financeiras, analisando suas arquiteturas, dados de entrada, desempenho em testes retrospectivos e os desafios atuais, com o objetivo de mapear o estado da arte e orientar futuras direções de pesquisa.

Han Ding, Yinheng Li, Junhao Wang + 3 more2026-03-03💬 cs.CL

Scaling Knowledge Graph Construction through Synthetic Data Generation and Distillation

O artigo apresenta o SynthKG, um pipeline de síntese de dados que gera pares documento-grafo de alta qualidade para treinar modelos menores via destilação (Distill-SynthKG), superando métodos baseados em LLMs maiores na construção de grafos de conhecimento e melhorando significativamente tarefas de recuperação e resposta a perguntas.

Prafulla Kumar Choubey, Xin Su, Man Luo + 9 more2026-03-03💬 cs.CL

Polynomial, trigonometric, and tropical activations

Este artigo demonstra que funções de ativação baseadas em bases ortonormais, como polinômios de Hermite, trigonometria e tropicalização, podem ser utilizadas com sucesso no treinamento de modelos profundos sem mecanismos de clamping, resolvendo problemas de explosão e desaparecimento de gradientes e permitindo aproximações eficientes para ajuste fino.

Ismail Khalfaoui-Hassani, Stefan Kesselheim2026-03-03💬 cs.CL

AStar: Boosting Multimodal Reasoning with Automated Structured Thinking

O artigo apresenta o AStar, uma metodologia de raciocínio multimodal livre de treinamento que utiliza "cartões de pensamento" recuperados automaticamente para estruturar o raciocínio do modelo, superando a eficiência e a precisão de métodos baseados em busca ou pós-treinamento, como demonstrado por resultados superiores ao GPT-4o em tarefas complexas de matemática e visão.

Jinyang Wu, Mingkuan Feng, Guocheng Zhai + 7 more2026-03-03💬 cs.CL

Enhancing Hallucination Detection through Noise Injection

Este trabalho propõe uma abordagem simples e sem treinamento que melhora significativamente a detecção de alucinações em Grandes Modelos de Linguagem ao injetar ruído nos parâmetros ou ativações do modelo durante a amostragem, superando os métodos de amostragem padrão ao incorporar melhor a incerteza do modelo no sentido bayesiano.

Litian Liu, Reza Pourreza, Sunny Panchal + 4 more2026-03-03💬 cs.CL

LLM-ProS: Analyzing Large Language Models' Performance in Competitive Problem Solving

Este artigo apresenta o LLM-ProS, uma nova técnica de avaliação que analisa o desempenho de modelos de linguagem de última geração na resolução de problemas do ICPC, revelando diferenças significativas em suas capacidades de raciocínio, precisão e generalização.

Md Sifat Hossain, Anika Tabassum, Md. Fahim Arefin + 1 more2026-03-03💬 cs.CL

Robust Adaptation of Large Multimodal Models for Retrieval Augmented Hateful Meme Detection

Este artigo propõe um quadro de adaptação robusto para Modelos Multimodais de Grande Escala que supera as limitações de métodos existentes, alcançando desempenho superior e maior generalização na detecção de memes de ódio, ao mesmo tempo que preserva as capacidades gerais do modelo e melhora a interpretabilidade através de explicações de alta qualidade.

Jingbiao Mei, Jinghong Chen, Guangyu Yang + 2 more2026-03-03💬 cs.CL

MemeIntel: Explainable Detection of Propagandistic and Hateful Memes

O artigo apresenta o MemeIntel, um novo conjunto de dados explicativo e uma abordagem de otimização multiestágio com modelos de visão e linguagem que superam o estado da arte na detecção de memes propagandísticos em árabe e de discurso de ódio em inglês, ao mesmo tempo que geram justificativas para suas previsões.

Mohamed Bayan Kmainasi, Abul Hasnat, Md Arid Hasan + 2 more2026-03-03💬 cs.CL

Rewarding Doubt: A Reinforcement Learning Approach to Calibrated Confidence Expression of Large Language Models

Este artigo propõe uma abordagem inovadora de Aprendizado por Reforço que ajusta finamente Grandes Modelos de Linguagem para expressar estimativas de confiança calibradas junto às suas respostas, integrando a calibração ao processo generativo e demonstrando melhorias significativas na precisão e generalização sem necessidade de ajuste adicional.

David Bani-Harouni, Chantal Pellegrini, Paul Stangel + 4 more2026-03-03💬 cs.CL

Not-Just-Scaling Laws: Towards a Better Understanding of the Downstream Impact of Language Model Design Decisions

Este artigo apresenta uma meta-análise de 92 modelos de linguagem que demonstra que incorporar decisões de design, como a composição dos dados e escolhas arquiteturais, melhora significativamente a previsão do desempenho downstream em comparação com o uso exclusivo da escala do modelo.

Emmy Liu, Amanda Bertsch, Lintang Sutawika + 9 more2026-03-03💬 cs.CL

Large Language Models in Bioinformatics: A Survey

Esta pesquisa oferece uma revisão sistemática sobre como os Modelos de Linguagem de Grande Escala (LLMs) estão revolucionando a bioinformática ao analisar dados genômicos e proteicos, abordando desafios atuais e explorando futuras aplicações clínicas e multimodais.

Zhenyu Wang, Zikang Wang, Jiyue Jiang + 3 more2026-03-03🧬 q-bio

LLaVE: Large Language and Vision Embedding Models with Hardness-Weighted Contrastive Learning

O artigo apresenta o LLaVE, um modelo de incorporação multimodal que supera o estado da arte ao utilizar aprendizado contrastivo ponderado por dificuldade para melhorar a distinção de pares negativos, alcançando desempenho superior com maior eficiência e generalização zero-shot.

Zhibin Lan, Liqiang Niu, Fandong Meng + 2 more2026-03-03💬 cs.CL

Vision-R1: Incentivizing Reasoning Capability in Multimodal Large Language Models

O artigo apresenta o Vision-R1, um modelo de linguagem multimodal que aprimora o raciocínio complexo por meio de aprendizado por reforço, utilizando um conjunto de dados de cadeia de pensamento gerado automaticamente e uma estratégia de supressão progressiva do pensamento excessivo para alcançar desempenho competitivo em benchmarks matemáticos.

Wenxuan Huang, Bohan Jia, Zijie Zhai + 7 more2026-03-03💬 cs.CL

I Predict Therefore I Am: Is Next Token Prediction Enough to Learn Human-Interpretable Concepts from Data?

Este artigo apresenta um modelo teórico que demonstra que a previsão do próximo token em LLMs permite aprender conceitos latentes discretos interpretáveis por humanos, provando que suas representações correspondem aproximadamente aos logaritmos das probabilidades posteriores desses conceitos e oferecendo uma base teórica unificada para entender a hipótese de representações lineares e avaliar autoencoders esparsos.

Yuhang Liu, Dong Gong, Yichao Cai + 6 more2026-03-03💬 cs.CL

A Foundational Individual Mobility Prediction Model based on Open-Source Large Language Models

Este artigo apresenta o MoBLLM, um modelo fundamental de previsão de mobilidade individual baseado em modelos de linguagem grandes (LLM) de código aberto e técnicas de ajuste fino eficientes em parâmetros, que supera os métodos tradicionais em precisão, robustez e transferabilidade entre diferentes contextos espaciais e temporais, oferecendo uma solução custo-eficiente para serviços de transporte personalizados.

Zhenlin Qin, Leizhen Wang, Yancheng Ling + 2 more2026-03-03💬 cs.CL

← Anterior Próximo →