cs.IR artigos | Gist.Science

One Model Is Enough: Native Retrieval Embeddings from LLM Agent Hidden States

Este artigo propõe um método que capacita agentes de LLM a realizar recuperação nativa de conhecimento diretamente a partir de seus estados ocultos, eliminando a necessidade de um modelo de incorporação separado e mantendo 97% da qualidade de recuperação original.

Bo JiangTue, 10 Ma💬 cs.CL

OfficeQA Pro: An Enterprise Benchmark for End-to-End Grounded Reasoning

O artigo apresenta o OfficeQA Pro, um novo benchmark que avalia a capacidade de agentes de IA de realizar raciocínio fundamentado em grandes corpora de documentos heterogêneos, revelando que os modelos de ponta atuais ainda apresentam desempenho insuficiente para aplicações empresariais confiáveis, embora representações estruturadas de documentos possam melhorar significativamente sua precisão.

Krista Opsahl-Ong, Arnav Singhvi, Jasmine Collins, Ivan Zhou, Cindy Wang, Ashutosh Baheti, Owen Oertell, Jacob Portes, Sam Havens, Erich Elsen, Michael Bendersky, Matei Zaharia, Xing ChenTue, 10 Ma💬 cs.CL

Explainability of Text Processing and Retrieval Methods: A Survey

Este artigo oferece uma visão abrangente das pesquisas sobre explicabilidade e interpretabilidade em métodos de processamento de linguagem natural e recuperação de informação, abordando desde embeddings de palavras e modelos de atenção até transformers e BERT, além de sugerir direções futuras para o campo.

Sourav Saha, Debapriyo Majumdar, Mandar MitraThu, 12 Ma💬 cs.CL

Taming the Long Tail: Denoising Collaborative Information for Robust Semantic ID Generation

O artigo propõe o ADC-SID, um quadro que melhora a geração robusta de IDs semânticos em sistemas de recomendação ao adaptar a alinhamento entre comportamento e conteúdo e ponderar dinamicamente os IDs comportamentais para filtrar o ruído colaborativo, especialmente em itens de cauda longa.

Yi Xu, Moyu Zhang, Chaofan Fan, Jinxin Hu, Xiaochen Li, Yu Zhang, Xiaoyi Zeng, Jing ZhangThu, 12 Ma💻 cs

Intuition First or Reflection Before Judgment? The Impact of Evaluation Sequence on Consumer Ratings

Este estudo demonstra que a sequência de avaliação ("Avaliar Primeiro" versus "Escrever a Análise Primeiro") polariza as classificações dos consumidores, aumentando-as em serviços de alta qualidade e diminuindo-as em serviços de baixa qualidade, um efeito mediado por heurísticas afetivas e esforço cognitivo que é amplificado em produtos hedônicos e confirmado por dados reais de plataformas como Yelp e Letterboxd.

He Wang, Yueheng Wang, Ziyu Zhou, Hanxiang LiuThu, 12 Ma💻 cs

Does Reasoning Make Search More Fair? Comparing Fairness in Reasoning and Non-Reasoning Rerankers

O estudo compara sistematicamente a justiça entre rerankers com e sem raciocínio, descobrindo que os modelos de raciocínio não melhoram nem prejudicam a equidade em comparação com abordagens tradicionais, mantendo as características de justiça da classificação de entrada.

Saron Samuel, Benjamin Van Durme, Eugene YangThu, 12 Ma🤖 cs.AI

Beyond Interleaving: Causal Attention Reformulations for Generative Recommender Systems

Este trabalho propõe uma reformulação causal para Sistemas de Recomendação Generativos, introduzindo as arquiteturas AttnLFA e AttnMVP que eliminam a intercalação ineficiente de tokens para reduzir a complexidade sequencial e o tempo de treinamento, enquanto superam consistentemente as abordagens atuais em desempenho e eficiência.

Hailing ChengThu, 12 Ma🤖 cs.AI

Differentiable Geometric Indexing for End-to-End Generative Retrieval

O artigo propõe o "Differentiable Geometric Indexing" (DGI), uma abordagem de recuperação generativa que resolve conflitos de otimização e geométricos ao unificar a indexação diferenciável via *Soft Teacher Forcing* e otimização isotrópica em hipersfera, superando métodos existentes e demonstrando maior robustez em cenários de cauda longa.

Xujing Wang, Yufeng Chen, Boxuan Zhang, Jie Zhao, Chao Wei, Cai Xu, Ziyu Guan, Wei Zhao, Weiru Zhang, Xiaoyi ZengThu, 12 Ma💻 cs

Modeling Stage-wise Evolution of User Interests for News Recommendation

O artigo propõe um quadro unificado para recomendação de notícias que modela a evolução dos interesses do usuário em estágios, combinando a modelagem de preferências de longo prazo com a análise de dinâmicas de curto prazo em subgrafos temporais para superar as limitações dos métodos estáticos existentes.

Zhiyong Cheng, Yike Jin, Zhijie Zhang, Huilin Chen, Zhangling Duan, Meng WangThu, 12 Ma🤖 cs.AI

Trajectory-Informed Memory Generation for Self-Improving Agent Systems

Este artigo apresenta um novo framework para agentes autônomos que melhora o desempenho futuro ao extrair automaticamente aprendizados estruturados de trajetórias de execução e recuperá-los contextualmente, resultando em ganhos significativos na conclusão de tarefas complexas.

Gaodan Fang, Vatche Isahagian, K. R. Jayaram, Ritesh Kumar, Vinod Muthusamy, Punleuk Oum, Gegi ThomasThu, 12 Ma🤖 cs.AI

A Hypergraph-Based Framework for Exploratory Business Intelligence

O artigo apresenta o ExBI, um sistema inovador baseado em hipergrafos que supera as limitações da Inteligência de Negócios tradicional ao permitir a evolução dinâmica de esquemas e a reutilização de visões materializadas, alcançando acelerações significativas de desempenho e alta precisão em workflows exploratórios de grande escala.

Yunkai Lou, Shunyang Li, Longbin Lai, Jianke Yu, Wenyuan Yu, Ying ZhangThu, 12 Ma💻 cs

Breaking User-Centric Agency: A Tri-Party Framework for Agent-Based Recommendation

Este trabalho propõe o TriRec, um novo framework de recomendação baseado em agentes de LLM que coordena a utilidade do usuário, a exposição dos itens e a justiça da plataforma em duas etapas, demonstrando que a autopromoção dos itens pode simultaneamente melhorar a precisão e a equidade, superando o compromisso tradicional entre relevância e justiça.

Yaxin Gong, Chongming Gao, Chenxiao Fan, Wenjie Wang, Fuli Feng, Xiangnan HeThu, 12 Ma💻 cs

Structured Linked Data as a Memory Layer for Agent-Orchestrated Retrieval

Este artigo demonstra que o uso de dados estruturados vinculados, especificamente através de páginas de entidades otimizadas com instruções para agentes e interligação neural, melhora significativamente a precisão e a qualidade das respostas em sistemas de Geração Aumentada por Recuperação (RAG) padrão e orientados a agentes, superando abordagens baseadas apenas em texto plano ou metadados JSON-LD simples.

Andrea Volpini, Elie Raad, Beatrice Gamba, David RiccitelliThu, 12 Ma🤖 cs.AI

RAGPerf: An End-to-End Benchmarking Framework for Retrieval-Augmented Generation Systems

O artigo apresenta o RAGPerf, um framework de benchmarking de ponta a ponta que modulariza e avalia o desempenho e a precisão de sistemas de Geração Aumentada por Recuperação (RAG), suportando diversos componentes, dados e métricas com sobrecarga negligenciável.

Shaobo Li, Yirui Zhou, Yuan Xu, Kevin Chen, Daniel Waddington, Swaminathan Sundararaman, Hubertus Franke, Jian HuangThu, 12 Ma💻 cs

Interpretable Chinese Metaphor Identification via LLM-Assisted MIPVU Rule Script Generation: A Comparative Protocol Study

Este estudo apresenta um pipeline assistido por LLM que converte quatro protocolos de identificação de metáforas em scripts de regras executáveis e auditáveis, demonstrando que a escolha do protocolo é a principal fonte de variação nos resultados e que essa abordagem garante transparência total e desempenho competitivo na identificação de metáforas em chinês.

Weihang Huang, Mengna LiuThu, 12 Ma💬 cs.CL

An Extreme Multi-label Text Classification (XMTC) Library Dataset: What if we took "Use of Practical AI in Digital Libraries" seriously?

Este artigo apresenta um novo corpus bilíngue (inglês/alemão) e uma taxonomia de arquivo de autoridade (GND) para treinar e avaliar sistemas de classificação de texto multi-rótulo, visando aprimorar a indexação e o trabalho dos catalogadores em bibliotecas digitais por meio de IA transparente e baseada em autoridade.

Jennifer D'Souza, Sameer Sadruddin, Maximilian Kähler, Andrea Salfinger, Luca Zaccagna, Francesca Incitti, Lauro Snidaro, Osma SuominenThu, 12 Ma💬 cs.CL

A Hybrid Knowledge-Grounded Framework for Safety and Traceability in Prescription Verification

O artigo apresenta o PharmGraph-Auditor, um sistema híbrido que combina uma Base de Conhecimento Farmacêutico (HPKB) com um paradigma de Verificação em Cadeia (CoV) para transformar modelos de linguagem em motores de raciocínio transparentes e baseados em evidências, visando aumentar a segurança e a rastreabilidade na verificação de prescrições médicas.

Yichi Zhu, Kan Ling, Xu Liu, Hengrun Zhang, Huiqun Yu, Guisheng FanThu, 12 Ma🤖 cs.AI

A Systematic Study of Pseudo-Relevance Feedback with LLMs

Este estudo sistematiza o impacto das fontes e modelos de feedback na eficácia do Feedback de Relevância Pseudo (PRF) com LLMs, demonstrando que a escolha do modelo de feedback é crítica e que a melhor estratégia depende do uso de texto gerado pelo LLM ou de documentos recuperados, conforme a força do recuperador inicial.

Nour Jedidi, Jimmy LinThu, 12 Ma💬 cs.CL

LLMGreenRec: LLM-Based Multi-Agent Recommender System for Sustainable E-Commerce

O artigo apresenta o LLMGreenRec, um novo sistema de recomendação baseado em agentes múltiplos e modelos de linguagem (LLMs) que promove o consumo sustentável ao identificar intenções ecológicas dos usuários e reduzir a pegada de carbono digital, preenchendo a lacuna entre a intenção verde e a ação no comércio eletrônico.

Hao N. Nguyen, Hieu M. Nguyen, Son Van Nguyen, Nguyen Thi HanhThu, 12 Ma💻 cs

Chasing RATs: Tracing Reading for and as Creative Activity

O artigo propõe as "Rastros de Atividade de Leitura" (RATs), uma abordagem que trata a leitura como uma atividade criativa por si só e para futuros artefatos, tornando visível o trabalho interpretativo que está sendo automatizado e comprimido por feeds algorítmicos e resumos de IA, ilustrado através de uma instância especulativa na Wikipedia chamada WikiRAT.

Sophia Liu, Shm Garanganao AlmedaThu, 12 Ma💻 cs

← Anterior Próximo →