cs.IR Arbeiten | Gist.Science

One Model Is Enough: Native Retrieval Embeddings from LLM Agent Hidden States

Die vorgestellte Methode eliminiert die Notwendigkeit separater Embedding-Modelle für LLM-Agenten, indem sie einen leichten Projektionskopf verwendet, um versteckte Zustände direkt in den Embedding-Raum zu projizieren, und erreicht dabei 97 % der ursprünglichen Suchqualität.

Bo JiangTue, 10 Ma💬 cs.CL

OfficeQA Pro: An Enterprise Benchmark for End-to-End Grounded Reasoning

Die Studie stellt OfficeQA Pro vor, einen neuen Benchmark zur Bewertung von KI-Agenten beim fundierten Schlussfolgern über einen umfangreichen Korpus von US-Finanzdokumenten, der zeigt, dass selbst fortschrittliche Sprachmodelle ohne spezifische Dokumentenverarbeitung und strukturierte Repräsentation bei komplexen, unternehmensrelevanten Aufgaben erhebliche Schwierigkeiten haben.

Krista Opsahl-Ong, Arnav Singhvi, Jasmine Collins, Ivan Zhou, Cindy Wang, Ashutosh Baheti, Owen Oertell, Jacob Portes, Sam Havens, Erich Elsen, Michael Bendersky, Matei Zaharia, Xing ChenTue, 10 Ma💬 cs.CL

Explainability of Text Processing and Retrieval Methods: A Survey

Dieser Übersichtsartikel beleuchtet verschiedene Forschungsansätze zur Erklärbarkeit und Interpretierbarkeit von Deep-Learning-Modellen im Bereich der Textverarbeitung und Informationsrückgewinnung, mit einem Fokus auf Methoden wie Wort-Embeddings, Transformer und BERT, und schließt mit Vorschlägen für zukünftige Forschungsrichtungen.

Sourav Saha, Debapriyo Majumdar, Mandar MitraThu, 12 Ma💬 cs.CL

Taming the Long Tail: Denoising Collaborative Information for Robust Semantic ID Generation

Die Arbeit stellt ADC-SID vor, ein Framework zur adaptiven Entfilterung von kollaborativen Informationen für die Generierung semantischer IDs, das durch eine adaptive Ausrichtung von Verhalten und Inhalt sowie eine dynamische Gewichtung verhaltensbasierter IDs die Rauschproblematik bei Langschwanzelementen in Empfehlungssystemen effektiv adressiert.

Yi Xu, Moyu Zhang, Chaofan Fan, Jinxin Hu, Xiaochen Li, Yu Zhang, Xiaoyi Zeng, Jing ZhangThu, 12 Ma💻 cs

Intuition First or Reflection Before Judgment? The Impact of Evaluation Sequence on Consumer Ratings

Die Studie zeigt, dass die Reihenfolge der Bewertung (zunächst Sterne oder Text) die Urteilsbildung von Verbrauchern durch affektive Heuristiken und kognitiven Aufwand polarisiert, wobei dieser Effekt je nach Servicequalität und Produktart variiert und durch große Datenanalysen von Yelp und Letterboxd bestätigt wird.

He Wang, Yueheng Wang, Ziyu Zhou, Hanxiang LiuThu, 12 Ma💻 cs

Does Reasoning Make Search More Fair? Comparing Fairness in Reasoning and Non-Reasoning Rerankers

Die Studie zeigt, dass reasoning-basierte Reranker im Vergleich zu herkömmlichen Ansätzen weder die Fairness in Suchergebnissen verbessern noch verschlechtern, sondern deren Fairness-Eigenschaften aus dem Eingangsranking weitgehend unverändert übernehmen.

Saron Samuel, Benjamin Van Durme, Eugene YangThu, 12 Ma🤖 cs.AI

Beyond Interleaving: Causal Attention Reformulations for Generative Recommender Systems

Die Arbeit stellt zwei neue Architekturen, AttnLFA und AttnMVP, vor, die durch die Beseitigung ineffizienter Interleaving-Mechanismen und die explizite Modellierung kausaler Abhängigkeiten zwischen Artikeln und Aktionen die Effizienz und Leistung von generativen Empfehlungssystemen signifikant steigern.

Hailing ChengThu, 12 Ma🤖 cs.AI

Differentiable Geometric Indexing for End-to-End Generative Retrieval

Die Arbeit stellt Differentiable Geometric Indexing (DGI) vor, einen Ansatz zur Lösung von Optimierungsblockaden und geometrischen Konflikten im generativen Retrieval durch operative Vereinheitlichung und isotrope geometrische Optimierung, der auf großen Datensätzen überlegene Ergebnisse, insbesondere bei Long-Tail-Items, erzielt.

Xujing Wang, Yufeng Chen, Boxuan Zhang, Jie Zhao, Chao Wei, Cai Xu, Ziyu Guan, Wei Zhao, Weiru Zhang, Xiaoyi ZengThu, 12 Ma💻 cs

Modeling Stage-wise Evolution of User Interests for News Recommendation

Die vorgestellte Arbeit schlägt ein einheitliches Framework vor, das durch die Kombination globaler Langzeitpräferenzen und lokaler, stufenweiser temporaler Subgraphen mit LSTM- und Self-Attention-Komponenten die dynamische Entwicklung von Nutzerinteressen für eine zeitnahe und relevantere Nachrichtenempfehlung modelliert.

Zhiyong Cheng, Yike Jin, Zhijie Zhang, Huilin Chen, Zhangling Duan, Meng WangThu, 12 Ma🤖 cs.AI

Trajectory-Informed Memory Generation for Self-Improving Agent Systems

Die Arbeit stellt einen neuen Rahmen vor, der durch die semantische Analyse von Agenten-Executionspfaden und die Generierung kontextspezifischer Lernhinweise die Fähigkeit von LLM-Agenten zur Selbstverbesserung durch gezieltes Abrufen von Erfahrungswissen signifikant steigert.

Gaodan Fang, Vatche Isahagian, K. R. Jayaram, Ritesh Kumar, Vinod Muthusamy, Punleuk Oum, Gegi ThomasThu, 12 Ma🤖 cs.AI

A Hypergraph-Based Framework for Exploratory Business Intelligence

Die Arbeit stellt ExBI vor, ein neues System, das mithilfe eines Hypergraphen-Datenmodells und sampling-basierter Algorithmen die Grenzen traditioneller Business-Intelligence-Systeme überwindet, indem es dynamische Schemata ermöglicht und bei gleichbleibend hoher Genauigkeit signifikante Geschwindigkeitsvorteile gegenüber etablierten Datenbanken wie Neo4j und MySQL erzielt.

Yunkai Lou, Shunyang Li, Longbin Lai, Jianke Yu, Wenyuan Yu, Ying ZhangThu, 12 Ma💻 cs

Breaking User-Centric Agency: A Tri-Party Framework for Agent-Based Recommendation

Die Arbeit stellt TriRec vor, ein bahnbrechendes Drei-Parteien-Framework für agentenbasierte Empfehlungssysteme, das durch die Koordination von Nutzerbedürfnissen, Item-Exposition und Plattform-Fairness mittels LLM-Agenten sowohl die Genauigkeit als auch die Fairness verbessert und dabei das traditionelle Zielkonflikt-Paradigma zwischen Relevanz und Fairness in Frage stellt.

Yaxin Gong, Chongming Gao, Chenxiao Fan, Wenjie Wang, Fuli Feng, Xiangnan HeThu, 12 Ma💻 cs

Structured Linked Data as a Memory Layer for Agent-Orchestrated Retrieval

Die Studie zeigt, dass die Integration von strukturierten Linked-Data-Elementen wie Schema.org-Markup und agentenoptimierten Entitätsseiten die Genauigkeit und Vollständigkeit von Retrieval-Augmented-Generation-Systemen im Vergleich zu reinem Fließtext erheblich verbessert.

Andrea Volpini, Elie Raad, Beatrice Gamba, David RiccitelliThu, 12 Ma🤖 cs.AI

RAGPerf: An End-to-End Benchmarking Framework for Retrieval-Augmented Generation Systems

Das Paper stellt RAGPerf vor, ein Open-Source-Framework zur umfassenden End-to-End-Leistungsbewertung von Retrieval-Augmented-Generation-Systemen, das durch modulare Komponenten, flexible Konfiguration und automatisierte Metrikenerfassung detaillierte Analysen ermöglicht, ohne nennenswerten Overhead zu verursachen.

Shaobo Li, Yirui Zhou, Yuan Xu, Kevin Chen, Daniel Waddington, Swaminathan Sundararaman, Hubertus Franke, Jian HuangThu, 12 Ma💻 cs

Interpretable Chinese Metaphor Identification via LLM-Assisted MIPVU Rule Script Generation: A Comparative Protocol Study

Diese Studie stellt einen interpretierbaren, LLM-gestützten Ansatz zur Identifizierung chinesischer Metaphern vor, der verschiedene Protokolle als ausführbare Regel-Skripte operationalisiert und zeigt, dass die Wahl des Protokolls die größte Variationsquelle darstellt, während gleichzeitig vollständige Transparenz und reproduzierbare Begründungen gewährleistet werden.

Weihang Huang, Mengna LiuThu, 12 Ma💬 cs.CL

An Extreme Multi-label Text Classification (XMTC) Library Dataset: What if we took "Use of Practical AI in Digital Libraries" seriously?

Diese Arbeit stellt ein großes zweisprachiges Korpus mit Katalogdatensätzen und einer maschinenlesbaren GND-Taxonomie vor, um ontologiebewusste Multi-Label-Klassifikation und agentengestützte Katalogisierung zu ermöglichen, wobei die Evaluierung nicht nur die Genauigkeit, sondern auch den praktischen Nutzen und die Transparenz von KI-Systemen für Bibliothekare in den Vordergrund stellt.

Jennifer D'Souza, Sameer Sadruddin, Maximilian Kähler, Andrea Salfinger, Luca Zaccagna, Francesca Incitti, Lauro Snidaro, Osma SuominenThu, 12 Ma💬 cs.CL

A Hybrid Knowledge-Grounded Framework for Safety and Traceability in Prescription Verification

Die Arbeit stellt PharmGraph-Auditor vor, ein hybrides System, das eine vertrauenswürdige pharmazeutische Wissensbasis und eine evidenzbasierte Verifikationskette nutzt, um die Sicherheit und Nachvollziehbarkeit bei der Arzneimittelverifikation durch Apotheker zu gewährleisten und dabei die Grenzen von reinen Sprachmodellen zu überwinden.

Yichi Zhu, Kan Ling, Xu Liu, Hengrun Zhang, Huiqun Yu, Guisheng FanThu, 12 Ma🤖 cs.AI

A Systematic Study of Pseudo-Relevance Feedback with LLMs

Diese Studie analysiert systematisch den Einfluss von Feedback-Quelle und Feedback-Modell auf die Wirksamkeit von Pseudo-Relevance-Feedback mit großen Sprachmodellen und zeigt, dass die Wahl des Feedback-Modells entscheidend ist, wobei LLM-generierter Text die kosteneffizienteste Lösung darstellt, während Korpus-basiertes Feedback bei starken Erststufen-Retrievern am vorteilhaftesten ist.

Nour Jedidi, Jimmy LinThu, 12 Ma💬 cs.CL

LLMGreenRec: LLM-Based Multi-Agent Recommender System for Sustainable E-Commerce

Die Arbeit stellt LLMGreenRec vor, ein neuartiges Multi-Agenten-System auf Basis von Large Language Models, das durch die Analyse von Nutzerabsichten nachhaltige Produktempfehlungen für den E-Commerce generiert und gleichzeitig den digitalen CO₂-Fußabdruck minimiert.

Hao N. Nguyen, Hieu M. Nguyen, Son Van Nguyen, Nguyen Thi HanhThu, 12 Ma💻 cs

Chasing RATs: Tracing Reading for and as Creative Activity

Die Arbeit stellt „Reading Activity Traces" (RATs) vor, ein Konzept, das Lesen als eigenständige kreative Tätigkeit begreift und durch die Sichtbarmachung von Lese- und Interpretationspfaden – exemplarisch am WikiRAT-Projekt – den Verlust menschlicher Deutungsarbeit angesichts zunehmender Automatisierung durch Algorithmen und KI adressiert.

Sophia Liu, Shm Garanganao AlmedaThu, 12 Ma💻 cs

← Zurück Weiter →