cs.IR Arbeiten | Gist.Science

ThinkQE: Query Expansion via an Evolving Thinking Process

Das Paper stellt ThinkQE vor, ein Testzeit-Query-Expansion-Framework, das durch einen denkenden Expansionsprozess und eine iterative Korpus-Interaktion die Vielfalt und Tiefe von Suchanfragen verbessert und dabei bestehende LLM-Methoden sowie trainierte Retrieval-Systeme auf verschiedenen Web-Such-Benchmarks übertrifft.

Yibin Lei, Tao Shen, Andrew YatesWed, 11 Ma💬 cs.CL

TaoSR1: The Thinking Model for E-commerce Relevance Search

Der Artikel stellt TaoSR1 vor, ein dreistufiges Framework, das Large Language Models durch Supervised Fine-Tuning mit Chain-of-Thought, Direct Preference Optimization und Group Relative Policy Optimization direkt für die E-Commerce-Relevanzsuche einsetzt, um komplexe Schlussfolgerungen zu ermöglichen und dabei Halluzinationen zu minimieren sowie eine effiziente Online-Bereitstellung zu gewährleisten.

Chenhe Dong, Shaowei Yao, Pengkun Jiao, Jianhui Yang, Yiming Jin, Zerui Huang, Xiaojiang Zhou, Dan Ou, Haihong Tang, Bo ZhengWed, 11 Ma🤖 cs.AI

Enhancing Retrieval-Augmented Generation with Entity Linking for Educational Platforms

Diese Studie stellt ELERAG vor, eine für den Bildungssektor optimierte Retrieval-Augmented-Generation-Architektur, die durch die Integration von Entity Linking und einer hybriden Neuordnung auf Basis von Reciprocal Rank Fusion die faktenbasierte Genauigkeit bei der Beantwortung von Fragen auf Italienisch in domänenspezifischen Kontexten signifikant verbessert.

Francesco Granata, Francesco Poggi, Misael MongiovìWed, 11 Ma🤖 cs.AI

MCGI: Manifold-Consistent Graph Indexing for Billion-Scale Disk-Resident Vector Search

Die Arbeit stellt MCGI vor, eine geometrieaware Methode zur diskbasierten Vektorsuche, die durch die dynamische Anpassung der Suchstrategie an die lokale intrinsische Dimensionalität die Leistung von Approximate Nearest Neighbor-Suchen in hochdimensionalen Räumen erheblich verbessert und dabei die Abhängigkeit von statischen Hyperparametern eliminiert.

Dongfang ZhaoWed, 11 Ma🤖 cs.AI

Scaling Multilingual Semantic Search in Uber Eats Delivery

Dieses Paper stellt ein produktionsreifes semantisches Suchsystem für Uber Eats vor, das durch Feinabstimmung eines Qwen2-Modells auf großen Datensätzen, den Einsatz von Matryoshka-Repräsentationslernen und eine kombinierte Verlustfunktion eine einheitliche und mehrsprachige Suche über Restaurants, Gerichte und Lebensmittelgeschäfte hinweg ermöglicht und dabei die Rückrufquote in mehreren Märkten signifikant verbessert.

Bo Ling, Zheng Liu, Haoyang Chen, Divya Nagar, Luting Yang, Mehul ParsanaWed, 11 Ma💻 cs

Time warping with Hellinger elasticity

Der Artikel stellt einen Algorithmus zur elastischen Zeitverzerrung für Zeitreihen in beliebigen metrischen Räumen vor, der eine optimale Zuordnung unter Verwendung eines Hellinger-Kerns als Strafterm für die Streckung ermöglicht und dabei eine kubische Rechenkomplexität aufweist.

Yuly BilligWed, 11 Ma💻 cs

Beyond Relevance: On the Relationship Between Retrieval and RAG Information Coverage

Die Studie zeigt, dass abdeckungsorientierte Suchmetriken verlässliche Frühindikatoren für die Informationsabdeckung in RAG-Systemen sind, insbesondere wenn die Suchziele mit den Generierungszielen übereinstimmen, wobei komplexe iterative Pipelines diese Abhängigkeit teilweise aufheben können.

Saron Samuel, Alexander Martin, Eugene Yang, Andrew Yates, Dawn Lawrie, Ian Soborof, Laura Dietz, Benjamin Van DurmeWed, 11 Ma🤖 cs.AI

Quantifying Uncertainty in AI Visibility: A Statistical Framework for Generative Search Measurement

Diese Studie zeigt, dass die Sichtbarkeit von Domänen in generativen Suchmaschinen aufgrund ihrer inhärenten Nichtdeterministik erheblichen Schwankungen unterliegt und daher anstelle von einzelnen Punktwerten statistisch fundierte Unsicherheitsschätzungen und Konfidenzintervalle erfordert, um aussagekräftige Vergleiche zu ermöglichen.

Ronald SielinskiWed, 11 Ma🤖 cs.AI

Interpretable Markov-Based Spatiotemporal Risk Surfaces for Missing-Child Search Planning with Reinforcement Learning and LLM-Based Quality Assurance

Das Paper stellt „Guardian" vor, ein interpretierbares, dreischichtiges Entscheidungssystem, das mithilfe von Markov-Ketten, Reinforcement Learning und LLM-basierter Qualitätsprüfung aus unstrukturierten Daten dynamische Suchpläne für vermisste Kinder innerhalb der ersten 72 Stunden erstellt.

Joshua Castillo, Ravi MukkamalaWed, 11 Ma🤖 cs.AI

PathoScribe: Transforming Pathology Data into a Living Library with a Unified LLM-Driven Framework for Semantic Retrieval and Clinical Integration

Die Studie stellt PathoScribe vor, ein einheitliches Framework auf Basis von Retrieval-Augmented Large Language Models, das statische Pathologie-Archive in eine interaktive Wissensdatenbank verwandelt und durch Funktionen wie semantische Suche, automatische Kohortenbildung sowie klinische Fragebeantwortung die Diagnoseunterstützung und Forschungseffizienz erheblich steigert.

Abdul Rehman Akbar, Samuel Wales-McGrath, Alejadro Levya, Lina Gokhale, Rajendra Singh, Wei Chen, Anil Parwani, Muhammad Khalid Khan NiaziWed, 11 Ma🤖 cs.AI

A Consensus-Driven Multi-LLM Pipeline for Missing-Person Investigations

Die Arbeit stellt Guardian vor, ein konsensgesteuertes Multi-LLM-System mit QLoRA-Feinabstimmung, das spezialisierte Modelle und einen Konsens-Engine koordiniert, um die Informationsgewinnung und Suchplanung bei Vermisstenfällen in den kritischen ersten 72 Stunden zu unterstützen.

Joshua Castillo, Ravi MukkamalaWed, 11 Ma🤖 cs.AI

Unlocking High-Fidelity Analog Joint Source-Channel Coding on Standard Digital Transceivers

Die Arbeit stellt D2AJSCC vor, ein Framework, das die Implementierung hochauflösender analoger Joint Source-Channel Coding auf Standard-Digital-Transceivern ermöglicht, indem es die OFDM-Struktur zur Wellenformsynthese nutzt und ein differenzierbares ProxyNet für das End-to-End-Training bereitstellt, um so eine nahtlose semantische Kommunikation ohne Hardwareänderungen zu realisieren.

Shumin Yao, Hao Chen, Yaping Sun, Nan Ma, Xiaodong Xu, Qinglin Zhao, Shuguang CuiWed, 11 Ma🔢 math

From Verification to Amplification: Auditing Reverse Image Search as Algorithmic Gatekeeping in Visual Misinformation Fact-checking

Diese Studie zeigt durch eine systematische Prüfung der Google-Rückwärtssuche, dass algorithmisches Gatekeeping die Bekämpfung visueller Falschinformationen erschwert, indem es entlarvende Inhalte oft unter irrelevanten Ergebnissen und wiederholten Falschmeldungen versteckt und dabei ein zeitliches Qualitätsgefälle aufweist.

Cong Lin, Yifei Chen, Jiangyue Chen, Yingdan Lu, Yilang Peng, Cuihua ShenWed, 11 Ma💻 cs

DataFactory: Collaborative Multi-Agent Framework for Advanced Table Question Answering

Die Arbeit stellt DataFactory vor, ein kollaboratives Multi-Agenten-Framework, das durch spezialisierte Teamkoordination, die automatische Umwandlung von Daten in Wissensgraphen und kontextbasierte Strategien die Genauigkeit und Zuverlässigkeit von Tabellen-Fragebeantwortung (TableQA) im Vergleich zu herkömmlichen Einzel-Agenten-Ansätzen signifikant verbessert.

Tong Wang, Chi Jin, Yongkang Chen, Huan Deng, Xiaohui Kuang, Gang ZhaoWed, 11 Ma🤖 cs.AI

Evoking User Memory: Personalizing LLM via Recollection-Familiarity Adaptive Retrieval

Die Arbeit stellt RF-Mem vor, einen adaptiven Dual-Pfad-Memory-Retriever für personalisierte LLMs, der durch die Nachahmung des menschlichen dualen Gedächtnisprozesses (Vertrautheit und Erinnerung) eine skalierbare und präzise Kontextwiedergewinnung ermöglicht, die herkömmliche Methoden in Bezug auf Genauigkeit und Effizienz übertrifft.

Yingyi Zhang, Junyi Li, Wenlin Zhang, Penyue Jia, Xianneng Li, Yichao Wang, Derong Xu, Yi Wen, Huifeng Guo, Yong Liu, Xiangyu ZhaoWed, 11 Ma💻 cs

Diagnosing and Repairing Citation Failures in Generative Engine Optimization

Diese Arbeit stellt AgentGEO vor, ein agentic System, das mithilfe einer neuen Taxonomie von Zitierfehlern gezielt Inhalte optimiert und so die Zitierquote um über 40 % steigert, während es gleichzeitig die Grenzen generischer Optimierungsansätze für die gerechte Sichtbarkeit aufzeigt.

Zhihua Tian, Yuhan Chen, Yao Tang, Jian Liu, Ruoxi JiaWed, 11 Ma💬 cs.CL

TA-Mem: Tool-Augmented Autonomous Memory Retrieval for LLM in Long-Term Conversational QA

Die Arbeit stellt TA-Mem vor, ein neuartiges, tool-augmentiertes Framework für autonome Gedächtnisabrufe in großen Sprachmodellen, das durch adaptive Extraktion, eine multi-indexierte Datenbank und einen selbstständigen Abruf-Agenten die Flexibilität und Leistung bei langfristigen konversationellen Frage-Antwort-Aufgaben im Vergleich zu bestehenden Ansätzen signifikant verbessert.

Mengwei Yuan, Jianan Liu, Jing Yang, Xianyou Li, Weiran Yan, Yichao Wu, Penghao LiangWed, 11 Ma💬 cs.CL

PRECEPT: Planning Resilience via Experience, Context Engineering & Probing Trajectories A Unified Framework for Test-Time Adaptation with Compositional Rule Learning and Pareto-Guided Prompt Evolution

Die Arbeit stellt PRECEPT vor, ein einheitliches Framework für die Anpassung von LLM-Agenten zur Laufzeit, das durch deterministische Regelabrufe, konfliktbewusstes Gedächtnis und einen pareto-gesteuerten Prompt-Evolutionsmechanismus (COMPASS) die Zuverlässigkeit, Kompositionsfähigkeit und Robustheit gegenüber veralteten oder adversarischen Informationen signifikant verbessert.

Arash ShahmansooriWed, 11 Ma🤖 cs.AI

Understanding the Interplay between LLMs' Utilisation of Parametric and Contextual Knowledge: A keynote at ECIR 2025

Diese Keynote-Präsentation für ECIR 2025 untersucht das Zusammenspiel zwischen parametrischem und kontextuellem Wissen in Sprachmodellen, wobei der Fokus auf der Diagnose von Wissenskonflikten und der Bewertung liegt, wie Modelle kontextuelle Informationen nutzen oder ignorieren.

Isabelle AugensteinWed, 11 Ma💬 cs.CL

Automatic Cardiac Risk Management Classification using large-context Electronic Patients Health Records

Diese Studie stellt einen automatisierten Klassifikationsrahmen zur kardiovaskulären Risikobewertung bei geriatrischen Patienten vor, der unstrukturierte elektronische Patientenakten nutzt und zeigt, dass eine maßgeschneiderte Transformer-Architektur traditionelle Methoden sowie generative Large Language Models übertrifft.

Jacopo Vitale, David Della Morte, Luca Bacco, Mario Merone, Mark de Groot, Saskia Haitjema, Leandro Pecchia, Bram van EsWed, 11 Ma🤖 cs.AI

Weiter →