Retrieval Augmented Generation - 2009年03月

To Click or not to Click? The Role of Contextualized and User-Centric Web Snippets

发布时间:2009-03-14

作者:N. Zotos, P. Tzekou, G. Tsatsaronis, L. Kozanidis, S. Stamou, I. Varlamis

中文摘要:

在搜索网页时,对于模糊的查询,往往会出现过多的结果。从检索到的页面中提取的文本片段可以作为页面对查询意图有用性的指标,并可用于聚焦搜索结果的范围。在本文中,我们提出了一种新的方法来自动提取与查询意图高度相关且能表达页面全部内容的网页片段。我们表明,使用语义作为聚焦检索的基础,可以产生高质量的文本片段建议。我们方法提供的片段在检索性能方面显著优于使用页面统计内容得到的片段。此外,我们的研究还表明,基于语义的片段生成也可以用来增强基于词重叠或统计权重的传统段落检索算法,因为它们通常在覆盖范围上有所不同,并产生不同的结果。用户点击与查询相关的片段可以用来细化查询结果,并促进最全面的相关文档。

一句话总结:

本文提出了一种基于语义的网页片段提取方法,以提高搜索结果的准确性和相关性。