Retrieval Augmented Generation - 2019年04月

An Axiomatic Approach to Regularizing Neural Ranking Models

发布时间：2019-04-15

作者：Corby Rosset, Bhaskar Mitra, Chenyan Xiong, Nick Craswell, Xia Song, Saurabh Tiwary

中文摘要：

形式化信息检索（IR）寻求一组在IR模型中期望的基本属性。这些属性在形式化表达后，为寻找更好的相关性估计函数提供指导。神经排序模型通常包含大量的参数。这些模型的训练涉及根据大量标记示例寻找适当的参数值。直观上，可以指导寻找更好传统IR模型的公理也应该有助于基于机器学习的排序器的更好参数估计。这项工作探讨了使用IR公理来增强对训练神经排序模型的直接监督。我们在训练过程中根据已知的公理修改数据集中的文档，并添加了一个基于排序模型与公理之间一致性的正则化损失，该一致性决定了应该优先选择文档的原始版本还是经过扰动的版本。我们的实验表明，使用公理正则化的神经排序模型实现了更快的收敛和更好的泛化。

一句话总结：

本研究通过引入信息检索公理正则化，提高了神经排序模型的训练效率和泛化能力。