Retrieval Augmented Generation - 2021年01月

What Makes Good In-Context Examples for GPT-$3$?

发布时间：2021-01-17

作者：Jiachang Liu, Dinghan Shen, Yizhe Zhang, Bill Dolan, Lawrence Carin, Weizhu Chen

中文摘要：

GPT-3因其卓越的性能在众多自然语言处理任务中受到广泛关注，尤其是在其强大且多功能的情境下小样本学习能力方面。尽管GPT-3取得了成功，但我们发现其实验结果很大程度上依赖于情境示例的选择。在本研究中，我们探讨了是否存在比随机采样更有效的策略来审慎选择情境示例，从而更好地发挥GPT-3的小样本能力。受近期利用检索模块增强大规模神经网络模型成功案例的启发，我们提出检索与测试样本语义相似的示例来构建其对应的提示。直观地，采用这种策略选择的情境示例可能作为更具有信息量的输入来释放GPT-3的广泛知识。我们在多个自然语言理解和生成基准测试上评估了所提出的方法，其中基于检索的提示选择方法在一致性上优于随机基线。此外，观察到在任务相关的数据集上微调的句子编码器产生了更有帮助的检索结果。值得注意的是，在表格到文本生成（ToTTo数据集上达到41.9%）和开放域问答（NQ数据集上达到45.5%）等任务上观察到显著的提升。我们希望我们的研究有助于理解GPT-3和大规模预训练语言模型的一般行为，并增强它们的小样本能力。

一句话总结：

本研究提出了一种基于检索的提示选择方法，显著提升了GPT-3在自然语言处理任务中的小样本学习能力。

Automatic Face Understanding: Recognizing Families in Photos

发布时间：2021-01-10

作者：Joseph P Robinson

中文摘要：

我们构建了最大的亲属识别数据库。数据使用一种新颖的聚类算法进行标注，该算法利用标签建议作为辅助信息来引导更准确的聚类，从而实现了时间和人力投入的大幅节省。从统计上看，FIW相较于其前辈取得了巨大的进步。我们在亲属验证、家族分类、三主体验证以及大规模搜索和检索等方面都有多个基准。我们还对FIW进行了CNN训练，并在著名的KinWild I和II上部署了模型以获得SOTA性能。最近，我们进一步通过MM对FIW进行了增强。现在，视频动态、音频和文本字幕可以用于亲属识别系统的决策制定。我们预计FIW将对研究和现实产生重大影响。此外，我们还解决了经典的面部关键点定位问题。大多数这些网络的目标基于L1或L2范数，这继承了几个缺点。关键点的位置是从生成的热图中确定的，预测的关键点位置在没有考虑扩散的情况下受到惩罚：高散度对应低置信度，反之亦然。为了解决这个问题，我们引入了一个对低置信度进行惩罚的目标。另一个问题是依赖于标注数据，收集成本高且易出错。我们通过提出一个利用未标注数据来提高模型性能的对抗性训练框架来解决这两个问题。我们的方法在著名的基准上实现了SOTA。此外，我们的模型具有较小的尺寸：通道数减少到原来的1/8，在CPU上的实时性能与SOTA相当。最后，我们构建了BFW作为衡量跨种族和性别子群体偏见的代理，使我们能够描述每个子群体的FR性能。我们发现，当使用单个阈值来确定样本对是否真实时，性能并不理想。

一句话总结：

本研究构建了大规模亲属识别数据库FIW，并提出了改进的模型和基准，显著提升了亲属识别系统的性能和泛化能力。