Retrieval Augmented Generation - 2018年11月

Learning Conditional Random Fields with Augmented Observations for Partially Observed Action Recognition

发布时间：2018-11-25

作者：Shih-Yao Lin, Yen-Yu Lin, Chu-Song Chen, Yi-Ping Hung

中文摘要：

本文旨在识别视频中部分观察到的动作。在不受控制的环境中获取的动作视频往往包含损坏的帧，这导致动作部分可观察。此外，这些帧可以持续任意长度的时间，并且不规则地出现。它们与训练数据不一致，并降低了预训练动作识别系统的性能。我们提出了一种解决这一问题的方法。对于每个训练和测试动作，我们将其划分为段，并探索时间段的相互依赖性。这一特性表明，一个时间段内两个动作的相似性往往意味着它们在另一个时间段内的相似性。我们通过从训练数据中检索到的额外替代方案来增强每个段。增强算法设计得足够好，以至于几个替代方案足以替换发生损坏帧的原始段。我们的方法基于隐藏条件随机场，并利用隐藏变量的灵活性来处理不确定性。结果证明，我们的方法将损坏段检测和替代选择整合到预测过程中，并能更准确地识别部分观察到的动作。该方法在完全观察到的动作和部分观察到的动作上进行了评估，这些动作要么是合成的，要么是真实的损坏帧。实验结果表明，该方法具有通用性和优越性能，尤其是在动作视频中存在损坏帧时。

一句话总结：

本文提出了一种基于隐藏条件随机场的方法，通过检测损坏段和选择替代方案，提高了识别视频中部分观察到的动作的准确性。

Adversarial Sampling and Training for Semi-Supervised Information Retrieval

发布时间：2018-11-09

作者：Dae Hoon Park, Yi Chang

中文摘要：

本文针对具有隐式反馈的即时检索模型常遇到的问题，如数据集中类别不平衡等，提出了一种对抗采样和训练框架来学习即时检索模型。该框架的关键思想是：(i) 通过对抗训练增强点击示例以实现更好的泛化；(ii) 通过对抗采样和训练获得非常信息丰富的非点击示例。在Web搜索、物品推荐和问答等常见的即时检索任务的标准数据集上进行了实验。实验结果表明，所提出的方法在强基线模型上显著优于，特别是在高排名文档方面，并且在使用仅5%标记数据的Web搜索任务中，它们在NDCG@5上优于IRGAN。

一句话总结：

本文提出了一种基于对抗采样和训练的框架，有效提高了具有隐式反馈的即时检索模型在数据集类别不平衡情况下的泛化能力和检索效果。

Texture Synthesis Guided Deep Hashing for Texture Image Retrieval

发布时间：2018-11-04

作者：Ayan Kumar Bhunia, Perla Sai Raj Kishore, Pranay Mukherjee, Abhirup Das, Partha Pratim Roy

中文摘要：

随着互联网上图像和视频的大规模爆炸式增长，高效的哈希方法被开发出来以促进相似图像的内存和时间高效检索。然而，现有的工作没有使用哈希来处理纹理图像检索，这主要是因为缺乏足够大的纹理图像数据库。我们的工作通过开发一种新的深度学习架构来解决这一问题，该架构为输入纹理图像生成二进制哈希码。为此，我们首先预训练了一个纹理合成网络（Texture Synthesis Network, TSN），它以纹理块作为输入，并通过注入新的纹理内容输出纹理的放大视图。这表明TSN在其中间层中编码了学习到的纹理特定信息。在下一阶段，第二个网络使用通道注意力从TSN的中间层收集多尺度特征表示，以渐进的方式将它们组合成一个密集的连续表示，最终在个体和成对标签信息的帮助下将其转换为二进制哈希码。新的放大纹理块也有助于数据增强，以缓解纹理数据不足的问题，并用于训练网络的第二阶段。在三个公开纹理图像检索数据集上的实验表明，我们的纹理合成引导的哈希方法优于当前最先进的方法。

一句话总结：

本研究提出了一种基于纹理合成的深度学习哈希方法，用于提高纹理图像检索的效率。