Retrieval Augmented Generation - 2018年02月

Constructing Category-Specific Models for Monocular Object-SLAM

发布时间：2018-02-26

作者：Parv Parkhiya, Rishabh Khawad, J. Krishna Murthy, Brojeshwar Bhowmick, K. Madhava Krishna

中文摘要：

本文提出了一种基于单目相机的实时面向对象SLAM新范式。与依赖对象级模型的先前方法不同，我们构建了从广泛可用的CAD集合中提取的类别级模型。为了减轻对大量标记数据的依赖，我们开发了一个渲染管道，它能够从有限的少量手动标记数据中合成大量数据集。使用这些合成的数据，我们学习3D对象变形的类别级模型以及2D判别性对象特征。这些类别模型是实例无关的，有助于设计可纳入通用单目SLAM框架的对象地标观测。与典型的对象SLAM方法通常只求解对象和相机姿态不同，我们还实时估计对象形状，允许场景中出现来自该类别的广泛对象。此外，由于我们的2D对象特征是判别性学习的，所提出的对象SLAM系统在稀疏特征基于的单目SLAM因特征不足或视差而失败的场景中取得了成功。此外，所提出的类别模型有助于对象实例检索，这对于增强现实（AR）应用很有用。我们在多个具有挑战性的真实场景中对所提出的框架进行了评估，并展示了——据我们所知——第一个实例无关的单目对象SLAM系统的结果，以及它相对于基于特征的SLAM方法的优点。

一句话总结：

本文提出了一种基于单目相机的实时面向对象SLAM新范式，通过类别级模型和渲染管道，实现了对广泛对象类别的高效识别和定位。

Instance-based Inductive Deep Transfer Learning by Cross-Dataset Querying with Locality Sensitive Hashing

发布时间：2018-02-16

作者：Somnath Basu Roy Chowdhury, K M Annervaz, Ambedkar Dukkipati

中文摘要：

监督学习模型通常在单个数据集上训练，这些模型的性能高度依赖于数据集的大小，即包含真实标签的数据量。学习算法试图仅基于训练过程中呈现的数据进行泛化。在这项工作中，我们提出了一种归纳迁移学习方法，可以通过在自然语言处理（NLP）领域注入来自不同学习任务的相似实例来增强学习模型。我们建议使用源数据集的实例表示，而不继承源学习模型中的任何内容。学习源数据集和目标数据集的实例表示，使用软注意力机制和局部敏感哈希进行相关源实例的检索，然后在目标数据集的训练过程中将这些增强融入模型。我们的方法同时利用了数据集的局部实例级信息以及宏观统计视角。使用这种方法，我们在三个主要的新闻分类数据集上相对于基线实现了显著的改进。实验评估还表明，所提出的方法在可比性能下显著减少了对于标注数据的依赖。通过我们提出的跨数据集学习过程，我们展示了与从单个数据集学习相比，可以达到具有竞争力/更好的性能。

一句话总结：

本文提出了一种基于跨数据集学习的迁移学习方法，通过融合不同任务中的相似实例来增强模型性能，显著提高了新闻分类任务的准确性。