Retrieval Augmented Generation - 2018年02月

Constructing Category-Specific Models for Monocular Object-SLAM

发布时间:2018-02-26

作者:Parv Parkhiya, Rishabh Khawad, J. Krishna Murthy, Brojeshwar Bhowmick, K. Madhava Krishna

中文摘要:

本文提出了一种基于单目相机的实时面向对象SLAM新范式。与依赖对象级模型的先前方法不同,我们构建了从广泛可用的CAD集合中提取的类别级模型。为了减轻对大量标记数据的依赖,我们开发了一个渲染管道,它能够从有限的少量手动标记数据中合成大量数据集。使用这些合成的数据,我们学习3D对象变形的类别级模型以及2D判别性对象特征。这些类别模型是实例无关的,有助于设计可纳入通用单目SLAM框架的对象地标观测。与典型的对象SLAM方法通常只求解对象和相机姿态不同,我们还实时估计对象形状,允许场景中出现来自该类别的广泛对象。此外,由于我们的2D对象特征是判别性学习的,所提出的对象SLAM系统在稀疏特征基于的单目SLAM因特征不足或视差而失败的场景中取得了成功。此外,所提出的类别模型有助于对象实例检索,这对于增强现实(AR)应用很有用。我们在多个具有挑战性的真实场景中对所提出的框架进行了评估,并展示了——据我们所知——第一个实例无关的单目对象SLAM系统的结果,以及它相对于基于特征的SLAM方法的优点。

一句话总结:

本文提出了一种基于单目相机的实时面向对象SLAM新范式,通过类别级模型和渲染管道,实现了对广泛对象类别的高效识别和定位。


Instance-based Inductive Deep Transfer Learning by Cross-Dataset Querying with Locality Sensitive Hashing

发布时间:2018-02-16

作者:Somnath Basu Roy Chowdhury, K M Annervaz, Ambedkar Dukkipati

中文摘要:

监督学习模型通常在单个数据集上训练,这些模型的性能高度依赖于数据集的大小,即包含真实标签的数据量。学习算法试图仅基于训练过程中呈现的数据进行泛化。在这项工作中,我们提出了一种归纳迁移学习方法,可以通过在自然语言处理(NLP)领域注入来自不同学习任务的相似实例来增强学习模型。我们建议使用源数据集的实例表示,而不继承源学习模型中的任何内容。学习源数据集和目标数据集的实例表示,使用软注意力机制和局部敏感哈希进行相关源实例的检索,然后在目标数据集的训练过程中将这些增强融入模型。我们的方法同时利用了数据集的局部实例级信息以及宏观统计视角。使用这种方法,我们在三个主要的新闻分类数据集上相对于基线实现了显著的改进。实验评估还表明,所提出的方法在可比性能下显著减少了对于标注数据的依赖。通过我们提出的跨数据集学习过程,我们展示了与从单个数据集学习相比,可以达到具有竞争力/更好的性能。

一句话总结:

本文提出了一种基于跨数据集学习的迁移学习方法,通过融合不同任务中的相似实例来增强模型性能,显著提高了新闻分类任务的准确性。