Retrieval Augmented Generation - 2016年01月
QUOTE: "Querying" Users as Oracles in Tag Engines - A Semi-Supervised Learning Approach to Personalized Image Tagging
发布时间:2016-01-20
作者:Amandianeze O. Nwana, Tsuhan Chen
中文摘要:
在图像标签研究中的一个普遍趋势是关注视觉相关的标签,这往往忽略了标签的个人和社会方面,尤其是在像Flickr这样的照片博客网站上。先前的研究正确地识别出用户在图像上提供的许多标签并非视觉相关(即不代表图像中的显著内容),并且它们将这些标签视为噪声,忽视了用户选择提供这些标签而不是其他可能更视觉相关的标签。关于图像用户生成标签的另一个常见假设是,这些标签的顺序对未来图像标签的预测没有提供有用的信息。这个假设也倾向于从图像的视觉相关性的角度来定义有用性。对于专注于提供图像内容视觉信息的通用标签或标记应用,这些假设是合理的,但当考虑到个性化图像标签应用时,这些假设至多过于僵化,忽略了用户的选择和偏好。我们挑战上述假设,并提出了一种机器学习方法来解决个性化图像标签问题,以下是我们的一些贡献:1.) 我们将个性化图像标签问题重新表述为一个搜索/检索排名问题;2.) 我们利用用户过去提供的标签顺序,作为他们标签偏好的线索,类似于点击数据,尽管这些标签的顺序并不总是反映视觉相关性;3.) 我们提出了一种技术来增强稀疏的用户标签数据(半监督);4.) 我们在我们的方法在Flickr图像的一个子集上展示了有效性,显示出比先前最先进的方法有所改进。
一句话总结:
本文挑战了传统图像标签研究的假设,提出了一种基于机器学习的个性化图像标签方法,通过利用用户标签顺序和半监督技术,在Flickr图像上实现了比先前方法更好的效果。