



如果您无法下载资料,请参考说明:
1、部分资料下载需要金币,请确保您的账户上有足够的金币
2、已购买过的文档,再次下载不重复扣费
3、资料包下载后请先用软件解压,在使用对应软件打开
基于多探寻局部敏感哈希和单词映射链投票的图像检索方法 摘要 图像检索是计算机视觉中的一个重要研究方向,其目的是在数据库中寻找与查询图像相似的图像,并将它们排列在所返还的结果中。本文提出了一种基于多探寻局部敏感哈希和单词映射链投票的图像检索方法。该方法通过对图像特征进行局部敏感哈希,同时利用单词映射链对图像进行关键特征的提取和匹配。实验结果表明,该方法在不同数据集上的退化性能比其他方法更好,准确率更高。 关键词:图像检索;局部敏感哈希;单词映射链;投票;准确率 1.引言 图像检索是计算机视觉领域的一个重要研究方向,涉及图像的内容分析、分类和识别等方面。传统的图像检索方法主要是基于手工制作的特征和基于颜色直方图的检索方法,但是这些方法在面对大量数据和复杂场景时,性能和结果不太可靠。因此,图像检索中的自动特征提取和快速索引技术是当前研究的热点。 为了解决传统图像检索方法的限制,很多研究者开始尝试使用局部敏感哈希等技术来提高图像检索的效率和准确性。局部敏感哈希技术是一种近似邻居搜索算法,普遍适用于高维空间和海量数据。目前,局部敏感哈希在图像检索领域的应用得到了广泛关注。但是,对于图像中的关键特征,目前大多数方法都是基于单个局部区域或者全局特征进行建模和匹配。这种方法只能捕捉图像的某些局部特征,而忽视了大量的全局结构和上下文信息。 在这种情况下,结合单词映射和链投票技术是一种很好的解决方法。单词映射可以帮助我们从图像中提取更丰富多样的特征,尤其是上下文信息,从而更准确地进行图像匹配。链投票可以针对匹配的特征点进行区域投票,从而提高了图像检索的准确率。 基于以上分析,本文提出了一种基于多探寻局部敏感哈希和单词映射链投票的图像检索方法。该方法通过对图像特征进行局部敏感哈希,同时利用单词映射链对图像进行关键特征的提取和匹配。实验结果表明,该方法在不同数据集上的退化性能比其他方法更好,准确率更高。 2.我们提出的方法 本文提出的方法主要包含以下两个步骤:一是局部敏感哈希来捕捉图像中的局部特征,而二是单词映射链和链投票技术取出关键特征。 2.1局部敏感哈希 哈希函数的设计直接影响局部敏感哈希的性能。在我们的方法中,哈希函数采用随机超平面技术,我们使用了1-bits最小哈希函数来计算哈希签名。相对于传统的哈希函数,这种方法更加灵活和高效。同时,我们使用多探测哈希技术,从而能够有效减少哈希错误率。总的哈希值可以由所有单个哈希值的异或计算获得。这种哈希方法的可靠性和有效性已经在我们的前期实验中证明。 2.2单词映射链和链投票技术 为了更准确地进行图像匹配,本文采用了单词映射链和链投票技术。在单词映射链阶段,我们首先建立一个词汇表,然后对数据集中的图像进行特征提取和编码。我们只选择局部敏感哈希的标签来建立单词汇表。这样可以保证汇表内的特征点的表示更加准确。然后,我们用基本的哈希函数w=H(x)将哈希标签x映射到单词词汇表中的一个位置w中。在这个场景下,单词映射的位置w与图像中的特征点x具有相似性。换句话说,每个单词代表了局部特征点的一部分,并对应与该点在实际的图像中的位置。 接下来,我们将这些特征点组织成链,从而形成单词映射链。这个链通常是一个长度为m的序列,其中m是单词数量。一个单词映射链可以表示为C={c1,c2,...,cm},其中每个单词都具有一个哈希标签。单词映射链技术允许区分图像特征的上下文信息,从而更有效地进行图像匹配。 在链投票阶段,我们将所有的图片的特征点合并成一个候选集A,然后计算候选集A中所有特征点的单词映射链。对于查询图像的单词映射链Cq,我们设计了一种新方法来检测候选集A中与查询图像的单词映射链Cq匹配的候选特征点。特别地,我们将映射链Cq在单词汇表中的每个特征点连接起来,然后建立一个新的哈希表B。每个哈希元素都由(Ci,1)转换成(w1_Ci,Ci)的形式。此时,哈希表B中的每个单元格都代表着一个单词汇表上的单词,并且与查询图像中的特定单词相对应。 为了确定哈希表B中的哪些元素与候选集A中的特征点有明显的匹配,我们提出了一种新的链投票策略。具体方法是,对于所有在哈希表B中包含的单词,找到在候选集A中出现的该单词。这些单词一起做成一条链,连成一个序列。这条链是包括特定的查询映射链和一组匹配的单词映射链。我们将所有匹配的链映射到一个能够取代查询映射链Cq的一组序列Y。同时,在建立链序列时,可以考虑某些特定的局部器官进行连接,从而进一步提高匹配精度。 3.实验结果 为了证明本文提出方法的有效性,我们在两个公共数据集上执行了实验。 3.1实验数据集 我们选择了两个典型的数据集来测试本文提出的方法,该数据集包含来自互联网的图片,每个图片的尺寸在200×200至800×800范围内。具体数据集描述如下: 1.INRIAHolidays:该

快乐****蜜蜂
实名认证
内容提供者


最近下载