近似最近邻搜索中投影增强型残差量化方法

艾列富; 程宏俊; 冯学军

doi:10.7510/jgjs.issn.1001-3806.2020.06.017

近似最近邻搜索中投影增强型残差量化方法

1.
安庆师范大学计算机与信息学院，安庆 246133
2.
安庆师范大学智能感知与计算安徽省高校重点实验室，安庆 246133

作者简介: 艾列富(1985-)，男，博士，副教授，现主要从事数字图像处理、特征量化与检索研究。E-mail:ailiefu@qq.com.

基金项目:
安徽省自然科学基金资助项目 1608085MF144

安庆师范大学教学研究资助项目 2018aqnujyxm009

安徽省高校自然科学基金资助项目 AQKJ2015B006

安徽省自然科学基金资助项目 1908085MF194
中图分类号: TP391

Projection-based enhanced residual quantization for approximate nearest neighbor search

1.
School of Computer and Information, Anqing Normal University, Anqing 246133, China
2.
University Key Laboratory of Intelligent Perception and Computing of Anhui Province, Anqing Normal University, Anqing 246133, China
CLC number: TP391

摘要: 为了降低图像特征向量量化的近似表示和高维向量带来的码书训练时间开销，提出了一种投影增强型残差量化方法。在前期的增强型残差量化工作基础上，将主成分分析与增强型残差量化相结合，使得码书训练和特征量化均在低维向量空间进行以提高效率；在低维向量空间上训练码书过程中，提出了联合优化方法，同时考虑投影和量化产生的总体误差，提升码书精度；针对该量化方法，设计了一种特征向量之间的近似欧氏距离快速计算方法用于近似最近邻完全检索。结果表明，相比增强型残差量化，在相同检索精度前提条件下，投影增强型残差量化的只需花费近1/3的训练时间；相比其它同类方法，所提出方法在码书训练时间效率、检索速度和精度上均具有更优的综合性能。该研究为主成分分析同其它量化模型的有效结合提供了参考。
- 图像处理 /
- 向量量化 /
- 近似最近邻 /
- 图像检索
Abstract: To reduce the time costs on approximating vector quantization of image features and training codebooks for high-dimensional vectors, a projection-based enhanced residual vector quantization was proposed. Based on previous research on enhance residual quantization (ERVQ), the principle component analysis (PCA) was combined with ERVQ, then both training codebooks and quantizing feature vectors were done in low-dimensional vector space to improve the efficiency. The features for training codebooks were projected into low-dimensional vector spaces. The overall errors generated by projection and quantization were both considered in training procedure to increase the codebook discrimination. For the proposed quantization method, a method to fast computing the approximate Euclidian distance between vectors was designed to retrieve approximate nearest neighbor exhaustively. The experimental results show that the proposed approach only takes near 1/3 training time compared to ERVQ on the condition of same retrieval accuracy. Meanwhile, the proposed approach outperforms the other state-of-the-arts over time efficiency on training codebooks, retrieval accuracy and efficiency. This study provides a reference for the effective combination of PCA with other quantization models.
- image processing /
- vector quantization /
- approximate nearest neighbor /
- image retrieval

Figure 1. Quantizing feature vector by ERVQ

下载: 全尺寸图片幻灯片

Figure 2. Training two-level initial codebooks

下载: 全尺寸图片幻灯片

Figure 3. Quantizing vector by projection-based enhanced residual vector quantization

下载: 全尺寸图片幻灯片

Figure 4. Overall quantization errors over variant projected dimensionality on GIST

下载: 全尺寸图片幻灯片

Figure 5. Overall quantization errors over variant projected dimensionality on VLAD

下载: 全尺寸图片幻灯片

Figure 6. R_recall@100 over variant parameter D on GIST

下载: 全尺寸图片幻灯片

Figure 7. R_recall@100 over variant parameter D on VLAD

下载: 全尺寸图片幻灯片

Figure 8. Time cost comparison of different methods on GIST

下载: 全尺寸图片幻灯片

Figure 9. R_recall@n comparison of different methods on GIST

下载: 全尺寸图片幻灯片

Table 1. Information of experimental datasets

datesets	GIST	VLAD
dimension of vectors	960	4096
size of database set	1000000	1295000
size of training set	500000	200000
size of query set	1000	849

下载: 导出CSV

Table 2. Description of compared methods

methods	description
PQ^[4]	composed by 8 sub-quantizers in which each codebook is consisted of 256 centers
RVQ^[17]	composed by L(L=8) level sub-quantizers in which each codebook is consisted of 256 centers
ERVQ^[19]	composed by L(L=8) level sub-quantizers in which each codebook is consisted of 256 centers
orthogonal RVQ^[18]	composed by L(L=8) level sub-quantizers in which each codebook is consisted of 256 centers

下载: 导出CSV

Table 3. Comparison of search time on GIST

methods	search time/ms	R_recall@100
PQ	33.6	0.32
RVQ	35.0	0.68
ERVQ	34.3	0.70
PERVQ D=8	31.1	0.70
PERVQ D=16	32.2	0.70
PERVQ D=32	33.8	0.71
PERVQ D=128	44.7	0.72
orthogonal RVQ	34.2	0.73

下载: 导出CSV

[1]	AI L, YU J, HE Y, et al. High-dimensional indexing technologies for large scale content-based image retrieval: A review [J]. Journal of Zhejiang University(Svirnvr C), 2013, 14(7): 505-520.
[2]	LIU D Y, WANG G J, WU J, et al. Light field image compression method based on correlation of rendered views [J]. Laser Technology, 2019, 43(4): 551-556 (in Chinese).
[3]	WU Z, YU J. Vector quantization: A review [J]. Frontiers of Information Technology & Electronic Engineering, 2019, 20(4):507-524.
[4]	HERVE J, MATTHIJS D, CORDELIA S. Product quantization for nearest neighbor search [J]. IEEE Transactions on Pattern Analysis and Machine Intelligence, 2011, 33(1): 117-128. doi: 10.1109/TPAMI.2010.57
[5]	MATSUI Y, UCHIDA Y, HERVE J. A survey of product quantization [J]. ITE Transactions on Media Technology and Applications, 2018, 6(1):2-10. doi: 10.3169/mta.6.2
[6]	GE T, HE K, KE Q, et al. Optimized product quantization [J]. IEEE Transactions on Pattern Analysis and Machine Intelligence, 2014, 36(4):744-755. doi: 10.1109/TPAMI.2013.240
[7]	KALANTIDIS Y, AVRITHIS Y. Locally optimized product quantization for approximate nearest neighbor search[C]//IEEE Conference on Computer Vision and Pattern Recognition (CVPR). New York, USA: IEEE, 2014: 1213-1220.
[8]	HEO J, LIN Z, YOON S. Distance encoded product quantization[C]//IEEE Conference on Computer Vision and Pattern Recognition (CVPR). New York, USA: IEEE, 2014: 1241-1248.
[9]	NOROUZI M, FLEET D. Cartesian k-means[C]// IEEE Conference on Computer Vision and Pattern Recognition (CVPR). New York, USA: IEEE, 2013: 3017-3024.
[10]	BABENKO A, LEMPITSKY V. Improving bilayer product quantization for billion-scale approximate nearest neighbors in high dimensions [EB/OL].[2019-10-10].https: //arxiv.org/abs/1404.1831.
[11]	KALANTIDIS Y, AVRITHIS Y. Locally optimized product quantization for approximate nearest neighbor search[C]//IEEE Conference on Computer Vision and Pattern Recognition (CVPR). New York, USA: IEEE, 2014: 2329-2336.
[12]	JOHNSON J, DOUZE M, HERVE J. Billion-scale similarity search with gpus [J/OL].[2019-11-20].https: //ieeexplore.ieee.org/document/8733051.
[13]	MATSUI Y, OGAKI K, YAMASAKI T, et al. PQ k-means: Billionscale clustering for product-quantized code[C]// ACM Conference on Multimedia (MM). California, USA: ACM, 2017: 1-9.
[14]	JONATHAN B. Transform coding for fast approximate nearest neighbor search in high dimensions[C]//IEEE Conference on Computer Vision and Pattern Recognition (CVPR). New York, USA: IEEE, 2010: 1815-1822.
[15]	OZAN E, KIRANYAZ A, GABBOUJ M. K-subspaces quantization for approximate nearest neighbor search [J]. IEEE TKDE, 2016, 28(7): 1722-1733.
[16]	BABENKO A, LEMPITSKY V. Tree quantization for large-scale similarity search and classification[C]//IEEE Conference on Computer Vision and Pattern Recognition (CVPR). New York, USA: IEEE, 2015: 4240-4248.
[17]	CHEN Y, GUAN T, WANG C. Approximate nearest neighbor search by residual vector quantization[J]. Sensors, 2010, 10(12): 11259-11273. doi: 10.3390/s101211259
[18]	WANG J, ZHANG T. Composite quantization [J]. IEEE Transactions on PAMI, 2019. 41(6): 1308-1322.
[19]	AI L, YU J, WU Z, et al. Optimized residual vector quantization for efficient approximate nearest neighbor search [J]. Multimedia Systems, 2017, 23(2): 169-181.
[20]	LIU S, SHAO J, LU H. Generalized residual vector quantization and aggregating tree for large scale search [J]. IEEE Transactions on Multimedia, 2017, 19(8): 1785-1797. doi: 10.1109/TMM.2017.2692181
[21]	WEI B, GUAN T, YU J. Projected residual vector quantization for ANN search [J]. IEEE Multimedia, 2014, 21(3):41-51. doi: 10.1109/MMUL.2013.65
[22]	AI L F, LIU K, WU J. Enhanced residual vector quantization-based non-exhaustive retrieval for image visual features [J]. Journal of Hefei University, 2016, 26(1): 46-51(in Chinese).
[23]	GUAN T, HE Y, GAO J, et al. On-device mobile visual location recognition by integrating vision and inertial sensors [J]. IEEE Transactions on Multimedia, 2013, 15(7):1688-1699. doi: 10.1109/TMM.2013.2265674

[1]	李文龙 , 戈海龙 , 任远 , 成巍 . 图像处理技术在激光熔池温度检测的应用. 激光技术, 2018, 42(5): 599-604. doi: 10.7510/jgjs.issn.1001-3806.2018.05.004
[2]	张海庄 , 姚梅 , 雷萍 , 李鹏 , 曾庆平 . 远场激光光斑图像处理方法研究. 激光技术, 2013, 37(4): 460-463. doi: 10.7510/jgjs.issn.1001-3806.2013.04.010
[3]	汤敏 , 王惠南 . 激光扫描共聚焦显微镜图像的计算机处理. 激光技术, 2007, 31(5): 558-560.
[4]	张羽鹏 , 王开福 . LabVIEW和MATLAB在电子散斑干涉图像处理中的应用. 激光技术, 2009, 33(6): 582-585,589. doi: 10.3969/j.issn.1001-3806.2009.06.007
[5]	冯煦 , 张瑞瑛 , 周萍 , 李松 . 大功率半导体线激光图像处理方法研究. 激光技术, 2010, 34(5): 624-627. doi: 10.3969/j.issn.1001-3806.2010.O5.013
[6]	顾国庆 , 王开福 , 燕新九 . 基于同态滤波的电子散斑干涉图像处理. 激光技术, 2010, 34(6): 750-752,797. doi: 10.3969/j.issn.1001-3806.2010.06.009
[7]	苏平 , 牛燕雄 , 李大乾 , 牛海莎 , 李易难 , 张超 . 基于面阵CCD的激光告警系统的图像采集与处理. 激光技术, 2013, 37(3): 394-399. doi: 10.7510/jgjs.issn.1001-3806.2013.03.028
[8]	刘逸飞 , 苏亚 , 姚晓天 , 崔省伟 , 杨丽君 , 周聪聪 , 何松 . OCT无创血糖检测图像处理最优化方法研究. 激光技术, 2023, 47(2): 178-184. doi: 10.7510/jgjs.issn.1001-3806.2023.02.004
[9]	张怡霄 , 杜惊雷 , 高福华 , 姚军 , 曾阳素 , 郭永康 . 分数域啁啾滤波及其在数字图像处理中的应用. 激光技术, 2003, 27(1): 78-80.
[10]	陈树越 , 刘金星 , 丁艺 . 基于小波变换的红外与X光图像融合方法研究. 激光技术, 2015, 39(5): 685-688. doi: 10.7510/jgjs.issn.1001-3806.2015.05.021
[11]	赵蓉 , 顾国华 , 杨蔚 . 基于偏振成像的可见光图像增强. 激光技术, 2016, 40(2): 227-231. doi: 10.7510/jgjs.issn.1001-3806.2016.02.016
[12]	虞文俊 , 顾国华 , 刘骋昊 . 红外偏振图像的仿真. 激光技术, 2014, 38(1): 76-78. doi: 10.7510/jgjs.issn.1001-3806.2014.01.016
[13]	周永康 , 朱尤攀 , 曾邦泽 , 胡健钏 , 欧阳慧明 , 李泽民 . 宽动态红外图像增强算法综述. 激光技术, 2018, 42(5): 718-726. doi: 10.7510/jgjs.issn.1001-3806.2018.05.025
[14]	张凡 . 红外图像改进非局部均值滤波算法研究. 激光技术, 2015, 39(5): 662-665. doi: 10.7510/jgjs.issn.1001-3806.2015.05.016
[15]	李庆辉 , 李艾华 , 姜柯 , 赵少宁 . HIS空间的火灾图像模糊增强快速算法. 激光技术, 2014, 38(1): 137-140. doi: 10.7510/jgjs.issn.1001-3806.2014.01.030
[16]	熊羽 , 左小清 , 黄亮 , 陈震霆 . 基于多特征组合的彩色遥感图像分类研究. 激光技术, 2014, 38(2): 165-171. doi: 10.7510/jgjs.issn.1001-3806.2014.02.005
[17]	张健 , 李白燕 . 基于图论最小割集算法的图像分割研究. 激光技术, 2014, 38(6): 863-866. doi: 10.7510/jgjs.issn.1001-3806.2014.06.030
[18]	孙越娇 , 雷武虎 , 胡以华 , 赵楠翔 , 任晓东 . 基于视觉显著模型的遥感图像舰船快速检测. 激光技术, 2018, 42(3): 379-384. doi: 10.7510/jgjs.issn.1001-3806.2018.03.017
[19]	陶昕辰 , 朱涛 , 黄玉玲 , 高恬曼 , 何博 , 吴迪 . 基于DDR GAN的低质量图像增强算法. 激光技术, 2023, 47(3): 322-328. doi: 10.7510/jgjs.issn.1001-3806.2023.03.006
[20]	李昌海 , 叶玉堂 , 沈淦松 , 徐伟 , 叶涵 , 姚景昭 . 基于图像轮廓分析的LCD线路缺陷检测. 激光技术, 2013, 37(2): 207-210. doi: 10.7510/jgjs.issn.1001-3806.2013.02.017

点击查看大图

图(9) / 表(3)

计量

文章访问数: 5654
HTML全文浏览量: 4057
PDF下载量: 15
被引次数: 0

全文HTML

引言

最近邻搜索是图像检索和机器学习领域的重要基础性问题，但以图像特征为代表的大规模高维特征使得精确最近邻搜索需要花费更多的时间和更大的存储开销。如何快速并准确地获得特征向量的近似最近邻成为一个重要研究内容，即：在保证近似表示精度的情况下，如何设计紧凑的编码来标识特征向量，降低存储空间以及加速特征向量之间欧氏距离的计算。

根据衡量特征向量之间相似度距离的方式的不同，用于图像特征向量近似表示的编码算法可以划分为哈希编码算法和基于量化的编码算法两大类^[1]。虽然都用于降低图像信息的存储空间需求，但不同于图像压缩^[2]，用编码对特征向量进行压缩存储时，允许特征向量在重构时存在误差，但要尽可能小。

欧氏距离比汉明距离对计算需求较大，但具有更好的相似度区分能力。基于量化的编码算法不仅采用二进制编码标识特征向量以减少存储空间需求，还使用近似欧氏距离保持区分能力。向量量化采用一种映射方式，又称为量化器^[3]，将特征向量映射到事先训练的码书中最相似的单词, 并且用于近似表示该特征向量，单词的二进制编号用于标识与之对应的特征向量。

率先将量化模型用于近似最近邻搜索和图像特征检索的积量化算法(product quantization，PQ)^[4-5]，将特征向量分割为若干段子向量，并分别在子向量所在的向量空间训练量化器。将特征向量在各量化器的量化输出串联起来, 用于近似表示该特征向量。基于PQ的思想，学者们提出了各种改进方法，具有代表性的研究工作包括：GE等人提出用带参量和无参量两种笛卡尔优化分解来最小化量化误差^[6]；参考文献[7]中采用倒排索引或多索引对特征向量集进行划分后，再在每一个子集上进行笛卡尔优化分解；为了进一步减少量化误差，HEO等人^[8]编码总长度不变的情况下，预留一定长度的部分编码给相同量化输出但量化误差不同的向量；NOROUZI等人提出了正交k均值算法及笛卡尔积k均值算法^[9]；双层PQ^[10]和局部优化PQ^[11]以及利用图形处理器(graphics processing unit, GPU)^[12]从硬件层面对PQ进行加速以及用于聚类^[13]等PQ的扩展应用研究。

PQ思想基于一个假设前提：特征向量的各个维度分量相互独立，不存在相互关联。然而，实际情况一般不会总是满足这种假设。为此，BRANDT^[14]将转换编码和PQ相结合，在特征向量的每个主成分维度上分别训练量化模型。在此基础上，子空间量化算法(即通过将向量空间划分为多个子空间)被用来解决特征向量维度的空间分布不平衡问题^[15]。类似的研究工作还包括树形量化方法^[16]对特征进行分解，在子向量空间训练子码书的同时对各子码书之间非正交联系进行约束。

上述量化模型大都考虑如何在单层码书的前提下，尽可能地减少量化误差，然而码书的大小决定了量化误差的大小。通常地，码书中单词的数量越多, 会使量化误差越小，然而这带来问题的码书训练所需要的开销也就越大。对此，残差向量量化(residual vector quantization，RVQ)^[17]利用多层小规模码书构成的量化器，其码书层数越多，量化误差越小，特征向量的近似表示精度越高。通过对RVQ引入正交约束条件，正交RVQ^[18]设计了查询点和重构点之间近似欧氏距离计算方法。在前期研究中，提出了增强型残差量化(enhanced residual vector quantization, ERVQ) ^[19]，在RVQ基础上对码书训练过程进行迭代优化，主要目的是在不增加码书规模的条件下，降低总体量化误差，得到更准确的码书，进而提升检索精度。

这类模型虽然训练得到的码书的区分度较高，但训练以及量化过程均发生在特征向量所在的原始向量空间。向量维度越高，带来的最直接影响是在高维向量空间训练码书花费的时间越多。因此，特征向量的高维度现象是制约这类量化方法的训练效率的关键因素之一。参考文献[20]中虽然将高维向量投影到低维空间来训练码书，但没有考虑到投影过程中所带来的投影误差。参考文献[21]中提出了一种投影残差量化(projected residual vector quantization, PRVQ)，在训练量化模型时同时考虑到了投影误差，然而却没有考虑残差量化方法中存在码书训练并不是最优化总体量化误差的不足。

作者在前期关于增强型残差量化模型的研究工作基础上，提出一种将主成分分析方法与该模型相结合的量化方法，通过将特征向量从原始高维向量空间投影到低维向量空间, 并低维向量空间进行码书训练，提高码书训练的时间效率。由于降维过程使特征在投影过程中产生投影误差，会降低所训练的低维向量码书的精度，而码书的精度直接影响到特征的检索准确率。为此，在优化码书的过程中，同时考虑训练码书产生的总体量化误差以及投影所产生的误差。在低维空间训练码书旨在提高码书训练的时间效率；码书优化旨在保证训练所生成的码书的精度。在此基础上，设计一种针对该量化模型的特征向量之间的欧氏距离近似计算方法，提高检索效率。

3. 近似最近邻完全检索

为了评估投影增强型残差量化对特征向量的近似表示精度，类似于参考文献[19]，设计近似欧氏距离计算方法并用于完全检索。

给定特征向量v，根据经过投影增强型残差量化得到的量化输出，可利用下式对其进行重构得到近似向量${\mathit{\boldsymbol{\hat v}}_1}$:

$ \mathit{\boldsymbol{\hat v}} = \mathit{\boldsymbol{\mu }} + \sum\limits_{l = 1}^L {(\mathit{\boldsymbol{M}}_l^T·{{\mathit{\boldsymbol{\hat v}}}_1})} = \\\mathit{\boldsymbol{\mu }} + \sum\limits_{l = 1}^L {(\mathit{\boldsymbol{M}}_l^T·{\mathit{\boldsymbol{c}}_{v, l}})} = \mathit{\boldsymbol{\mu }} + \mathit{\boldsymbol{\tilde v}} $

(3)

式中, μ为应用PCA之前用于调整中心的均值向量，c_{v, l}∈C_l, c_{v, l}(D×1向量)为v(d×1向量)在第l层码书C_l的量化输出，D为投影降维后的向量维度，d为向量的原始维度，L为投影增强型残差量化的码书总层数，M_l^T(d×D投影矩阵)为第l层的逆投影矩阵。

因此，给定查询特征向量q，其与库中特征向量v之间欧氏距离转换成计算q与v的近似表示${\mathit{\boldsymbol{\hat v}}_1}$的欧氏距离，计算公式如下所示：

$ \begin{array}{c} d{(\mathit{\boldsymbol{q, v}})^2} \approx {\left\| {\mathit{\boldsymbol{q}} - \mathit{\boldsymbol{\hat v}}} \right\|^2} = {\left\| {\mathit{\boldsymbol{\tilde q}} - \mathit{\boldsymbol{\tilde v}}} \right\|^2} = \\ {\left\| {\mathit{\boldsymbol{\tilde q}}} \right\|^2} + {\left\| {\mathit{\boldsymbol{\tilde v}}} \right\|^2} - 2\left\langle {\mathit{\boldsymbol{\tilde q}}, \mathit{\boldsymbol{\tilde v}}} \right\rangle = \\ {\left\| {\mathit{\boldsymbol{\tilde q}}} \right\|^2} + {\left\| {\mathit{\boldsymbol{\tilde v}}} \right\|^2} - 2\left\langle {\mathit{\boldsymbol{\tilde q}}, \sum\limits_{l = 1}^L {(\mathit{\boldsymbol{M}}_l^T{\mathit{\boldsymbol{c}}_{v, l}})} } \right\rangle = \\ {\left\| {\mathit{\boldsymbol{\tilde q}}} \right\|^2} + {\left\| {\mathit{\boldsymbol{\tilde v}}} \right\|^2} - 2\sum\limits_{l = 1}^L {\left\langle {\mathit{\boldsymbol{\tilde q}}, \mathit{\boldsymbol{M}}_l^T{\mathit{\boldsymbol{c}}_{v, l}}} \right\rangle } = \\ {\left\| {\mathit{\boldsymbol{\tilde q}}} \right\|^2} + {\left\| {\mathit{\boldsymbol{\tilde v}}} \right\|^2} - 2\sum\limits_{l = 1}^L {\left\langle {{\mathit{\boldsymbol{M}}_l}\mathit{\boldsymbol{\tilde q}}, {\mathit{\boldsymbol{c}}_{v, l}}} \right\rangle } = \\ {\left\| {\mathit{\boldsymbol{\tilde q}}} \right\|^2} + {\left\| {\mathit{\boldsymbol{\tilde v}}} \right\|^2} - 2\sum\limits_{l = 1}^L ( {\mathit{\boldsymbol{M}}_l}\mathit{\boldsymbol{\tilde q}}{)^{\rm{T}}}{\mathit{\boldsymbol{c}}_{v, l}} \end{array} $

(4)

式中，〈·〉为向量的点积运算，$\mathit{\boldsymbol{\tilde q}} = \mathit{\boldsymbol{q}} - \mathit{\boldsymbol{\mu }}, \mathit{\boldsymbol{\tilde v}} = \mathit{\boldsymbol{\hat v}} - \mathit{\boldsymbol{\mu }} $其中μ为应用PCA之前用于调整中心的均值向量。第1项${\left\| {\mathit{\boldsymbol{\tilde q}}} \right\|^2} $对数据库中所有向量影响相同，不会影响数据库向量与查询的相似度排名，在距离计算中可以忽略掉；第2项${\left\| {\mathit{\boldsymbol{\tilde v}}} \right\|^2} $可以在数据库向量量化编码过程离线计算得到并预先存储；第3项$ {({\mathit{\boldsymbol{M}}_l}·\mathit{\boldsymbol{\tilde q}})^{\rm{T}}}{\mathit{\boldsymbol{c}}_{v, l}}$，当提交查询向量q时可提前计算并储存在一个查找表中。

5. 结论

提出了一种投影增强型残差量化方法，通过结合前期研究工作，在训练码书时，将图像视觉特征从高维向量空间投影到低维向量空间，降低训练过程中的时间开销；为了降低投影到低维向量空间带来的投影误差，在训练码书的过程中，同时考虑量化和投影所产生的误差，进而保证所生成码书的精度。实验结果表明，提出的PERVQ在码书训练时间效率上，较ERVQ具有明显提升作用，同时保证了检索精度。

参考文献 (23)

姓名
邮箱
手机号码
标题
留言内容
验证码

留言板

近似最近邻搜索中投影增强型残差量化方法

作者简介: 艾列富(1985-)，男，博士，副教授，现主要从事数字图像处理、特征量化与检索研究。E-mail:ailiefu@qq.com.

Projection-based enhanced residual quantization for approximate nearest neighbor search

计量

近似最近邻搜索中投影增强型残差量化方法

作者简介: 艾列富(1985-)，男，博士，副教授，现主要从事数字图像处理、特征量化与检索研究。E-mail:ailiefu@qq.com

English Abstract

Projection-based enhanced residual quantization for approximate nearest neighbor search

全文HTML

1.1. ERVQ码书训练

1.2. ERVQ量化特征向量

2.1. 码书训练

2.1.1. 初始码书训练

2.1.2. 码书联合优化

2.2. 特征向量量化

4.1. 实验数据集和实验环境

4.2. 投影维度对量化误差的影响

4.3. 投影维度对检索精度的影响

4.4. 同其它方法实验对比

4.4.1. 训练码书的时间开销对比

4.4.2. 检索精度对比

4.4.3. 检索效率对比

目录

留言板

近似最近邻搜索中投影增强型残差量化方法

作者简介: 艾列富(1985-)，男，博士，副教授，现主要从事数字图像处理、特征量化与检索研究。E-mail:ailiefu@qq.com.

Projection-based enhanced residual quantization for approximate nearest neighbor search

计量

出版历程

近似最近邻搜索中投影增强型残差量化方法

作者简介: 艾列富(1985-)，男，博士，副教授，现主要从事数字图像处理、特征量化与检索研究。E-mail:ailiefu@qq.com

English Abstract

Projection-based enhanced residual quantization for approximate nearest neighbor search

全文HTML

1.1. ERVQ码书训练

1.2. ERVQ量化特征向量

2.1. 码书训练

2.1.1. 初始码书训练

2.1.2. 码书联合优化

2.2. 特征向量量化

4.1. 实验数据集和实验环境

4.2. 投影维度对量化误差的影响

4.3. 投影维度对检索精度的影响

4.4. 同其它方法实验对比

4.4.1. 训练码书的时间开销对比

4.4.2. 检索精度对比

4.4.3. 检索效率对比

目录