在2维坐标系中,平面椭圆方程的隐式方程表示为F(a, x)=0,其中$a = (A, B, C, D, E, F) $为椭圆方程的参量,即椭圆隐式方程为:
$ f\left( {x, y} \right) = A{x^2} + Bxy + C{y^2} + Dx + Ey + F $
(1) 式中,$ f\left( {x, y} \right)$为椭圆方程,其中x和y分别为椭圆上点的横纵坐标值; $ A, B, C, D, E, F$为椭圆方程参量。
比较常见的椭圆拟合方法有基于代数距离的最小二乘法。由最小二乘法可知,椭圆的拟合可以近似看成是求光斑边缘上的i个数据点$\left( {{x_i}, {y_i}} \right) $到曲线$ f\left( {x, y} \right) = 0$的残差平方和的最小值,即求目标函数$f\left( {B, C, D, E, F} \right) = \sum\limits_{i = 1}^m {} {\left( {{x_i}^2 + B{x_i}{y_i} + C{y_i}^2 + D{x_i} + E{y_i} + F} \right)^2} $的最小值。再由极值原理,欲使$f\left( {B, C, D, E, F} \right) $值为最小,必有$ \frac{{\partial f}}{{\partial B}} = \frac{{\partial f}}{{\partial C}} = \frac{{\partial f}}{{\partial D}} = \frac{{\partial f}}{{\partial E}} = \frac{{\partial f}}{{\partial F}} = 0$。由此可得一个线性方程组,将其转换成求线性矩阵方程Ax=b的解。这里A为5×5维实矩阵,x为待求5维列向量,b为n维实向量。
$ \begin{array}{l} \left[ {\begin{array}{*{20}{c}} {\sum\limits_{i = 1}^m {} {x_i}^2{y_i}^2}&{\sum\limits_{i = 1}^m {} {x_i}{y_i}^3}&{\sum\limits_{i = 1}^m {} {x_i}^2{y_i}}&{\sum\limits_{i = 1}^m {} {x_i}{y_i}^2}&{\sum\limits_{i = 1}^m {} {x_i}{y_i}}\\ {\sum\limits_{i = 1}^m {} {x_i}{y_i}^3}&{\sum\limits_{i = 1}^m {} {y_i}^4}&{\sum\limits_{i = 1}^m {} {x_i}{y_i}^2}&{\sum\limits_{i = 1}^m {} {y_i}^3}&{\sum\limits_{i = 1}^m {} {y_i}^2}\\ {\sum\limits_{i = 1}^m {} {x_i}^2{y_i}}&{\sum\limits_{i = 1}^m {} {x_i}{y_i}^2}&{\sum\limits_{i = 1}^m {} {x_i}^2}&{\sum\limits_{i = 1}^m {} {x_i}{y_i}}&{\sum\limits_{i = 1}^m {} {x_i}}\\ {\sum\limits_{i = 1}^m {} {x_i}{y_i}^2}&{\sum\limits_{i = 1}^m {} {y_i}^3}&{\sum\limits_{i = 1}^m {} {x_i}{y_i}}&{\sum\limits_{i = 1}^m {} {y_i}^2}&{\sum\limits_{i = 1}^m {} {y_i}}\\ {\sum\limits_{i = 1}^m {} {x_i}{y_i}}&{\sum\limits_{i = 1}^m {} {y_i}^2}&{\sum\limits_{i = 1}^m {} {x_i}}&{\sum\limits_{i = 1}^m {} {y_i}}&{\sum\limits_{i = 1}^m {} 1} \end{array}} \right]\left[ \begin{array}{l} B\\ C\\ D\\ E\\ F \end{array} \right] = \\ \left[ \begin{array}{l} - \sum\limits_{i = 1}^m {} {x_i}^3{y_i}\\ - \sum\limits_{i = 1}^m {} {x_i}^2{y_i}^2\\ - \sum\limits_{i = 1}^m {} {x_i}^3\\ - \sum\limits_{i = 1}^m {} {x_i}^2{y_i}\\ - \sum\limits_{i = 1}^m {} {x_i}^2 \end{array} \right] \end{array} $
(2) 式中,$ \left( {{x_i}, {y_i}} \right)$为光斑边界上点的坐标,$\left( {{x_i}, {y_i}} \right) \subset E $表示光斑图像中边缘上所有的点的集合。通过求解该线性方程组,便可得到椭圆方程参量B, C, D, E和F,则中心坐标$\left( {{x_{\rm{c}}}, {y_{\rm{c}}}} \right) $为:
$ \left\{ \begin{array}{l} {x_{\rm{c}}} = \frac{{BE - 2CD}}{{4C - {B^2}}}\\ {y_{\rm{c}}} = \frac{{BD - 2E}}{{4C - {B^2}}} \end{array} \right. $
在数字信号处理(digital signal processing,DSP)系统设计开发工具中以高斯消元法为基础对线性方程组进行求解,鉴于DSP builder的除法模块只能计算出被除数和除数相除以后的商和余数,故而采用移位寄存器将被除数移位倍增,再进行相除,经验证,其精度远远小于单精度浮点数,计算的结果与理论比较误差大于10%,因此选用Quartus Ⅱ的单精度浮点运算知识产权(intellectual property,IP)核,运用IP核设计运算处理单元。
$ \begin{array}{l} \mathit{\boldsymbol{A}} = \mathit{\boldsymbol{LD}}{\mathit{\boldsymbol{L}}^{\rm{T}}} = \left[ {\begin{array}{*{20}{c}} 1&{}&{}&{}&{}\\ {{l_{21}}}&1&{}&{}&{}\\ {{l_{31}}}&{{l_{32}}}&1&{}&{}\\ \ldots&\ldots&\ldots&\ldots &{}\\ {{l_{n1}}}&{{l_{n2}}}&{{l_{n3}}}& \ldots &1 \end{array}} \right] \cdot \\ \left[ {\begin{array}{*{20}{c}} {{d_1}}&{}&{}&{}&{}\\ {}&{{d_2}}&{}&{}&{}\\ {}&{}&{{d_3}}&{}&{}\\ {}&{}&{}& \ldots &{}\\ {}&{}&{}&{}&{{d_n}} \end{array}} \right]\left[ {\begin{array}{*{20}{c}} 1&{{l_{21}}}&{{l_{31}}}& \ldots &{{l_{n1}}}\\ {}&1&{{l_{32}}}& \ldots &{{l_{n2}}}\\ {}&{}&1& \ldots&\ldots \\ {}&{}&{}&1& \ldots \\ {}&{}&{}&{}&1 \end{array}} \right] \end{array} $
(4) 矩阵D及L中的元素dj和lij根据下式计算:
$ \left\{ \begin{array}{l} {d_j} = {a_{jj}} - \sum\limits_{k = 1}^{j - 1} {} {l_{jk}}^2{d_k}\\ {l_{ij}} = \frac{{{a_{ij}} - \sum\limits_{k = 1}^{j - 1} {} {l_{ik}}{d_k}{l_{jk}}}}{{{d_j}}} \end{array} \right. $
(5) 式中,$ j = 1, 2, \ldots , n;i = j + 1, j + 2, \ldots , n$。aij和ajj分别为矩阵A中的第i行j列和第j行j列所对应的元素,dj和dk为对角阵D中对角线上所对应的的元素(k=j-1),lij,lik和ljk分别为矩阵L中第i行j列、第i行k列和第j行k列所对应的元素。
$ \left\{ \begin{array}{l} \mathit{\boldsymbol{Lz}} = \mathit{\boldsymbol{b}}\\ \mathit{\boldsymbol{Dr}} = \mathit{\boldsymbol{z}}\\ {\mathit{\boldsymbol{L}}^{\rm{T}}}\mathit{\boldsymbol{x}} = \mathit{\boldsymbol{r}} \end{array} \right. $
(6) 式中, z和r为引入的n维待求列向量。根据以上步骤即可求得方程的解向量x。
$ \left\{ \begin{array}{l} {d_j} = {a_{jj}} - \left[ {{l_{i1}}^2{d_1} + {l_{i2}}^2{d_2} + \ldots + {l_{i(j - 1)}}^2{d_{(j - 1)}}} \right]\\ {l_{ij}} = [{a_{ij}} - ({l_{i1}}{d_1}{l_{j1}} + {l_{i2}}{d_2}{l_{j2}} + \ldots + \\ {l_{i(j - 1)}}{d_{(j - 1)}}{l_{j(j - 1)}})]/{d_j} \end{array} \right. $
(7) 由(7)式可知,矩阵D中元素dj的计算依赖于矩阵A中的元素ajj、矩阵L的第j行元素以及矩阵D的前(j-1)个元素。L矩阵的元素lij的计算依赖于矩阵A中的元素aij、矩阵D中的元素dj以及矩阵L的第i行元素。而lij与l(i+1)j之间的计算没有依赖关系,且dj和lij的计算都要计算中间结果ljkdk。
通过对LDLT分解算法及相关数据分析,可设计如图 1所示的分解结构框图。分解模块主要分为计算对角阵D元素的单元PED、下三角阵L元素的单元PEL和数据选择器,PED与PEL共享PED的计算结果ljkdk,所以可以将此结果缓存于先入先出缓存器(first in, first out, FIFO)中的直接用于lij的计算,从而避免重复运算,节省资源。PED的输入ljk通过四选一数据选择器,按照一定的顺序将4组存储矩阵L中元素的随机存取存储器(random access memory, RAM)中的数据读出,用于计算dj。矩阵A的数据通过数据分配器从外部传输到PEL与PED。其中,矩阵中aij与dj, lij各自关联,但是PED与PEL计算存在延迟,故将数据存于FIFO_a0~FIFO_a4中。当前lij的计算结果与当前dj值关联很大,且lij的计算还会用到计算dj时的中间值ljkdk,所以PED要在PEL之前执行。在理想的情况下,为了实现运算速度最快,PEL的数量越多,效率越高。输入矩阵A为5×5的矩阵,在每一个内层循环中,需要计算的矩阵D的对角线元素dj仅为1个,采用一个PED单元即可;而计算的矩阵L的元素lij的个数最多为4个,且互不依赖,故采用4个PEL并行计算。分解模块具体结构如图 3所示。其中RAMD为存储矩阵D中元素的随机存取存储器。
图 3中,PED和PEL模块均采取流水化设计方案,运算单元主要包括乘法器(multiplication)、除法器(division)、加法器(addition)和减法器(subtraction),均使用Quartus Ⅱ提供的IEEE 754规范的浮点数运算IP核实现。
$ \left\{ \begin{array}{l} {z_m} = {b_m} - \sum\limits_{p = 1}^{m - 1} {} {l_{mp}}{z_p}, \left( {m = 1, 2, \ldots , q} \right)\\ {r_m} = \frac{{{z_m}}}{{{d_m}}}, \left( {m = 1, 2, \ldots , q} \right)\\ {x_m} = {r_m} - \sum\limits_{u = m + 1}^q {} {l_{um}}{x_u}, \left( {m = q, q - 1, \ldots , 1} \right) \end{array} \right. $
(8) 式中,lmp和lum分别表示矩阵L中第m行p列和第u行m列所对应的元素;dm表示矩阵D对角线上对应的元素;zm, rm, xm, bm分别代表列向量z, r, x, b的第m个元素;zp,xu分别代表列向量z的第p个元素和列向量x的第u个元素;q为待求向量的维数(q=5)。
本文中基于Quartus Ⅱ 14.0的开发环境,将上述设计在Altera公司的DE1-SOC开发板上进行了验证。鉴于作者无法准确地得到光斑图像真实的中心,因此通过MATLAB程序生成一幅人工光斑图像,并附着一些噪声及干扰,该光斑图像的理论中心坐标为(150,166),分别在FPGA平台和计算机Visual Studio(VS)环境下利用本文中的算法对光斑进行中心定位,根据(3)式计算的最终结果对比如表 1所示。其中,FPGA的工作时钟设定为50MHz,并采取IEEE 754规范下的单精度浮点制IP核来实现设计中的各浮点运算。
Table 1. Deviation between FPGA and PC
coordinate of center absolute deviation visual studio (150.06907, 166.097) (0.06907, 0.097) FPGA (150.06881, 166.048) (0.06881, 0.048) 由表 1可知,本方法对圆的中心定位的精度小于0.1pixel,但FPGA平台与计算机VS环境下实现相同的算法计算的结果有差异,出现此结果的原因是,在FPGA平台使用单精度浮点IP核进行计算时,首先要将数据转换为单精度浮点数(32bit),但对于较大的数据,尾数部分会有部分省略,进而对结果产生一定的误差。不过两个平台计算的中心位置的误差都小于0.1pixel,所以该方法保证了中心定位算法的精度。
保证中心定位算法精度的前提下,为测试方法的效率,将实现LDLT解最小二乘问题的方法在FPGA平台和计算机VS下进行了计算效率比较。具体结果如表 2所示。
Table 2. Processing time
FPGA visual studio proportion decomposition/μs 36.38 620 1/17.04 solving/μs 37.06 995 1/26.85 total/μs 73.44 1615 1/21.99 由表 2可知,在FPGA平台下实现解5维最小二乘问题时,本文中方法在保证精度的前提下,可达到相对于计算机21倍以上的速度。
Locating algorithm of optical fiber spot center based on FPGA
摘要: 为了解决传统数字图像处理算法中数据运算量大、复杂度高、耗时长的问题,提出一种基于可编程门阵列(FPGA)光纤光斑中心定位的方法。采用数字信号处理系统,利用开发工具(DSP builder),设计了光斑图像预处理算法和边缘检测算法,用最小二乘法拟合光斑边界,采用流水线设计,增强了数据处理的并行能力,提高了处理速度。在Cyclone V平台上进行理论分析和实验验证,取得了光斑图像边界、中心坐标数据。结果表明,在保证对光斑中心定位的绝对误差小于0.1pixel的条件下,使用FPGA比计算机运算速度能提高21倍以上。该研究能够在FPGA平台上快速准确定位光斑中心。Abstract: In order to solve the problem of large amount of data, high complexity and long time consuming in traditional digital image processing algorithm, a method for center location of optical fiber spot was presented based on field-programmable gate array (FPGA). By using digital signal processing system and development tools (DSP builder), image preprocessing algorithm and edge detection algorithm were designed. The least square method was used to fit the boundary of light spot. The parallel capability for data processing was enhanced and the processing speed was improved by means of pipeline design. Theoretical analysis and experimental verification were carried out on Cyclone V platform. The image boundary and the central coordinate data were obtained. The results show that under the condition that the absolute error of spot center location is less than 0.1pixel, the computer speed can be improved by more than 21 times based on FPGA. The spot center can be located quickly and accurately on FPGA platform.
Key words:
- image processing /
- spot center detection /
- least square method /
- optical fiber spot
