Investigation on mechanism of material ejection by nanosecond laser ablation of mono-crystalline silicon under different environments
-
摘要: 为了探究纳秒激光烧蚀单晶硅过程中熔融物质的喷溅过程, 对不同加工环境中纳秒激光烧蚀单晶硅的过程进行了模拟仿真及实验验证。采用Level-Set界面追踪法, 通过仿真软件建立有限元模型, 对空气、静水和真空加工环境中纳秒激光烧蚀单晶硅时物质抛出过程进行模拟仿真, 研究了不同加工环境中温度场、速度场对表面喷溅的影响; 采用波长266 nm、脉宽30 ns和频率50 Hz的单脉冲激光烧蚀单晶硅的工艺实验对仿真结果进行验证, 通过原子力显微镜和数字显微镜对烧蚀结果进行了表征。结果表明, 空气环境中, t=30 ns时熔融物质的喷溅速率达到14.1 m/s, 在微孔内部蒸汽压力的作用下, 烧蚀区域熔融物质向外喷出; 静水环境中, t=30 ns时熔融物质的喷溅速率为1.68 m/s, 远低于空气中的喷溅速率, 熔融物质快速冷却; 真空环境中, 材料在短时间内汽化, t=30 ns时熔融物质的喷溅速率最大可达18.4 m/s, 较高的喷溅速率有利于物质的抛出。加工环境对纳秒激光烧蚀单晶硅的物质抛出影响较大, 这为提高纳秒激光加工单晶硅的加工质量提供了参考。Abstract: In order to investigate the process of molten material ejection during nanosecond laser ablation of mono-crystalline silicon, simulation and experimental investigation on nanosecond laser ablation of silicon under different environments were carried out. Simulation on the material ejection during nanosecond laser ablation of silicon under air, water, and vacuum environments with simulation software was carried out based on the Level-Set method. The effects of the temperature field and velocity field on surface sputtering under different environments were investigated. Experiments on laser ablation of mono-crystalline silicon using a wavelength of 266 nm, a pulse width of 30 ns, and a frequency of 50 Hz were done to verify the simulation results. The ablation results were observed by atomic force microscopy and digital microscopy. The results show that the spatter velocity under the air environment is 14.1 m/s at t=30 ns, and the molten material ejectes the ablated holes outwards due to the action of vapor pressure in the ablated area. Under the water environment, the spatter velocity is 1.68 m/s at t=30 ns, much lower than that in air conditions. Under the vacuum environment, the material is vaporized for a short time, and the spatter velocity of the molten material is 18.4 m/s at t=30 ns. The molten materials eject productively due to the high spatter velocity. The adhesion of molten material on the surface is improved. The processing environment has a strong influence on the material ejection during the nanosecond laser ablation of silicon. The investigation provides a reference for improving the quality during nanosecond laser micro-machining.
-
引言
在测量与恢复物体3维面形的领域,以传统结构光法为原理的3维测量有着重要意义,如位相测量轮廓术法(phase measurement profilometry, PMP)和傅里叶变换轮廓术法(Fourier transform profilometry, FTP)等等。这些经典方法对于3维面形的重建已经有了非常大的成效,PMP法能够进行针对于点的初相位求解,解决了被测对象面形的非均匀反射引起的偏差,测量的准确度为等效波长的1%~10%;FTP法只需获取单幅调制图就可以复刻出被测对象的3维面形,并且含有高速和高精度恢复的优点。但是PMP法对正弦光栅的稳定性和相移设备的精密性要求都较高,否则就会存在比较大的测量误差,其测量目标也只适合于小尺寸物体;而FTP法存在频谱混叠现象且缺乏迁移适用性,采用FTP法也有可能因为基准频和零频频谱掺杂导致无法进行准确的窗口式波过滤,从而无法正确恢复被测对象的面形结构。此类经典方法在解相位步骤时都会过于繁琐,亦或是噪声过大光源混杂,或在测量断崖式高度陡变物体等病态问题时,效果往往不尽如人意。
随着人工智能时代的到来,算法图像处理和神经网络于众多方面迅速兴起,其中非常多的算法和框架都被引入到了3维面形重建之中。MIN等人[1]利用最小二乘法测量3维物体面形粗糙度。GUO等人[2]以改进简化的反向传播(back propagation, BP)神经网络模型提高3维面形测量精度。本文作者通过对样本数据特征的采集和算法优化,训练一种深度神经网络模型来恢复物体的面形信息。
1. 经典结构光法的面形恢复原理
经典结构光法的面形恢复原理如图 1所示,由被测物体、电耦合设备(charge-coupled device, CCD)相机和投影仪组成了整个框架。图中蓝色部分为被测物体,弧为被测物体表面,以投影仪和CCD相机为主要框架。光束AD交基面于D点,放上物体后,由于受到了高度限制,由CCD相机看到的光束移到了C点,其两点间距离记为CD,相位差记为Δφ(x, y)。
通过相似三角形△ABG∽△CDG的几何关系,化简并最终得到物体表面一点(x, y)的高度h,计算过程如下:
¯CD=Δφ(x,y)T2π (1) h=LׯCD¯AB+¯CD=L×Δφ(x,y)2πf0ׯAB+Δφ(x,y) (2) 式中,T为余弦的周期。将(1)式代入(2)式中可得出高度值h的关于条纹光固有频率f0和相移值表达结果(过程略),AB为投影仪中心点和相机中心点之间的宽度。L为投影仪中心和CCD相机中心与底面的高度,除了相位差Δφ(x, y)之外的参数都是已知或易于测量的,所以只要知道准确的相位差,就可以非常近似地计算出高度值。传统N步相移法的相位差Δφ(x, y)计算方式的如下:
I(x,y)=R(x,y)⋅[A(x,y)+B(x,y)⋅cosφ(x,y)] (3) Δφ(x,y)=arctan[N−1∑n=0In(x,y)⋅sin(2πnN)N−1∑n=0In(x,y)⋅cos(2πnN)] (4) 式中,I(x, y)表示被测对象一点的光强值,R(x, y)表示被测对象表面非均匀反射系数,A(x, y)为背景光强度,B(x, y)为调制度,φ(x, y)为相位值,N为相移总步数,n为第1, 2, 3⋯步相移,In(x, y)为第n步相移时(x, y)点的光照强度。(3)式为CCD相机接收到的光强信息的表达式; 分别设相移量为0,π/3,2π/3得到3个方程,并联立求解,可得相位表达式(4)式(过程略)。3步相移变化如图 2所示,为一个相移方向上的条纹与调制条纹图。图中,φx, 1表示投影条纹沿x方向上的第1步相移调制图,φx, 2表示投影条纹沿x方向上的第2步相移调制图,φx, 3表示投影条纹沿x方向上的第3步相移调制图。
不难看出,以PMP法还原高度信息,会在最后求取相位差时,包含一个反正切解相位的步骤,而通过相移法求得的相位值域会被限制在(-π, π)的区间上,故必须对其进行一个反正切运算,即解包裹处理,才能正确恢复出被折叠的真实高度信息,而此过程往往会使得计算过程变得冗杂而困难。所以,本文作者尝试以新的视角来思考这个问题,希望找到一个数学函数,来拟合物体的光强信息和此点高度值的直接关系。
2. 深度神经网络的面形重建原理
2.1 深度神经网络的基本结构
深度神经网络(deep neural network, DNN)的结构如图 3所示。网络框架由含32层中间隐藏层构成。层间激活函数为tanh,以σ表示,层间连接采用可有效防止模型过拟合的随机舍弃方式。每层隐含层含有18个记忆神经元,输入为单个像素点的9维光强特征,输出为此点的对应高度预测值。
机器学习中的神经网络模型在本质上是一种标签学习算法[3],通过使用样本集训练学习模型f(·): Rm→Ro,其中f(·)表示两集合间的映射逻辑关系,Rm和Ro分别表示有m和o个元素的集合。此种模型无需相机的标定和解包裹等繁杂过程,直接建立输入量和预测值之间的函数关系。Rm的下标m在神经网络模型中表示输入样本的特征维度数,Ro的下标o为模型预测值的维度数[3],即输入一条特征X=[x1 x2 ⋯ xm]T和标签y,神经网络通过学习训练,可以拟合出一个高纬非线性函数。在输入结点与输出结点之间,会存在一个层或者多层的非线性层,称为隐藏层。
图 4是1维输出且只含有1层隐藏层的多层感知机[4](multilayer perceptron, MLP)。在此MLP结构中,样本特征由输入层导入,为一列代表样本特征值的神经元构成。信息传递途径隐藏层,上一层的信息经过下一层隐藏层中的结点进行加权求和: z=w1x1+w2x2+⋯+wmxn,其中参数wm为各输入项的加权值,加上一个偏置项后,由非线性单元进行z值的非线性转换。最右边的层叫做输出层,其收到的传递值是最后一个隐藏层经过非线性加权变换的输出值。而DNN的核心原理就是对MLP的横向方向进行隐藏层的层数拓展[5]。当网络结构确定后,神经网络的训练过程就是求解所有层间权重和偏置的过程,在整个神经网络模型训练完成后,即可对新的物体直接建立其光照强度和真实高度信息,如图 5所示。
DNN模型在本质上是一个处处可导的多元复合函数,在理论上能拟合出任意维度的超曲面,其训练过程是数据在网络中正向传播, 再以反向传播求取函数梯度更新权重,以进行参数迭代求解目标函数最优解的过程。具体训练流程如图 6所示。
2.2 DNN训练数据采集与预处理
通过改变条纹光的投影角度,增加了神经网络训练样本的特征维度。更多维度的光强信息训练,能使得模型鲁棒性增加[6],使得训练好的模型在投影系统参数(如环境光强噪声、测量深度等)强噪音的情况下能够精确复现出被测对象的3维面形。在条纹光的部署上,与传统N步相移法在单一方向上改变条纹光相位不同,将周期为T=8 pixel、变量区间为0~512 pixel的仿真余弦条纹以0°、45°和90°3个旋转角度, 以15°倾斜角投影在被测物体上。由于被测对象的面形起伏,当正弦条纹光投影到被测对象上时,会让光栅条纹的相位发生调制型变化,再用CCD相机收集这些条纹光光强信息组,得到总共9幅条纹图,如图 7所示。
图 7中,I0°, φ1, I0°, φ2, I0°, φ3为投影条纹光于0°旋转角下沿水平方向经3步相移调制后的调制条纹图。I45°, φ1, I45°, φ2, I45°, φ3为投影条纹光于45°旋转角下沿对角线方向经3步相移调制后的调制条纹图,以此类推。输入层以条纹调制前后总计9个光强信息作为训练集维度特征,分别记为F1 ~ F9,输出值以每个点的真实高度值作为其自身标签,即y。投影仪本身不发生位置和角度改变,通过编码调整投影条纹的旋转角,可以得到同一点在不同条纹角度下的光强信息。单点光照强度的特征采集方式如图 8所示。
在图 8的样本集表格中,y1~yi表示各样本点对应的真实高度值,即为样本标签。将每个样本数据写作计算机更易于处理的向量形式,以每个像素点在9幅调制图中所对应的光照强度值作为其特征值I1, 1~I1, 9。在训练时,若取训练集的一个像素点的特征值和标签值组成向量X1,作为神经网络的输入值,则其表达式为:
\boldsymbol{X}_1=\left[\begin{array}{lllll} I_{1, 1} & I_{1, 2} & \cdots & I_{1, 9} & h_1 \end{array}\right]^{\mathrm{T}} (5) 式中,X1表示此点是(1, 1)位置的像素对应的样本点,I1, 1~I1, 9表示同一点在3种旋转角下3步相移的光强值,h1表示此点的真实高度值。对于一个分辨率为512×512的重建对象,一共具有512×512=262144个像素级样本,记为训练集S={X1, X2, ⋯, X262144},以训练深度神经网络的拟合函数。
2.3 DNN的前向传播与代价函数
图 9为简化的节点信息传递图。红色表示权重为负,蓝色连线表示权重为正,灰色连线表示随机舍弃[7]的层节点;方框中的绿色曲线表示激活函;a0, 1表示神经网络输入层的第1个输入项,ω1, 1表示a0, 1项在第1层神经网络的第1个权重系数,b1, 1表示第1层神经网络的第1个偏置系数,以此类推。经过激活函数将线性映射转换为非线性关系,得到神经网络第1层的其中一个输出a1, 1,以tanh函数为线性转非线性的映射激活,其转换关系如下:
\begin{gathered} a_{1, 1}=\tanh \left[\left(\sum\limits_{i=1}^n \omega_{1, i} a_{0, i}\right)+b_{1, 1}\right]= \\ \frac{\exp \left[\left(\sum\limits_{i=1}^n \omega_{1, i} a_{0, i}\right)+b_{1, 1}\right]-\exp \left[\left(\sum\limits_{i=1}^n \omega_{1, i} a_{0, i}\right)+b_{1, 1}\right]}{\exp \left[\left(\sum\limits_{i=1}^n \omega_{1, i} a_{0, i}\right)+b_{1, 1}\right]+\exp \left[\left(\sum\limits_{i=1}^n \omega_{1, i} a_{0, i}\right)+b_{1, 1}\right]} \end{gathered} (6) BP神经网络是一种采用梯度下降算法[8]进行学习的多层信息前向传递误差反向传播神经网络,根据深度信念网络[9]理论,BP神经网络隐层的神经结点数越多,就越可以以极大精度拟合任意连续超曲面。BP网络有特征光强值的前馈传导和逆向传播两个相互影响制约的步骤[10]。特征光强值的前馈传导步骤是:输入的特征光强值通过输入结点和随机舍弃的隐藏层逐一计算出各单元输出值。逆向传播步骤是:递归循环地计算模型预测值与样本标签高度值的残差,并根据代价函数最小化来自动调整每个神经元结点的权重比例和后续激活阈值[11],最后以全连接作为输出预测值[12]。将神经网络中的权重和偏置参数以和的形式记录,其中下标i和下标j分别表示此参数是属于第i层网络的j个权重或偏置参数。输入量A1为样本数据X1除去标签值h1的剩下部分,输入量A1的各分量在神经网络中传播时以an, m表示,其中n表示数值此刻正传递于神经网络的第n层,m表示此分量为A1的第m个特征数值。记神经网络第1层所有权重参数组成的系数矩阵为W1,所有偏置系数组成的偏置向量为B1,则神经网络第1层的层间线性矩阵映射关系如下:
\begin{gathered} \boldsymbol{W}_1 \boldsymbol{A}_1+\boldsymbol{B}_1= \\ {\left[\begin{array}{ccccc} \omega_{1, 1} & \omega_{1, 2} & \cdots & \omega_{1, 17} & \omega_{1, 18} \\ \omega_{1, 19} & \ddots & \vdots & \therefore & \omega_{1, 36} \\ \vdots & \cdots & \cdot & \cdots & \vdots \\ \omega_{1, 127} & \therefore & \vdots & \ddots & \omega_{1, 144} \\ \omega_{1, 145} & \omega_{1, 146} & \cdots & \omega_{1, 161} & \omega_{1, 162} \end{array}\right]\left[\begin{array}{c} a_{1, 1} \\ a_{1, 2} \\ \vdots \\ a_{1, 8} \\ a_{1, 9} \end{array}\right]+\left[\begin{array}{c} b_{1, 1} \\ b_{1, 2} \\ \vdots \\ b_{1, 17} \\ b_{1, 18} \end{array}\right]=} \\ {\left[\begin{array}{c} \omega_{1, 1} a_{1, 1}+\omega_{1, 2} a_{1, 2}+\cdots+\omega_{1, 18} a_{1, 9}+b_{1, 1} \\ \omega_{1, 19} a_{1, 1}+\omega_{1, 20} a_{1, 2}+\cdots+\omega_{1, 36} a_{1, 9}+b_{1, 2} \\ \vdots \\ \omega_{1, 127} a_{1, 1}+\omega_{128} a_{1, 2}+\cdots+\omega_{1, 144} a_{1, 9}+b_{1, 17} \\ \omega_{1, 145} a_{1, 1}+\omega_{146} a_{1, 2}+\cdots+\omega_{1, 162} a_{1, 9}+b_{1, 18} \end{array}\right]} \end{gathered} (7) 将上述结果记为Z1,再通过激活函数tanh对Z1的第1个分量z1, 1为例,对于层间非线性软化的转换,可将(7)式简化,记Z1=W1A1+B1,其转换关系如下:
\sigma\left(z_{1, 1}\right)=\frac{\exp \left(z_{1, 1}\right)-\exp \left(-z_{1, 1}\right)}{\exp \left(z_{1, 1}\right)+\exp \left(-z_{1, 1}\right)} (8) 可见神经网络的本质是一个多层复合函数。对于整个网络,其完整函数表达式是非常繁琐的。以ŷ表示神经网络最后输出的高度预测值,以σ表示激活运算,则整个预测过程表达式可写作:
\begin{gathered} \hat{y}=\sigma\left\langle\boldsymbol { W } _ { 3 2 } \boldsymbol { \sigma } \left\{\cdots \boldsymbol { W } _ { 3 } \sigma \left[\boldsymbol{W}_2 \boldsymbol{\sigma}\left(\boldsymbol{W}_1 \boldsymbol{A}_1+\boldsymbol{B}_1\right)+\right.\right.\right. \\ \left.\left.\left.\boldsymbol{B}_2\right] \cdots+\boldsymbol{B}_{31}\right\}+b_{32, 1}\right\rangle \end{gathered} (9) 将得到的高度预测值ŷ与真实值y作残差得到损失函数L,度量了回归值对于真实值的偏差,记为:
L=\frac{1}{2}\|\hat{y}-y\|_2^2 (10) 本文中以弹性网络[12]作为目标函数惩罚项,同时使用l1和l2范数进行正则化,将二者的优点都结合了起来,兼顾了拉索回归[13]和岭回归[14]的各自优势,其目标函数惩罚项Ω(W)的数学表达式如下:
{\mathit{\Omega}}(\boldsymbol{W})=\alpha \rho\|\boldsymbol{W}\|_1+\frac{\alpha(1-\rho)}{2}{\|\boldsymbol{W}\|_2}^2 (11) 式中,超参数α和ρ为取值在(0, 1)之间的动态可控值,以控制两种正则化类型所占比重, W为由(9)式中W1~W32各矩阵的所有行列元素按角标顺序重新组合构成的向量,即W=[ω1, 1 ω1, 2 ⋯ ω32, 324]T,其中ω32, 324的下标32表示其位于第32层网络,324表示其为此层网络的第18×18=324个参数。使用l1范数项作为估计稀疏系数的惩罚项,会趋向使目标函数解的非零系数变少的方向,降低最小值对应解所需的特征维度达到降维的效果,即将惩罚为0,从而减少参数ω的数量。而l2范数项作为控制网络的收缩量,使得ω往更小的值收敛,神经网络对未知数据的鲁棒性就更强[15]。将损失项和惩罚项合并,即得到了目标优化函数,如下:
\begin{aligned} & f_{\text {obj }}=L+{\mathit{\Omega}}(\boldsymbol{W})=\frac{1}{2}{\|\hat{y}-y\|_2}^2+ \\ & {\left[\alpha \rho\|\boldsymbol{W}\|_1+\frac{\alpha(1-\rho)}{2}{\|\boldsymbol{W}\|_2}^2\right]} \end{aligned} (12) 问题转化为求取目标函数最小值时对应的参数值,一旦将所有权重系数和偏置系数,神经网络模型就确定了。现在转化为如下数学问题:
(\boldsymbol{W}, \boldsymbol{B})=\arg \min f_{\mathrm{obj}} (13) 式中, B表示由(9)式中B1~B31各向量的所有分量按角标顺序重新组合并加上b32, 1所构成的向量,即B=[b1, 1 b1, 2 ⋯ b32, 1]T,其中b32, 1的下标32表示其位于第32层网络,1表示最后一层网络只有此一个偏置项。
2.4 随机梯度下降迭代过程
本文作者使用非常适合处理万量级以上样本数的随机梯度下降[16](stochastic gradient descent, SGD)的迭代算法来求解上述问题,如本训练对象的512×512=262144个像素级样本。因SGD是针对每个样本进行逐一迭代的[17],所以SGD对样本集的特征缩放非常敏感,需要将样本特征即9维的光照强度信息,全部归一化到均值为0、方差为1的区间内。每次将样本集S={X1, X2, ⋯, X262144}中的多个样本传入算法流程,以迭代方式更新参数值,其迭代公式如下:
{\mathit{\boldsymbol{ \boldsymbol{\varTheta} }}^{(t + 1)}} = {\mathit{\boldsymbol{ \boldsymbol{\varTheta} }}^{(t)}} - {\left. {{\eta ^{(t)}} \cdot \nabla {\mathit{\boldsymbol{f}}_{{\rm{obj}}}}} \right|_{{\mathit{\boldsymbol{ \boldsymbol{\varTheta} }}^{(t)}}}} (14) 式中,Θ(t)为当前迭代的参数值组成的向量,Θ(t+1)为下一迭代后的参数值组成的向量,η(t)为第t时刻的自适应学习率[18],▽fobjΘ(t)为目标函数在Θ(t)处的梯度,是一个k行1列的向量,其中k为所求参数的总数。记迭代过程收敛时刻的t=τ,即当fobj(Θτ) < ε时(ε为一极小量),终止迭代。训练结束时获得的所有的ω值和b值即为神经网络模型的最终参数。下面以反向传播运算加速梯度值的求取速度。
2.5 反向传播求取梯度
神经网络的反向传播,是一种以链式法则求取函数梯度分量的过程[19]。通过增加电脑内存占用为代价,提高神经网络的训练速度。目标函数的梯度为:
\nabla \boldsymbol{f}_{\text {obj }}=\left[\begin{array}{llll} \frac{\partial f_{\text {obj }}}{\partial \omega_{1, 1}} & \frac{\partial f_{\text {obj }}}{\partial \omega_{1, 2}} & \cdots & \frac{\partial f_{\text {obj }}}{\partial \omega_{32, 324}} \end{array}\right]^{\mathrm{T}} (15) 式中,梯度的分量为目标函数的偏导数,由于神经网络的层层复合,参数所在神经网络的层级越初级,其偏导计算式越繁琐:
\left\{\begin{array}{l} \frac{\partial f_{\text {obj }}}{\partial \omega_{32, 1}}=\frac{\partial f_{\text {obj }}}{\partial \sigma_{32, 1}} \frac{\partial \sigma_{32, 1}}{\partial z_{32, 1}} \frac{\partial z_{32, 1}}{\partial \omega_{32, 1}} \\ \frac{\partial f_{\text {obj }}}{\partial \omega_{31, 1}}=\frac{\partial f_{\text {obj }}}{\partial \sigma_{32, 1}} \frac{\partial \sigma_{32, 1}}{\partial z_{32, 1}} \frac{\partial z_{32, 1}}{\partial \sigma_{31, 1}} \frac{\partial \sigma_{31, 1}}{\partial z_{31, 1}} \frac{\partial z_{31, 1}}{\partial \omega_{31, 1}} \\ \vdots \\ \vdots \\ \frac{\partial f_{\text {obj }}}{\partial \omega_{1,1}}= \frac{\partial f_{\text {obj }}}{\partial \sigma_{32,1}} \frac{\partial \sigma_{32,1}}{\partial z_{32,1}} \frac{\partial z_{32,1}}{\partial \sigma_{31,1}} \frac{\partial \sigma_{31,1}}{\partial z_{31,1}} \frac{\partial z_{31,1}}{\partial \sigma_{30,1}} \underbrace{\ldots \ldots}_{\text {87×partial derivative }} \\ \;\;\;\;\;\;\;\;\;\;\;\; \frac{\partial \sigma_{2,1}}{\partial z_{2,1}} \frac{\partial z_{2,1}}{\partial \sigma_{1,1}} \frac{\partial \sigma_{1,1}}{\partial z_{1,1}} \frac{\partial z_{1,1}}{\partial \omega_{1,1}} \end{array}\right. (16) 反向传播即以占用更多内存为代价,如图 10所示。算力较强的计算机,在DNN架构的设计策略上,可增加网络的宽度和深度[20],或使用不同的处理器,如在图形处理器上进行并行运算。在提高拟合精度的同时,还能显著减少神经网络的训练时间[21]。
将各个链式中间项写入计算机内存, 便可快速求解任意第p层的第q个权重的偏导数, 让神经网络可以较为快速地迭代出收敛区间下的神经网络全参数。只要训练完成,迁移适用性也会变得非常强, 这使得在测量新型面形时,无需再重复训练, 而神经网络权值参数的优化更新,是一个可多次输入样本簇并迭代优化的过程。
2.6 多次训练至网络收敛
为了增加网络的泛化能力,本文作者使用了总计260×104个像素级样本点对神经网络进行参数训练,且对每类物体进行多个轮次训练,体现了神经网络的进阶学习性。如加入刀锋和波纹状样本进行训练,可强化神经网络对物体表面划痕或刮痕的重建鲁棒性,如图 11a和图 11b所示。加入随机噪点样本进行训练,可强化神经网络对表面含较多毛刺物体的重建鲁棒性,如图 11c所示。
将两个呈共轭关系等阶梯状物体的像素点记为样本集送入神经网络再次迭代参数,既可优化神经网络在断崖式物体面形测量上表现,同时又优化了此类阶梯型样本数据在空间上分布不均衡所导致神经网络的欠鲁棒性,如图 12和图 13所示。
总共进行193个轮次时均方误差(mean square error, MSE)达到一个收敛区间(1.0×10-8~1.0×10-9)。图 14为深度神经网络模型输出高度值的MSE随迭代轮次的变化结果。图 15为其它性能指标的参数走势图。当然,如此高的测量精度只是在理想样本集上精度的表现。在对实际物体进行测量时精度会降低1~2个数量级。作者将收敛的DNN模型储存起来,然后在真实物体数据集上进行面形重建实验。
因本文中重建物体面形的方法与其自身实验装置的耦合性较强,部分主要实验装置配置和神经网络的最优参数如表 1所示。
表 1 本文中的DNN训练参数与实验配置Table 1. Training parameters and experimental configuration of DNNexperimental configuration table network training parameters inclination angle of projector 15° initial learning rate 0.01 rotation angle of projector 0°, 45°, 90° weight decay open distance between projector and base plane 0.966 m optimizer Adam distance between camera and base plane 1.0 m number of learning rounds 193 epochs program platform MATLAB/Python number of hidden layers 32 model of projector XGIMI NEW Z6X number of neurons per layer 18 GPU model of computer GTX 1650 activation function tanh CUDA model of computer 896 interlayer connection dropout experimental environment chamber penalty function elastic net 3. 深度神经网络的面形重建实验
本文作者使用相关软件进行仿真重建实验,以训练好的深度神经网络重建了软件中内置山峰函数的绝对值函数,还原结果和误差分布图如图 16和图 17所示。
经典FTP法和PMP法的重建单点最大误差大于1.00 mm,MLP法的重建单点最大误差为1.00×10-2 mm。GUO等人[2]的BP神经网络的平均重建时间为3.8 s,单点最大误差为0.34×10-3 mm。本文中的DNN单点最大误差在1.42×10-4 mm以下,重建时间达到了非常短的0.27 s之内。因为整个DNN的高度复原计算方法是对单点进行的直接映射关系预测,结构相对简单,也没有较大的区域性误差。本文中的DNN对于物体面形的重建从速度和精度上相较于其它方法都存在着优势,且对于反光材质的物品(如铁制镀漆物品)的还原结果也较为优良。
考虑到不同测量距离和测量环境对面形恢复精度的影响,对西南石油大学铁制校徽进行了对照重建实验,如图 18所示。对本文中方法的面形重建能力进行了定量评价,具体数值如表 2所示。
表 2 不同条件下重建能力对比Table 2. Comparison of reconstruction capabilities under different conditionsmeasuring distance/mm light interference average error/mm maximum error /mm reconstruction time/s 1.0×103 no interference 1.40×10-4 1.42×10-4 0.27 1.0×103 bright light 1.93×10-4 1.94×10-4 0.30 2.0×103 no interference 1.62×10-4 1.65×10-4 0.27 2.0×103 bright light 2.82×10-4 2.84×10-4 0.31 3.0×103 no interference 2.16×10-4 2.29×10-4 0.26 3.0×103 bright light 3.72×10-4 3.81×10-4 0.31 4.0×103 no interference 3.46×10-4 3.72×10-4 0.25 4.0×103 bright light 4.21×10-4 4.84×10-4 0.32 5.0×103 no interference 3.84×10-4 4.04×10-4 0.25 5.0×103 bright light 5.39×10-4 5.77×10-4 0.33 6.0×103 no interference 4.34×10-4 4.72×10-4 0.24 6.0×103 bright light 5.79×10-4 6.00×10-4 0.35 7.0×103 no interference 5.57×10-4 5.83×10-4 0.23 7.0×103 bright light 6.83×10-4 6.93×10-4 0.37 8.0×103 no interference 6.26×10-4 6.63×10-4 0.20 8.0×103 bright light 7.55×10-4 7.75×10-4 0.41 9.0×103 no interference 7.54×10-4 7.94×10-4 0.19 9.0×103 bright light 8.40×10-4 8.75×10-4 0.43 10.0×103 no interference 7.81×10-4 8.51×10-4 0.18 10.0×103 bright light 9.89×10-4 9.96×10-4 0.51 本文中的DNN具有一定的迁移泛化能力,即一旦网络参数全部训练完毕,便可在无需再次训练情况下迅速重建物体面形信息。即使在光线干扰较强的室外,且测量距离小于10 m之内的情况下,对物体的重建平均误差不超过9.96×10-4 mm。
为了验证本文中DNN在真实情况下的对物体面形恢复的效果,作者对太阳神鸟(仿品)和某观音饰品进行了真实试验,如图 19和图 20所示。
同时,为了对比本文中DNN对物体面形恢复效能,作者以同等阶梯状物体的面形恢复效果作了横向对比。其中,样本规模是指参与训练的总样本数量,样本规模和训练轮数越大,在相同性能的计算机下耗费的计算资源和计算时间也就越大。对比结果如表 3所示。
表 3 不同方法重建阶梯状物体性能对照Table 3. Comparison of properties of step objects reconstructed by different methodsmethods sample size training time/
(s/batch)MSE maximum error/mm reconstruction time/s PMP/FTP — — >1.00 >1.00 >1 MLP unknow unknow >1.00 1.00×10-2 >1 BP neural network 32768000 3.9 9.27×10-4 3.40×10-3 3.8 our approach 2621440 1.11 4.12×10-5 1.42×10-4 0.27 4. 结论
本文中采用了以较多维度的相关参量作训练集来表征物体面形高度,即GUO等人[2]提出的进一步优化的方法之一。根据深度信念网络理念,只要模型训练的批次取得合适范围,训练后期步长足够小,并且整个模型有更多的神经结点和隐藏层层数,拟合任意连续超曲面都是可行的,甚至可以让损失无限趋近于0。特征维度增加之后,需要更高质量的样本集来训练神经网络,需要更精准的仪器和低噪声的光照环境中所收集的样本集来进一步提高面形恢复精确度。作者将相位测量轮廓术中的相移思想运用到神经网模型的样本集收集中,通过不同角度的条纹增加了单点光强信息的特征数,同时防止了神经网模型欠拟合。本文中的方法省去了传统相位测量轮廓术和傅里叶变换轮廓术的繁琐计算过程,优化了神经网络模型的训练样本采集方式,在实践中可降低计算时间和设备成本,为实时面形复原提供了一定的可行性。
-
表 1 单晶硅材料属性[17]
Table 1 Main properties of mono-crystalline silicon materials
material melting point/℃ density/
(g·cm-3)conductivity of heat/
(W·cm-1·K-1)boiling point /℃ Si(P-100) 1410 2.33 1.5 2355 -
[1] 王佳敏, 季艳慧, 梁志勇, 等. 532 nm皮秒脉冲激光对单晶硅的损伤特性研究[J]. 中国光学, 2022, 15(2): 242-250. https://www.cnki.com.cn/Article/CJFDTOTAL-ZGGA202202005.htm WANG J M, JI Y H, LIANG Zh Y, et al. Damage characteristics of a 532 nm picosecond pulse laser on monocrystalline silicon[J]. Chin-ese Optics, 2022, 15(2): 242-250(in Chinese). https://www.cnki.com.cn/Article/CJFDTOTAL-ZGGA202202005.htm
[2] 聂世琳, 管迎春. 紫外激光器及其在微加工中的应用[J]. 光电工程, 2017, 44(12): 1169 -1179. https://www.cnki.com.cn/Article/CJFDTOTAL-GDGC201712008.htm NIE Sh L, GUAN Y Ch. Review of UV laser and its applications in micromachining[J]. Opto-Electronic Engineering, 2017, 44(12): 1169-1179(in Chinese). https://www.cnki.com.cn/Article/CJFDTOTAL-GDGC201712008.htm
[3] 卢红. 不同环境下激光与材料的相互作用[D]. 天津: 天津大学, 2017: 10-17. LU H. Interaction between laser and materials under different environmental conditions[D]. Tianjin: Tianjin University, 2017: 10-17 (in Chinese).
[4] 张晋平. 飞秒激光加工高深径比微孔的研究[D]. 上海: 上海交通大学, 2015: 20-26. ZHANG J P. Research of high-aspect ratio holes drilled by femtose-cond laser[D]. Shanghai: Shanghai Jiao Tong University, 2015: 20-26(in Chinese).
[5] UENO I, SHOJI M. Thermal-fluid phenomena induced by nanosecond-pulse heating of materials in water[J]. Journal of Heat Transfer, 2001, 123(6): 1123-1132. DOI: 10.1115/1.1409264
[6] 周翔, 段军, 陈航, 等. 水辅助激光无重铸层钻孔Al2O3陶瓷实验研究[J]. 激光技术, 2018, 42(2): 271-275. DOI: 10.7510/jgjs.issn.1001-3806.2018.02.025 ZHOU X, DUAN J, CHEN H, et al. Experimental study about water-assisted laser drill on Al2O3 ceramics without recast layer[J]. Laser Technology, 2018, 42(2): 271-275(in Chinese). DOI: 10.7510/jgjs.issn.1001-3806.2018.02.025
[7] 朱帅杰, 张朝阳, 储松林, 等. 海量微孔水辅助法皮秒激光加工技术的研究及应用[J]. 中国激光, 2020, 47(3): 03020028. https://www.cnki.com.cn/Article/CJFDTOTAL-JJZZ202003015.htm ZHU Sh J, ZHANG Ch Y, CHU S L, et al. Research and application of massive micropores water-assisted picosecond laser processing technology[J]. Chinese Journal of Lasers, 2020, 47(3): 03020028 (in Chinese). https://www.cnki.com.cn/Article/CJFDTOTAL-JJZZ202003015.htm
[8] DOU H Q, YAO C Z, LIU H, et al. Femtosecond laser ablation of Al-Mg alloy in vacuum and air[J]. Applied Surface Science, 2018, 447(31): 388-392.
[9] WANG Q W, YE Y C, PENG Y, et al. Friction and cutting characteristics of micro-textured diamond tools fabricated with femtosecond laser[J]. Tribology International, 2020, 154: 106720.
[10] 王卫江, 贾凯, 房瑞娜, 等. 激光诱导等离子体辐射特性的研究综述[J]. 激光技术, 2022, 46(4): 499-510. DOI: 10.7510/jgjs.issn.1001-3806.2022.04.010 WANG W J, JIA K, FANG R N, et al. Review on radiation features of laser-induced plasma[J]. Laser Technology, 2022, 46(4): 499-510(in Chinese). DOI: 10.7510/jgjs.issn.1001-3806.2022.04.010
[11] WANG X, QIN Y, WANG B, et al. Numerical and experimental study of the thermal stress of silicon induced by a millisecond laser[J]. Applied Optics, 2011, 50 (21) : 3725-3732. DOI: 10.1364/AO.50.003725
[12] 张廷忠. 毫秒激光打孔过程熔融喷溅、重铸层和微裂纹形成机理研究[D]. 南京: 南京理工大学, 2017: 31-33. ZHANG T Zh. Study on the mechanism of melt ejection recast, layer and micro crack formation in millisecond laser drilling[D]. Nanjing: Nanjing University of Science and Technology, 2017: 31-33(in Chinese).
[13] 钟发成, 吕雪明, 李佳桂, 等. 组合激光对单晶硅热作用的数值分析[J]. 激光技术, 2017, 41(5): 637-643. DOI: 10.7510/jgjs.issn.1001-3806.2017.05.004 ZHONG F Ch, LV X M, LI J G, et al. Numerical analysis of thermal effect of the combined laser on single crystal silicon polymers irradiated by high power laser[J]. Laser Technology, 2017, 41(5): 637-643(in Chinese). DOI: 10.7510/jgjs.issn.1001-3806.2017.05.004
[14] 齐立涛, 李雪, 刘亚升. 单脉冲266 nm固体激光烧蚀蓝宝石的工艺和机理[J]. 黑龙江科技大学学报, 2020, 30(4): 416-421. https://www.cnki.com.cn/Article/CJFDTOTAL-HLJI202004012.htm QI L T, LI X, LIU Y Sh. Process and mechanism for sapphire ablation by singlepulse 266 nm solid-state laser[J]. Journal of Heilongjiang University of Science and Technology, 2020, 30(4): 416-421 (in Chinese). https://www.cnki.com.cn/Article/CJFDTOTAL-HLJI202004012.htm
[15] 曹州权, 谢小柱, 陈蔚芳, 等. 液体辅助激光加工过程中压力检测及应用研究进展[J]. 光电工程, 2017, 44(4): 381-392. https://www.cnki.com.cn/Article/CJFDTOTAL-GDGC201704005.htm CAO Zh Q, XIE X Zh, CHEN W F, et al. Research progress of pressure detection and applications in liquid-assisted laser machining[J]. Opto-Electronic Engineer, 2017, 44(4): 381-392(in Chin-ese). https://www.cnki.com.cn/Article/CJFDTOTAL-GDGC201704005.htm
[16] 齐立涛, 刘凤聪. 266 nm纳秒固体激光在CH薄膜上打孔的工艺实验研究[J]. 激光技术, 2022, 46(6): 767-772. DOI: 10.7510/jgjs.issn.1001-3806.2022.06.009 QI L T, LIU F C. Experimental investigation on 266nm nanosecond solid-state laser drilling on CH film[J]. Laser Technology, 2022, 46(6): 767-772(in Chinese). DOI: 10.7510/jgjs.issn.1001-3806.2022.06.009
[17] 鲍家定. 水层特性对水下激光划切单晶硅质量的影响研究[D]. 桂林: 桂林电子科技大学, 2021: 28-34. BAO J D. Study on the influence of water layer characteristics on quality of under water laser cutting monocrystalline silicon[D]. Gui-lin: Guilin University of Electronic Technology, 2021: 28-34(in Ch-inese).
[18] 彭根琛. 铝合金真空激光焊接特性及能量传输机理研究[D]. 哈尔滨: 哈尔滨工业大学, 2020: 20-25. PENG G Ch. Research on characteristics and energy transfer mechanism of laser welding under vacuum for aluminum alloys[D]. Harbin: Harbin Institute of Technology, 2020: 20-25 (in Chinese).
[19] 张潇允, 张巍, 夏盛强, 等. 高功率激光辐照CFRP的温度场和应力场的数值分析[J]. 激光技术, 2021, 45(5): 636-641. DOI: 10.7510/jgjs.issn.1001-3806.2021.05.017 ZHANG X Y, ZHANG W, XIA Sh Q, et al. Study on numerical analysis of temperature field and stress field of carbon fiber reinforced polymers irradiated by high power laser[J]. Laser Technology, 2021, 45(5): 636-641(in Chinese). DOI: 10.7510/jgjs.issn.1001-3806.2021.05.017
[20] LI G L, SHI D, H H S, et al. Research on the mechanism of laser drilling alumina ceramics in shallow water[J]. The International Journal of Advanced Manufacturing Technology, 2022, 118(11): 3631-3639.
-
期刊类型引用(1)
1. 李胜,呼家龙,蒋国庆. 基于改进神经网络的弱光图像自动分割算法. 许昌学院学报. 2024(05): 105-110 . 百度学术
其他类型引用(0)