HTML
-
实验仪器:便携式差分喇曼光谱仪(SEDRS Portable-Base,南京简智仪器设备有限公司)。
实验条件:光源采用双频输出(Δλ≤1nm),单频输出功率不大于450mW,线宽不大于0.06nm;积分时间30s,激光功率为220mW,测量范围180cm-1~2800cm-1。
-
44个不同品牌、不同系列的烟用内衬纸样本信息见表 1。
number brands and collections 1# Nanjing/Jinling twelve hairpins 2# Nanjing/red China west 3# Nanjing/Nanjing red 4# Nanjing/Jiapin 5# Nanjing/ninth five-year plan 6# Nanjing/Xuan He Men 7# Nanjing/Yuhua stone 8# Golden Leaf/golden hall 9# Golden Leaf/red flag canal 10# Golden Leaf/sky leaf 11# Golden Leaf/small gold 12# Golden Leaf/golden eye 13# Yellow Crane Tower/soft blue 14# Yellow Crane Tower/big choi 15# Yellow Crane Tower/tender valley 16# Yellow Crane Tower/wonderful view 17# Yellow Crane Tower/Yaxiang 18# Yellow Crane Tower/hardsafety 19# Yellow Crane Tower / 1916 Ruanpu 20# Liqun/soft red long mouth 21# Liqun/new edition 22# Liqun/national beauty 23# Yuxi/happy new year 24# Yuxi/hard box 25# Yuxi/soft box 26# Yuxi/original aspiration 27# Changbai Mountain/777 series 28# Marlboro/hard red 29# Marlboro/hard platinum 30# Marlboro/iqos 31# Su Yan/hard gold sand 32# Su Yan/gold sand C 33# Dunhill/blue 34# Yunyan/purple 35# Zhongnanhai/extra high 36# Taishan/luxury 37# Peony/soft export 38# 555/Jin Rui 39# Diamond/lotus 40# Lanzhou/hard boutique 41# Furong King/hard box 42# Double Happiness/boutique 43# Hongtashan/classic 1956 44# Seven Stars/sky blue Table 1. Cigarette liner sample information
1.1. 主要仪器及条件
1.2. 实验样本
-
重现性实验结果见图 1,均匀性实验结果见图 2。由图 1和图 2可以看出, 样品的差分喇曼光谱谱图的峰数、峰位、峰形和峰强基本一致,仅个别受宇宙射线的干扰,如图 1所示的10次实验中出现的1180cm-1, 1705cm-1, 1763cm-1, 1866-1和2230cm-1;图 2中出现的574cm-1和998cm-1,单次实验出现干扰峰的数目最多不超过1个,对实验影响很小。实验结果表明:该方法重现性良好,样品的均匀性良好,可用该方法对烟用内衬纸进行检验分析。
-
在生产过程中,生产厂家为了填补植物纤维间的空隙,提升纸张的性能,降低成本,常会加入不同种类、配比、产地、加工工艺的填料和胶料,这些差异会反映在差分喇曼谱图中,为利用差分喇曼光谱法检验烟用内衬纸提供了理论依据。烟用内衬纸常用的填料有:碳酸钙、高岭土、滑石粉、钛白粉、氧化锌、硫酸钡、二氧化硅等。不同种类的烟用内衬纸都含有植物纤维素,区别主要在于填料。植物纤维素及常见填料的喇曼特征峰见表 2。由表 2可以看出,填料和纤维素,填料和填料之间,存在很多相近的特征峰,根据某个特征峰无法判断出是否含有该填料,因此结合仪器实际的扫描范围,对表 2中的特征峰进行剔除筛选。经过筛选,可以得出识别碳酸钙的特征峰为711cm-1, 1085cm-1;识别高岭土的特征峰为393cm-1, 636cm-1;识别滑石粉的特征峰为289cm-1, 360cm-1, 674cm-1;识别硫酸钡的特征峰为459cm-1, 1138cm-1。
filler name raman characteristic peak/cm-1 cellulose 169, 378, 382, 434, 457, 896, 993, 1094, 1119, 1292, 1338, 1379, 1409, 1471 calcium carbonate 153, 280, 711, 1085 kaolin 140, 393, 636 talcum 106, 192, 289, 360, 430, 464, 674, 1048, 1096 sulphate 279, 459, 616, 986, 1085, 1138 Table 2. Raman characteristic peaks of cellulose and commonly used fillers for cigarette liner paper
通过对44个烟用内衬纸样品的差分喇曼光谱谱图初步分析,发现依据主要填料的不同可将样品分为4大类(分类结果见表 3)。第1类样品中只含有碳酸钙(见图 3),第2类样品只含有高岭土(见图 4),第3类样品既不含有碳酸钙,也不含有高岭土(见图 5);第4类样品既含碳酸钙又含高岭土(见图 6)。
group sample number 1 1#, 8#, 9#, 24#, 26#, 27#, 33# 2 2#, 3#, 5#, 6#, 7#, 11#, 12#, 17#, 20#, 21#, 22#, 23#, 28#, 29#, 30#, 31#, 39#, 41#, 42#, 44# 3 4#, 15#, 18#, 19#, 34#, 35#, 36#, 37#, 40#, 43# 4 13#, 14#, 16#, 25#, 38# Table 3. Classification results of cigarette liner
通过直接比对光谱图并依据样品主要填料的不同,对样品进行分类的方法,结果直观,但不能避免人工主观带来的误差,且当样品成分较复杂时,比对难度也会增大,因此需要结合多种客观分析方法,以期达到准确的区分效果。
-
实验中将44个样品的喇曼数据处理成喇曼位移-喇曼强度的2维数组,由于变量(喇曼位移)数目较多,故采用主成分分析对数据进行降维,各主成分得分情况见图 7。贡献率是指单个主成分在总变异中占据的比例,代表了此主成分对因变量的影响力大小;累计贡献率表示了当前选择的所有主成分携带原数据的信息的比例。由图 7可知,提取的24个主成分包含了原喇曼光谱数据93.48%的信息量,其中主成分1贡献最大,为16.89%,表明其对44个样本数据的影响力较强,主成分24的方差贡献率小,为1.05%,其对44个样本数据影响力较弱。
-
将3.3节中得出的前24个主成分进行系统聚类分析,用平方欧氏距离度量类间距离,聚类方法选择瓦尔德法,聚类结果谱系图见图 8。
由图 8可知,当类间距离为最小值时,样品被分为32类;当类间距离为5时,样品被分为10类,当类间距离达到阈值25时,所有样品被归为一类。为选择合理的分类,以连接距离为依据,抽取9#, 13#, 14#, 29#, 39#这5个样品,考察它们的显著性P值和Pearson相关系数,计算结果见表 4。
samplenumber parameter 9# 13# 14# 29# 39# 9# Pearson correlation 1 P value 0.000 13# Pearson correlation 0.533 1 P value 0.000 14# Pearson correlation 0.548 0.984 1 P value 0.000 0.000 29# Pearson correlation 0.407 0.932 0.927 1 P value 0.000 0.000 0.000 39# Pearson correlation 0.407 0.414 0.387 0.367 1 P value 0.000 0.000 0.000 0.000 Table 4. Correlation results of 5 samples
由表 4可知, 5个样品的P值都为0.000,说明它们之间的差异具有高度统计学意义。13#和14#,14#和29#的相关系数分别为0.984和0.927,表明两者的相关性很强,而9#, 39#和其余样品的相关系数均小于0.7,说明其相关性较弱,因此可以将13#, 14#, 29#样品分为一类,9#, 39#样品各自单独成一类。同理,通过对不同组间距离分类的结果进行相关性检验,比较P值和Pearson相关系数,发现:当组间距离为7时,分类效果最好,此时样品被分为5类,分类结果见表 5。
group sample number 1 35# 2 39# 3 24#, 30#, 33#, 34#, 37#, 40# 4 2#, 6#, 9#, 26#, 32# 5 1#, 3#, 4#, 5#, 7#, 8#, 10#, 11#, 12#, 13#, 14#, 15#, 16#, 17#, 18#, 19#, 20#, 21#, 22#, 23#, 25#, 27#, 28#, 29#, 31#, 36#, 38#, 41#, 42#, 43#, 44# Table 5. Clustering results
-
考虑到在实际办案中,判断未知样本的类别情况意义重大,因此,用主成分分析提取的24个主成分构建判别分析,在数据分析中,判别分析常和聚类分析联合起来使用,这里利用3.4节中聚类分析得出的最佳分类结果,选择各类别的先验概率与其样本量成正比进行计算,使用合并的类内协方差矩阵进行分析,得到了各样本的特征值输出和Wilk lambda检验结果(见表 6)。
function variance percentage cumulative percentage canonical correlation function test Wilk lambda P value 1 47.7 47.7 0.986 1~4 0.000 0.000 2 33.4 81.1 0.980 2~4 0.001 0.000 3 14.6 95.7 0.956 3~4 0.021 0.000 4 4.3 100.0 0.871 4 0.242 0.000 Table 6. Eigenvalue output and Wilk lambda test results of each sample
由表 6可知,该模型构建了4个典则判别函数,其中函数1携带了47.7%的原始信息,函数2携带了33.4%的原始信息,前两个函数的累计百分比达81.1%,能较好的解释原始数据的基本特征。Wilk lambda检验结果用于检验各个判别函数有无统计学上的显著意义,函数1、函数2的Wilk lambda数值都极接近0,表示组间变异较大,且P值均为0,说明这两个判别函数的作用都是显著成立的。综上所述,选择函数1和函数2建立联合分布散点图(见图 9),并得出判别结果(见表 7)。
classification resultsa classi-fication prediction group member information total 1 2 3 4 5 count number 1 1 0 0 0 0 1 2 0 1 0 0 0 1 3 0 0 6 0 0 6 4 0 0 0 5 0 5 5 0 0 0 0 31 31 percentageof number/% 1 100.0 0.0 0.0 0.0 0.0 100.0 2 0.0 100.0 0.0 0.0 0.0 100.0 3 0.0 0.0 100.0 0.0 0.0 100.0 4 0.0 0.0 0.0 100.0 0.0 100.0 5 0.0 0.0 0.0 0.0 100.0 100.0 Table 7. Discriminant analysis results
由图 9可以看出,5类样本的质心在整体上得到了区分。第1类、第2类、第3类样品在水平方向上,类与类之间的距离均超过20,因此这3类样本在函数1判别轴上区分明显;第2类样本和第4类和第5类样本在竖直方向上,间隔的距离超过20,因此第2类和第4类和第5类样本在函数2判别轴上区分明显;第4类样本和第5类样本在图 9中区分不是十分明显,通过调节函数1判别轴的取值范围,如图 10所示,将数值范围(-30,30)调节为(-5,5),可以看出,第4类和第5类的质心在水平方向上仍然可以得到很好的区分。结合表 7中的判别分析结果可知, 该模型能对5类烟用内衬纸样品做出100%的正确分类。如果想考察未知样本的分类情况,只需要将相应数据代入上述两个判别函数,就可以联合分布图上找到位置,从而完成对未知样本的类别判定。