HTML
-
OXFORD X-MET7500型荧光光谱仪(OXFORD公司);Poly-MHP透射膜、样品盒;Rh为阳极靶,电压为40kV,电流为50mA,测试时间为90s。
-
不同品牌、同一品牌不同系列的香烟烟灰样本83个, 见表 1。
serial number sample name and series 1# Huanghelou (yellow hard box) 2# Huanghelou (snow view two) 3# Huanghelou (xueya serial) 4# Nanjing (twelve hairpins in Jinling) 5# Lanzhou (luck filter) 6# Hongta Mountain (classic 1956) 7# Changbai Mountain (red hard box) 8# Changbai Mountain (yellow hard box) 9# Zhongnanhai Five (white hard box) 10# Seven Wolves (white hard box) 11# Baisha(blue hard box) 12# Taishan Xinyue (white hard box) 13# Golden Leaves (rose gold hard box) 14# Cloud(red hard box) 15# Cloud(red soft box) 16# Huanghelou(golden blue soft box) 17# Huanghelou(red soft box) 18# Red Double Happiness (gold soft box) 19# International Double Happiness (red soft box) 20# Memory Huangshan (yellow soft box) 21# Yuxi(soft box) 22# Great Hall of the People (guci box) 23# Huanghelou(blue soft box) 24# Liqun (gray hard box) 25# Lanzhou(blue hard box) 26# Baisha(red hard box) 27# Furongwang(gold hard box) 28# Gui(golden hard box) 29# Changbai Mountain(777 box) 30# Pride(white hard box) 31# Golden Bridge(Golden hard box) 32# Cloud Hulunbuir (green and yellow hard box) 33# Nanjing(mengdu) 34# Nanjing(xuanhemen) 35# Nanjing(red hard box) 36# Great Hall of People(red hard box) 37# Zhonghua(red hard box) 38# Zhonghua(red soft box) 39# Lanzhou(purple hard box) 40# Lanzhou(luck filter) 41# ESSE(blue hard box) 42# ENNE(white packaging) 43# Dubao(white soft box) 44# Huangshan(jimei) 45# Huangshan Red Square Seal(red soft box) 46# Red River Panda(red soft box) 47# Peony (red soft box) 48# Suyan(red soft box) 49# Yuxi(hard box) 50# Hongta Mountain(classic 100) 51# Red Double Happiness(shangpai) 52# Zhonghua(full open) 53# Zhonghua(export) 54# Great Hall of the People(legend) 55# Great Hall of the People(shengjing) 56# Red Golden Dragon(red soft box) 57# Honghe(red and white hard box) 58# Marlboro(blue hard box) 59# Changbai Mountain(lanshang) 60# Marlboro(gray hard box) 61# Huangshan Red Square Seal(yellow hard box) 62# Panda(orange hard box) 63# Seven Stars(white hard box) 64# Jianpai HD Silver 4(white hard box) 65# Furongwang(yellow hard box) 66# Panda(jiaozi) 67# Seven Stars(black mark) 68# Zhongnanhai(menthol flavor) 69# KOOL 70# Suyan(fuyun) 71# Hongtashan(classic 150) 72# Hongtashan(century) 73# Taishan(soft box) 74# Nanjing(xiqing) 75# Baisha(boutique cigarette) 76# Red double Happiness (hepai) 77# Red double Happiness (jiangshan) 78# Nanjing(red hard box) 79# Zhonghua(red soft box 330) 80# China Red 81# Taishan(yellow hard box) 82# Changbai Mountain(hailan) 83# Dougle Happiness Table 1. Sample table of cigarette ash
-
将收集到的烟灰样品装入样品盒内,用Poly-MHP透射膜将装有烟灰的样品盒上端封住,在上述实验条件下进行检测。借助SPSS24.0软件,Zscore标准化处理数据[17]。利用数理统计方法,对样品进行分析。
1.1. 实验仪器及条件
1.2. 实验样品
1.3. 实验方法
-
按照相似性将物理或抽象对象分类,各个类别由类似对象组成,这一过程称为聚类。聚类分析是按照一定的相似性对样品分类后,通过分析发现全局数据的分布模式及样品之间的相互关系[18]。现将样品数据进行标准化处理,然后采用Ward法作为类间亲疏程度的度量方法,平方欧氏距离作为个体间距离的计算方式。样品经过聚类分析后的分类结果见图 1。
如图 1所示,为了不使样品分类类别过多,同时达到聚类分析的目的,取重新标定距离为5,所有样品被分为4类(见表 2)。
classification sample number Ⅰ 70#, 74#, 65#, 77#, 78#, 73#, 79#, 76#, 81#, 68#, 80#, 71# Ⅱ 18#, 63#, 56#, 60#, 64#, 41#, 53#, 58# Ⅲ 8#, 29#, 7#, 59#, 82#, 51#, 67#, 69#, 72#, 75#, 40#, 83#, 27#, 34#, 37#, 33#, 2#, 42#, 66# Ⅳ 3#, 16#, 47#, 12#, 24#, 14#, 25#, 5#, 30#, 15#, 45#, 17#, 19#, 22#, 11#, 4#, 13#, 36#, 55#, 54#, 31#, 32#, 10#, 61#, 9#, 43#, 38#, 52#, 23#, 1#, 21#, 49#, 28#, 46#, 6#, 50#, 35#, 44#, 48#, 20#, 26#, 39#, 57#, 62# Table 2. Classification results of tobacco ash samples
-
为了考察聚类结果的准确性,借助多元线性回归分析考察聚类结果分成的不同类别与各个元素变量之间的相互依赖的关系。回归分析是研究变量之间相关关系的一种统计方法,运用十分广泛,这种技术通常用于预测分析[19]。回归模型的相关参量方差分析结果见表 3。回归模型的分析结果见表 4。残差直方图见图 2。标准化残差预期累积概率-累积目标概率图见图 3。
model sum of squares degree of freedom mean square jointhypothesestset signification 1 regression 78.147 14 5.582 18.867 0.000 residual 20.118 68 0.296 total 98.265 82 Table 3. Analysis of variance results
model R R2 adjusted R2 error of standard estimation Durbin-Watson 1 0.892 0.795 0.793 0.544 2.010 Table 4. Model summary
Figure 3. Expected cumulative probability-cumulative probability of observation of standardized residual
由表 3可知,回归模型的显著性水平为0.000(预测变量:常数、铅、铁、钴、钾、钛、锆、锌、铜、钙、汞、锰、钡、铷、锶),其显著性概率远远小于0.01,故说明该模型内各个元素变量对类别变量的影响达到显著性水平。
R2代表着模型参量对因变量的解释能力,不同模型可以直接用R2来判断模型精确度的高低,其值越接近1,说明回归直线对于观测值的拟合效果越好。由表 4可知,该回归模型的调整后R=0.793,拟合度较好(预测变量同表 3)。Durbin-Watson统计量的值为2.010,与临界值(d=2)十分接近,在无自相关性的值域之中,认定残差独立,通过检验。说明变量之间基本没有自相关性,各个元素变量的独立性较好[20]。
由图 2可知,标准化残差直方图呈一个倒扣的钟形,左右两侧基本对称。由图 3可知,标准化残差的预期累积概率-累积目标概率图中散点大部分靠近斜线,综合而言,残差符合正态分布。根据以上残差独立性检验和残差正态性检验的结果,认为数据基本满足线性回归要求,所建立的模型可按照拟合质量进行预测,即通过2.1节中聚类分析得到的样品类别与各元素之间可建立良好的拟合关系,说明聚类结果较为准确。
-
判别分析是一种判断个体所属类别的统计分析手段[21-22],是根据已知对象的某些观测值和其所属类别来判断未知对象所属类别,因此可将判别分析与聚类分析相结合,建立判别模型对聚类分析结果进行检验。将2.1节中聚类分析的结果作为已知类别,对样品聚类结果进行逐步判别分析,根据判别函数计算得出相对应的得分, 样品最终划入得分最高的类中[23-24]。4个类别Wilk的Lambda检验判别结果见表 5。
function test Wilks Lambda chi square degree of freedom signification 1~3 0.010 337.430 42 0.000 2~3 0.129 149.223 26 0.000 3 0.497 51.065 12 0.000 Table 5. Wilks Lambda result
由表 5可知,软件在判别过程中建立了3个判别函数,函数1、2、3的显著性水平均小于0.05,说明3个判别函数显著成立,采用这3个函数得到的判别结果较好,判别函数的特征值见表 6。
function characteristic value percent of variance/% cumulative/% regular correlation 1 12.173* 76.0 76.0 0.961 2 2.837* 17.7 93.7 0.860 3 1.013* 6.3 100.0 0.709 Table 6. Eigenvalue of discriminant function
表 6中的方差百分比反映了典型函数所能解释的方差变异程度(*表示分析中使用了前3种典型的判别函数),由函数1的方差百分比值为76.0%,函数2的方差百分比值为17.7%,函数3的方差百分比为6.3%,函数1所能解释的信息远远比函数2及函数3多。所以选取函数1作为区分样品的主要判别依据。函数1与函数2之间典型相关性系数分别为0.961和0.860,表示样品在函数1和函数2这两个维度上具有显著差异。故选择函数1和函数2作为函数判别轴建立联合分布图,结果见图 4。
由图 4可知,1代表第Ⅰ类样品,2代表第Ⅱ类样品,3代表第Ⅲ类样品,4代表第Ⅳ类样品。这4类样品在函数1、函数2的判别轴上区分明显。由于函数1是区分样品的主要依据,在函数1的维度上,4类样本之间的差异性显著,同一类的样品均落在了同一区域。利用Fisher判别函数进行回判,样品回判正确率为100%,表明该判别模型对样品的区分效果显著。结果见表 7。
classifi-cation forecast group members total 1 2 3 4 initial count 1 12 0 0 0 12 2 0 8 0 0 8 3 0 0 19 0 19 4 0 0 0 44 44 percentage/% 1 100 0 0 0 100 2 0 100 0 0 100 3 0 0 100 0 100 4 0 0 0 100 100 Table 7. Sample back judgment output table
第Ⅰ类样品的线性判别函数是:
第Ⅱ类样品线性判别函数是:
第Ⅲ类样品线性判别函数是:
第Ⅳ类样品线性判别函数是:
(1) 式~(4)式中的Y1~Y4分别为判别函数的因变量,X1~X14分别为判别函数的自变量。
表 7显示,100.0%的初始样品被正确分类,利用判别模型预测的样品类别与实际样品类别完全一致,若要检验其它未知样品的分类,只需将样品元素含量输入各变量中,就能直接在联合分布图上找到与之距离最近的分组质心,进而完成对未知样品的准确分类。