0、 引言
梨枣又名大铃枣、脆枣等,果实多数似梨形,为枣中稀有的名贵鲜食品种。其中,梨枣糖度是其鲜食时品质优劣的首要判断标准。为了提供高品质的梨枣,需要研究能同时检测果实内外部品质的快速、无损自动检测分级系统。研究表明,物质的内部成分与波谱信息密切相关,这使利用光谱信息对梨枣内部品质进行无损检测成为可能。
相对于传统的检测方法,高光谱成像技术集中了光学、光电子学、电子学、信息处理、计算机科学等领域的先进技术,是光谱技术与图像技术的有机结合。
近年来,高光谱技术在农产品检测的应用日益广泛,不仅可以实现农作物成分的检测,还可以实现水果的大小、损伤、糖度等的无损检测分析。小波分析算法作为一种强大的时-频局部化分析方法,解决了傅里叶分析方法无法对局部时间信号的局部频谱特性进行分析的问题。近几年,小波分析已经广泛应用于工业检测和农产品检测等各个领域,其主要应用是进行去噪和提取特征参数,以提高建模分析水平。
小波分析虽然在光谱研究中应用很多,但是将小波分析应用于高光谱数据中并提取其逼近系数进行建模分析的应用还未见报道。为此,利用小波分析方法,针对高光谱成像仪采集的梨枣光谱信息建立模型,对梨枣糖度质量分数进行无损检测分析。
1、 实验材料和方法
1. 1 梨枣样本
实验所用样本于 2013 年9 月28 日采摘于山西省太谷县东庄枣园。为了实现高光谱对梨枣糖度质量分数的无损检测,采集了 82 个正常梨枣样本(将其标记为 tg1 ~ tg82) ,用于检测其糖度含量。
1. 2 高光谱数据采集
高光谱图像数据通过高光谱成像系统采集得到,系统装置 如图 1 所示。其主要包括成像光谱仪V10E—QE、C - mount 成 像 镜 头 OLE—23、线 光 源Schott DCR Ⅲ、电控位移台 PSA 200—11—X、OBF570滤片、移动平台控制器 SC300A、计算机、校正白板和暗箱等一系列部件。其中,线光源 Schott DCR Ⅲ是一种功率为 150W 的直流稳压卤素光源。
进行实验时,实验台速度设置为 1. 6mm/s,高度为 240mm,分辨率为 672×1 390,曝光时间为 500ms。本实验采集得到光谱范围是 400 ~ 1 000nm 之间共512 个波长下的图像信息。
1. 3 高光谱图像校正
由于系统暗电流和光源不均匀等的影响,采集梨枣样本图像后,须对高光谱图像进行黑白标定。系数调整好后,先扫描反射率为 99% 的标准白色校正板得到全白的参考图像 Ac,然后采集全黑的参考图像 Bc。
黑白标定公式为
式中 Ic—原始的高光谱图像;Bc—全黑的标定图像;Ac—全白的标定图像;Rc—标定后的高光谱图像。所有高光谱图像数据的采集都是基于台湾五铃光学股份有限公司提供的信息采集软件平台(Isuzuo-ptics) ,数据处理基于 ENVI4. 7 (Research System Inc. ,Boulder ,Co. ,USA) 和 Matlab R2010b 软件平台。
1. 4 糖度数据采集
当样本采集完高光谱后,立即采集其糖度数据。本实验梨枣糖度数据采用传统的方式获取,即将梨枣果肉挤压出汁,并采用滤纸对果汁进行过滤,对过滤后的汁液采用数字阿贝折射仪(WAY-2S) 测定其糖度质量分数。
2、 结果与讨论
2. 1 光谱预处理
2. 1. 1 原始光谱图
将 82 个梨枣感兴趣区域像素点的光谱求均值,得到 82 条光谱曲线。图 1 为 82 个梨枣样本的可见-近红外光谱图。
2. 1. 2 全光谱 PLS 建模
首先将 82 个太谷梨枣样本全部作为校正集,用The Unscrambler9. 8 软件进行偏最小二乘法 (PLS) 建模预测,得到的糖度质量分数(SSC) 实测值/预测值的散点分布图如图 2 所示,实测值与预测值的残差分布图如图 3 所示。
由图 3 可知,tg42 偏离拟合线最远,其次为 tg3 和tg15,先将这 3 个样本暂时定为异常样本,对其逐个剔除并建模分析模型性能。模型性能参数如表 1 所示。
由表 1 可知: 首先将 tg42 剔除后,模型 Rc 提高,RMSEC 降低,模型性能改善; 再依次剔除 tg3 和 tg15。
当剔除 tg3 时,Rc 升高,RMSEC 降低,模型得到改善;当剔除 tg15 时,Rc 降低,RMSEC 降低,但是降低幅度不大。当把 3 个样本全部剔除时,Rc 降低,RMSEC 也降低。综合考虑,应该剔除 tg42 和 tg3。
2. 1. 3 原始光谱预处理
背景和噪声干扰是光谱分析中必须考虑的问题。
在光谱分析中,首先要去除背景跟噪声的干扰,提高信噪比。本实验采用小波变换的分解重构法对剔除异常样本后的光谱进行预处理,在 MatLab 里用小波分解重构法对光谱进行预处理。试验表明,该预处理方法得到的数学模型比原始光谱所建数学模型效果要好。图 4 为原始光谱跟小波预处理后的光谱图。
2. 1. 4 全波段光谱建模分析
用 80 个正常梨枣样本的 472 个波段的光谱数据建立偏最小二乘(PLS) 模型和主成分回归(PCR) 模型,模型参数如表 2 所示。
由表 2 可知: 用预处理后 512 个光谱波段建模时,PLS 模型校正集相关系数 Rc 比 PCR 模型的 Rc 要高,方差比 PCR 要低; 且 PLS 预测集相关系数 Rp 比 PCR模型的 Rp 要高,方差比 PCR 要低。所以,PLS 模型优于 PCR 模型。
2. 2 近似系数建模分析
2. 2. 1 提取近似系数
对经过预处理后的光谱进行多尺度分解,提取近似系数。本文对梨枣可见-近红外光谱用小波函数db6 进行 6 层分解,分别提取 6 层的逼近信号 a1 ~ a6和 6 层的细节信号 d1 ~ d6,如图 5 所示。
由图5 可知: 细节信号 d1 和 d2 的值较小,可认为是由传感器或是状态噪声的高频干扰; 细节信号 d5反应了 250 波段处的光谱吸收信息,因此第 5 层的贡献最大。在利用上述算法计算特征提取时,小波分解的尺度由于目标光谱特征宽度较大,往往在所确定尺度上特征空间数据量过少,对原始光谱的描述较为粗糙。这时,可以选择计算结果所确定尺度的上一级近似小波系数作为光谱特征提取的结果,即 a4 近似系数。最终选择用小波函数 db6 进行 4 层分解,并提取第 4 层的近似系数 a4 来代替原始光谱信息进行建模分析。
2. 2. 2 近似系数建模分析
对梨枣样本提取的 42 个近似系数进行建模分析,分别建立偏最小二乘回归(PLS) 模型和主成分回归(PCR) 模型,模型参数如表 3 所示。随机取前 20个样本作为预测集,后 60 个样本作为建模集,用建模集样本分别建立 PLS 校正模型和 PCR 校正模型,并分别对预测集样本进行预测,结果如图 6 所示。
由表 2 和表 3 可知: 近似系数的 PLS 模型校正集相关系数 Rc(0. 931) 和 PCR 模型 Rc(0. 882) 分别要比全光谱 PLS 模型 Rc(0 . 875 ) 和 PCR 模 型 Rc(0. 858) 要高; PLS 模型校正集方差 RMSEC(0. 986) 、预测集方差 RMSEP(1. 159) 和 PCR 模型校正集方差RMSEC(1. 048) 、预测集方差 RMSEP (1. 322 ) 分别要比全光谱 PLS 模型校正集方差 RMSEC(0. 731) 、预测集方差 RMSEP(1. 270) 和 PCR 模型校正集方差 RM-SEC(0. 958) 、预测集方差 RMSEP(1. 361) 的差值更为接近,说明近似系数所建模型较稳定。因此,基于小波分解得到的近似系数可以代表光谱信息进行建模分析。
由图 6 可知,近似系数 PLS 模型预测结果的相关系数为 0. 746,PCR 模型预测结果的相关系数为0. 736 3,均达到了良好的预测结果,且 PLS 模型预测结果比 PCR 模型要好。
3、 结论
1) 对比近似系数建模和全光谱数据建模,建模参数由 512 个减少为 42 个,主成分数也减少,且模型性能稳定。因此,基于小波分解得到的近似系数可以代表光谱信息进行建模分析。
2) 对比近似系数建模和全光谱建模可知: 近似系数的 PLS 模型和 PCR 模型校正集相关系数分别要比全光谱 PLS 模型和 PCR 模型校正集相关系数高; PLS模型和 PCR 模型校正集方差、预测集方差分别要比全光谱 PLS 模型和 PCR 模型校正集方差、预测集方差更为接近。这说明,应用近似系数所建模型较稳定。因此,基于小波分解得到的近似系数可以代表光谱信息进行建模分析。
参考文献: [1] 周竹,李小昱,高海龙,等. 马铃薯干物质含量高光谱检测中变量选择方法比较[J]. 农业机械学报,2012,43(2) :128-133,185. [2] 孙通,徐惠荣,应义斌. 近红外光谱分析技术在农产品/食品品质在线无损检测中的应用研究进展[J]. 光谱学与光谱分析,2009,29(1) : 122-126. [3] 赵聪慧,张淑娟,张海红,等. 鲜枣可溶性固形物最小二乘支持向量机动态监测研究[J]. 中国食品学报,2012(3) :210-214. [4] 王迅,刘书杰,贾海峰,等. 基于高光谱数据的高寒草地营养状况的研究[J]. 光谱学与光谱分析,2012,32(10) :2780-2784. [5] 程国首,郭俊先,石砦,等. 基于高光谱图像技术的新疆红富士苹果重量预测[J]. 新疆农业大学学报,2011,34(3) :249-252.