2.4数据处理
使用光谱仪配套软件IndicoPro Version3.1采集蓝莓样本的近红外光谱,由ViewSpecPro软件将采集的近红外光谱转换成数据文件,由于LabSpec光谱仪采集的光谱包含了可见光和近红外光的全部范围,本文选取波长范围为780~2 500 nm的近红外波段共1 721个变量进行后续研究。
首先通过联合x-y的异常样本识别(outliner samples detection based on joint x-y distance,ODXY)方法筛选并剔除异常样本,将剩余样本用光谱-理化值共生距离(sample set partitioning based on joint x-y distance,SPXY)算法划分校正集和测试集,然后对蓝莓原始近红外光谱数据进行标准正态变换、卷积平滑和基线校正等预处理,以减少光散射、背景噪声等因素对光谱的干扰,随后利用iPLS、SiPLS和FiPLS算法以交叉验证均方根误差(root mean square error of cross validation,RMSECV)最小原则选出与蓝莓花青素预测相关度最大的特征波段,在选出最优波段的基础上,采用UVE、SPA和CARS挑选特征波长,最后建立DBN模型,并与PLS模型结果进行对比,得出蓝莓花青素最优检测模型。