高光谱识别真假甘草分类模型_分类模型_浙江以象科技有限公司

13867128415

数据验证

数据预处理

数据验证

首页数据验证分类模型

高光谱识别真假甘草分类模型

高光谱分类模型是基于高光谱遥感技术发展而来的机器学习 / 深度学习模型，核心目标是通过分析高光谱图像中数百个连续、窄波段的光谱信息，实现对地表地物（如植被、土壤、水体、矿物、人工建筑等）的精细分类与识别。与传统多光谱遥感（仅几个至几十个离散波段）相比，高光谱数据能捕捉地物独特的 “光谱指纹”，使模型具备更强的区分能力（例如区分不同种类的作物、识别矿物成分、检测植被病虫害等）。

13867128415

项目内容

高光谱识别真假甘草分类模型

一、检测目的和依据

使用高光谱技术，采集中药材中真甘草与假甘草光谱数据，通过建模分析实现高光谱技术无损检测甘草真假。

二、样品类别及数量

甘草样本：

中药材真甘草若干条；
假甘草若干条；

三、检测设备和方法

检测设备

1. 400-1000nm高光谱相机

2. 高光谱采集暗箱

3. 黑色托盘（低反射率背景）

4. 辅助材料：标签（用于标记真假甘草）

采集方式

1、训练集样品摆放规则：

中药材甘草：将样品中药材甘草按如图所示摆放，使用标签标记好甘草的真假。

甘草实拍图.png

2、验证集数据采集方式

将真假甘草摆放在托盘，标记真假的标签放在了甘草样品下面放着

甘草验证图像-压缩.png

四、采集与分析结果

1. 数据提供

提供数据格式，每个样品数据包含如下6个格式文件：

样本400-1000nm原始数据（包含 .dat、.hdr格式）
样本400-1000nm反射率数据（包含 .dat、.hdr格式）
样本400-1000nm高光谱图像（.png格式）

2. 数据预处理

1、使用打标工具，甘草样本进行打标，结果图如下

训练集：

甘草训练集打标遮罩.png

验证集：

甘草验证集1打标遮罩.png

甘草验证集2打标遮罩.png

3.光谱反射率提取

真甘草（C1）和假甘草（C2）的反射率平均光谱图

真假甘草平均反射率光谱.png

根据反射率曲线可以看出，真假甘草反射率存在较大差异

数据预处理

为了进一步消除噪声, 消除位置影响, 提升特征显著性, 我们实验了多种预处理方法的组合, 最终选用效果最好的预处理方式 SGD1 + SNV 对原始进行处理.预处理后的 C1 和 C2 数据如下图所示:

甘草-预处理结果曲线图.png

特征分析

根据波段和分组的相关性分析, 获得分组相关性最高的前 50 个波段位于下图中红色矩形区域

甘草-特征分析图.png

相关性最高的前 50 个波段的 PCA 图像

甘草PCA分析.png

依据以上条件我们可以认为：真甘草(C1)和假甘草(C2) 光谱数据在 628.02nm 到 731.77nm 之间存在较为明显的差异

模型训练

模型采用我们自有的针对高光谱数据研发的深度学习模型架构，更容易捕获特征与标签之间的非线性关系。

训练数据使用上文中的训练集01，训练 20 个 Epoch，每个 Epoch 结束后使用验证集进行一次评估

训练过程中损失下降情况如下图所示：

甘草-训练结果图.png

训练后在训练集上的推理结果:

甘草训练集-训练集模型验证.png

对比基线模型(KNN)准确率

验证集01评价结果

甘草验证集01-模型验证结果.png

验证集02评价结果

甘草验证集02-模型验证.png

结果评价：

对比训练集, 模型能力有所下降, 但准确率依然高于基线模型 10% ~ 20%
模型能力下降的主要原因是训练样本不够, 使用更多样本进行训练可以有效提升模型泛化能力
经过后处理, 即: 在空间维度对标签做平滑处理 + 对单个样本使用置信度 (样本中标记为真的光谱数量 / 样本中所有光谱的数量) > 0.8 可以实现对验证集中样本识别做到 100% 准确率

采集服务

电话咨询

13867128415
返回顶部