高光谱数据预处理通常遵循 “数据校正→噪声去除→维度优化” 的逻辑顺序,各环节环环相扣,需根据数据来源(如卫星、无人机、地面光谱仪)和实际问题调整步骤。
将传感器获取的原始数字值(DN 值)转化为具有物理意义的辐射亮度或反射率,消除传感器响应差异的影响。
- 绝对定标:利用已知辐射亮度的标准光源(如积分球),建立 DN 值与辐射亮度的数学模型(如线性回归)。
- 相对定标:通过同一传感器不同波段或不同时间的响应一致性,校正波段间的辐射偏差,常用于时序数据。
消除大气散射、吸收对光谱信号的干扰,还原地物真实反射率,是定量分析的核心步骤。
- 基于辐射传输模型:如 MODTRAN、6S 模型,需输入大气参数(如气溶胶类型、水汽含量),精度高但操作复杂。
- 基于地面实测数据:利用同步获取的地面标准板反射率(如灰板),建立图像反射率与实测值的校正关系,适用于无人机、地面光谱数据。
- 基于图像本身:如暗目标法(DOS),通过选取图像中 “暗目标”(如深水区、阴影)假设其反射率为 0,反演大气影响,操作简便但精度依赖目标选取。

修正图像因传感器姿态、地形起伏等导致的空间位置偏差,确保像素坐标与实际地理坐标匹配。
- 系统几何校正:利用传感器参数(如轨道、姿态角)和地形数据,通过物理模型校正,适用于卫星数据(如 Hyperion)。
- 几何精校正:通过选取地面控制点(GCP),将图像与高精度地图(如 Google Earth)或 GPS 实测点对齐,常用多项式拟合方法,适用于无人机等低空数据。
高光谱数据波段多(通常数百个),易受仪器噪声、环境干扰影响,需针对性去噪。
- 坏波段剔除:直接删除受严重噪声或水汽吸收影响的波段(如 1300-1500nm、1800-2000nm 的水汽吸收带)。
- 平滑滤波:通过邻域平均、高斯滤波等降低随机噪声,需注意避免过度平滑导致光谱细节丢失。
- 光谱重采样:当部分波段噪声严重时,可将相邻波段合并(如每 5 个波段取平均),在保留主要信息的同时减少噪声。
高光谱数据存在严重的 “维度灾难”(波段多、冗余信息多),需通过降维减少计算量并避免过拟合。
- 主成分分析(PCA):将高维数据投影到少数几个主成分上,保留数据中 90% 以上的信息,是最常用的降维方法。
- 波段选择:根据波段的信息量(如方差)或相关性,手动或自动筛选关键波段(如植被分析优先选择红边、近红外波段),保留原始光谱物理意义。
- 线性判别分析(LDA):结合样本类别信息降维,更适用于分类任务,但对样本数量要求较高。

不同工具适用于不同数据规模和操作需求,以下是主流选择对比: