题目
基于高光谱图像的密度峰值k-均值算法估算小麦植被覆盖度
应用关键词
植被覆盖度;k-means算法;ndvi;植被指数;小麦
背景
植被覆盖度(fractional vegetation cover, fvc)是测量地球表面植被分布的重要参数。在评价小麦生长状况时,准确测定小麦各生育期的fvc具有指导意义。此外,在监测小麦生物量时,需要快速提取fvc、植物含水量、叶绿素、叶黄素含量和氮含量数据。然而,本研究发现,现有的针对小麦生长不同时期和土壤条件的fvc提取方法效果各异,无法满足小麦多时相生长监测的精度要求。因此,开发一种操作简单、提取精度高、受环境、时间、空间等外界条件影响较小的fvc提取新方法具有重要意义。
目前,大多数研究采用像素二分法或监督分类法分离植被与非植被,提取fvc。但是,不同时间、不同条件下采集的植被和非植被的光谱反射率的变化,会使像素二分法的阈值发生很大变化,从而使得提取效果产生较大波动。监督分类受人为因素和样本影响较大。当测试样本和训练样本之间没有差异时,提取效果会很好。然而,当样本之间存在时空差异时,提取的精度将显著降低。
考虑到无监督学习算法无需人为干预,通过确定的分类标准对植被和非植被进行分类,受人为和环境因素影响较小。因此,假设无监督学习算法可以准确地提取fvc,将其应用于各种条件下收集的数据,理论上应该可以达到相同的效果。k-means算法通过像素点到聚类中心的距离来划分像素点的类型。该算法能有效减小时间和空间对提取精度的影响。然而,k-means算法对初始选择的质心点比较敏感,不同初始质心点的聚类结果可能有很大差异。为了减小初始质心点对k-means算法结果的影响,根据植被像素与非植被像素的不同特点,增加了密度峰值计算算法。将植被像素和非植被像素的密度峰值作为k-means算法的初始质心,以减少异常结果带来的提取误差,提高fvc的提取精度。
基于上述问题,本研究利用高光谱相机获取小麦的高光谱图像数据,计算ndvi(normalized difference vegetation index),并基于ndvi图像采用dpk-means(density peak k-means)聚类算法和像素二分法提取fvc。本研究比较了像素二分法与dpk-means算法的精度和稳定性,并分析了基于植被指数图像的dpk-means算法的优势。
试验设计
试验地点位于江苏扬州大学,包括小麦盆栽试验和大田试验。中国农业科学院刘升平研究员团队利用gaiasky-mini2-vn高光谱相机(江苏双利合谱)于近地面采集了干性土壤和湿性土壤的高光谱图像,同时将其搭载在dji m600无人机上,获取了大范围小麦冠层高光谱图像。采集设备如图1所示。
图1 采集设备。gaiasky-mini2-vn相机(a)、地面数据采集设备(b)、无人机数据采集设备(c)。
如图2所示,小麦在绿光550 nm处有一个反射峰,在红光680 nm处有一个吸收谷,在近红外光780 ~ 900 nm处有一个连续反射峰。小麦红光波段与近红外波段反射率有明显差异。土壤的光谱反射率在整个波段范围内呈缓慢上升趋势,没有明显的反射峰和吸收谷。红光波段和近红外波段可以很好地指示植被与土壤的差异,结合它们构建的植被指数可以有效地用于植被与土壤的区分。因此,本研究选取近红外波段800 nm和红光波段680 nm构建ndvi。
图2 小麦和土壤的典型反射率曲线
为了检验基于ndvi提取的小麦植被灰度图像上植被和非植被像素的分布,本研究制作了ndvi灰度图像的像素频率分布图(图3)。从图中可以看出,小麦植被、土壤和盆像素都近似于高斯分布,小麦植被与土壤和盆的高斯分布距离较远。结果表明,在ndvi灰度图像中,植被像素与非植被像素可以很好地分离。
图3 植被指数灰度图像的像素分布。ndvi灰度图(a)、ndvi灰度图像像素分布的高斯拟合(b)。
为了解决k-means算法的局部优化问题,本研究以密度峰值作为初始聚类中心点对算法进行改进。dpk-means算法流程如下所示:
(1) 对灰度图像进行多模态高斯拟合,计算k个拟合密度峰值作为初始聚类中心进行搜索和计算。
(2) 计算数据集中每个样本点与k个聚类中心之间的距离,并将其划分为距离最小的聚类中心对应的类。
(3) 计算每个类别的平均值作为新的聚类中心。
(4) 重复步骤2和步骤3,直到聚类中心的位置没有改变,然后停止迭代。
然后,本研究基于svm监督分类结果,比较分析了两种方法的提取效果。具体提取过程如图4所示。本研究采取的评价指标为ef = (fsvm – fvi) / fsvm,式中ef为fvc提取误差,fsvm和fvi分别为基于svm的fvc以及实测fvc。
图4 小麦fvc的提取过程
结论
采用像素二分法和dpk-means提取fvc。两种土壤条件下阈值的平均值,如表1所示。将像素二分的固定阈值设置为t0、t1和t2,dpk-means算法采用高斯核函数。两种土壤条件下像元二分法的阈值差异较大。干土的光谱反射率明显高于湿土。湿土的ndvi值高于干土,更接近植被的ndvi值。这可能导致在潮湿土壤条件下像素二分法的固定阈值更高。两种土壤条件下不同方法对小麦fvc的提取效果如图5所示。
基于dpk-means算法的ef绝对值和rmse的均值最di(表2),这表明dpk-means算法具有良好稳定的提取精度。在湿润土壤条件下,t1阈值像素二分法效果最hao,ef绝对值仅为0.034,但其rmse值为0.061,ef分布较为分散,集中使用大样本数据难以获得较好的提取效果。dpk-means算法ef的均值绝对值为0.051,仅高于t1阈值,但其rmse值为0.032,ef分布相对集中,在大样本数据集中使用时效果较好。在不考虑土壤条件的情况下,dpk-means算法的ef主要分布在-0.05 ~ 0.05之间,ef相对集中。t0、t1、t2阈值下的ef分布分散,ef范围较大。对四种方法的fvc提取结果进行线性拟合,dpk-means算法的拟合精度最高,r2达到0.87(图6)。
dpk-means算法在无人机高光谱影像中提取fvc的效果如图7所示。平均误差绝对值为0.044,rmse为0.030,误差相对集中,与地面高光谱图像的提取误差相似。svm与dpk-means拟合的fvc的r2达到0.93。综上所述,dpk-means算法可以有效地从无人机高光谱图像中提取小麦的fvc,且该算法受图像采集日期的影响较小。
综合地面和无人机高光谱影像的fvc提取结果,与其他算法相比,dpk-means算法受土壤条件和采集日期的影响较小,误差分布更集中,提取精度更高。相对于像素二分法,dpk-means算法具有更高的准确性和鲁棒性,在不同条件下都能取得更好的结果。
表1 两种土壤条件的平均阈值
图5 两种土壤条件下小麦fvc提取效果。土壤干燥状况(1)和湿润状况(2)。a1和2为rgb图像;b1和2为ndvi灰度图像;c1和2为干土阈值提取的灰度图像;d1和2为dpk-means提取的灰度图像;e1和2为湿土阈值提取的灰度图像;f1和2为整体阈值提取的灰度图像;g1和2为svm提取的灰度图像。
表2 两种土壤条件和不同提取方法下小麦fvc提取误差绝对值
图6 采用多种方法拟合小麦fvc的结果。dpk-means(a)、t0(b)、t1(c)、t2(d)。
图7 不同日期的无人机高光谱图像提取结果。rgb图像(a)、ndvi灰度图像(b)、dpk-means提取的灰度图像(c)、svm提取的灰度图像(d)。
作者信息
刘升平,博士,中国农业科学院农业信息研究所研究员,硕士生导师。
主要研究方向:农业智能管控技术、智慧蜂业、农产品质量安全控制。
参考文献:
liu, d.z., yang, f.f., & liu, s.p. (2021). estimating wheat fractional vegetation cover using a density peak k-means algorithm based on hyperspectral image data. journal of integrative agriculture, 20, 2880-2891.
买撒肥车需要注意哪些因素?
大鼠elisa试剂盒的两种检测模式分析
中药超微粉碎机在细贵中药材中的应用
九源解读螺旋输送机的选购方法和技巧
落锤冲击试验机的执行标准有哪些?
基于高光谱图像的密度峰值k-均值算法估算小麦植被覆盖度
白酒塑化剂检测方案
反渗透组件及其技术特性
膨化燕麦酥生产设备
智能一体化万用蒸馏仪型号大全 功能详解
邢台医院污水处理设备-自动控制
YY/T0573.4-2020防止重复使用注射器性能测试方案
超声波婴儿秤的基础操作方法流程
透明聚氨酯软连接
烘干机配套除尘设备的选择
恒温恒湿箱低压及其他故障报警
坑内钻探技术的应用及其效果
食品微生物检测 小肠结肠炎耶尔森氏菌检验 GB 4789.8-2016
无锡市惠山区清化粪池承包施工方案
立卧两用铣床主轴和套筒磨损的修复方法