我国是一个传统农业大国,在农业种植和病害综合防治方面积累了大量经验。我国耕地面积占世界耕地面积的7%,农作物病害是我国的主要自然灾害之一,具有突发性、普遍性和危害性3个显著特点[1]。每年全世界范围内因为农业病害所导致的粮食减产达到了总产量的10%[2],造成了巨大的经济损失。因此,加强农业病害综合防治工作,对农业经济发展具有重要意义。农业病害预测是一种非常有效的手段,对降低农业病害的危害具有重要作用。进入21世纪后,人工神经网络不断发展,其在现代农业应用方面取得了非常好的效果,特别是在“智慧农业”发展方面提供了一种强有力的支持。马丽丽等[3]建立BP(BackPropagation)神经网络,对发生在黄瓜上的4种常见病害发生情况进行了预测。张映梅等[4]利用BP神经网络对小麦吸浆虫的发生程度进行预测,也取得了理想的效果。由此可见,利用人工神经网络对农业病害进行预测是一种非常有力的手段。
1病害预测方法概述
在农业病害防治工作中,为实现最好的防治效果,往往在病害大面积发生前对病害的发生面积、发生程度、发展方向等先进行全面的预测。这样一来,在病害发生前便可以采取相应的措施,使病害发生的泛滥程度大幅度减小,从而降低病害的危害程度。病害的预测方法主要分为四大类:专家评估法、类推法、数理统计模型法和系统模拟模型法[5]。一是专家评估法。此方法是一种人为的预测方式,即通过本领域的专家们利用他们所掌握的农业病害知识对病害的发生进行分析总结,最后再得出预测结果。二是类推法。通过对以往的病害发生程度进行一种经验上的预测。但此类方法不适合复杂环境下的病害预测,预测方式单一,往往只能在本地区病害类型不多的情况下达到预测的效果。三是数理统计模型法。通过记录并分析病害发生前各项可能导致病害发生的环境因素,建立数理模型并进行预测。模型可以根据调查取得的影响病害发生的因子直接得出病害发生程度。如刘方等[6]利用数理统计模型中的马尔科夫链模型对未来降水量进行预测。四是系统模拟模型法。此方法也属于数理模型法,只是针对模型计算采用计算机。利用计算机高速运算能力可以很好地对模型进行计算并很快得到结果。但是,这种预测方法的模型构建比较复杂且不易扩展。根据农业病害发生的特点[7],可将农业病害预测分为3种类型,即病害发生期预测、病害发生量预测和病害发生分布预测[8]。通过这几种方式的预测,就可大致掌握农业病害发展趋势。病害发生期预测又可分为短期预测、中期预测、中长期预测、长期预测。针对不同的病害可以采用不同的预测方式,通过预测发生期可以实时掌握病害的发生趋势。
2农业病害预测研究
农业病害的发生不仅由外部因素导致,还有内部因素的原因。外部因素具体表现为环境气候,如温度、降水量、日照时长、昆虫携带病菌导致的感染。除此之外,土壤中微生物也会导致病害发生。如刘德飞等[9]通过分析发现,土壤中大量菌群对病害微生物的生长有益。内部因素常表现为作物本身早已携带了病菌,导致作物一开始就已经被病害感染。我国早在20世纪50年代就开展了病害预防预测工作,在农业病害预测技术上积累了大量经验。在经历了传统的经验预测、试验预测、统计预测和信息预测[10]后,直到20世纪80年代,人工神经网络与非线性理论的引入,为病害的预测方式方法开辟了一条新道路,使农业病害预测方式更加多样化。
2.1传统病害预测方法
传统病害预测方法主要是通过专家评估和数理统计模型进行预测,类推法和系统模拟法分别属于这2种模型中的一种分支。专家预测法是由各个学科的专家们根据病害的发生类别、病原、状态特点、发生规律、诊断方法、无公害防治等内容[11]建立知识库。通过专家对知识库的数据进行分析处理,再创建专家决策系统对病害的发生做预测;数理统计模型是通过对引起病害发生的各种外部条件进行大量统计并建立模型,得出一种综合预测结果。这在一定条件下是有效的,但预测结果不稳定[12]。传统病害预测方法在病害预测上能起到一定的效果,病害发生是一种根据时间线发生的行为,也是一种动态行为,以上的预测方法为静态(预测模型为静态),随着时间的推移,病害综合防治方法也会导致病害防治效果下降。如果长期使用这些方式进行预测,预测精度会大幅下降。为了解决这种问题,常用方法是定期重新评估模型并改进。这样虽然能达到最终目的,但必然会使预测工作量增加,人工神经网络的出现恰好能解决这个问题。
2.2基于人工神经网络的病害预测
2.2.1人工神经网络概述。人工神经网络是为了使计算机模拟人脑思维方式进行学习的一种网络模型,最早由20世纪40年代的心理学家McCulloch以及数学家Pitts提出[13]。人工神经网络是由若干个网络最基本单位“神经元”构成,不同层的神经元与神经元之间相互连接,2个神经元之间的连线叫作权值,是前一个神经元的加权值,后一个神经元中存储的就是上一个神经元和权值共同计算后的结果。权值可以理解为人工神经网络的记忆,人工神经网络需要进行的训练过程就是网络通过对数据样本的学习,通过不断调整网络中的权值,让人工神经网络记住数据样本分布情况,从而完成人工神经网络的训练过程。人工神经网络一经提出就引起了学术界的大规模研究,但是由于当时的计算机计算速度慢和理论不够健全等原因,其曾经被认为人工神经网络只停留在理论研究阶段,是不能够在实际中去实现的模拟人脑学习[14-15],直到J.J.Hopfield提出了Hopfield神经网格模型以及计算机在计算速度上取得了突破,使人工神经网络的研究工作重新得到科学家的认可,并开展相关研究。人工神经网络具有强大的非线性逼近能力[16]和自适应能力,能够感知环境变化,从而自动调节网络结构。人工神经网络具有强大的容错能力,个别样本的误差对整体误差的影响非常渺小。上述这些特性使人工神经网络在解决预测问题和分类问题时能够比很多传统方法处理的效果要好,例如文字翻译、语言识别、图像识别、气象预测、人机对话等。
2.2.2基于人工神经网络的病害预测。研究表明,排除人为因素,农作物病害发生与当季的气候因子和土壤微生物有巨大的关系,主要是各类微生物在温度、湿度、阳光、降雨等气候条件适宜其生存时,真菌孢子就会大量繁殖并侵害作物,使作物发生病变[17]。风是病害传播的一个重要途径,真菌孢子很轻,只需有一些很微弱的风吹过,便能将真菌孢子带到下一个待传染的地区(昆虫也能成为病害传播的另一个媒介)。根据病害特点,可以把需要预测的各种类型(病害发生期预测、病害发生量预测、病害发生分布预测)的发生程度,与对应其病害发生的因子和影响结果分别记录,用作人工神经网络的学习样本。当人工神经网络从样本学习完毕后,即建立了最终预测模型。此时就可以对病害的发生期、发生量、发生分布进行预测。例如,用人工神经网络对病害发生量进行预测,通常需要将病害发生量分为5个等级,分别是轻、中偏轻、中、中偏重、重。将影响病害发生的因子和导致的病害结果作为网络模型训练样本。训练过程的大致原理表现为对数据样本和标签数据进行归类,并划出各类别的分布。当网络训练完毕之后,即各个类别的分布已规划好,再把待预测数据录入网络中,即可计算出待预测数据与哪种分布最接近,分布最近的类别即为最终预测结果。
2.2.3常用于预测的神经网络模型。①BP神经网络模型。BP神经网络是一种应用链式求导法则的误差反向传播的前馈神经网络,是目前神经网络模型中应用最广泛的网络。整个网络由输入层、隐藏层和输出层组成[18],属于机器学习中的监督学习网络。BP神经网络是人工神经网络家族中最基本的网络。BP神经网络有非常好的非线性逼近能力,一个具有3层的神经网络可以无线逼近任何一个非线性连续函数。但是一个未经优化的BP神经网络也存在一些不足,例如在网络训练时容易陷入局部最小值问题,最终导致模型训练失败。基于BP神经网络自身的特性导致在解决问题时很少完全采用BP神经网络的思想,更多的做法是在更复杂的神经网络上面再加一个BP神经网络用作整体功能的一部分,又或使用改进的BP网络[19]。BP神经网络结构如图1所示。②LSTM(LongShortTermMemory)神经网络模型。LSTM网络是循环神经网络(RecurrentNeuralNetwork)衍生出来的一种改进的网络模型。在前面介绍的BP神经网络或者其他神经网络模型中几乎没有考虑过样本与样本之间的联系,只是简单地把样本送交模型训练,以减少模型结果与真实结果的误差。RNN网络模型的出现改变了这种原始做法,对样本与样本之间是否具有某些联系进行了考虑,特别是有时间顺序的样本集。模型在训练的时候每一个样本的输出值都会受到前面样本输出值的影响,样本之间的联系就得到了很好的利用。这种模型的出现使神经网络在解决问题的时候不仅能从数据的“量”里面获取信息,还能够从数据与数据间的“逻辑”中更精确地分析信息。虽然RNN神经网络相较传统的神经网络来说具有特殊的记忆能力,但是RNN神经网络也有明显的缺点,即在模型训练时对前面样本信息的记忆不长久,只能够保留短期记忆,在某些问题上这种短期记忆所达到的效果欠佳。LSTM网络模型提出的目的即是为了解决RNN神经网络不能拥有长期记忆力和梯度消失以及梯度爆炸等一系列问题[20]。LSTM神经网络也是前馈型神经网络,继承了RNN网络模型的特性并具有更强的记忆力。LSTM主要解决与时序有关的问题,网络模型训练时会把当前的样本数据与以往的样本数据计算后的结果共同参与计算,并留作与下个数据样本共同计算。因此,每次得到的计算结果都与之前的数据有关系,是一种具有长期记忆力的神经网络。由于其长期的记忆功能,LSTM神经网络常用于解决在时序方面的预测问题,比如股票预测[21]、天气预测、语言识别等[22]。沈皓俊等[23]利用LSTM网络对气候降水量进行预测,陈艳平等[24]利用LSTM网络对自然语言中的句法要素进行识别,两者都达到了非常高的精度,相对于使用其他不考虑时间序列的网络来说效果更加明显。LSTM网络展开后的结构如图2所示。以上2种神经网络都可用于农业病害发展趋势预测,且2种神经网络都是通过对历史病害发生情况和与之对应的环境因子作为样本训练,是深度学习里面的有监督学习。训练过程其实是利用神经网络强大的非线性逼近能力确定函数(神经网络的学习过程可以理解为一种确定函数具体形式的过程)的具体形式。当神经网络训练完毕之后就可以利用模型对未来的病害发生情况进行预测。利用一个已经训练好的神经网络对当下的病害进行预测的过程非常简单。可以把人工神经网络模型理解为一个“黑盒”,只需把当前的天气数据输入到模型中就可以直接得出预测结果,无须知道模型是如何计算得到的。利用人工神经网络病害预测在神经网络模型训练阶段时会花一些时间训练,模型训练完毕之后便能很快得出预测结果,相较于传统病害预测模型来说,人工神经网络帮助人类减少了对数据样本分析的过程,只需关注模型构建的本身。
2.2.4人工神经网络应用到病害预测中可能出现的问题。没有任何一种模型和方法是完美的,人工神经网络也存在着一些缺点。一是人工神经网络的固有缺点,即训练速度过慢。在人工神经网络模拟人类学习的过程中,即在人工神经网络进行训练阶段时(减少训练得到的结果与真实结果的误差过程),可能会花费大量时间。这不仅取决于样本数量,也取决于硬件设备的计算速度。但农业病害的样本数据相较于语音、视频等各种非结构化的数据来说非常小,因而训练时的速度问题几乎不存在。二是在人工神经网络非线性逼近(模型训练)时有可能出现不能逼近真实结果的情况,虽然可以通过对数据样本进行再处理来解决,但同时也会增加预测工作量和构建模型的难度,使人工神经网络难以找到一种通用的学习算法[25]。因此,在人工神经网络学习时,往往需要对学习的数据样本进行再次处理才能达到目的。三是人工神经网络的训练需要充足的训练样本数据。当训练样本不足时,会导致预测精度低,不能达到预测的目的。农业病害的预测发展历经多年,积累了大量农业数据,并且可以利用迁移学习技术[26]从类似且已经训练好的模型中扩展,因而数据不足的问题能够很好地解决。总体来看,从在人工神经网络所能处理问题的领域来说,农业病害预测属于一种相对轻量级的问题,人工神经网络自身存在的各种缺点对农业病害预测方面的影响都很小。
3农业病害预测研究面临的挑战与展望
3.1我国农业病害预测研究面临的挑战
农业病害预测研究虽已取得了巨大进步,但是农业病害预测的最终目的是防治,如果仅对农业病害发展进行预测,而不做好病害防治工作,那么病害预测工作在整个农业病害防治工作中会很无力。我国农业病害综合防治工作取得了巨大进步,特别是在生物技术病害综合防治方面,利用病害的天敌昆虫对病害进行防治[27],取得了不错的效果。资料显示,我国每年在农业病害防治方面使用的化学农药高达25万t[28]。使用农药虽然解决了当下的病害问题,但是这种做法严重破坏了土壤结构。化学防治导致的污染问题已成为影响我国农业发展的一个因素。此外,农业病害预测研究面临的另一个问题是我国农业现代化建设进程仍不完善,农业病害预测所需的硬件设备和其他硬件设备并不多,究其原因是所需设备价格昂贵,从事农业的人们不愿意使用昂贵的产品。综合来看,我国病害预防工作不仅需要技术,更需要一种全面、现代、完备的农业病害解决体系。
3.2农业病害预测的展望
在加速建设农业现代化进程中,我国增加了许多对农业病害预测有巨大帮助的工具。智慧农业概念提出后,对农业病害研究工作提供了理论指导,特别是在实时数据获取方面有了更加精确快速获取数据的设备。对于农业病害预测来说,有了这些实时数据,就能够时刻监测农作物动态。当设备从当前获取的数据中分析发现环境因素可能导致病害的发生,就可以使设备自动做出对应的措施,减少人工的工作量。不仅可以实现农业全智能化,而且能够减少人工成本。
4结语
综上所述,传统农业病害预测方法虽然能够对病害发生起到预测的效果,但是一般传统的农业病害预测方法是一种静态的预测方法,很难做到实时预测,很难根据新增的数据快速重新构建和优化模型。随着时间的增加,传统预测模型的病害预测效果也会减弱。人工神经网络对农业病害的预测是一种非常有效的手段,人工神经网络模型是一种动态而不需要人为修改的模型,一旦网络模型搭建完毕,模型就可以根据得到的数据进行训练,然后完成预测工作,并且可以动态更新模型(利用最新数据对模型再次训练),在这一过程中不需要任何人为干预。因此,农业自动化将是未来农业的发展趋势。
《农业病害预测人工神经网络的应用》来源:《现代农业科技》,作者:陈民 胡雪琼 鲁韦坤 周文文 陈亚平 李晓君 曹志勇