随着深度学习在各个领域的深入使用,使得深度学习已经取得了突破的进展,在文本处理方面,深度学习同样拥以往机器学习所不能媲美的优势,即可以将单纯的文档经过深层网络的多次转换,可以形成多层结构含义。这就使得我们对自然语言的处理能够达到质的飞跃,同样将深度学习应用在装备领域的文档信息中,可以使得原有的以文本形式存储的装备检测报告中所含有的信息能够被更好地发掘,为更好地处理装备领域中的文本信息提供了可靠的保障。通过将装备领域原有的处理结构化数据与非结构化数据的方法与基于深度学习的文本信息处理办法相结合,目的是进一步加深装备数据的充分利用,在装备质量预测方面能够有一个更加完善的体系结构,为装备质量预测提供更好的决策服务。
同数据挖掘技术一样,深度学习同样拥有很多种定义的说法,其中一个说法就是通过构建传统神经网络的基础之上,加大中间层的层数和每个层所对应的结点数据,这样单纯的数据就可以表示成高纬的多特征最终达到提升预测的正确率的效果。
该模型以神经网络模型为基础,具有一个隐层的神经网络模型称为浅层神经网络,具有两个及两个以上隐层的神经网络架构模型称之为深层神经网络也被称之为深度学习网络模型。深度学习网络模型较传统神经网络模型而言优势在于将传统神经网络中的经过一次变换的非线性变换转化为随着网络深度的增加即模型中隐层个数的增加多种非线性运算结合的形式,因此深层学习模型具有更高的准确度以及更好的表达能力。对于深度学习的中心思想可以总结为以下几点[1]:
1.深度学习是多层次的神经网络模型,在预训练的条件下,每一层神经网络都采用的是无监督学习机制。
2.深度学习的训练是逐层进行,即上一层的输出结果是下一层的输入。
3.在深度神经网络训练的过程中,需要一个分类器进行配合,即深度学习过程伴随着有监督学习。与传统的信息检索模型相比,深度神经网络具有不可比拟的优势,尤其是随着大数据时代的到来,信息中的噪声影响也随之增加,信息量处于急速膨胀的状态下,即使是在军队这种特殊的环境条件下,随着部队信息化建设的发展,由此产生的各种与装备有关的文本信息数据也在急剧膨胀的问题,因此给装备文档信息检索带来十分大的困难。对于深度神经网络模型而言,能够将所有的文档全部都放在该模型中训练,在训练的过程中也不需要经过特殊的处理,其本身的网络模型结构是复杂的,网络模型的复杂程度直接影响到了训练模型的难易程度、以及代价的大小,因此深度神经网络模型的训练过程往往会比较复杂,付出的代价成本也会比较大。传统的信息检索模型虽然较深度神经网络模型在预测功能上存在着欠缺,在准确率上也有很大的不足,但是好处在于传统的信息检索模型结构较为简单,训练模型时间上较短,效率较好,深度神经网络虽然可以简化装备文本信息的操作,但是就意味着需要在原有的基础上增加相应的硬件设备,来完成其的存储操作,这就表示使用深度神经网络模型的时候需要增加训练成本。其次传统的检索模型最大的优势在于可以进行并行处理,这是深度神经网络所不具备的优势,同样也解决了深度神经网络模型在处理大数据时的致命缺陷,这个优势可以让传统的信息检索模型在多台服务器上将数据存储下来,可以不必对数据进行融合处理,就能在多台计算机上分布地将结果运行出来,从而大大地减少了训练时间也能够节省存储空间。因此,综合以上两种检索模型的各自的优势以及劣势,基于我军在装备领域中存在的现实情况,本文的针对装备信息检索将采取将深度神经网络模型与传统模型相结合的优化方案,利用深度神经网络的检索模型增加检索准确率和查全率,以及能够提升整体的预测准确率,在此基础上融合传统的检索模型,同时保证信息检索的效率以及对于文本信息的分类速度。