本文将隐含狄利克雷分布(LDA)和隐马尔可夫过程(HMM)这两种方法进行组合。首先将国外的芯片产业专利库运用LDA进行文本分类并构建相应的技术主题,接下来通过HMM构建技术主题之间的混淆与转移矩阵,对技术主题进行未来的趋势预测。
1.2 数据构成与数据来源
本文数据来源于智慧芽全球专利数据库,本文首先通过查询芯片产业相关技术,构建初始的检索公式,再经过多次调整,确定最终的检索公式。最后根据最终的检索公式在数据库中获取所需要的专利数据,并对提取的数据进行筛查,剔除部分杂质,得到本文所需的芯片产业专利文本库。