一、新冠肺炎疾病及病毒学术论文的收集、筛选和处理
2020年1月以来,发表了大量与新冠疫情相关的论文。首先,我们从CORD-19[1]和PUBMED[2]下载了116485篇与新冠疫情相关的论文(截止到2021年7月19日),并去掉重复的论文,结果获得85531篇论文的全文。然后,抽取这些论文的关键词、作者、研究机构和国家信息,统计不同国家发表的论文数量(以第一作者单位为标准),计算各个国家发表论文数量占世界总发论文数的百分比,以及各国每月发表论文数的变化图。最后,统计各个研究机构发表论文的数量(以每一篇论文的第一作者单位为标准),筛选出发表论文数量最多的十个机构,分析其主要研究内容进行(根据发表论文的关键词出现的频数)。