成绩分布曲线可视化
R软件可以用经验分布函数来对课程成绩数据的总体分布函数进行估计;图2通过ecdf()函数作出的经验分布曲线,并与拟合的总体分布曲线比较来判断拟合程度的好坏。图中红色阶梯状的曲线为数据的经验分布函数曲线,蓝色曲线为正态分布函数曲线。由图可知:经验分布函数与正态分布函数的拟合效果较好,说明“核电站水工况”的成绩分布总体接近正态分布。
前面绘制的直方图和经验分布函数图很难直观地判断成绩数据是否符合哪种类型的分布状况?R软件提供了另一个绘图函数,即qqnorm;使用这个函数,可以绘制出分位数图。
可以用来判断样本数据是否近似于正态类型的分布。图中红色的虚直线为正态拟合线,紫色的分位数数据点可以近似地看作在该直线上,由此可以判断该组数据是来自对数正态总体的。