描述统计是数据分析中常用的方法,它是指通过数学方法,对数据资料进行整理、分析,并对数据的分布状态、数字特征和随机变量之间的关系进行估计和描述的方法。描述统计通常包括集中趋势分析、离散趋势分析和相关分析三大部分。使用Excel函数公式或者分析工具可以满足这样的分析需求。
1、使用函数进行数据分析
我举个例子。
如上图所示,A列是某产品数据,现需在C:D列统计其各类描述分析数据,相关函数公式如下▼
1) 平均值
=AVERAGE(A2:A16)
2) 标准误差
=STDEV(A2:A16)/SQRT(COUNT(A2:A16))
3) 中位数
=MEDIAN(A2:A16)
4) 众数
=MODE(A2:A16)
5) 标准差
=STDEV(A2:A16)
6) 方差
=VAR(A2:A16)
7) 峰度
=KURT(A2:A16)
8) 偏度
=SKEW(A2:A16)
9) 极差
=MAX(A2:A16)-MIN(A2:A16)
10) 平均置信度(95%)
=TINV(0.05,COUNT(A2:A16)-1)*STDEV(A2:A16)/SQRT(COUNT(A2:A16))
……
打个响指,还解释下以上名词的意思▼
平均值、中位数、众数等是表现数据集中趋势的指标。平均值是N个数相加除以N得到的结果;中位数是一组数据按大小排序后,排在中间位置的数值;众数是一组数据中出现次数最多的数值。
方差与标准差是表现数据离散程度的指标,它们反映了与平均值之间的离散程度。
峰度系数和偏度系数是表现数据分布形状的指标。
峰度系数是相对于正态分布而言,描述对称分布曲线峰顶尖峭程度的指标。峰度系数大于零,则两侧极端数据较少,峰度系数小于零,则两侧极端数据较多。
偏度系数是以正态分布为标准来描述数据对称性的指标。偏度系数等于零,则数据分布对称。偏度系数大于零,则为正偏态分布,偏度系数小于零,则为负偏态分布。偏度系数大于1或者小于-1,被称为高度偏态分布,偏度系数在0.5~1或-0.5~-1范围内,被称为中等偏态分布。
……
2、数据分析工具库
除了使用函数公式外,Excel还提供了[数据分析]工具库。
在[开发工具]选项卡下,单击[Excel加载项],在打开的对话框中选中[数据分析],并单击[确定]按钮。将该工具库加载到[数据]选项卡下。
在[数据]选项卡下,依次单击[数据分析]→[描述统计](位于选项卡最右侧),打开[描述统计]对话框。
在【描述统计】对话框中设置相关参数如下▼
【输入区域】:选择A1:A16。
【分组方式】:指定输入数据是以行还是以列的方式排列。本例中使用逐行。
【标志位于第一列】复选框:本例包含标题列,因而勾选此选项。
【输出选项】:选择【输出区域】,并在选择输入框中输入F1,以此作为输出结果的存放位置。
【汇总统计】复选框:若勾选此复选框,则显示描述统计结果,否则不显示结果。本例勾选此项。
【平均数置信度】复选框:若勾选此复选框,则输出包含均值的置信度。本例键入默认值95,表明要计算在显著性水平为5%时的均值置信度。
【第K大值】复选框:根据需要指定要输出数据中的第几个最大值。本例只需要得到最大值,故不勾选此项。
【第K小值】复选框:根据需要指定要输出数据中的第几个最小值。本例只需要得到最小值,故不勾选此项。
确定之后返回结果如下(和公式的计算结果是一致的)
评论(0)