正在进行安全检测...
时间:2023-11-05 11:08:36 下载该word文档
第五节EXCEL在统计描述中的运用
一、编制分布数列
【例3-19】某地区进行农产量抽样调查,抽取50个单位构成样本。样本资料如下:
亩产量数据单位:公斤240440400375500528412425320400520600485600588412444430342364450455465500580345340320300403445360517390410360422428520400425385440380548304448605325500
要求(1)编制次数分布数列(组距为100,进行等距分组),并绘制次数分布图;(2)分别向上累计和向下累计并绘制累计分布图。
解:本例可用[直方图]分析工具或FREQUENCY等函数来完成。但[直方图]工具不能直接进行向下累计,需要借助Excel公式才可进行。
(一)用[直方图]工具进行分析。直方图工具,用于在给定工作表中数据单元格区域和接收区间的情况下,计算数据的个别和累积频率,可以统计有限集中某个数值元素的出现次数。
主要步骤如下:
1.输入数据。如图3-15所示,A列输入亩产量,A1为列标志“亩产量”,C列为分组标志,B2:B7为分组组限,B1为列标志“组限”。在确定组限时,需要注意:(1)组限指的是某一组的上限,如299.9是300以下(也即200-300)这一组的上限,399.9是300-400这一组的上限。(2)对未排序的亩产量数据,可先用MAX与MIN函数确定亩产量的最大与最小值,以方便确定组限。(3)[直方图]工具分组时采用的是“上限在内”原则,为符合统计分组的“上限不在内”原的则,每个组限均不应与亩产量相同。如本例中组限399.9表示将统计出亩产量大于299.9而小于等于399.9的数据点个数,如果亩产量中有399.9这个数,则可将300-400这一组的上限上为399.99。
2.调出[直方图]对话框,其主要选项的含义如下。
输入区域:在此输入待分析数据区域的单元格范围。本例输入区域为“$A$1:$A$51”。接收区域(可选):在此输入接收区域的单元格范围,该区域应包含一组可选的用来计算频数的边界值。这些值应当按升序排列。只要存在的话,Excel将统计在当前边界点和相邻的高值边界点之间的数据点个数。如果某个数值等于或小于某个边界值,则该值将被归到以该边界值为上限的区间中(注意:与统计分组“上限不在内”原则有所区别)。如果省略此处的接收区域,Excel将在数据组的最小值和最大值之间创建一组平滑分布的接收区间。本例接收区域为“$B$1:$B$6”。
图3-14标志:如果输入区域的第一行或第一列中包含标志项,则选中此复选框;如果输入区域没有标志项,则清除此该复选框,Excel将在输出表中生成适宜的数据标志。
柏拉图:选中此复选框,可以在输出表中同时显示按降序排列频率数据。如果此复选框被清除,Excel将只按升序来排列数据。
累积百分比:选中此复选框,可以在输出结果中添加一列累积百分比数值,并同时在直方图表中添加累积百分比折线。如果清除此选项,则会省略以上结果。
图表输出:选中此复选框,可以在输出表中同时生成一个嵌入式直方图表。本例[直方图]对话框的填写如图3-14所示。
3.单击[确定]按钮即可。完整的结果通常包括三列和一个频率分布图,第一列是数值的区间范围,第二列是数值分布的频数,第三列是频数分布的累积百分比。在输出的结果中,“频率”指的是统计中所指的“频数”,“累积%”指的是“向上累计频率”。结果中原本还有一“其它”行的数据,该行是亩产量大于699.9的频数与累计频率(位于单元格区域D7:F7),因本例中没有大于699.9的数据,所以可将该行删除,即选定D7:F7,然后执行菜单命令[编辑][删除]命令。由于该工具总会自动统计出大于最大组限的数据的频数,所以本例中组限也可以不使用699.9,即在第2步中接收区域为“$B$1:$B$6”,在输出的结果中,将“其它”更改为我们所需要的标志性文字,如改为“699.9”。经过修改的结果如图3-15所示。
图3-154.计算向下累计频率。在G1