题目5. 上海发布微信公众号可查询到上海市实时空气质量状况。下面是三月某一周连续七天的空气质量指数(AQI):28,26,26,37,33,40,117。这组数据的下列统计量中,能比较客观地反映这一周空气质量平均水平的是(▲)。
(A)平均数; (B)中位数; (C)众数; (D)方差。
解析:
首先,我们需要理解各个统计量的含义及其计算方法。
- 平均数:所有数值的总和除以数值的个数。对于这组数据,平均数为 \( \frac{28 + 26 + 26 + 37 + 33 + 40 + 117}{7} = 45.57 \)。
- 中位数:将一组数据从小到大排列后位于中间位置的数。对于这组数据,排序后为 26, 26, 28, 33, 37, 40, 117,因此中位数为 33。
- 众数:一组数据中出现次数最多的数。对于这组数据,众数为 26。
- 方差:衡量数据波动大小的指标,计算步骤如下:
- 计算平均数:\( \frac{28 + 26 + 26 + 37 + 33 + 40 + 117}{7} = 45.57 \)
- 求每个数据与平均数的差的平方:
\( (28-45.57)^2, (26-45.57)^2, \ldots, (117-45.57)^2 \) - 将所有差的平方相加,再除以数据个数:
\( \frac{(28-45.57)^2 + (26-45.57)^2 + \cdots + (117-45.57)^2}{7} \)
方差的计算结果为约 \( 919.1 \),但其作用是衡量数据的波动性,而非平均水平。
在这组数据中,由于有一个极端值 117,它会显著影响平均数,使得平均数偏高,不能很好地反映这一周空气质量的平均水平。而中位数不受极端值的影响,能够更客观地反映这一周空气质量的平均水平。
因此,正确答案是 (B)中位数。
知识点复习:
- 平均数:适用于数据分布较为均匀的情况,受极端值影响较大。
- 中位数:适用于数据分布不均匀或有极端值的情况,不受极端值影响。
- 众数:适用于数据分布中有明显峰值的情况,可以反映数据的集中趋势。
- 方差:衡量数据的波动性,常用于描述数据的离散程度。
易错题型及易错点扩展:
- 在选择合适的统计量时,要注意数据的分布情况和是否有极端值。
- 平均数容易受到极端值的影响,导致结果偏离实际情况。
- 中位数和众数不受极端值影响,但在某些情况下可能无法准确反映数据的整体水平。
- 方差主要用于衡量数据的波动性,而不是平均水平。