数据分布形状
三种常见形状:右偏态、左偏态、对称分布(通常是正态分布)
形状 | 均值与中位数 | 显示世界中的应用 |
---|---|---|
对称(正态) | 均值等于中位数(正态分布都是完美对称的) | 身高、体重、误差、降雨量 |
右偏态 | 均值大于中位数(数据偏向右边,均值往「右偏移」 | 血液中残留的药物量,呼叫中心的电话间隔时间,灯泡多久熄灭 |
左偏态 | 均值小于中位数(数据偏向左边,均值往「左偏移」 | 许多大学的成绩百分比,死亡年龄,资产价格变动 |
Tip
- 分布中的众数基本上是直方图中最高的直条。可能有多个众数。
- 上述均值与中位数的关系是普遍性的结论,并不适用于所有的情况。
- 当数据遵循正态分布时,可以使用均值和标准差理解数据集。
- 如果数据集是偏态分布,**五数概括法(和关联的集中趋势度量)**更适用于概括数据