推论统计概述

statistics

推论统计概述

推论统计在于使用我们收集的数据对更大的总体数据得出结论。要很好地进行推断统计,需要抽取一个准确地代表我们感兴趣人群的样本。一个常用的数据收集方法是通过调查。但根据所提问题的类型,以及提问的方式,调查可能会有很大偏见。这是你在开始第一个项目前应该考虑的问题。

基本概念

  • 总体:研究的整个群体
  • 参数:描述总体的数值摘要(一般只能估算,无法得到确切的数据),一般是总体的百分比或平均数等摘要
  • 样本:总体的子集
  • 统计量:描述样本的数值摘要,一般是样本的百分比或平均数等摘要

常见符号

在统计学中

  • 参数常使用希腊符号(或使用带有「帽子」,如 σ^\hat\sigma 的希腊字母,表示对应参数的估算
  • 统计量常使用小写字母
参数统计量描述
μ\muxˉ\bar{x}数据集的平均值
π\pipp仅包括数值 0011 的数据集平均数:比例
μ1μ2\mu_1 - \mu_2xˉ1xˉ2\bar{x}_1-\bar{x}_2平均数差异
π1π2\pi_1 - \pi_2p1p2p_1-p_2比例差异
β\betabb回归系数:通常出现在下标
σ\sigmass标准差
σ2\sigma^2s2s^2方差
ρ\rhorr相关系数

常见估计技巧

常见的估算参数的方法

最大似然估计

Tip

矩估计方法

Tip

贝叶斯估计

Tip

讨论

应答偏差

解读任何统计结果 (这一点常被忽视) 的最重要一方面在于确保样本代表你感兴趣的总体

假设检验与机器学习

样本容量很大时,假设检验会产生统计意义最小的发现。然而,这些发现可能根本不具有现实意义。(即可能由于个性化产生了巨大的噪点,因此无法获得「符合大众」的具备现实意义的发现)

  • 假设检验采用综合方法,得出基于数据的结论,因为这些检验旨在了解总体参数 (即综合的总体数值)。
  • 机器学习技巧采用个体方法得出结论,因为他们旨在预测每个特殊数据点的结果。

Copyright © 2024 Ben

Theme BlogiNote

Icons from Icônes