样本平均数(sample mean):将从总体中抽取的样本(随机变量)的和,除以样本的数量
母体平均数(population mean)
均值分布的期望值(expected value of the distribution of mean),其中X_bar 表示第i个样本的均值,pi表示该均值出现的概率。
这个均值分布的期望值,可以视为,有限多个样本平均值(sample means)的权重均值(weighted average)
可以证明,μ和μx_bar是相等的
顺带一提,如果统计值的期望值,和母体的参数相等,则该统计值本身称为母体该参数的无偏差估计器(unbiased estimator)
标准误(Standard Error):各个样本的均值,互相之间离散程度的大小。也代表使用相应的统计量,回推母体参数可能发生的误差大小(但这一点我不太理解)
均方误差(Mean Squared Error (MSE),),实际上是标准误的平方
上面两个是等同的
统计值(statistic):通过抽取样本而得到的,用以估计母体属性的值
方差:从定义可以看出,方差是一种特殊的期望,以下是我的笔记
母体方差
样本方差
即使母体分布不是正态分布,样本平均值也是正态分布
下图为一个随机的总体分布, 横坐标代表总体中每个卡片的号码,纵坐标代码这个号码在总体中存在的数量
下图为样本均值的分布;即从总体中进行抽样,样本自身的大小为n,抽样一千次,每次抽样计算一个平均值并四舍五入。横坐标为样本均值,纵坐标为该值在1000次抽样中出现的次数
抽样分布(sampling distribution):将样本或统计值的分布成为抽样分布
最后觉得这张图挺好的,粘一下