中心极限定理可以说是CFA一级数量部分最核心的一块了,起到了承上启下的左右,把样本和总体联系在一起。我们知道统计分为描述性统计和推断性统计,描述性统计主要是以比如均值、方差、中位数、众数等来描述数据;而推断性统计指的是用样本推断总体,如假设检验和线性回归等,是相对比较难以理解的。而中心极限定理从一方面来说为推断性统计提供了一个非常好的方法。
中心极限定理用一句简单的话来概括:样本均值服从正态分布,期望等于总体均值
这里就要解释一下了,什么是样本均值。样本是一个相对有限的量,比如我们想知道全国人口的平均身高(称作总体),鉴于量特别大,无法计算。但注意虽然无法计算,但是全国人口的平均身高是客观存在的,只是我们不知道而已。
我们可以抽取1W人来估计,这1W人就是一个样本了。通过算这1W人的平均身高来估算全国人口的平均身高,肯定不准确的,毕竟只是估算而已。这里的1W人的平均身高就是样本均值,那么我们是不是可以多抽几次比如K次,每次抽1W人。这样我们就可以算出K个样本均值也就是K个平均身高。
接下来,比较合理的是不是可以把这K个平均身高再求一次平均值。神奇的结论就是这K个平均身高服从正态分布,而且只要K够大,最终算出来的K个值的平均值就等于全国人口的平均身高。
简单一句来说,中心极限定理指的就是样本均值可以估算总体均值而且服从正态分布。
虽然听上去中心极限定理很难的样纸,但是我们一定要摸透本质,看透本质才能更深刻的理解后续的东西。
数学是一块一块的,前面学的就是后面的基础,只有把基础知识打牢,才能轻松的学习后面难的知识点。