新版的进阶数学删除了向量空间，力学的简弦运动和转动惯量换成抛体和胡克定律，纯数和力学的理解门槛显著降低，高数变得亲民了！

但是，统计的检验和置信区间一日不删，这一块的理解就永远是高数的难点和重点。不止一次的有同学问我，这些题目我都会做，但我就是不知道为啥要这么做，这么做的意义和逻辑在哪，特别是样本方差为啥分母除的是n-1而不是n了？

本次我们来深度剖析一波，掌握了其中精髓，简直手握吹牛利器，你的高数老师甚至都会对你刮目相看。

首先，与s1不同，高数统计中的所有知识点，几乎都针对于样本，不同于s1中所有数据针对于总体，

样本存在的意义，是去估计总体，帮我们化不可能为可能。

举个例子，我们想要去了解一下中国人民的平均身高。

如果本着严肃认真的态度，我们需要精密测量13亿余个中国公民的准确身高，并且除以13亿这个容量，为了严肃，我们甚至要到各个山沟沟，把一些藏身于山洞中的隐士请出，为的，就是不放过每一个中国公民的身高数据，当然，这一切需要在几秒之内完成，不然每一秒都有新生婴儿出生，有人去世，那一切就显得不严谨，不严肃了。

那对于这种测量统计方法，操作难度有一点点偏高。所以这时候样本带来的抽样调查统计法应运而生。

所有中国公民的身高为总体，那个别中国公民的身高即为样本，我们可以抽取每个市县，亦或是社区的身高数据，在其中随机抽取足够具有代表性数量的样本，理论上最棒的样本呢？

每个样本随机抽取，所以它们互相独立（independent），且彼此样本的期望和方差值相同，都对应总体均值和总体方差（identical）。数学符号上可以表示为：

随后进行整合，那我们就可以用样本的平均值去合理的估计总体的平均值了。

在s1中我们知道，总体的平均值我们常以希腊字母μ来表示，而样本平均值我们则用符号χ来表示。它们的计算方法都是：

所有数据之和除以总数，只不过n在总体平均的计算中是总体数据量，而在样本均值的计算中为样本个数。

那为什么样本的平均值去估计总体的平均值是为合理的呢？

统计学中把某一个用来估计总体参数的样本估计量称作estimator，而有一种estimator还不错，这种估计量叫unbiased estimator，是为无偏估计量。

无偏估计量的定义是，这个估计量的期望值（expectation）等于总体参数值，说得通俗点，咱们可以理解为，这个估计量所预期达到的值就是总体参数值。

所以在样本iid的条件下，我们可以尝试着去求样本均值这个estimator的期望，来检验它是否拿得起一个无偏估计量的称号：

通过简单的推导，我们轻松得知样本均值χ是一个无偏估计量！

那么现在，困扰几乎所有同学，甚至部分老师的一个问题，为什么样本方差需要除以n-1，这个答案也就浮出水面了。因为样本方差只有除以n-1它才拿得起一个无偏估计量~

掌握了它，在高中阶段，你的统计理解就是王中王！不论可以作为在课间和同学聊天吹牛的时候重磅炸弹，还是在课堂上突然放出，挑战老师，让老师刮目相看，都好用得很。

不过这个证明比样本均值会稍微麻烦一丢丢，篇幅所限，不在文中阐述了，欢迎大家收看我的公开课，我会在其中进行详细的证明和推导，学霸们可以自己先做一次，然后和我的答案校对。

我是正领大川老师，下次教你如何用高数统计学来验证你的同学是不是在吹牛，铁证如山，毫无还手之力，我们下次再见。

聂老师