如何让你的高数老师对你刮目相看
2019-12-07 正领国际教育

新版的进阶数学删除了向量空间,力学的简弦运动和转动惯量换成抛体和胡克定律,纯数和力学的理解门槛显著降低,高数变得亲民了!

31.jpg

但是,统计的检验和置信区间一日不删,这一块的理解就永远是高数的难点和重点。不止一次的有同学问我,这些题目我都会做,但我就是不知道为啥要这么做,这么做的意义和逻辑在哪,特别是样本方差为啥分母除的是n-1而不是n了?

 32.jpg

本次我们来深度剖析一波,掌握了其中精髓,简直手握吹牛利器,你的高数老师甚至都会对你刮目相看。

首先,与s1不同,高数统计中的所有知识点,几乎都针对于样本,不同于s1中所有数据针对于总体,

样本存在的意义,是去估计总体,帮我们化不可能为可能。

举个例子,我们想要去了解一下中国人民的平均身高。

如果本着严肃认真的态度,我们需要精密测量13亿余个中国公民的准确身高,并且除以13亿这个容量,为了严肃,我们甚至要到各个山沟沟,把一些藏身于山洞中的隐士请出,为的,就是不放过每一个中国公民的身高数据,当然,这一切需要在几秒之内完成,不然每一秒都有新生婴儿出生,有人去世,那一切就显得不严谨,不严肃了。

那对于这种测量统计方法,操作难度有一点点偏高。所以这时候样本带来的抽样调查统计法应运而生。

所有中国公民的身高为总体,那个别中国公民的身高即为样本,我们可以抽取每个市县,亦或是社区的身高数据,在其中随机抽取足够具有代表性数量的样本,理论上最棒的样本呢?

33.jpg

每个样本随机抽取,所以它们互相独立(independent),且彼此样本的期望和方差值相同,都对应总体均值和总体方差(identical)。数学符号上可以表示为:

34.jpg

随后进行整合,那我们就可以用样本的平均值去合理的估计总体的平均值了。

在s1中我们知道,总体的平均值我们常以希腊字母μ来表示,而样本平均值我们则用符号χ来表示。它们的计算方法都是:35.jpg

所有数据之和除以总数,只不过n在总体平均的计算中是总体数据量,而在样本均值的计算中为样本个数。

那为什么样本的平均值去估计总体的平均值是为合理的呢?

统计学中把某一个用来估计总体参数的样本估计量称作estimator,而有一种estimator还不错,这种估计量叫unbiased estimator,是为无偏估计量。

无偏估计量的定义是,这个估计量的期望值(expectation)等于总体参数值,说得通俗点,咱们可以理解为,这个估计量所预期达到的值就是总体参数值。

所以在样本iid的条件下,我们可以尝试着去求样本均值这个estimator的期望,来检验它是否拿得起一个无偏估计量的称号:

36.jpg

通过简单的推导,我们轻松得知样本均值χ是一个无偏估计量!

那么现在,困扰几乎所有同学,甚至部分老师的一个问题,为什么样本方差需要除以n-1,这个答案也就浮出水面了。因为样本方差只有除以n-1它才拿得起一个无偏估计量~

掌握了它,在高中阶段,你的统计理解就是王中王!不论可以作为在课间和同学聊天吹牛的时候重磅炸弹,还是在课堂上突然放出,挑战老师,让老师刮目相看,都好用得很。

不过这个证明比样本均值会稍微麻烦一丢丢,篇幅所限,不在文中阐述了,欢迎大家收看我的公开课,我会在其中进行详细的证明和推导,学霸们可以自己先做一次,然后和我的答案校对。

我是正领大川老师,下次教你如何用高数统计学来验证你的同学是不是在吹牛,铁证如山,毫无还手之力,我们下次再见。

上一篇:一个视力测试——不仅音乐有remix,数学p3答案也有! 下一篇:干货|| 2006夏季P3 mark scheme高清重制来袭!