返回列表

来自人教论坛的一道统计(兼复习)

看到这个贴 http://bbs.pep.com.cn/forum.php?mod=viewthread&tid=2703114 让我想复习一下以前高中学过的一点点统计初步,虽然其实从来没认真学过。

复习最好就是自己推一下,如有任何错的请马上指出。

$N$ 个东东里有 $n$ 个 $A$,$m$ 个 $B$,$n+m=N$。
现从中不放回地随机抽取 $k$ 个,则抽到 $x$ 个 $A$ 的概率为 $C_n^x C_m^{k-x}/C_N^k$,于是抽到 $A$ 的个数 $X_A$ 的期望值为
\begin{align*}
E(X_A)&=\sum_{x=1}^k\frac{xC_n^x C_m^{k-x}}{C_N^k}\\
&=\frac n{C_N^k}\sum_{x=1}^k C_{n-1}^{x-1} C_m^{k-x}\\
&=\frac{n C_{n-1+m}^{k-1}}{C_N^k}\\
&=\frac{nk}N.
\end{align*}
(变形过程用到两个组合恒等式,均能在 http://kkkkuingggg.5d6d.net/thread-878-1-1.html 找到,下同)

现在,我们看看放回的情况又如何。有放回地随机抽取 $k$ 个,抽到 $x$ 个 $A$ 的概率为 $C_k^x(n/N)^x(m/N)^{k-x}$,于是抽到 $A$ 的个数 $X_A$ 的期望值为
\begin{align*}
E(X_A)&=\sum_{x=1}^k \frac{x C_k^x n^x m^{k-x}}{N^k}\\
&=\frac k{N^k}\sum_{x=1}^k C_{k-1}^{x-1} n^x m^{k-x}\\
&=\frac{nk}{N^k}\sum_{x=1}^k C_{k-1}^{x-1} n^{x-1} m^{k-x}\\
&=\frac{nk}{N^k}(n+m)^{k-1}\\
&=\frac{nk}N.
\end{align*}

结果的确是相同的,同理,无论是有放回还是无放回,抽到 $B$ 的个数的期望值都为 $E(X_B)=mk/N$。

于是,可以回到链接的题目中,如果抽到每个 $A$ 记 $p$ 分,每个 $B$ 记 $q$ 分,那么当抽取 $k$ 个时,那么无论是有放回还是无放回,总分 $Y$ 的期望值都是
\[E(Y)=p\cdot E(X_A)+q\cdot E(X_B)=\frac{k(np+mq)}N.\]

也就是说原贴里那两种计算方法结果相同是必然的。
基本信息:kuing,GG,19880618~?,地道广州人,高中毕业,无业游民,不等式爱好者,论坛混混;
现状:冇钱又冇样、冇型又冇款、冇身材又冇文采、冇学历又冇能力、冇高度冇速度冇力度兼夹冇野做!(粤语)

先吃饭,晚点再复习一下方差,and……我突然发现我好像忘记了方差的定义式,看来还得类比一下经典情形……先闪
基本信息:kuing,GG,19880618~?,地道广州人,高中毕业,无业游民,不等式爱好者,论坛混混;
现状:冇钱又冇样、冇型又冇款、冇身材又冇文采、冇学历又冇能力、冇高度冇速度冇力度兼夹冇野做!(粤语)

接楼上,先把定义式类比出来先。

经典情形,设有 $N$ 个数据,其中有 $n_i$ 个 $x_i$, $i=1$, $2$, \ldots, $k$,则这些数据的平均数为
\[\bar x=\sum_{i=1}^k \frac{n_i}Nx_i,\]
方差为
\[
s^2=\sum_{i=1}^k \frac{n_i}N(x_i-\bar x)^2
=\sum_{i=1}^k \frac{n_i}Nx_i^2-2\bar x\sum_{i=1}^k \frac{n_i}Nx_i+\bar x^2\sum_{i=1}^k \frac{n_i}N
=\sum_{i=1}^k \frac{n_i}Nx_i^2 - \bar x^2.
\]

类比一下,随机变量 $X$,其中 $X=x_i$ 发生的概率为 $p_i$, $i=1$, $2$, \ldots, $k$,则 $X$ 的期望为
\[E(X)=\sum_{i=1}^k p_ix_i,\]
方差为
\[D(X)=\sum_{i=1}^k p_i\bigl(x_i-E(X)\bigr)^2
=\sum_{i=1}^k p_ix_i^2-2E(X)\sum_{i=1}^k p_ix_i+E(X)^2\sum_{i=1}^k p_i
=E(X^2)-E(X)^2.\]

这样应该没错吧?

如果没问题的话,$k\to\infty$ 时以上公式应该也适用,而对于连续的随机变量,大概就是要变成积分,等我想想应该怎么写,待续……
基本信息:kuing,GG,19880618~?,地道广州人,高中毕业,无业游民,不等式爱好者,论坛混混;
现状:冇钱又冇样、冇型又冇款、冇身材又冇文采、冇学历又冇能力、冇高度冇速度冇力度兼夹冇野做!(粤语)

超几何分布与二项分布的区别啊。
k推出的那个公式是超几何分布的期望公式吧。记得方差也有公式的。

4# 第一章

嗯,等会也推推,方法应该差不多,以前没认真学,现在几乎是从头开始推,连定义式都要重新想想……慢慢来……
基本信息:kuing,GG,19880618~?,地道广州人,高中毕业,无业游民,不等式爱好者,论坛混混;
现状:冇钱又冇样、冇型又冇款、冇身材又冇文采、冇学历又冇能力、冇高度冇速度冇力度兼夹冇野做!(粤语)

发现有些写法应该改下好些……改了下1#

话说,连续的随机变量还真不知怎么写……貌似没接触过,先放一会……
基本信息:kuing,GG,19880618~?,地道广州人,高中毕业,无业游民,不等式爱好者,论坛混混;
现状:冇钱又冇样、冇型又冇款、冇身材又冇文采、冇学历又冇能力、冇高度冇速度冇力度兼夹冇野做!(粤语)

第一次见超几何的期望公式

1# kuing


当年我也有这个疑问,现在终于明白了

超几何分布的期望、方差公式其实没多大用处(在高考里面),一方面,高中试卷里面提供的数据不复杂,直接算概率得了;另一方面,绝大多数的老师还真不知道这些公式。

其实...
$D(X)=E(X-EX)^2=E(X^2-2X*EX+(EX)^2)=E(X^2)-(EX)^2$

10# 秋风树林

还能这样写……
基本信息:kuing,GG,19880618~?,地道广州人,高中毕业,无业游民,不等式爱好者,论坛混混;
现状:冇钱又冇样、冇型又冇款、冇身材又冇文采、冇学历又冇能力、冇高度冇速度冇力度兼夹冇野做!(粤语)

还是推一下方差吧

当组合数上标为负数时定义其值为 $0$,这样对于正整数 $x$ 都有
\[x^2C_n^x=xnC_{n-1}^{x-1}=nC_{n-1}^{x-1}+n(x-1)C_{n-1}^{x-1}=nC_{n-1}^{x-1}+n(n-1)C_{n-2}^{x-2},\]

\begin{align*}
\sum_{x=1}^k x^2 C_n^x C_m^{k-x} &= n\sum_{x=1}^k C_{n-1}^{x-1} C_m^{k-x} + n(n-1)\sum_{x=2}^k C_{n-2}^{x-2} C_m^{k-x}\\
&=nC_{n-1+m}^{k-1} + n(n-1)C_{n-2+m}^{k-2}\\
&=\frac{nk}NC_N^k + \frac{n(n-1)k(k-1)}{N(N-1)}C_N^k,
\end{align*}
于是根据上述公式,对于不放回的方差就是
\[D(X_A)=\frac{nk}N+\frac{n(n-1)k(k-1)}{N(N-1)}-\left(\frac{nk}N\right)^2=\frac{kn(N-k)(N-n)}{N^2(N-1)}.\]

有放回的情形,有
\begin{align*}
\sum_{x=1}^k x^2 C_k^x n^x m^{k-x} &= k\sum_{x=1}^k C_{k-1}^{x-1} n^x m^{k-x} + k(k-1)\sum_{x=2}^k C_{k-2}^{x-2} n^x m^{k-x}\\
&=nk\sum_{x=1}^k C_{k-1}^{x-1} n^{x-1} m^{k-x} + n^2k(k-1)\sum_{x=2}^k C_{k-2}^{x-2} n^{x-2} m^{k-x}\\
&=nk(n+m)^{k-1}+n^2k(k-1)(n+m)^{k-2},
\end{align*}
于是根据上述公式,对于有不放回的方差就是
\[D(X_A)=\frac{nk}N+\frac{n^2k(k-1)}{N^2}-\left(\frac{nk}N\right)^2=\frac{nk(N-n)}{N^2}.\]
基本信息:kuing,GG,19880618~?,地道广州人,高中毕业,无业游民,不等式爱好者,论坛混混;
现状:冇钱又冇样、冇型又冇款、冇身材又冇文采、冇学历又冇能力、冇高度冇速度冇力度兼夹冇野做!(粤语)

查了下维基,结果好像一样,不过用的字母不同,看得我的……
基本信息:kuing,GG,19880618~?,地道广州人,高中毕业,无业游民,不等式爱好者,论坛混混;
现状:冇钱又冇样、冇型又冇款、冇身材又冇文采、冇学历又冇能力、冇高度冇速度冇力度兼夹冇野做!(粤语)

顺便地,对于两种情形的方差的差,有
\[\frac{nk(N-n)}{N^2}-\frac{kn(N-k)(N-n)}{N^2(N-1)}=\frac{nk(k-1)(N-n)}{N^2(N-1)}\geqslant 0,\]
所以不方回的方差总是大些。
基本信息:kuing,GG,19880618~?,地道广州人,高中毕业,无业游民,不等式爱好者,论坛混混;
现状:冇钱又冇样、冇型又冇款、冇身材又冇文采、冇学历又冇能力、冇高度冇速度冇力度兼夹冇野做!(粤语)

是的,大学概率论教材详细证明并给出了超几何分布的期望和方差的,特别是期望公式与二项分布的期望相同,方差虽然不同,但是超几何分布取了极限,就和二项分布的方差想通相同了。
证明时要用到一些组合恒等式。

返回列表