2万元建设网站贵吗,谷歌搜索引擎镜像入口,专业的网站建设专业平台,设计类公司简介网页文章目录 泊松分布和二项分布的关系和正态分布的关系 泊松分布
如果在有限时间 ( 0 , 1 ) (0,1) (0,1)内进行 n n n次伯努利实验#xff0c;那么每次伯努利实验所占用的时间为 1 n \frac{1}{n} n1#xff0c;按照自然规律#xff0c;一件事情肯定是时间越长越容易发生那么每次伯努利实验所占用的时间为 1 n \frac{1}{n} n1按照自然规律一件事情肯定是时间越长越容易发生假定事件发生的概率与 1 n \frac{1}{n} n1成正比记作 λ n \frac\lambda n nλ则二项分布变为 P { X k } ( n k ) ( λ n ) k ( 1 − λ n ) n − k P\{Xk\}\binom{n}{k}(\frac{\lambda}{n})^k(1-\frac{\lambda}{n})^{n-k} P{Xk}(kn)(nλ)k(1−nλ)n−k
如果这个时间差 1 n \frac1n n1非常小以至于事件变得近似连续则有 lim n → ∞ P { X k } lim n → ∞ ( n k ) ( λ n ) k ( 1 − λ n ) n − k \lim_{n\to\infty} P\{Xk\}\lim_{n\to\infty}\binom{n}{k}(\frac{\lambda}{n})^k(1-\frac{\lambda}{n})^{n-k} n→∞limP{Xk}n→∞lim(kn)(nλ)k(1−nλ)n−k
其中 lim n → ∞ ( n k ) ( λ n ) k λ k k ! \lim_{n\to\infty}\binom{n}{k}(\frac{\lambda}{n})^k\frac{\lambda^k}{k!} n→∞lim(kn)(nλ)kk!λk
而后面有一项更是传说中的重要极限 lim n → ∞ ( 1 − λ n ) n e − λ \lim_{n\to\infty}(1-\frac{\lambda}{n})^ne^{-\lambda} n→∞lim(1−nλ)ne−λ
综上就得到了一个新的分布 P ( x k ) e − λ λ k k ! P(xk)\frac{e^{-\lambda}\lambda^k}{k!} P(xk)k!e−λλk
此即泊松分布表示某个随机事件在连续时间内发生的概率其中 λ n \frac\lambda n nλ表示单位时间内某件事发生的概率。
和二项分布的关系
下面通过scipy中的stats模块模拟二项分布和泊松分布之间的关联。
import numpy as np
import matplotlib.pyplot as plt
import scipy.stats as ssp,q 0.2, 0.8
ns [10, 500, 25000, 1250000]fig plt.figure()
for i,n in enumerate(ns):lam n * prs ss.binom(n, p).rvs(50000)rv ss.poisson(n*p)st, ed rv.interval(0.999)xs np.linspace(st, ed, 100)ax fig.add_subplot(2,2,i1)ax.hist(rs, densityTrue, binsauto, alpha0.2)ax.plot(xs, rv.pmf(xs))plt.title(fn{n})plt.show()效果如下 和正态分布的关系
泊松分布是二项分布在有限时间内的极限情况而根据中心极限定理随着伯努利试验次数的增加二项分布将逼近于 σ 2 n p q , μ n p \sigma^2npq, \munp σ2npq,μnp的高斯分布。
在通过二项分布推导泊松分布的过程中比较关键的一步是 λ n \frac{\lambda}{n} nλ作为概率的一个假定当 n → ∞ n\to\infty n→∞时可以发现 λ n \frac{\lambda}{n} nλ将趋近于0如果继续沿用二项分布的模型那么 q 1 ˉ − λ n − 0 q\1-\frac{\lambda}{n}-0 q1ˉ−nλ−0从而 n p q ≈ n p npq\approx np npq≈np。
由此可以得到当事件趋近于无穷多时泊松分布将趋近于 μ λ , σ 2 λ \mu\lambda, \sigma^2\lambda μλ,σ2λ的正态分布。
下面对这个关系进行测试
import numpy as np
import matplotlib.pyplot as plt
import scipy.stats as ssp 0.1
#lam 100
ns [10, 500, 25000, 1250000]fig plt.figure()
for i,n in enumerate(ns):lam 0.1 * nrs ss.poisson(lam).rvs(n)rv ss.norm(lam, np.sqrt(lam))st, ed rv.interval(0.999)xs np.linspace(st, ed, 100)ax fig.add_subplot(2,2,i1)ax.hist(rs, densityTrue, binsauto, alpha0.2)ax.plot(xs, rv.pdf(xs))plt.title(fn{n})plt.show()效果如下