对于随机试验中的随机事件来说,其在一次试验中是否一定发生,我们是不能预先知道的,但它们在一次实验中发生的可能性是有大小之分的。
比如:在掷硬币时,正面向上的可能性和反面向上的可能性是一样的;掷色子时,点数大于3的可能性比点数大于4的可能性大。
一般的,对于一个随机事件 A ,可以找到一个数与之相对应,此数可以作为事件 A 发生的可能性大小的度量,称此数为事件 A 发生的概率,记为 P(A) 。
但是上面所说的数是怎么来的?不可能凭空得来的。这就涉及到了概率的“测量”问题,为此首先引入频率,他描述了事件发生的频繁程度,进而引出表示事件在一次试验中发生的可能性大小的数——概率。
定义1.2 在相同的条件下重复进行 n 次试验,如果事件 A 在这 n 次试验中出现了 n_A 次,则称比值 frac{n_A}{n} 为事件 A 发生的频率,记为 f_n(A) ,即
f_n(A)=frac{n_A}{n}./
频率的性质:
(1)非负性: f_n(A)geq0 ;(因为 n>0, n_Ageq0 )
(2)规范性:若 A 为必然事件,则 f_n(A)=1 ;
(3)有限可加性:若 A_1, A_2, A_3, …,A_m 是一组两两互不相容的事件,即 A_iA_j=varnothing (1leq i,jleq m, ine j) ,则 f_n(bigcup_{i=1}^{m}A_i)=sum_{i=1}^{m}f_n(A_i)./ 从定义看,频率 f_n(A) 的大小表示在 n 次试验中事件 A 发生的频繁程度。如果事件 A 发生的频率越大,事件 A 的发生就越频繁,在一次事件中事件 A 发生的可能性就越大,即事件 A 发生的概率越大。因此,我们理所当然的可以想到用频率来描述概率。(存在的问题:比如抛4次硬币,恰好全是正面向上,则频率是1,也就是说正面向上的频率大于反面向上,正面向上的概率大于反面向上,但实际上正面和反面的概率是一样的,下面的表述就可以解决这个问题)
有很多锲而不舍的人(大闲人)做过掷硬币实验
实验者 | 投掷次数n | 正面出现的次数 | 频率 |
---|---|---|---|
蒲丰 | 4040 | 2048 | 0.5070 |
皮尔逊 | 12000 | 6019 | 0.5016 |
皮尔逊 | 24000 | 12012 | 0.5005 |
从上表可以看出的是:当投掷试验次数逐渐变大时,频率在0.5附近摆动且逐渐稳定于0.5(距离0.5越来越近)。
我们可以得出一个更加一般的结论:一个随机事件 A 在 n 次试验中出现的频率 f_n(A) 会随着试验次数的增加而在一个常数附近摆动,且逐渐稳定于这个常数。——频率的稳定性
概率的公理化定义:
设有任意一个随机试验 E , S 为 E 的样本空间,若对于任意事件 A ,有实数 p(A) 与之相对应,且满足下列条件,则实数 p(A) 称为 A 的概率:
(1) 非负性:对于任意的事件 A ,总有 P(A)geq 0 ;
(2)规范型: P(S)=1 ;
(3)可列可加性:若 A_1,A_2,…,A_n,… 为两两互不相容的事件组,则有
由概率的定义,我们不难有如下性质:
(1) p(varnothing)=0 ;( P(S)=P(Scupvarnothing)=P(S)+P(varnothing) ,所以 p(varnothing)=0 )
(2)(有限可加性)若 A_1,A_2,…,A_n 为两两互不相容的事件组,则有
P(bigcup_{i=1}^{n}A_i)=sum_{i=1}^{n}P(A_i)./(3)对任意的事件 A ,有 P(overline{A})=1-P(A) ;( 1=P(S)=P(Acupoverline{A})=P(A)+P(overline{A}) )
有趣的概率问题:生日问题
设班级内人数为 n ( n<365 ),则至少有两人的生日在同一天的概率是多少?
解:设一年的天数 N=365 ,事件 A= { n 个人中至少有两人的生日在同一天},则 overline{A}= {所有人的生日都不在同一天},由于 P(A) 不容易求,因此我们根据概率的性质(3)可知,可以通过 P(overline{A}) 得到 P(A) ,且
P(overline{A})=frac{C_{N}^{n}}{N^n}=frac{N!}{N^n(N-n)!}/ 或
因为每个人的生日在一年中的一天的概率是 frac{1}{365} ,设第一个人为365天的某一天,则另外一个人与他的生日不在同一天的概率为 frac{364}{365} ,下一个人与上面两个人的生日不在同一天的概率为 frac{363}{365} ,所以 n 个人的生日都不在同一天的概率为
P(overline{A})=1cdotfrac{364}{365}cdotfrac{363}{365}cdot…cdotfrac{365-n+1}{365}=frac{365cdot364cdot363cdot…cdot(365-n+1)}{365^n}/ 所以由 P(A)=1-P(overline{A}) 可得至少有两人的生日在同一天的概率。下面是不同 n 值下 P(A) 的值:
n | 10 | 20 | 30 | 50 | 100 |
---|---|---|---|---|---|
P(A) | 0.12 | 0.41 | 0.71 | 0.97 | 0.9999997 |
结果让人觉得很离谱。
(上课时,我在100多个人的班里现场验证了一下,差点翻车,我说概率论还好没有毁在我的手上)
(4)(减法公式)设 A, B 为任意事件,则
P(A-B)=P(A)-P(AB),/ 特别的,若 Bsubset A ,则
(1) P(A-B)=P(A)-P(B) ;
(2) P(A)geq P(B) .
证明:因为 A=A-B+AB 且 A-B 与 AB 互不相容,由性质(2)可得 P(A)=P(A-B+AB)=P(A-B)+P(AB) 。
(5)(加法公式)设 A, B 为任意事件,则
P(Acup B)=P(A)+P(B)-P(AB)./ 证明:因为 Acup B=Acup(B-AB) 且 A 与 B-AB 互不相容, ABsubset B ,由性质(2)可得
P(Acup B)=P(A)+P(B-AB)=P(A)+P(B)-P(AB) 。
上述加法公式可以推广至多个事件,常见的是三个事件的加法公式:设 A, B, C 为任意事件,则
P(Acup Bcup C)=P(A)+P(B)+P(C)-P(AB)-P(AC)-P(BC)+P(ABC)./
补充:
P(AB)+P(Aoverline{B})=P(A)/
P(AB)+P(overline{A}B)=P(B)/ (上面的几个公式画出来 Venn 图就能直接得出来)
要记公式啊,公式记不住怎么做题!
例1:已知 P(overline{A})=0.5, P(overline{A}B)=0.2, P(B)=0.4, 求:
(1)P(AB) (2)P(A-B) (3)P(Acup B) (4) P(overline{A}overline{B})
解: P(AB)=P(B)-P(overline{A}B)=0.4-0.2=0.2;
P(A)=1-P(A)=0.5, P(A-B)=P(A)-P(AB)=0.5-0.2=0.3;
P(Acup B)=P(A)+P(B)-P(AB)=0.5+0.4+-0.2=0.7;
P(overline{A}overline{B})=P(overline{A}capoverline{B})=P(overline{Acup B})=1-P(AB)=1-0.7=0.3.
例2: A, B, C 是三个事件,且 P(A)=P(B)=P(C)=frac{1}{4}, P(AB)=P(BC)=0, P(AC)=frac{1}{8}, 求:
(1) A, B, C 至少有一个发生的概率;
(2) A, B, C 都不发生的概率。
解:(1)A, B, C 至少有一个发生,即 Acup Bcup C ,且
P(Acup Bcup C)=P(A)+P(B)+P(C)-P(AB)-P(AC)-P(BC)+P(ABC),
又因为 P(AB)=0, 所以 P(ABC)=0 ,故
P(Acup Bcup C)=frac{1}{4}+frac{1}{4}+frac{1}{4}-0-frac{1}{8}-0+0=frac{5}{8};
(2)A, B, C 都不发生,即 overline{A}overline{B}overline{C} ,因此
P(overline{A}overline{B}overline{C})=P(overline{Acup B cup C})=1-P(Acup Bcup C)=1-frac{5}{8}=frac{3}{8}.
例3:已知 P(A)=0.5, P(Acup B)=0.8, P(AB)=0.3, 则 P(B)= , P(Boverline{A})= .
解: P(B)=0.6 , P(Boverline{A})=0.3 .
如果一类随机实验满足:
(1)样本空间的基本事件(样本点)有有限个(不妨设为 e_1, e_2,…, e_n );
(2)每个基本事件出现的可能性是相等的(即 P(e_1)=P(e_2)=…=P(e_n) ),
则称这种模型为古典概型(又称等可能概型)。
若事件 A 包含 k 个基本事件,即 A={e_{i_1}}cup{e_{i_2}}cup…cup{e_{i_k}} ,其中 i_1, i_2,…, i_k 是 1, 2,…, k 中个不相同的数,则有
P(A)=sum_{j=1}^kP({e_{i_j}})=frac{k}{n}=frac{A中包含的基本事件数}{S中基本事件总数}/ 初学者碰到的很多试验(题型)都是满足古典概型的,而在计算过程中又大都需要用到排列组合的知识。
排列:从 n 个不同元素中,任取 k ( kleq n ,且 k 与 n 都是自然数)个不同的元素按照一定的顺序排成一列,叫做从 n 个不同元素中取出 k 个元素的一个排列。
从 n 个不同元素中取 k 个不同的元素的所有排列的个数常用 A_n^k 表示,且
A_n^k=frac{n!}{(n-k)!}=ntimes (n-1)times…times (n-k+1)./ 组合:从 n 个不同元素中,任取 k ( kleq n ,且 k 与 n 都是自然数)个不同的元素合并成一组,叫做从 n 个不同元素中取出 k 个元素的一个组合。
从 n 个不同元素中取 k 个不同的元素的所有组合的个数常用 C_n^k 表示,且
C_n^k=frac{n!}{k!(n-k)!}./ 注:① 排列可以理解为从 n 个不同元素中,分 k 次取 k 个不同的元素;
② 组合可以理解为从 n 个不同元素中,一次取 k 个不同的元素(不考虑取出元素的顺序);
③ C_n^k=frac{A_n^k}{k!}.
例4:从1、2、3、4、5 中等可能地、有放回的连续抽取三个数字。试求下面事件发生的概率:
(1) A= {三个数字完全不相同};
(2) B= {三个数字中不含“2”和“5”};
(3)C= {三个数字中“3”恰好出现两次};
(4)D= {三个数字中至少出现一次“5”}。
上述试验满足古典概型,且基本事件总数为 5^3,则
(1)事件 A 要求三个数字完全不相同,且取出来的数字顺序不同的话,则表示的数字也不同,因此可以用排列,5个数字中选三个,即 A_5^3 ,所以: P(A)=frac{A_5^3}{5^3}=0.48 ;
同理可得:(2) P(B)=frac{3^3}{5^3}=0.216 ;
(3)三个数字中“3”出现两次,可以是三次中的任意两次,共有 C_3^2 种,剩下的一个位置只能是1、2、4、5 中的一个数,有 C_4^1 (或者 A_4^1 )种,所以 P(C)=frac{C_3^2A_4^1}{5^3}=0.096 ;
(4) D 包含了“5”出现一次、两次和三次情况,所以事件 D 包含的事件个数为 C_3^1A_4^1A_4^1+C_3^2A_4^1+C_3^3 ,所以 P(D)=frac{C_3^1A_4^1A_4^1+C_3^2A_4^1+C_3^3}{5^3}=0.488 ;
或者:通过对立事件的概率从侧面求解事件 D 的概率。因为overline{D}= {三个数字没有数字“5”},所以事件 overline{D} 包含的事件个数为 4^3 ,因此 P(D)=1-P(overline{D})=1-frac{4^3}{5^3}=0.488 。
我们可以发现古典概型的一个重要特点就是样本点的有限性,这就导致当样本点个数为无限多个的时候古典概型就不再使用,因此出现了下述的几何概型,几何概型保留了等可能性,将将试验的可能结果推广到无限多个。
一般情况下,几何概型主要有如下特点:
(1)随机试验的样本空间 S 是某个区域(可以为一维区间、二维平面区域、三维空间区域);
(2)每个样本点发生的可能性是相等的。
事件 A 发生的概率公式为
P(A)=frac{m(A)}{m(S)},/ 其中 m(cdot) 表示并不总是一个意思,在一维区间中表示长度,二维平面区域中表示面积、三维空间区域中表示体积。
几何概型在初学概率时,用的不多,不再详细介绍。
上一篇
下一篇