本文主要学习概率统计学的一些基础知识,内容主要包括两部分,概率学上的基础概念介绍,以及如何使用python代码实现离散概率分布、连续概率分布和随机抽样。
随机事件:统计概率中,用事件表示某件事情,在一定条件下,可能发生也可能不发生的事件叫做随机事件,例如,抛一枚硬币,可能出现正面朝上,也可能出现反面朝上;通过数值来量化随机事件,得到发生某个结果的可能性大小,称为概率;
随机变量,是量化随机事件的函数,将随机事件每一个可能出现的实验结果赋予一个数值;
分布,数据在统计图中的形状称为它的分布;
概率分布,用统计图来表示随机变量所有可能结果和对应结果发生的概率,横轴是随机变量的数字(随机事件的所有可能结果),纵轴是横轴上对应结果发生的概率;
举例,随意抛掷一枚骰子就是一次试验,骰子落地,可能出现1点,2点,…,6点,等都是一个事件,而且这些事件都是在一次试验中可能出现也可能不出现的,即为随机事件,如果用X表示抛掷骰子,X的可能值计为x1,x2,…,x6,具有确定概率P(x1),P(x2),…,P(x6),则X称为P(X)的随机变量,P(X)称为随机变量X的概率函数。
随机变量有两种分类,离散型随机变量和连续型随机变量,离散型随机变量的特点是可逐个列举,如:抛一枚骰子出现几点朝上;而连续型变量则无法逐个列举,如:下雨雨量毫米数。
计算离散随机变量的概率公式叫概率质量函数(PMF);计算连续随机变量的概率公式为概率密度函数(PDF)。
离散概率分布常见有4种:伯努利分布、二项分布、几何分布、泊松分布;
2.1、伯努利分布
伯努利试验,在同样的条件下重复进行的相互独立的随机试验,试验的结果有两种结果,成功或不成功,例如,抛硬币,正面朝上或反面朝上;如果随机变量X是一次伯努利试验,则这个随机变量服从伯努利分布;
python中实现伯努利分布的代码:
第1步:定义随机变量
第2步:计算概率质量函数PMF
第3步,绘图
#第3步,绘图
plt.plot(X,pList,marker='o',linestyle='')
'''
vlines用于绘制竖直线(vertical lines),
参数说明:vline(x坐标值, y坐标最小值, y坐标值最大值)
我们传入的X是一个数组,是给数组中的每个x坐标值绘制竖直线,
竖直线y坐标最小值是0,y坐标值最大值是对应pList中的值
官网文档:https://matplotlib.org/api/pyplot_api.html#matplotlib.pyplot.vlines
'''
plt.vlines(X,0,pList)
#x轴文本
plt.xlabel('随机变量:抛硬币1次')
#y轴文本
plt.ylabel('概率')
#标题
plt.title('伯努利分布:p=%.2f' % p)
#显示图形
plt.show()
<< · Back Index ·>>
下一篇