数学天才必学的12大概率分布

开通VIP,畅享免费电子书等14项超值服

首页

好书

留言交流

下载APP

联系客服

2022.10.23河北

概率论是集中研究概率及随机现象的数学分支,主要研究对象为随机事件、随机变量以及随机过程。概率分布,是指用于表述随机变量取值的概率规律,它大致分为离散概率分布和连续概率分布两种。在本文中,我们将介绍以下12种分布:

符号:X~二项式(p)

参数:p是成功试验(0<=p<=1)

PMF=p(k)=

CDF=p(X<=k)=

平均值=

p

方差=

伯努利分布的PMF

伯努利分布的CDF

假设我有n个硬币。我在n次投掷中得到k个正面的概率是多少?

任何分布为二项分布的条件-

符号:X~Bl(p,n)

参数:n为试验次数,

p是成功试验

二项分布的PMF

二项分布的CDF

均匀分布是每个值(在域中或区间中)出现的概率相同的分布。

均匀分布的类型

根据分布中使用的随机变量的类型,有两种类型的均匀分布。他们是

离散均匀分布

符号:X~Unif(a,b)或U(a,b)

参数:其中a和b是整数,b>a

可能结果的数量表示为“n”并且(即,n=b-a+1)

PMF=p(X=k)=

CDF=p(X=

离散均匀分布的PMF

离散均匀分布的CDF

连续均匀分布

PDF=p(X=k)=

连续均匀分布的PDF

连续均匀分布的CDF

假设

符号:X~poisson(λ)

参数:λ,即任何事件发生的速率。

泊松分布的PMF

泊松分布的CDF

泊松分布的另一个性质是

如果

X1~poisson(λ1)和X2~poisson(λ2)

(两者都是独立的)

然后

(X1和X2)~泊松(λ1+λ2)

符号:X~指数(λ)

参数:λ,它是任何事件发生的速率。

PDF=

CDF=

指数分布的PDF

指数分布的CDF

指数分布的无记忆性

指数分布的随机变量T服从关系

Pr(X>s+t|X>s)=Pr(X>t)

Pr(事件在40分钟内发生|等待30分钟)=Pr(事件在10分钟内发生)

当我们从未知分布的群体中抽取大量样本时,它遵循正态分布。

X~正常(m,p2)

其中μ是平均值

σ2是标准差

PDF=f(x)=

CDF=F(x)=

平均值=E(x)=

方差=Var(x)=

正态分布的PDF

正态分布的CDF

经验法则或68–95–99.7法则

68-95-99.7规则或经验规则用于记住正态分布的区间估计值中的百分比。

68%、95%和99.7%的数值分别位于两侧第一、第二和第三标准差的区间内。

例如,我们有一个均值为150,标准差为25的正态分布,则1σ=25;2σ=50,3σ=75

68%的值位于区间[150–25,150+25]中(即[125,175])

95%的值位于区间[150–50,150+50]中(即[150,200])

99.7%的值位于区间[150–75,150+75](即[75,125])

注意:正态分布的平均值始终不是必须为0。它也可以是非零值。但是,一旦将值标准化,则均值变为0,标准差变为1。

标准正态变量(Z)和标准化

标准正态分布是均值为零,标准差为1的正态分布。

标准正态变量—Z分数是一种数值度量,用于描述一个值与一组值的平均值的关系。

如果我们有一个均值为0、标准差为1且服从正态分布的随机变量“Z”,则“Z”称为标准正态变量。表示为Z~N(0,1)

标准化是将具有均值“μ”和方差“σ2”的给定分布转换为均值为0、标准差为1的相同类型分布的过程。(即使方差也为1)

注意:标准化只是将给定的值分布转换为平均值=0和标准差=1的新尺度。分布的性质根本不会改变。(无论分布是高斯还是非高斯)

X~LogNormal(m,p2)

如果X~LogNormal(m,p2)

然后y=log(x)并且y服从正态分布(自然对数)

对数正态分布的PDF

对数正态分布的CDF

对数正态分布始终呈正偏态。没有机会被负面扭曲。每个对数正态分布都是偏态分布,但每个偏态分布都不是对数正态分布。

对于对数正态分布,我们不能应用68-95-99.7规则,因为它不是高斯分布。但是一旦我们对一个对数正态分布变量应用一个自然对数,那么转换后的特征遵循正态分布,那么68-95-99.7规则就适用了。

如果“X”服从对数正态分布,则Y=ln(X)服从正态分布。Y~N(μ,σ)

根据正态分布,

68%的数据位于[m-s,m+s]

95%的数据位于[μ-2σ,μ+2σ]

99.7%的数据位于[μ-3σ,μ+3σ]

因为Y=ln(X)X=eY

所以'X'中68%的数据位于[eμ-σ,eμ+σ]

所以'X'中95%的数据位于[eμ-2σ,eμ-2σ]

所以'X'中99.7%的数据位于[eμ-3σ,eμ-3σ]

这里μ,σ是'Y'的参数

如何检查给定分布是否为对数正态分布

让'X'是给定的输入分布。让我们计算“X”值的自然对数并将它们表示为“Y”。(即,Y=ln(X))。

对数正态分布的应用

为什么对数正态分布的峰值不被视为均值?

正态/高斯分布是对称的,50%的值位于一侧

其余50%的值位于另一侧。所以我们可以说高斯分布的最高峰是它的平均值。

但是在对数正态分布的情况下,我们不能保证平均值是

因为曲线是不对称的,所以恰好出现在最高峰。

幂律是两个量之间的函数关系,其中一个量的相对变化导致另一个量成比例的相对变化,与这些量的初始大小无关。(即,一个数量随着另一个数量的力量而变化)。

幂律遵循80-20规则。在给定的分布“X”中,80%的分布值低于20%的“X”值。当分布遵循幂律时,该分布称为帕累托分布。幂律函数有一条长尾。帕累托分布适用于连续随机变量。

任何遵循幂律分布的分布称为帕累托分布。

帕累托分布的参数是

示例——80%的社会财富由20%的人持有。

帕累托分布PDF

帕累托分布的CDF

从PDF图中,我们观察到随着'α'值不断减小,尾部变得不那么粗。对于α→无穷大,PDF变为delta函数(即,具有单个值的垂直直线)。这里这个delta函数只在一个点有一个值,而在其他点上,它的值是0。这样的函数称为DiracDelta函数。

帕累托和对数正态分布的共同点是“两种分布都有少量较大的值和大量的较小值。但主要区别在于帕累托分布没有增加的PDF。

如何检查两个给定变量是否遵循幂律?

检查两个给定变量是否遵循幂律的一种方法是使用对数对数图。如果'X'和'Y'是两个给定变量,那么如果我们用Log(X)在X轴上,Log(Y)在Y轴上做一个绘图,并且绘图收敛到一条直线,如图所示如图,那么我们可以说分布有幂律尾。(即,两个变量都遵循幂律)对数图上的直线是幂律的有力证据,直线的斜率对应于幂律指数。

如果发现分布是帕累托,可以应用box-cox变换将其转换为正态/高斯分布。

若n个相互独立的随机变量ξ,ξ,...,ξn,均服从标准正态分布(也称独立同分布于标准正态分布),则这n个服从标准正态分布的随机变量的平方和构成一新的随机变量,其分布规律称为卡方分布(chi-squaredistribution):

分布在数理统计中具有重要意义。

分布是由阿贝(Abbe)于1863年首先提出的,后来由海尔墨特(Hermert)和现代统计学的奠基人之一的卡·皮尔逊(CK.Pearson)分别于1875年和1900年推导出来,是统计学中的一个非常有用的著名分布。

卡方分布是由正态分布构造而成的一个新的分布,当自由度很大时,卡方分布近似为正态分布。

对于任意正整数x,自由度为u的卡方分布是一个随机变量X的机率分布。

卡方分布的概率密度函数为:

其中

。这里Γ代表Gamma函数。

概率密度函数

卡方分布的累积分布函数为:

其中γ(k,z)为不完全Γ函数

在大多数涉及卡方分布的书中都会提供它的累积分布函数的对照表。此外许多表格计算软件如OpenOffice.orgCalc和MicrosoftExcel中都包括卡方分布函数。

自由度为k的卡方变量的平均值是k,方差是2k。卡方分布是伽玛分布的一个特例,它的熵为:

是双伽瑪函數。

累积分布函数

韦布尔分布,即韦伯分布(Weibulldistribution),又称韦氏分布或威布尔分布,是可靠性分析和寿命检验的理论基础。

威布尔分布在可靠性工程中被广泛应用,尤其适用于机电类产品的磨损累计失效的分布形式。由于它可以利用概率值很容易地推断出它的分布参数,被广泛应用于各种寿命试验的数据处理。

从概率论和统计学角度看,WeibullDistribution是连续性的概率分布,其概率密度为:

其中,x是随机变量,λ>0是比例参数(scaleparameter),k>0是形状参数(shapeparameter)。显然,它的累积分布函数是扩展的指数分布函数,而且,Weibulldistribution与很多分布都有关系。如,当k=1,它是指数分布;k=2且时,是Rayleighdistribution(瑞利分布)。

{\displaystyleE=\lambda\Gamma\left(1+{\frac{1}{k}}\right)\,}其中,Г是伽马(gamma)函数。

{\displaystyleVar=\lambda^{2}\left[\Gamma\left(1+{\frac{2}{k}}\right)-\Gamma\left(1+{\frac{1}{k}}\right)^{2}\right],}

累积分布函数曲线

在概率论和统计学中,学生t-分布(t-distribution)用于根据小样本来估计呈正态分布且方差未知的总体的均值。如果总体方差已知(例如在样本数量足够多时),则应该用正态分布来估计总体均值。

t分布曲线形态与n(确切地说与自由度df)大小有关。与标准正态分布曲线相比,自由度df越小,t分布曲线愈平坦,曲线中间愈低,曲线双侧尾部翘得愈高;自由度df愈大,t分布曲线愈接近正态分布曲线,当自由度df=∞时,t分布曲线为标准正态分布曲线。

由于在实际工作中,往往σ是未知的,常用s作为σ的估计值,为了与u变换区别,称为t变换,统计量t值的分布称为t分布。

THE END
1.均匀分布分布函数演示清华教育在线系列软件https://eol.shzu.edu.cn/meol/common/script/preview/download_preview.jsp?fileid=85414&resid=151226004&lid=10615
2.FluentPBM模型离散方法详解哔哩哔哩系统讲解PBM离散方法、bin设置、边界条件、颗粒现象设置发布者 关注 Dearanwen 博士,研究方向为流体动力学,擅长使用Fluent软件进行多相流,对PBM模型和多相流中颗粒相互作用有深入研究。 课程概述 评论(0) 1. 对PBM模型(Population Balance Model)的详细设置及理论进行了比较深入的讲解 2. 详细讲解了PBM模型分区bin的https://www.bilibili.com/cheese/play/ss34314?search_query=%E7%A6%BB%E6%95%A3%E5%9E%8B%E6%A8%A1%E5%9E%8B
3.离散的均匀分布python离散均匀分布怎么表示离散概率分布,即离散型随机变量的概率分布,与其相对的是连续概率分布。显然,离散往往意味着与自然数密切相关,本文下面介绍几种常见的离散概率分布及其Python运用。 一、离散均匀分布:掷骰子 均匀分布分为离散与连续两种情况,这里介绍离散的情况。离散型均匀分布指有限个数值拥有相同的概率的分布,比如掷骰子。假设实验结果https://blog.51cto.com/u_16213569/8174259
4.熟悉常见概率分布离散均匀分布 特别地,当我们仅仅进行一次多项实验,并且多项的各项结果是等可能的,那么这个时候就得到的就是离散均匀(Discrete Uniform)分布。其概率密度函数如下:\[P(X = x) = \frac{1}{N} \; (x= 1,,N)\]例如,抛掷一枚均匀的骰子,出现 6 个数中任意一个的概率都是 $\frac{1}{6}$。https://baijiahao.baidu.com/s?id=1786580210573566956&wfr=spider&for=pc
5.两种常见的离散概率分布(离散均匀分布及泊松分布)离散均匀分布:n个可能的值,每个值的概率相等,即pi= 1/n,例:掷骰子 a: 最小值 b: 最大值 n: 值的个数= b-a+1 平均数= (a + b)/2 中位数= https://www.jianshu.com/p/f21f1642a9da
6.离散型均匀分布相关工具书解释 ·应用统计方法辞典·统计大辞典 亦称“离散型矩 形分布”。一种格点分布。称随机变 量X有离散型均匀分布,如果其一 切可能值构成有限等差数列,且取 各可能值的概率相等。(本文共107字)阅读全文>> 权威出处:《应用统计方法辞典》 扩展阅读: https://xuewen.cnki.net/R2008060440000554.html
7.离散均匀分布的期望和方差(均值和方差的性质)连续分布期望、方差 预备定义 数学期望 定义 E [ g ( x ) ] = { ∑ i g ( x i ) p ( x i ) , 离散场合 ∫ ? ∞∞ g ( x ) p ( x ) d x , 连续场合 E[g(x)]=\begin{cases}\sum\limits_ig(x_i)p(x_i),&\text{离散场合} \\ \\ \int_{-\infty}^\infty{g(x)p(https://cloud.tencent.com/developer/article/2060685
8.离散型均匀分布学术百科本文研究了随机需求下随机利润的分布类型,给出了随机需求为连续型随机变量时,随机利润为连续型随机变量的充分必要条件,生动而有趣地回答了本文提出的问题。 详情>> 工科数学1994年03期随机利润,连续型随机变量 AI辅助阅读 下载 下载 6.离散型随机变量的一种应用 https://wiki.cnki.com.cn/HotWord/2398289.htm
9.离散型均匀分布&连续型均匀分布discreteuniformdistribution是一种简单的概率分布,其分为离散型均匀分布(discrete uniform distribution)和连续型均匀分布(continuous uniform distribution)两种类型的机率分布。 1.离散型均匀分布(discrete uniform distribution) 在统计学及概率理论中,离散型均匀分布是一个离散型概率分布,其中有限个数值拥有相同的概率。 https://blog.csdn.net/haha0332/article/details/89204966
10.概率分布深度解析:PMFPDF和CDF的技术指南图4:左图显示了离散随机变量(骰子投掷)的 CDF,展示了骰子投掷结果概率的阶梯式累积。右图是连续随机变量(均匀分布)的 CDF,显示了从 0 到 1 的连续均匀分布概率的平滑线性增加。 结论 累积分布函数(CDF)是理解离散和连续设置中概率分布的强大工具。它使我们https://mp.weixin.qq.com/s?__biz=MzI1MjQ2OTQ3Ng==&mid=2247645553&idx=2&sn=4cef21a798a09d12a84143f8df92ac5c&chksm=e9efb0fade9839ecf40a6647551633c4f900eff198b480606667e4d1cbfc0eb59645128ef6e6&scene=27
11.离散分布均匀分布正态分布偏态分布等的翻译是:Discretea现在我是有空就学习英文,同事们都感觉我怪怪的 Now I am have free time on the study English, the colleagues all feel me strangely[translate] a离散分布、均匀分布、正态分布、偏态分布等 Discrete distribution, uniform distribution, normal distribution, skewness distribution and so on[translate]http://riyu.zaixian-fanyi.com/fan_yi_2922303
12.均匀分布种类.pdf(1)均匀分布类 (矩形分布类)(统一分布类)(Uniform) 分布名称 01.连续均匀分布 (等概分布,一致分布) 02.离散均匀分布(稀疏分布,同致分布) 03. 逆连续均匀分布 04.逆离散均匀分布 数学标记 U(a,b)或 或Unif (a,b ) X Continuous uniform distribution 或CU(a,b) X Inverse discrete uniform 或IU(a,bhttps://max.book118.com/html/2017/0810/126999682.shtm
13.3DMax如何均匀分布3d溜溜设计问答平台为广大设计师们提供各种3DMax如何均匀分布问题解答,3d溜溜素材问答平台汇聚全球各地的设计师、名师名司、设计爱好者等设计灵感和经验,迅速为您解决3DMax如何均匀分布的困惑。https://www.3d66.com/answers_relation/relation_1941382.html