开通VIP,畅享免费电子书等14项超值服
首页
好书
留言交流
下载APP
联系客服
2022.05.12
本词条由集智俱乐部众包生产,难免存在纰漏和问题,欢迎大家留言反馈或者前往对应的百科词条页面进行修改,一经修改,可以获得对应的积分奖励噢!
目录
重尾分布有三个重要的子类:胖尾分布Fat-taileddistribution,长尾分布Long-taileddistribution和次指数分布Subexponentialdistributions。实际上,所有常用的重尾分布都属于次指数分布类subexponentialclass。
在使用“重尾”Heavy-tailed一词时仍存在一些歧义。于是就出现了另外两种定义。
有一些作者使用该术语来指代并非所有阶矩都是有限的那些分布,也有一些作者使用这个术语来指代那些没有有限方差的分布。
在这里,给出的是最常用的定义,包括其他定义所涵盖的所有分布,以及具有所有幂矩但通常被认为是重尾分布的对数正态分布long-normaldistributions。(有时“重尾”用于任何具有比正态分布更重的尾巴的分布。)
定义
如果X的矩母函数,Mx(t)对于所有t>0都是无限的,则具有分布函数F的随机变量的分布被称为重尾(右)。
也可以写成尾分布函数thetaildistributionfunction:
分布函数为F的随机变量X具有长尾分布,如果对于所有t>0,都满足
或等价于
对于右尾长尾分布的随机变量有一个直观的解释,即在长尾分布随机变量尾部取值已超过某个高水平的条件下,它将超过其他更高水平的概率接近于1。
所有长尾分布都是重尾分布,但反过来不一定成立,且可以构造出非长尾分布的重尾分布。
次指数性是根据概率分布的卷积Convolution定义的。对于具有共同分布函数F的两个独立同分布的随机变量X1,X2,F与自身的卷积,F*2是二重卷积,使用Lebesgue–Stieltjes积分,方法如下:
如果满足以下条件,分布F在正半轴上是为次指数的
这意味着,对于任何n>=1,
对此的概率解释是,对于具有共同分布F的n个独立随机变量X1,….,Xn的总和
这通常被称为单跳singlebigjump或突变理论catastropheprinciple。
如果分布FI([0,∞))为实数,则F为整个实数上的次指数分布。此时I([0,∞))是正半轴的示性函数。或者,当且仅当X^+=Max(0,X)是次指数时,则支撑集为实数轴的随机变量X是次指数的。
所有次指数分布都是长尾分布,但可以构造出非次指数分布的长尾分布的示例。
常见的重尾分布
所有常用的重尾分布都是次指数的。
单尾的包括:
双尾的包括:
与胖尾分布的关系
胖尾分布是指对于较大的x,以幂律的速度x^-a趋向于0。由于这样的幂总是受到指数分布概率密度函数的限制,因此,胖尾分布始终是重尾分布。
但是,某些分布的尾部趋近于零的速率比指数函数慢(表示它们是重尾),而比幂快(表示它们不是胖尾)。例如对数正态分布。当然,许多其他的重尾分布,例如对数逻辑分布和帕累托分布也属于胖尾分布。
重尾密度的估计
编者推荐
课程推荐
巴拉巴西网络科学
本课程中,我们有幸邀请了汪小帆、赵海兴、许小可、史定华、陈清华、张江、狄增如、陈关荣、樊瑛、刘宗华这十个来自六大不同高校、在网络科学领域耕耘许久的教授作为导师,依据教材框架,各有侧重地为我们共同勾勒出整个学科的美丽图景,展示这个学科的迷人魅力,指引这个学科的灿烂未来。
课程推荐:巴拉巴西网络科学
复杂网络2020
本课程是由北京师范大学樊瑛老师所筹划的课程,这个课程对复杂性科学的一个概述,包含10个章节,每节都会涵盖复杂系统的一个主要概念。
课程推荐:圣塔菲课程:IntrodutiontoComplexity
厚尾分布
本课程是由北京师范大学陈清华老师所筹划的课程,这个课程结合实际数据和丰富的学术文献,从各方面向大家展示幂律分布——复杂系统入门必修课,其特征和意义,以及如何应用,为大家打造了体系完整的幂律分布学习框架!
课程推荐:复杂系统中的幂律分布(首节免费)
百科项目志愿者招募
作为集智百科项目团队的成员,本文内容由Jie,Smile,思无涯咿呀咿呀,丁义明老师参与贡献。我们也为每位作者和志愿者准备了专属简介和个人集智百科主页,更多信息可以访问其集智百科个人主页。
在这里从复杂性知识出发与伙伴同行,同时我们希望有更多志愿者加入这个团队,使百科词条内容得到扩充,并为每位志愿者提供相应奖励与资源,建立个人主页与贡献记录,使其能够继续探索复杂世界。
如果你有意参与更加系统精细的分工,扫描二维码填写报名表,我们期待你的加入!