算概率首先要明确数据类型,因为数据类型会影响求概率的方式。
数据类型分为:1.离散型随机变量 2.连续型随机变量
离散型随机变量的取值为有限个或者无限可列个(整数集是典型的无限可列),这个算概率的时候很简单,即随机变量取某个值的时候,概率对应多少。
连续型随机变量的取值为无限不可列个(实数集是典型的无限不可列)
这个时候我们讨论概率就需要用到面积,因为取值既然是无限个,那么讨论某个点的概率是没有意义的(就像对某个时间点讨论位移是没有意义的,只有时间段的位移才有意义),这个时候我们就需要一个反应概率变化趋势的函数,然后用它来算积分值(面积),也就是概率,而这个函数就是概率密度函数,也是概率的导函数。
附上一个大神链接:/p/48140593
分布函数有几种反复出现,于是统计学家开始研究常见的那几种,这样下次就可以直接套用。
离散概率分布:
二项分布 几何分布 泊松分布
连续型概率分布:
指数分布 正态分布
二项分布
二项分布有啥用呢?
当你遇到一个事情,如果该事情发生次数固定,而你感兴趣的是成功的次数,那么就可以用二项分布的公式快速计算出概率来。
如何判断是不是二项分布?
1)做某件事的次数(也叫试验次数)是固定的,用n表示(抛硬币)
2)每一次事件都有两个可能的结果(成功,或者失败)
3)每一次成功的概率都是相等的,成功的概率用p表示
4)你成功x次的概率是多少。那么就可以用二项分布的公式快速计算出来了。
如何计算?
几何分布
几何分布有啥用?
如果你需要知道尝试多次能取得第一次成功的概率(也就是说前面都是失败的),则需要几何分布。
如何判断是不是几何分布?
1)做某事件次数(也叫试验次数)是固定的,用n表示
2)每一次事件都有两个可能的结果(成功,或者失败)
3)每一次“成功”的概率都是相等的,成功的概率用p表示
4)你感兴趣的是,进行x次尝试这个事情,取得第1次成功的概率是多大(例如你在玩抛硬币的游戏,想知道抛5次硬币,只有第5次(就是滴1次成功)正面朝上的概率是多大。
如何计算?
先要失败x-1次:
泊松分布
泊松分布有啥用?
如果你想知道某个时间范围内,发生某件事情x次的概率是多大。这时候就可以用泊松分布轻松搞定。比如一天内中奖的次数,一个月内某机器损坏的次数等。
泊松分布的形状会随着平均值的不同而有所变化,无论是一周内多少人能赢得彩票,还是每分钟有多少人会打电话到呼叫中心,泊松分布都可以告诉我们它们的概率。(泊松分布的分布函数有个参数就是均值,影响分布函数)
什么是泊松分布?
1)事件是独立事件
2)在任意相同的时间范围内,事件发的概率相同
(例如1天内中奖概率,与第2天内中间概率相同)
3)你想知道某个时间范围内,发生某件事情x次的概率是多大
(例如你搞了个促销抽奖活动,想知道一天内10人中奖的概率,但是要知道平均一天有多少人中奖)
如何计算?