对 而言,x 是确定性变量, y 是确定性函数值.
对 而言, 是不确定性变量.
随机变量就是“其值会随机而定”的变量.设随机试验 的样本空间为 ,如果对每一个 ,都有唯一的实数 与之对应,并且对任意实数 ,{} 是随机事件,则称定义在 上的实值单值函数 为随机变量,简记为随机变量 .一般用大写字母 或希腊字母 来表示随机变量.
简单来说就是随机变量出现的情况是有概率的,是以多少的概率收敛到这个值 ,将出现的结果赋值为 ,例如记事件:抛骰子结果为6,则令,那么就代表这个事件,这是一种将事件映射为函数关系(不论连续还是离散),这样就将函数和概率联系在一起
概念:设 是随机变量, 是任意实数,称函数 为随机变量 的分布函数,或称 服从 分布,记为 .牢记概念,贯穿整个概率论
是 的单调不减函数,即对任意实数 ,有 ;
是 的右连续函数,即对任意 ,有 , ;
分布函数是事件的概率,由此知 ,即 是有界函数。注:是从右边趋近这个点,所以为右连续,是从左边趋近这个点,所以称为左连续
直观理解为什么是右连续
常见的两类随机变量——离散型随机变量和连续型随机变量
离散型随机变量的概率分布的充要条件:,且 。
因此可以得知,F(X)求导可得到概率密度
充要条件:,因此在保证非负的条件下,改变 f(x) 有限个点的值, f(x) 仍然是概率密度(有限个点的改变不会影响面积)
,一个点的概率为0,所以有
根据定义可知,一点的概率为,根据连续函数左右极限值等于该点的值,故上式,因而我们不能将概率映射到函数,所以采用微积分思想,引入了概率密度,即区间概率等于密度函数在该区间的积分
不论是在离散型还是连续性,根据定义,所以在书写F(x)分段表示的时候,注意是累加,不要只写一个区间段的概率表示,而在连续性中,概率密度f(x)分段表示的时候是按照每个区间各自表示的概率密度进行书写的,这两者不要搞混了,也要注意书写的时候取值是,根据定义概率为,这就是为什么需要分段累加
注:当分布函数是不连续的分段函数时,为保证其右连续性,自变量x的分段小区间除第一个区间之外,其余都应是左闭右开的,即等号跟着大于号,连续情况下等号跟谁都可以。
0——1分布B(1,p)(Ber-E1),X~B(1,p)
二项分布B(n,p)(Ber-En),X~B(n,p)
单位时间源源不断的质点来流的个数,也常用于描述稀有事件发生的次数。强度其实为,因为是单位时间,所以t=1,后续的指数分布就不是单位时间
表示来流强度,,期望代表随机变量取值的中心水平,可以理解为强度。
若 ,当 n 很大,p 很小, 适中时,二项分布可用泊松分布近似表示,即
理解为首中即停止
如果 的概率分布为
,前面失败了k-1次,第k次才成功
如果 X 的概率分布为
则称 X 服从参数为) 的超几何分布,记为 。
理解:在等待t的时间内兔子来撞树的概率,因为是在等待,故在t的时间内没有兔子来撞树,所以,从而可以引入泊松分布,但是强度是,根据对立事件就可知晓
当 t > 0 ,s > 0 时, } 称为指数分布的无记忆性。
正态分布使用数形结合更简单
连续型->连续型(混合型):设 为连续型随机变量,其分布函数、概率密度分别为 与 ,随机变量 是 的函数,则 的分布函数或概率密度可用下面两种方法求得。
(1) 题设条件中的 “ 严格单调增加” 是充分条件,事实上只需要 在 的正概率密度区间上严格单调增加即可。
(2) 在满足 在 的正概率密度区间上严格单调增加时,若 ,则 。注意是,不是,一个是随机变量,一个是随机变量取值